语音交互服务_SIS

语音交互服务

语音交互服务（Speech Interaction Service，简称SIS）是一种智能人机交互方式，用户通过实时访问和调用API获取语音交互结果。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

识别准确率高

产品列表

实时语音识别 RASR

实时语音识别（Real-time ASR），将连续的音频流实时转换成文本，语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

了解详情

一句话识别 SASR

一句话识别将口述音频转换为文本，通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

了解详情

语音合成 TTS

语音合成服务提供在线语音合成能力，支持将文本信息实时转化为近似的真人发声，支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

了解详情

录音文件识别 LASR

录音文件识别，基于深度学习技术，可以实现5小时以内的音频到文字的转换。支持垂直领域定制，对应领域转换效果更佳。

了解详情

录音文件识别极速版

录音文件识别极速版，音频转文字速度大幅提升。

了解详情

实时语音合成

实时流的语音合成服务。

了解详情

实时语音识别 RASR

实时语音识别（Real-time ASR），将连续的音频流实时转换成文本，语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

一句话识别 SASR

语音合成 TTS

录音文件识别 LASR

录音文件识别，基于深度学习技术，可以实现5小时以内的音频到文字的转换。支持垂直领域定制，对应领域转换效果更佳。

录音文件识别极速版

录音文件识别极速版，音频转文字速度大幅提升。

实时语音合成

实时流的语音合成服务。

产品动态

文档与学习成长

快速入门

快速入门

语音交互服务介绍

调用API实现一句话识别

调用Java SDK实现一句话识别

查看更多
常见问题

常见问题

产品咨询类

计费类

错误码类

部署类

查看更多
开发者工具

开发者工具

SDK文档、SDK下载

SDK简介

API概览

查看更多

语音交互服务 SIS