语音交互服务

语音交互服务 SIS

产品列表

产品列表

实时语音识别 RASR

实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

一句话识别 SASR

一句话识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

语音合成 TTS

语音合成服务提供在线语音合成能力,支持将文本信息实时转化为近似的真人发声,支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

录音文件识别 LASR

录音文件识别,基于深度学习技术,可以实现5小时以内的音频到文字的转换。支持垂直领域定制,对应领域转换效果更佳。

录音文件识别极速版

录音文件识别极速版,音频转文字速度大幅提升。

实时语音合成

实时流的语音合成服务。

如您对语音交互服务仍有疑问,请点击右侧按钮,技术专家将为您提供专业解决方案→

产品动态