什么是语音交互服务

时间:2020-09-08 08:22:02

语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果。

什么是语音合成

使用前必读

用户需要具备编程能力,熟悉Java、Python等编程语言。

SIS服务需要用户通过调用API接口,将语音文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

支持的语言

目前语音交互服务仅支持中文识别与合成。

首次使用SIS

如果您是首次使用SIS的用户,建议您学习并了解如下信息:

功能介绍

通过功能介绍章节的内容,了解SIS不同功能的具体介绍,主要包括定制语音识别(ASR Customization,ASRC)、实时语音转写(Real-time ASR,RASR)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、定制语音合成(Text To Speech Customization,TTSC)功能。

入门使用

SIS以开放API的方式提供给用户,您可以参考《快速入门》学习并使用SIS服务。

使用方式

如果您是一个开发工程师,熟悉代码编写,想要直接调用SIS的API或SDK使用服务,您可以参考《API参考》或《SDK参考》获取详情。

由浅入深学习

您可以参考成长地图,由浅入深学习使用SIS。


实时语音转写(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

将连续的音频流实时转换成文本,语音识别更快

实时语音接口调用费用低至¥1.2/小时

https://www.huaweicloud.com/product/rasr.html

猜你喜欢