华为云计算 云知识 什么是语音交互服务

什么是语音交互服务

语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取语音交互结果。

使用前必读

用户需要具备编程能力,熟悉Java、Python等编程语言。

SIS服务需要用户通过调用API接口,将语音文件识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

支持的语言

目前语音交互服务仅支持中文识别与合成。

首次使用SIS

如果您是首次使用SIS的用户,建议您学习并了解如下信息:

功能介绍

通过功能介绍章节的内容,了解SIS不同功能的具体介绍,主要包括定制语音识别(ASR Customization,ASRC)、实时语音转写(Real-time ASR,RASR)、语音识别(Automatic Speech Recognition,ASR)、语音合成(Text To Speech,TTS)、定制语音合成(Text To Speech Customization,TTSC)功能。

入门使用

SIS以开放API的方式提供给用户,您可以参考《快速入门》学习并使用SIS服务。

使用方式

如果您是一个开发工程师,熟悉代码编写,想要直接调用SIS的API或SDK使用服务,您可以参考《API参考》或《SDK参考》获取详情。

由浅入深学习

您可以参考成长地图,由浅入深学习使用SIS。

上一篇:漏洞扫描服务提供哪些?漏洞扫描有哪些功能 下一篇:数据库客户端工具介绍