语音交互服务 SIS-http接口:请求参数

时间:2024-05-14 09:27:19

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。

用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。

Enterprise-Project-Id

String

企业项目ID。SIS支持通过企业项目管理(EPS)对不同用户组和用户的资源使用,进行分账。

获取方法:进入“企业项目管理”页面,单击企业项目名称,在企业项目详情页获取Enterprise-Project-Id(企业项目ID)。

企业项目创建步骤请参见用户指南。

说明:

账户创建企业项目后,在传参时,有以下三类场景。

  • 携带正确的ID,正常使用SIS服务,账单归到企业ID对应的企业项目中。
  • 携带错误的ID,正常使用SIS服务,账单的企业项目会被分类为“default”。
  • 不携带ID,正常使用SIS服务,账单的企业项目会被分类为“default”。
表3 请求Body参数

参数

是否必选

参数类型

描述

config

Config object

配置信息。

data

String

语音数据,Base64编码,要求Base64编码后大小不超过4M,音频时长不超过1分钟。Base64编码示例如/+MgxAAUeHpMAUkQAANhuRAC...,如果携带data:audio/mp3;base64,类前缀,会产生报错。

表4 Config

参数

是否必选

参数类型

描述

audio_format

String

支持语音的格式,请参考表 audio_format取值范围

property

String

所使用的模型特征串,通常是 “语种_采样率_领域”的形式,采样率需要与音频采样率保持一致,取值范围请参考表 property取值范围

add_punc

String

表示是否在识别结果中添加标点,取值为“yes”“no”,默认为“no”

digit_norm

String

表示是否将语音中的数字识别为阿拉伯数字,取值为“yes”“no”,默认为“yes”

vocabulary_id

String

热词表id,不使用则不填写。创建热词表信息请参考创建热词表

need_word_info

String

表示是否在识别结果中输出分词结果信息,取值为“yes”“no”,默认为“no”

表5 audio_format取值范围

audio_format取值

描述

pcm16k16bit

16k16bit单通道录音数据。

pcm8k16bit

8k16bit单通道录音数据。

ulaw16k8bit

16k8bit ulaw单通道录音数据。

ulaw8k8bit

8k8bit ulaw单通道录音数据。

alaw16k8bit

16k8bit alaw单通道录音数据。

alaw8k8bit

8k8bit alaw单通道录音数据。

mp3

mp3格式音频。目前仅支持单通道的音频。

aac

aac格式音频。目前仅支持单通道的音频。

wav

带wav封装头的格式,从封装头中自动确定格式,目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。

amr

AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。

amrwb

AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。

auto

由引擎自动判断音频数据的格式并解码,支持自动判断amr,flac,m4a,mp3,ogg,webm,wav,aac,ac3,mov,wma、amrwb格式。

表6 property取值范围

property取值

描述

chinese_16k_general

支持采样率为16k的中文普通话语音识别,采用新一代端到端识别算法,识别准确率更高。

区域支持cn-east-3和cn-north-4(强烈推荐使用)。

chinese_16k_travel

支持采样率为16k的中文普通话语音识别,采用新一代端到端识别算法,并针对网约车质检场景进行了优化。

区域支持cn-east-3和cn-north-4(强烈推荐使用)。

sichuan_16k_common

支持采样率为8k/16k的中文普通话与四川话方言识别。区域仅支持cn-north-4,暂不支持digit_norm,vocabulary_id参数。

cantonese_16k_common

支持采样率为8k/16k的粤语方言识别。区域仅支持cn-north-4,暂不支持digit_norm,vocabulary_id参数。

shanghai_16k_common

支持采样率为8k/16k的上海话方言识别,区域仅支持cn-north-4,暂不支持digit_norm,vocabulary_id参数。

chinese_8k_common

支持采样率为8k的中文普通话语音识别。

chinese_16k_common

支持采样率为16k的中文普通话语音识别。

english_16k_common

支持采样率为16k的英文语音识别,区域仅支持cn-east-3。格式仅支持wav,暂不支持add_punc, digit_norm,vocabulary_id,need_word_info参数。

english_8k_common

支持采样率为8k的英文语音识别,区域仅支持cn-east-3。格式仅支持wav,暂不支持add_punc, digit_norm,vocabulary_id,need_word_info参数。

support.huaweicloud.com/api-sis/sis_03_0094.html