华为云首页用户手册

语音交互服务 SIS-http接口:请求参数

语音交互服务 SIS-http接口:请求参数

时间：2024-05-14 09:27:19

语音交互服务 SIS 一句话识别

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	是	String	用户Token。用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。
Enterprise-Project-Id	否	String	企业项目ID。SIS支持通过企业项目管理（EPS）对不同用户组和用户的资源使用，进行分账。获取方法：进入“企业项目管理”页面，单击企业项目名称，在企业项目详情页获取Enterprise-Project-Id（企业项目ID）。企业项目创建步骤请参见用户指南。说明：账户创建企业项目后，在传参时，有以下三类场景。携带正确的ID，正常使用SIS服务，账单归到企业ID对应的企业项目中。携带错误的ID，正常使用SIS服务，账单的企业项目会被分类为“default”。不携带ID，正常使用SIS服务，账单的企业项目会被分类为“default”。

表3 请求Body参数
参数	是否必选	参数类型	描述
config	是	Config object	配置信息。
data	是	String	语音数据，Base64编码，要求Base64编码后大小不超过4M，音频时长不超过1分钟。Base64编码示例如/+MgxAAUeHpMAUkQAANhuRAC...，如果携带data:audio/mp3;base64,类前缀，会产生报错。

表4 Config
参数	是否必选	参数类型	描述
audio_format	是	String	支持语音的格式，请参考表 audio_format取值范围。
property	是	String	所使用的模型特征串，通常是 “语种_采样率_领域”的形式，采样率需要与音频采样率保持一致，取值范围请参考表 property取值范围。
add_punc	否	String	表示是否在识别结果中添加标点，取值为“yes”和“no”，默认为“no”。
digit_norm	否	String	表示是否将语音中的数字识别为阿拉伯数字，取值为“yes” 和 “no”，默认为“yes”。
vocabulary_id	否	String	热词表id，不使用则不填写。创建热词表信息请参考创建热词表。
need_word_info	否	String	表示是否在识别结果中输出分词结果信息，取值为“yes”和“no”，默认为“no”。

表5 audio_format取值范围
audio_format取值	描述
pcm16k16bit	16k16bit单通道录音数据。
pcm8k16bit	8k16bit单通道录音数据。
ulaw16k8bit	16k8bit ulaw单通道录音数据。
ulaw8k8bit	8k8bit ulaw单通道录音数据。
alaw16k8bit	16k8bit alaw单通道录音数据。
alaw8k8bit	8k8bit alaw单通道录音数据。
mp3	mp3格式音频。目前仅支持单通道的音频。
aac	aac格式音频。目前仅支持单通道的音频。
wav	带wav封装头的格式，从封装头中自动确定格式，目前仅支持8k/16k采样率、单通道、pcm, alaw, ulaw三种编码格式。
amr	AMR窄带(8k) 压缩录音数据。目前仅支持单通道的音频。
amrwb	AMR 宽带(16k) 压缩录音数据。目前仅支持单通道的音频。
auto	由引擎自动判断音频数据的格式并解码，支持自动判断amr，flac，m4a，mp3，ogg，webm，wav，aac，ac3，mov，wma、amrwb格式。

表6 property取值范围
property取值	描述
chinese_16k_general	支持采样率为16k的中文普通话语音识别，采用新一代端到端识别算法，识别准确率更高。区域支持cn-east-3和cn-north-4（强烈推荐使用）。
chinese_16k_travel	支持采样率为16k的中文普通话语音识别，采用新一代端到端识别算法，并针对网约车质检场景进行了优化。区域支持cn-east-3和cn-north-4（强烈推荐使用）。
sichuan_16k_common	支持采样率为8k/16k的中文普通话与四川话方言识别。区域仅支持cn-north-4，暂不支持digit_norm，vocabulary_id参数。
cantonese_16k_common	支持采样率为8k/16k的粤语方言识别。区域仅支持cn-north-4，暂不支持digit_norm，vocabulary_id参数。
shanghai_16k_common	支持采样率为8k/16k的上海话方言识别，区域仅支持cn-north-4，暂不支持digit_norm，vocabulary_id参数。
chinese_8k_common	支持采样率为8k的中文普通话语音识别。
chinese_16k_common	支持采样率为16k的中文普通话语音识别。
english_16k_common	支持采样率为16k的英文语音识别，区域仅支持cn-east-3。格式仅支持wav，暂不支持add_punc, digit_norm，vocabulary_id，need_word_info参数。
english_8k_common	支持采样率为8k的英文语音识别，区域仅支持cn-east-3。格式仅支持wav，暂不支持add_punc, digit_norm，vocabulary_id，need_word_info参数。

上一篇：语音交互服务 SIS-http接口:响应参数

下一篇：语音交互服务 SIS-创建热词表:约束与限制

语音交互服务 SIS-http接口:请求参数

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题