智能语音识别服务

可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。方言当前支持四川话、粤语和上海话。

一句话识别-智能语音服务产品优势

· 高识别率

基于深度学习技术,对特定领域场景的语音识别进行优化,识别率达到业界领先。

· 前沿技术

使用工业界成熟的算法,结合学术界最新研究成果,为企业提供独特竞争力优势。

· 支持热词

针对专业词汇,支持上传至热词表,增加专业词汇的识别准确率。

· 可定制化

针对客户的特定场景需求,定制垂直领域的语音识别模型,识别效果更精确。

· 多语音格式支持

支持11种输入语音格式,包含ulaw、alaw、pcm、mpx、wav等

· 简单易用

提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出。

· 稳定可靠

成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验。

一句话识别-智能语音服务的应用场景

语音搜索

搜索内容直接以语音的方式输入,让搜索更加高效。支持各种场景下的语音搜索,比如地图导航、网页搜索等。

语音短消息

通过语音发送或者接收短消息时,将音频消息转文字,提升阅读效率和交互体验。

游戏娱乐

将游戏娱乐中的语音聊天转成文字消息,提升用户阅读效率和交互体验。

智能语音识别服务的计费方式

计费项

· 一句话识别语音合成按调用次数计费;实时语音识别录音文件识别、录音文件识别极速版按音频时长计费,时长计算精确到秒。

· 按音频时长计费的,累加每次调用的音频时长。

· 按调用次数计费的,返回失败的调用不计入次数。

计费模式

· 按需计费

按需计费是指按照API调用次数阶梯价格计费,计费价格参见语音交互价格计算器

· 折扣套餐包

折扣套餐包方式是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式,计费价格参见语音交互价格计算器

变更配置

SIS默认使用按需计费。您也可以根据您的实际情况购买资源包,购买后对应区域的资源将自动转为包年包月计费方式。如果超出当前已购买资源包的额度,超出部分将自动转为按需计费。

一句话识别-智能语音服务常见问题

一句话识别-智能语音服务常见问题

  • 什么是语音交互服务?

    语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API(Application Programming Interface,应用程序编程接口)获取语音交互结果。例如用户通过语音识别功能,将口述音频、普通话或者带有一定方言的语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、会议记录、语音短消息、有声读物、电话回访等。

  • 智能语音服务支持哪些语言?

    · 录音文件识别、语音合成支持中文普通话。

    · 一句话识别和实时语音识别支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。

  • 一句话识别是否支持aac格式的语音文件转文字?

    一句话识别和录音文件识别以及实时语音识别均可实现语音转文字,一句话识别支持aac格式,录音文件识别和实时语音识别不支持aac格式。

  • 智能语音服务当前处于商用还是免费阶段?

    当前语音交互服务在中国区已全部商用,使用该服务需要收费。详细的接口费用说明请参见计费说明

  • 语音交互服务的区域如何选择?

    不同区域的资源之间内网不互通。为保证网络的连通性,降低网络时延、提高访问速度,请选择靠近您客户的区域,当前语音服务支持北京和上海区域,后续会陆续上线其他区域,当前支持的区域请参见地区与终端节点

    · 华北-北京一,该区域资源有限,当前仅支持已选择该区域的老用户使用,新用户不可见,后续该区域不可用。

    · 华北-北京四,为推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

    · 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

  • 智能语音识别是强制绑定使用OBS进行录音文件存储吗?

    不是,只有录音文件识别需要使用OBS服务,语音交互服务对用户存储在OBS的数据,具有只读权限,没有修改和删除的权限。所以用户是否删除上传至OBS服务的数据,需要用户根据自己的obs桶的使用情况或者容量大小确认,并在OBS服务上执行。

  • 语音交互服务是否支持私有化部署?

    目前语音交互服务暂不支持私有化部署。

  • 实时语音识别多人同时使用,如何区分各自识别结果?

    每个用户独立建立websocket连接,不可共用一个websocket连接。

  • 录音文件识别多久可以返回结果?

    音频转写时长受音频时长和排队任务数量影响,音频时长和理论返回时间可参见音频转写时长参考表。如果转写耗时比理论时延长,大概率表示当前时间段出现转写高峰,请耐心等待,我们承诺最大转写时长不超过6小时。

多款智能云产品限时领取免费体验,每位新用户仅限一次

立即体验