语音识别 ASR

语音识别(Automatic Speech Recognition),将口述音频转换为文本,通过API调用识别不同音频源发来的实时音频,或识别音频文件。识别的语言为中文普通话(本服务核心能力由科大讯飞提供)

现以申请公测资格方式免费试用,名额有限

产品优势
  • 效果出众

    使用高级深度学习技术,语音识别准确率超过95%,在业界具有一定的技术优势

  • 广泛支持

    支持短语音和长语音识别;长语音提供标准版和专门用于电话录音识别的电话专用版,满足多种场景下的应用需求

  • 稳定可靠

    成功应用于各类场景,基于华为等企业客户的长期实践,经受过复杂场景考验

  • 简单高效

    提供RESTful规范API接口,并提供服务SDK,方便客户使用与集成;帮助客户减少人力成本,节省业务支出

应用场景
  • 智能客服

  • 智能会议

  • 直播字幕

  • 人机交互

智能客服

智能客服

集成语音识别的智能客服系统,可以自动识别客户的语音和语义,然后自动以语音形式回复客户。减少人力成本,保证服务质量

优势

识别准确

语音识别准确率高

速度快

快速识别短语音和长语音

建议搭配使用

对象存储服务 obs

智能会议

智能会议

集成语音识别的智能会议系统,可以自动识别参会人员的的声纹、语音,通过实时、精准的识别,达到实时弹幕显示、会议记录等

优势

识别准确

语音识别准确率高

高效便捷

快速进行会议记录

建议搭配使用

对象存储服务 obs

直播字幕

直播字幕

在视频直播场景中,将音频实时转写成文本字幕,与视频一起播出,提升观众友好性。结合敏感关键词检测服务,进行质检审查

优势

速度快

实时识别直播语音内容

准确率高

识别准确率业界领先

建议搭配使用

对象存储服务 obs

人机交互

人机交互

通过语音唤醒、语音识别服务,对终端设备发送语音命令,对设备进行实时操作,提升人机交互体验

优势

唤醒率高

设备唤醒率业界领先

个性化定制

支持自定义唤醒词

建议搭配使用

对象存储服务 obs

功能描述

  • 语音识别

    支持短语音、长语音、远场语音识别,实时将语音转换成文字

  • 语言支持

    支持中文普通话识别

语音识别

语言支持

  • 语音唤醒

    设备在休眠或锁屏状态下通过语音唤醒进入等待指令状态

  • 命令词识别

    通过语音说出操作指令,对设备进行操作

语音唤醒

命令词识别

携手讯飞,联合运营,努力打造更优的语音服务体验

免费试用

高达4核8G云服务器0元体验

免费体验