实时语音识别

实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。

实时语音识别

将连续的音频流实时转换成文本,语音识别更快

如您希望解锁AI能力,切实有效变革企业业务,请点击右侧按钮联系我们

免费获取企业强有力的AI战略落地方案→

获取方案

产品优势

  • 识别准确率高

    采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升

    采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升

  • 识别速度快

    把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位

    把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位

  • 多种识别模式

    支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景

    支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景

  • 定制化服务

    可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率

    可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率

功能特性

  • 文本时间戳

    为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频片段

    为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频片段

  • 智能断句

    通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性

    通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性

  • 中英文混合识别

    支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别

    支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别

  • 语言支持

    支持中文普通话,含带方言口音的普通话识别

    支持中文普通话,含带方言口音的普通话识别

  • 即时输出识别结果

    连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正

    连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正

  • 自动静音检测

    对输入语音流进行静音检测,识别效率和准确率更高

    对输入语音流进行静音检测,识别效率和准确率更高

应用场景

直播实时字幕

将视频直播或现场直播中的音频实时转为字幕,为观众提供更高效的观会体验,方便对内容进行监控

优势

  • 速度快

    实时识别直播语音内容

  • 识别准确

    语音识别准确率高

会议实时记录

将视频或电话会议中的音频实时转为文字,可实时校核、修改及检索转写会议内容,提高会议效率

优势

  • 高效便捷

    =快速进行会议记录

  • 识别准确

    语音识别准确率高

即时文本录入

手机APP上实时录音并即时提供转写的文本,例如语音输入法等,方便后期文字处理和内容存档,省去记录的人力和时间成本,大幅提升了转换效率

优势

  • 高效便捷

    快速记录音频内容

  • 不间断识别

    可对大于60秒的长语音数据流不间断识别

联系我们

联系我们

活动规则

活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理

活动时间: 2020年8月12日-2020年9月11日