产品优势
-
识别准确率高
采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升
采用最新一代语音识别技术,基于DNN(深层神经网络)技术,大大提高了抗噪性能,使识别准确率显著提升
-
识别速度快
把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位
把语言模型,词典和声学模型统一集成为一个大的神经网络,同时在工程上进行了大量的优化,大幅提升解码速度,使识别速度在业内处领先地位
-
多种识别模式
支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景
支持多种实时语音转写模式,如流式一句话、连续和单句模式,灵活适应不同应用场景
-
定制化服务
可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率
可定制特定垂直领域的语言层模型,识别更多专有词汇和行业术语,进一步提高识别准确率
功能特性
-
文本时间戳
为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频片段
为音频转换结果生成特定的时间戳,从而通过搜索文本即可快速找到对应的原始音频片段
-
智能断句
通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性
通过提取上下文相关语义特征,并结合语音特征,智能划分断句及添加标点符号,提升输出文本的可阅读性
-
中英文混合识别
支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别
支持在中文句子识别中可夹带英文字母、数字等,从而实现中、英文以及数字的混合识别
-
语言支持
支持中文普通话,含带方言口音的普通话识别
支持中文普通话,含带方言口音的普通话识别
-
即时输出识别结果
连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正
连续识别语音流内容,即时输出结果,并可根据上下文语言模型自动校正
-
自动静音检测
对输入语音流进行静音检测,识别效率和准确率更高
对输入语音流进行静音检测,识别效率和准确率更高