华为云语言合成服务功能介绍

语音合成,是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果,将用户输入的文字合成为音频。通过音色选择、自定义音量、语速,为企业和个人提供个性化的发音服务。

产品优势

• 多语种多音色

中文普通话、男声、女声、童声自由切换,可以调整音量,语速。

• 效果出色

文本转换自然清晰,近乎真人发音,能够符合多样的应用场景。

在线语音合成有哪些约束和限制?

1、支持“华北-北京一”、“华北-北京四”、“华东-上海一”区域。

说明:当前服务仅支持北京和上海区域,后续会陆续上线其他区域。

华北-北京一,该区域资源有限,当前仅支持已选择该区域的老用户使用,新用户不可见,后续该区域不可用。

华北-北京四,推荐的区域,支持一句话识别、录音文件识别、实时语音识别和语音合成和热词等接口。

华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

2、仅支持中文,文本不长于500个中文字。

3、支持合成采样率8kHz、16kHz。

语音合成软件适用的应用场景有哪些?

语音导航

使用语音合成服务将车载导航数据转换成语音素材,为用户提供精确的语音导航服务。利用个性化定制能力,提供丰富的导航语音服务

优势

  • 效果自然

    合成效果接近真人发声,流畅自然

  • 个性化定制

    调整语音属性进行个性化合成

有声读物

将书籍、杂志、新闻的文本内容转换成逼真的人声发音,充分解放人们的眼睛,在搭乘地铁、开车、健身等场景下获取信息、享受乐趣

优势

  • 发声自然

    合成后的语音接近真人发声

  • 多种音色

    支持多种人员声音,更支持语速、音调等设置

电话回访

在客服系统场景中,通过语音合成服务将回访内容转换成人声,直接使用语音和客户交流,提升用户体验

优势

  • 多种合成模式

    支持在线语音合成

  • 发声自然

    合成后的语音接近真人发声

智能教育

将书本上的文本内容合成为语音,接近真人的发音可模拟真人教学场景,实现课文的朗读和带读,帮助学生更好地理解和掌握教学内容

优势

  • 效果自然

    合成音效流畅、自然,在音色、自然度等方面接近人声

  • 个性定制

    根据喜好选择不同的发声人

人机交互

通过定制语音合成,实现高品质的机器人发声,使得人机交互更加自然

优势

  • 效果自然

    合成效果接近真人发声,流畅自然

  • 个性化定制

    调整语音属性进行个性化合成

语音合成软件-在线语音合成服务如何收费?

语音合成软件-在线语音合成服务如何收费?

  • 在线语音合成服务,按调用次数计费。

  • · 按需计费

    按需计费是指按照API调用次数阶梯价格计费,计费价格参见语音交互价格计算器

    · 折扣套餐包

    折扣套餐包方式是用户可以购买套餐包,扣费时调用次数会先在套餐包内进行抵扣,抵扣完后的剩余调用量默认转回按需计费方式,计费价格参见语音交互价格计算器

  • 续费

    资源包到期后,您可以进行续费以延长资源包的有效期,也可以设置到期自动续费。续费相关操作,请参见续费管理

  • 服务到期

    包年包月资源包到期后,自动转为按需计费。转按需后如果帐号欠费,会根据“客户等级”定义不同的保留期时长,保留期内资源处理和费用详见“保留期”。保留期满仍未续订或充值,数据将被删除且无法恢复。

展开内容
收起内容

语音合成软件试用和选购

  • 免费文字转换成语音

    华为云语音合成服务提供在线语音合成能力,支持将文本信息实时转化为近似的真人发声,支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

    华为云语音合成服务提供在线语音合成能力,支持将文本信息实时转化为近似的真人发声,支持多语言多音色语音在线合成。支持客户的个性化语音定制化需求。

  • 定制语音合成TTSC免费体验

    定制语音合成TTSC免费天,免费额度:用户可在语音交互服务体验中心在线免费体验定制语音合成TTSC,可以选择不同类型的男声/女声,并调整音量和语速,更有1元包年特惠套餐,可享每天调用500次API,时长一年。

    定制语音合成TTSC免费天,免费额度:用户可在语音交互服务体验中心在线免费体验定制语音合成TTSC,可以选择不同类型的男声/女声,并调整音量和语速,更有1元包年特惠套餐,可享每天调用500次API,时长一年。

  • 文字语音识别

    文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。本文为您介绍文字识别、文字语音识别、OCR免费试用相关内容。

    文字识别(Optical Character Recognition,简称OCR)是指将图片、扫描件或PDF、OFD文档中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。本文为您介绍文字识别、文字语音识别、OCR免费试用相关内容。

  • 智能语音_语音服务

    华为云智能语音识别服务可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。方言当前支持四川话、粤语和上海话。

    华为云智能语音识别服务可以实现1分钟以内音频到文字的转换。对于用户上传的二进制音频格式数据,系统经过处理,生成语音对应的文字,支持的语言包含中文普通话、方言。方言当前支持四川话、粤语和上海话。

  • 语音识别转文字免费

    华为云实时语音识别是款优秀的语音转文字服务,实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。本文为您介绍语音转文字、语音合成、一句话识别等相关内容

    华为云实时语音识别是款优秀的语音转文字服务,实时语音识别(Real-time ASR),将连续的音频流实时转换成文本,语音识别更快。可应用于直播实时字幕、会议实时记录、即时文本生成等场景。本文为您介绍语音转文字、语音合成、一句话识别等相关内容

  • 语音转文字识别接口_免费语音转文字

    华为云录音转文字专题为用户提供录音转文字哪个软件好用、华为云录音转文字的优势、免费语音转文字、哪些应用场景需要使用录音转文字、录音转文字价格表以及录音转文字的常见问题等相关内容。

    华为云录音转文字专题为用户提供录音转文字哪个软件好用、华为云录音转文字的优势、免费语音转文字、哪些应用场景需要使用录音转文字、录音转文字价格表以及录音转文字的常见问题等相关内容。

语音合成软件-在线语音合成服务的常见问题解答

语音合成软件-在线语音合成服务的常见问题解答

  • 语音合成软件支持哪些语言?

    语音合成支持中文普通话。

  • 语音合成后输出的音频格式是什么?

    语音合成后返回一组Base64编码格式的语音数据,用户需要用编程语言或者sdk将返回的Base64编码格式的数据解码成byte数组,再保存为wav格式的音频。

    说明:语音合成(Text To Speech ,TTS服务)服务的音频格式则根据接口中audio_format参数设置的语音格式为准。若audio_format的值设置为wav,则解码后输出为wav格式,如果设置为mp3,则解码后输出mp3格式。

  • 语音合成后能否返回播放时长?

    不能,当前语音合成无此参数。若需要知道语音时长,可以将返回语音数据解码转换成音频格式,播放后查看。

  • 帐号中存在语音合成服务的套餐,但是为什么却收到了欠费的信息?

    问题描述

    帐号中存在语音合成服务的套餐,但是为什么却收到了欠费的信息?

    解决方案

    如果是同一个区域的服务,存在套餐会先从套餐计费,超出套餐的部分才会按照按需计费。

    请确认上述套餐和欠费服务否属于不同服务或者不同区域的。

  • 语音合成的base64编码如何使用?

    问题现象

    用户在使用语音合成获取响应体的base64编码,不了解应该如何进一步使用。

    解决方案

    1. 建议用户使用Java或Python SDK,可参考SDK简介

    2. 使用html网页播放,新建一个html文件,如下填写内容,即可在浏览器播放。

    <audio controls="controls" autobuffer="autobuffer" autoplay="autoplay">

    <source src="data:audio/wav;base64,UklGRhwMAABXQVZFZ..." />

    </audio>

  • 如何查看当前文字转语音服务接口是否免费调用?

    1、登录华为云,单击右上角的“控制台”,进入“管理控制台”界面。

    2、在左侧服务列表中选择“EI企业智能 > 语音交互服务”。

    3、图1 服务列表

    4、在语音交互服务主页,单击左侧导航栏子服务名称(如“一句话识别”),查看该服务是否已商用。

    5、当服务处于公测阶段,可以免费使用该服务,但是使用前需要先申请公测。

    6、当服务处于商用阶段,不需要开通服务,可以直接调用,使用该服务需要付费,计费方式详细请参考语音交互价格计算器。

  • 语音合成能不能支持返回立体音(双声道)格式的音频?

    语音合成接口当前仅支持单声道,不支持返回立体音(双声道)格式的音频。

  • 华为云语音合成服务的区域如何选择?

    不同区域的资源之间内网不互通。为保证网络的连通性,降低网络时延、提高访问速度,请选择靠近您客户的区域,当前语音服务支持北京和上海区域,后续会陆续上线其他区域,当前支持的区域请参见地区与终端节点

    · 华北-北京一,该区域资源有限,当前仅支持已选择该区域的老用户使用,新用户不可见,后续该区域不可用。

    · 华北-北京四,为推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。

    · 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。