云服务器内容精选
-
问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chrome等浏览器将无法播放H265(HEVC)视频,并获取不到视频分辨率等参数。 在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。
-
操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”。进入分身形象制作页面,如图1所示。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 视频封面(可选) 视频封面,无需上传。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 第三方用户ID(可选) 无需填写。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图3所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,需要等待1天左右的时间审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图5所示。 数字人定制任务审核通过后,启动算法训练,模型训练过程较长,约10个小时左右,请耐心等待。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。
-
操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 选择声音制作服务“基础版声音制作”。 定制声音名称 输入声音名称,示例:欢快女声。 请选择声音性别 选择声音的性别,示例:女生。 选择语言 选择声音的语言,示例:中文。 选择声音标签 声音的标签。请根据所选文案样例,选择相应的标签,如下所示: 电商:直播带货风格文案 营销:营销宣传风格文案 新闻:新闻播报风格文案 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV文件,无需压缩,无需携带文案txt文件。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 第三方用户ID(可选) 无需填写。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击试听声音效果。
-
功能特性 MetaStudio提供形象制作、声音定制、分身形象视频制作、分身形象 视频直播 、分身形象名片制作、智能交互等能力,如表1所示。 表1 功能特性 功能名称 功能描述 形象制作 通过拍摄真人视频,建模生成数字人分身形象。 数字人可作为虚拟主播、虚拟主持、虚拟客服、虚拟老师等形象使用。 声音制作 通过录制真人声音,建模生成自定义的数字人声音,用于为数字人配音。 也支持直接购买第三方声音套餐,使用套餐内的声音,为数字人配音。 视频制作 使用数字人形象,进行画布和音频设置,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,进行画布设置、剧本设计、互动和开播设置,生成直播视频。 可用于在合作的第三方平台进行数字人视频直播。 智能交互 支持用户开箱即用的智能交互数字人场景;也支持使用智能交互API或SDK,自主开发实现与数字人对话场景。 数字人名片 支持为分身数字人制作形象名片,且支持通过名片来试听语音效果。 照片数字人 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。
-
操作步骤 访问云商店 语音合成 商品页面,进入云商店的“语音合成”商品购买页面。 用户可以在界面下方查看商品详情,确定要购买的商品规格。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。 图2 订单确认页面 阅读并勾选所有协议和相关授权,单击“去支付”,进入订单支付页面。 图3 订单支付页面 按照界面提示,选择您的付款方式,完成支付即可。 订单支付成功后,进入如图4所示的界面。 图4 订单支付成功
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域右下方的图标,切换视频的分辨率为横屏“16:9”或竖屏“9:16”。 画布制作完成后,需要制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间间隔,实现阅读的停顿。 多音字 如果文字存在多个发音,可选中文字,单击“多音字”,在弹出的提示框中,选择正确的发音。 局部语速 选中需要设置语速的文字段,设置局部语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 全局语速 设置全局语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 亲切女声 默认为“亲切女声”。 如需更换声音,可单击“亲切女声”,在弹出的对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考(可选)购买第三方声音。 试听 单击“试听”,可试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标,在视频中添加字幕。 仅文本驱动的方式,支持开启字幕功能。音频驱动方式,暂不支持。 图标 展示当前视频的分辨率。 图标 第一次单击可收起“文本驱动/视频驱动”板块的配置,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传,或直接拖拽本地音频文件至提示区域中,完成上传。单击图标,可试听音频效果。 图2 音频驱动 音频制作完成后,可单击“音量”,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景均设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入资产详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入 视频编辑 界面,更新视频内容,重新合成视频。 图5 我的视频
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。 参数配置说明,如表1所示。 图2 创建商品 表1 商品配置说明 参数 说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
-
视频直播首页面 分身视频直播首页面,如图1所示。各个页签的说明,如下所示: 直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。 商品管理:支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。 直播任务管理:用户创建的直播间列表。支持通过直播间任务进入直播间,修改直播间内容后,重新开播。操作请参考直播任务管理。 图1 首页面
-
直播间界面 视频直播制作界面如图2所示。各区域详细说明,如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 设置视频直播的场景,包括如下内容: 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象。 背景:背景图片列表,可本地导入图片。可选择需要使用的背景图。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,可本地导入视频文件,目前仅支持MP4格式的视频文件。支持添加为背景视频。 商品:商品列表,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 视频直播画面,可以预览视频直播的效果。 ③ 如果直播包含多个背景或数字人形象,可以通过服务定义的场景来依次制作。 默认只有场景1,可以通过单击下方的图标“+”来增加多个场景。每个场景都需要设置对应的数字人形象、背景、声音等内容。 当前区域包含如下3个页签: 剧本驱动 包含下述三种方式: 文本驱动:需要输入文本,通过文本驱动数字人说话。 音频驱动:需要上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 ④ 左侧为当前视频直播的名称,支持自定义设置。 中间区域,从左往右依次为操作回退图标、操作恢复图标和屏幕布局,默认为“16:9”。 右侧依次为下述内容: :直播间保存图标,右侧展示最近一次保存的时间。 清空:单击“清空”,可以一次性清空直播间所有内容。
-
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,实现第三方语言模型对接到智能交互服务,实现智能交互能力。 操作请参考创建智能交互数字人。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型。科大讯飞对接到智能交互服务,开发者基于SDK完成web界面开发。 操作请参考创建智能交互数字人(SDK场景)。 用户购买华为的 对话机器人 CBS服务,对接到智能交互服务,开发者基于SDK完成web界面开发。 操作请参考创建智能交互数字人(SDK场景)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。 操作请参考创建智能交互数字人(SDK+API场景)。 父主题: 智能交互
-
操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: 租户id:请输入项目ID,获取方式如获取项目ID所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。 租户取消成功后,租户未使用的资源将被收回。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。 图1 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图3所示。 输入互动库的名称。支持对互动库执行如下操作。 单击互动库右侧的,从下拉框中选择“重命名”,可以修改互动库的名称。 单击互动库右侧的,从下拉框中选择“复制”,可以复制当前互动库,生成一个新的互动库。 单击互动库右侧的,从下拉框中选择“删除”,删除当前互动库。 图2 互动库 图3 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“互动编辑”对话框,如图4所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如图4所示。 图4 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称 互动名称。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 支持选择下述一种方式设置回复内容。 文本回复:输入文本内容。当满足触发方式时,数字人会阅读文本内容。 音频回复:从本地上传录制好的音频文件。当满足触发方式时,自动播放音频文件。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
-
操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 系统提供如下声音制作服务,请选择一种声音制作服务。 基础版声音制作:仅需20条语料。音频格式为WAV文件。音频时长为3~10分钟,建议5分钟。 进阶版声音制作:仅需100条语料。音频格式为WAV文件。音频时长10~30分钟,建议15分钟。 高品质声音制作:需要500条语料。音频格式为WAV文件。音频时长1小时以上,建议1小时。仅支持录制成长音频,每句之间需要有2~3秒的停顿。 每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 定制声音名称 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示: 男生 女生 选择语言 声音的语言,包含如下选项: 中文 英文 选择声音标签 声音的标签,包含如下选项: 电商 新闻 营销 针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果按句录制方式(仅基础版和进阶版支持),且使用预置文案,必须选对标签。 请制作声音 制作声音的方式为: 语料上传:界面提供录音指导,需要按照指导,基础版录制20句音频,进阶版录制100句音频,高品质声音制作需要录制500句以上的音频。音频仅支持wav格式。建议整段录制生成一个长音频文件,直接上传,无需压缩,无需携带文案txt文件。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或100条合格的语料音频即可。 高品质声音制作,不支持在线录音方式。 如果选择“语料上传”的方式,且未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
-
示例流程 图1 给用户授权MetaStudio权限流程 创建用户组并授权 在 IAM 控制台创建用户组,并授予MetaStudio管理员权限“MetaStudio FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 新创建的用户登录控制台,验证MetaStudio FullAccess的管理员权限。 在“服务列表”中选择数字内容生产线,进入服务主界面,单击“分身形象制作”,并参考《用户指南》手册,制作分身数字人。如果制作成功,说明MetaStudio FullAccess”已生效。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示,对应操作说明如下所示: 除了系统预置的视频素材外,角色还可以自定义定制分身数字人,背景、贴图、视频还支持从本地导入使用。 从素材区域添加到视频直播区域中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择一种剧本驱动方式。 “剧本驱动”包含下述3种方式: 文本驱动 需要通过文本来驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,增加更多的场景或段落。 单击右上方的“导入”,从本地导入文本文件。文件必须为txt格式,字数不少于200字;如果多个段落,可通过换行来实现。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际一个段落需要满足至少200字,不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 全局声音(主播) 全局声音为直播间中的数字人主播使用的声音。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考(可选)购买第三方声音进行操作。 直播女生(助播) 直播间的数字人为主播,这是助播的声音。 在开播后的界面,可以单击如图3所示的图标,切换到助播声音,再输入互动内容,通过助播声音播放互动内容。 试听 单击“试听”,可以试听当前所有场景下文字内容。 也可以单击具体段落区域的试听图标,试听当前段落的内容。 场景操作 支持对场景,执行下述操作: :设置主播声音。 :复制当前场景,新增一个相同场景。 :修改场景名称,默认值为“场景1”。 :删除当前场景。 :移动场景的位置。 :新增1个空白段落。 段落操作 支持对段落,执行下述操作: :使用主播声音播报当前段落内容。 :修改段落名称,默认值为“段落1.1”。 :复制当前段落,新增一个相同段落。 :删除当前段落。 :移动段落的位置。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 用户也可以根据实际情况设置主播和助播的声音。开播后可单击如图5所示的图标,切换到主播或者助播的声音,再发送互动内容,系统会使用所选声音播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,即切换多个背景及其展示的内容,可以单击右侧“场景”区域下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图7所示。 包含如下4类设置: 弹幕 用户入场 点赞 送礼 上面4类设置的操作基本相同,下面以弹幕为例,进行操作说明,详情参见表2。 用户也可以直接导入已有的互动库使用,如互动管理所示。 图7 互动设置 表2 弹幕设置说明 参数 配置说明 间隔时间 同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120秒,不能小于60秒。 添加互动 单击“添加互动”,界面下方新增一条语料,如图7所示。用户可以根据实际情况,添加多条语料。 第一行输入框中,需要输入触发关键词,如果有多个,请以“|”分隔。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前语料内容。 示例:链接|型号|优惠 第二行输入框中,需要输入相应的回复内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 单击界面右侧的“直播配置”页签,如图8所示。 直播配置说明,如表3所示。 图8 我的视频 表3 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 输出设置 直播画面 选择视频直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 支持直接设置播放的次数,也可以选择“无限循环”。 风控设置 主播轮换 如果视频场景存在多场景,支持开启主播轮换,最多支持选择5个主播,以实现每轮场景更换时,相应的更换主播形象。 须知: 前面操作过程中,各个场景均已设置了相应的主播,即原主播;如果这里开启了“主播轮换”,且选择了主播,即备主播;那么直播时,可能随机选择原主播和备主播进行播放。所以直播画面的主播不一定是这里设置的备主播。 随机播放 仅“播放次数”选择“无限循环”时展示此参数。 如果开启随机播放,支持设置“随机规则”,包含如下选项: 按场景随机:视频直播过程中,随机选取任一场景进行播放,且确保场景不重复播放。场景中的段落仍按顺序播放。 按段落随机:视频直播过程中,场景播放顺序不变,场景内的段落随机进行播放,且确保段落不重复播放。 场景和段落都随机:视频直播过程中,随机选取任一场景中的任一段落进行播放,且确保所有场景的各个段落不重复播放。 更多设置 直播间ID 无需设置,当前视频直播保存后展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备直播”,准备开播。 即兴直播方式,无需执行本步骤的下述子步骤。 弹出“风险提示”对话框,如图9所示。 用户需要参照风险提示项,逐一核查并优化视频直播内容。 图9 风险提示 用户可以等直播风险消除后,再开播,也可以选择“承担风险开播”。 在“直播窗口”对话框中,选择“竖屏”或“全屏”,如图10所示。 图10 直播窗口 单击“继续”,等待直播启动。 直播启动成功后,视频制作界面的直播画面区域,会展示直播启动的进度。 开播后的效果如图11所示。界面右下方的操作说明,如表4所示。 图11 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可以切换为助播声音。 用户设置的互动内容列表,单击选择后发送,数字人会播报。 请输入互动内容,回车发送内容 输入互动内容,并发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,停止视频直播。
更多精彩内容
CDN加速
GaussDB
文字转换成语音
免费的服务器
如何创建网站
域名网站购买
私有云桌面
云主机哪个好
域名怎么备案
手机云电脑
SSL证书申请
云点播服务器
免费OCR是什么
电脑云桌面
域名备案怎么弄
语音转文字
文字图片识别
云桌面是什么
网址安全检测
网站建设搭建
国外CDN加速
SSL免费证书申请
短信批量发送
图片OCR识别
云数据库MySQL
个人域名购买
录音转文字
扫描图片识别文字
OCR图片识别
行驶证识别
虚拟电话号码
电话呼叫中心软件
怎么制作一个网站
Email注册网站
华为VNC
图像文字识别
企业网站制作
个人网站搭建
华为云计算
免费租用云托管
云桌面云服务器
ocr文字识别免费版
HTTPS证书申请
图片文字识别转换
国外域名注册商
使用免费虚拟主机
云电脑主机多少钱
鲲鹏云手机
短信验证码平台
OCR图片文字识别
SSL证书是什么
申请企业邮箱步骤
免费的企业用邮箱
云免流搭建教程
域名价格