云服务器内容精选

  • 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chrome等浏览器将无法播放H265(HEVC)视频,并获取不到视频分辨率等参数。 在Chrome浏览器中输入“chrome://gpu”后,搜索“coding”。可以检查当前PC的浏览器是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com/BtbN/FFmpeg-Builds/releases。 ffmpeg解压后,将其下bin目录加入系统环境变量。 输入命令行ffmpeg后可以显示版本号,说明安装成功。
  • 操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”。进入分身形象制作页面,如图1所示。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 视频封面(可选) 视频封面,无需上传。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 第三方用户ID(可选) 无需填写。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图3所示。 图3 任务列表 单击任务所在行的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,需要等待1天左右的时间审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图5所示。 数字人定制任务审核通过后,启动算法训练,模型训练过程较长,约10个小时左右,请耐心等待。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。
  • 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 选择声音制作服务“基础版声音制作”。 定制声音名称 输入声音名称,示例:欢快女声。 请选择声音性别 选择声音的性别,示例:女生。 选择语言 选择声音的语言,示例:中文。 选择声音标签 声音的标签。请根据所选文案样例,选择相应的标签,如下所示: 电商:直播带货风格文案 营销:营销宣传风格文案 新闻:新闻播报风格文案 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV文件,无需压缩,无需携带文案txt文件。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 第三方用户ID(可选) 无需填写。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击试听声音效果。
  • 功能特性 MetaStudio提供形象制作、声音定制、分身形象视频制作、分身形象 视频直播 、分身形象名片制作、智能交互等能力,如表1所示。 表1 功能特性 功能名称 功能描述 形象制作 通过拍摄真人视频,建模生成数字人分身形象。 数字人可作为虚拟主播、虚拟主持、虚拟客服、虚拟老师等形象使用。 声音制作 通过录制真人声音,建模生成自定义的数字人声音,用于为数字人配音。 也支持直接购买第三方声音套餐,使用套餐内的声音,为数字人配音。 视频制作 使用数字人形象,进行画布和音频设置,合成视频。 适用于各类培训、宣讲、知识分享等场景。 视频直播 使用数字人形象,进行画布设置、剧本设计、互动和开播设置,生成直播视频。 可用于在合作的第三方平台进行数字人视频直播。 智能交互 支持用户开箱即用的智能交互数字人场景;也支持使用智能交互API或SDK,自主开发实现与数字人对话场景。 数字人名片 支持为分身数字人制作形象名片,且支持通过名片来试听语音效果。 照片数字人 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。
  • 操作步骤 访问云商店 语音合成 商品页面,进入云商店的“语音合成”商品购买页面。 用户可以在界面下方查看商品详情,确定要购买的商品规格。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。 图2 订单确认页面 阅读并勾选所有协议和相关授权,单击“去支付”,进入订单支付页面。 图3 订单支付页面 按照界面提示,选择您的付款方式,完成支付即可。 订单支付成功后,进入如图4所示的界面。 图4 订单支付成功
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域右下方的图标,切换视频的分辨率为横屏“16:9”或竖屏“9:16”。 画布制作完成后,需要制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间间隔,实现阅读的停顿。 多音字 如果文字存在多个发音,可选中文字,单击“多音字”,在弹出的提示框中,选择正确的发音。 局部语速 选中需要设置语速的文字段,设置局部语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 全局语速 设置全局语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 亲切女声 默认为“亲切女声”。 如需更换声音,可单击“亲切女声”,在弹出的对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考(可选)购买第三方声音。 试听 单击“试听”,可试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标,在视频中添加字幕。 仅文本驱动的方式,支持开启字幕功能。音频驱动方式,暂不支持。 图标 展示当前视频的分辨率。 图标 第一次单击可收起“文本驱动/视频驱动”板块的配置,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传,或直接拖拽本地音频文件至提示区域中,完成上传。单击图标,可试听音频效果。 图2 音频驱动 音频制作完成后,可单击“音量”,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景均设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入资产详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入 视频编辑 界面,更新视频内容,重新合成视频。 图5 我的视频
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。 参数配置说明,如表1所示。 图2 创建商品 表1 商品配置说明 参数 说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
  • 视频直播首页面 分身视频直播首页面,如图1所示。各个页签的说明,如下所示: 直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。 商品管理:支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。 直播任务管理:用户创建的直播间列表。支持通过直播间任务进入直播间,修改直播间内容后,重新开播。操作请参考直播任务管理。 图1 首页面
  • 直播间界面 视频直播制作界面如图2所示。各区域详细说明,如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 设置视频直播的场景,包括如下内容: 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象。 背景:背景图片列表,可本地导入图片。可选择需要使用的背景图。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,可本地导入视频文件,目前仅支持MP4格式的视频文件。支持添加为背景视频。 商品:商品列表,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 视频直播画面,可以预览视频直播的效果。 ③ 如果直播包含多个背景或数字人形象,可以通过服务定义的场景来依次制作。 默认只有场景1,可以通过单击下方的图标“+”来增加多个场景。每个场景都需要设置对应的数字人形象、背景、声音等内容。 当前区域包含如下3个页签: 剧本驱动 包含下述三种方式: 文本驱动:需要输入文本,通过文本驱动数字人说话。 音频驱动:需要上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 ④ 左侧为当前视频直播的名称,支持自定义设置。 中间区域,从左往右依次为操作回退图标、操作恢复图标和屏幕布局,默认为“16:9”。 右侧依次为下述内容: :直播间保存图标,右侧展示最近一次保存的时间。 清空:单击“清空”,可以一次性清空直播间所有内容。
  • 场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,实现第三方语言模型对接到智能交互服务,实现智能交互能力。 操作请参考创建智能交互数字人。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型。科大讯飞对接到智能交互服务,开发者基于SDK完成web界面开发。 操作请参考创建智能交互数字人(SDK场景)。 用户购买华为的 对话机器人 CBS服务,对接到智能交互服务,开发者基于SDK完成web界面开发。 操作请参考创建智能交互数字人(SDK场景)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。 操作请参考创建智能交互数字人(SDK+API场景)。 父主题: 智能交互
  • 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: 租户id:请输入项目ID,获取方式如获取项目ID所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。 租户取消成功后,租户未使用的资源将被收回。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。 图1 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图3所示。 输入互动库的名称。支持对互动库执行如下操作。 单击互动库右侧的,从下拉框中选择“重命名”,可以修改互动库的名称。 单击互动库右侧的,从下拉框中选择“复制”,可以复制当前互动库,生成一个新的互动库。 单击互动库右侧的,从下拉框中选择“删除”,删除当前互动库。 图2 互动库 图3 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“互动编辑”对话框,如图4所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如图4所示。 图4 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称 互动名称。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 支持选择下述一种方式设置回复内容。 文本回复:输入文本内容。当满足触发方式时,数字人会阅读文本内容。 音频回复:从本地上传录制好的音频文件。当满足触发方式时,自动播放音频文件。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
  • 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 系统提供如下声音制作服务,请选择一种声音制作服务。 基础版声音制作:仅需20条语料。音频格式为WAV文件。音频时长为3~10分钟,建议5分钟。 进阶版声音制作:仅需100条语料。音频格式为WAV文件。音频时长10~30分钟,建议15分钟。 高品质声音制作:需要500条语料。音频格式为WAV文件。音频时长1小时以上,建议1小时。仅支持录制成长音频,每句之间需要有2~3秒的停顿。 每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 定制声音名称 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示: 男生 女生 选择语言 声音的语言,包含如下选项: 中文 英文 选择声音标签 声音的标签,包含如下选项: 电商 新闻 营销 针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果按句录制方式(仅基础版和进阶版支持),且使用预置文案,必须选对标签。 请制作声音 制作声音的方式为: 语料上传:界面提供录音指导,需要按照指导,基础版录制20句音频,进阶版录制100句音频,高品质声音制作需要录制500句以上的音频。音频仅支持wav格式。建议整段录制生成一个长音频文件,直接上传,无需压缩,无需携带文案txt文件。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或100条合格的语料音频即可。 高品质声音制作,不支持在线录音方式。 如果选择“语料上传”的方式,且未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
  • 示例流程 图1 给用户授权MetaStudio权限流程 创建用户组并授权 在 IAM 控制台创建用户组,并授予MetaStudio管理员权限“MetaStudio FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 新创建的用户登录控制台,验证MetaStudio FullAccess的管理员权限。 在“服务列表”中选择数字内容生产线,进入服务主界面,单击“分身形象制作”,并参考《用户指南》手册,制作分身数字人。如果制作成功,说明MetaStudio FullAccess”已生效。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示,对应操作说明如下所示: 除了系统预置的视频素材外,角色还可以自定义定制分身数字人,背景、贴图、视频还支持从本地导入使用。 从素材区域添加到视频直播区域中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择一种剧本驱动方式。 “剧本驱动”包含下述3种方式: 文本驱动 需要通过文本来驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,增加更多的场景或段落。 单击右上方的“导入”,从本地导入文本文件。文件必须为txt格式,字数不少于200字;如果多个段落,可通过换行来实现。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际一个段落需要满足至少200字,不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 全局声音(主播) 全局声音为直播间中的数字人主播使用的声音。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考(可选)购买第三方声音进行操作。 直播女生(助播) 直播间的数字人为主播,这是助播的声音。 在开播后的界面,可以单击如图3所示的图标,切换到助播声音,再输入互动内容,通过助播声音播放互动内容。 试听 单击“试听”,可以试听当前所有场景下文字内容。 也可以单击具体段落区域的试听图标,试听当前段落的内容。 场景操作 支持对场景,执行下述操作: :设置主播声音。 :复制当前场景,新增一个相同场景。 :修改场景名称,默认值为“场景1”。 :删除当前场景。 :移动场景的位置。 :新增1个空白段落。 段落操作 支持对段落,执行下述操作: :使用主播声音播报当前段落内容。 :修改段落名称,默认值为“段落1.1”。 :复制当前段落,新增一个相同段落。 :删除当前段落。 :移动段落的位置。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 用户也可以根据实际情况设置主播和助播的声音。开播后可单击如图5所示的图标,切换到主播或者助播的声音,再发送互动内容,系统会使用所选声音播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,即切换多个背景及其展示的内容,可以单击右侧“场景”区域下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图7所示。 包含如下4类设置: 弹幕 用户入场 点赞 送礼 上面4类设置的操作基本相同,下面以弹幕为例,进行操作说明,详情参见表2。 用户也可以直接导入已有的互动库使用,如互动管理所示。 图7 互动设置 表2 弹幕设置说明 参数 配置说明 间隔时间 同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120秒,不能小于60秒。 添加互动 单击“添加互动”,界面下方新增一条语料,如图7所示。用户可以根据实际情况,添加多条语料。 第一行输入框中,需要输入触发关键词,如果有多个,请以“|”分隔。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前语料内容。 示例:链接|型号|优惠 第二行输入框中,需要输入相应的回复内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 单击界面右侧的“直播配置”页签,如图8所示。 直播配置说明,如表3所示。 图8 我的视频 表3 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 输出设置 直播画面 选择视频直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 支持直接设置播放的次数,也可以选择“无限循环”。 风控设置 主播轮换 如果视频场景存在多场景,支持开启主播轮换,最多支持选择5个主播,以实现每轮场景更换时,相应的更换主播形象。 须知: 前面操作过程中,各个场景均已设置了相应的主播,即原主播;如果这里开启了“主播轮换”,且选择了主播,即备主播;那么直播时,可能随机选择原主播和备主播进行播放。所以直播画面的主播不一定是这里设置的备主播。 随机播放 仅“播放次数”选择“无限循环”时展示此参数。 如果开启随机播放,支持设置“随机规则”,包含如下选项: 按场景随机:视频直播过程中,随机选取任一场景进行播放,且确保场景不重复播放。场景中的段落仍按顺序播放。 按段落随机:视频直播过程中,场景播放顺序不变,场景内的段落随机进行播放,且确保段落不重复播放。 场景和段落都随机:视频直播过程中,随机选取任一场景中的任一段落进行播放,且确保所有场景的各个段落不重复播放。 更多设置 直播间ID 无需设置,当前视频直播保存后展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备直播”,准备开播。 即兴直播方式,无需执行本步骤的下述子步骤。 弹出“风险提示”对话框,如图9所示。 用户需要参照风险提示项,逐一核查并优化视频直播内容。 图9 风险提示 用户可以等直播风险消除后,再开播,也可以选择“承担风险开播”。 在“直播窗口”对话框中,选择“竖屏”或“全屏”,如图10所示。 图10 直播窗口 单击“继续”,等待直播启动。 直播启动成功后,视频制作界面的直播画面区域,会展示直播启动的进度。 开播后的效果如图11所示。界面右下方的操作说明,如表4所示。 图11 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可以切换为助播声音。 用户设置的互动内容列表,单击选择后发送,数字人会播报。 请输入互动内容,回车发送内容 输入互动内容,并发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,停止视频直播。