华为云用户手册

  • 边缘实例 IEC暂不支持通过VNC(Virtual Network Console,虚拟网络控制台)方式登录边缘实例,请使用远程连接工具登录实例。 系统默认一个华为云账号最多创建300台边缘实例,如果您需要创建更多个边缘实例,请申请扩大配额。一次最多可以创建50台边缘实例。 系统默认一个华为云账号最多创建边缘实例的内存(Random Access Memory, RAM )容量为100GB,vCPU(Virtual Central Processing Unit,虚拟处理器)为100个。如果您需要更多配额,请申请扩大配额。
  • 边缘安全组 系统默认一个华为云账号最多创建200个安全组。如果您需要创建更多个安全组,请申请扩大配额。 由于归属于不同虚拟私有云的多个实例网络不连通,则为同一个安全组下归属于不同的虚拟私有云的多个实例配置网络连通的访问规则是不生效的。 由于归属于不同边缘站点的多个子网之间网络不连通,则为安全组配置跨站点多个子网连通的访问规则是不生效的。 系统默认一个华为云账号最多创建10000个安全组规则。如果您需要创建更多个安全组规则,请申请扩大配额。
  • 边缘镜像 当前IEC仅支持在华北-北京四[cn-north-4]的华为云区域通过 镜像服务 创建边缘私有镜像。 对于 IAM 用户通过镜像服务创建边缘私有镜像,需要账号为该IAM用户同时赋予IEC FullAccess权限和华北-北京四[cn-north-4]区域的IAM ReadOnlyAccess权限。 系统默认一个华为云账号最多创建50个边缘私有镜像(从边缘实例和从镜像服务创建合计)。如果您需要创建更多个边缘私有镜像,请申请扩大配额。 IEC场景下不支持windows公共镜像;windows私有镜像仅支持创建虚拟机,但不支持对虚拟机进行激活。
  • 边缘网络ACL 每个网络ACL都包含一组默认规则,如下所示: 默认放通同一站点下同一子网内的流量。 默认放通目的IP地址为255.255.255.255/32的广播报文。用于配置主机的启动信息。 默认放通目的网段为224.0.0.0/24的组播报文。供路由协议使用。 默认放通目的IP地址为169.254.169.254/32,TCP端口为80的metadata报文。用于获取元数据。 默认放通公共服务预留网段资源的报文,例如目的网段为100.125.0.0/16的报文。 除上述默认放通的流量外,其余出入子网的流量全部拒绝,如表1所示。该规则不能修改和删除。 表1 网络ACL默认规则 方向 优先级 动作 协议 源地址 目的地址 说明 入方向 * 拒绝 全部 0.0.0.0/0 0.0.0.0/0 拒绝所有入站流量 出方向 * 拒绝 全部 0.0.0.0/0 0.0.0.0/0 拒绝所有出站流量 网络连通性: 由于归属于不同虚拟私有云的多个子网网络不连通,则为同一个网络ACL下归属于不同的虚拟私有云的多个子网配置网络连通的访问规则是不生效的。 由于归属于不同边缘站点的多个子网之间网络不连通,则为网络ACL配置跨站点多个子网连通的访问规则是不生效的。 规则优先级: 网络ACL规则的优先级使用“优先级”值来表示,优先级的值越小,优先级越高,最先应用。优先级的值为“*”的是默认规则,优先级最低。 多个网络ACL规则冲突,优先级高的规则优先生效。如果某个规则需要优先或落后生效,可在对应规则(需要优先或落后于某个规则生效的规则)前面或后面插入此规则。
  • 边缘路由和路由表 系统默认一个VPC下最多创建10个自定义路由表。如果您需要创建更多个自定义路由表,请申请扩大配额。 每个路由表最多添加200个路由。 一个子网一次只能关联一个路由表,但一个路由表可以关联多个子网。 系统路由不能修改和删除。 通过自定义路由访问Internet网络时,目的地址配置为默认0.0.0.0/0,不能配置为具体的公网网段,下一跳为本VPC内绑定了EIP的边缘实例、绑定了EIP的虚拟IP或互联网网关地址。
  • 修订记录 发布日期 更新内容 2023-12-28 第十次正式发布。 刷新“约束与限制”章节相关内容。 2022-12-14 第九次正式发布。 新增实例规格章节。 2022-09-23 第八次正式发布。 约束与限制章节删除通用计算型(S6)、内存优化型(M6)和GPU加速型(G5r和Pi2)规格。 2021-09-13 第七次正式发布。 “权限管理”章节新增委托相关内容。 2021-07-01 第六次正式发布。 新增通用计算型(s6)和内存优化型(m6)规格描述。 2021-05-29 第五次正式发布。 优化“什么是智能边缘云”章节内容。 刷新“约束与限制”章节相关内容。 2021-05-07 第四次正式发布。 新增智能边缘平台和IEC交互关系的相关内容。 2021-04-12 第三次正式发布。 优化文档部分内容。 匹配产品功能刷新“约束与限制”章节相关内容。 2021-01-30 第二次正式发布。 在“权限管理”章节新增为IAM用户进行细粒度授权访问IEC的内容。 2020-10-30 第一次正式发布。
  • 云硬盘的磁盘模式 云硬盘的磁盘模式分为VBD (虚拟块存储设备,Virtual Block Device) 类型和S CS I (小型计算机系统接口,Small Computer System Interface) 类型。 VBD类型: 当您通过管理控制台创建云硬盘时,云硬盘的磁盘模式默认为VBD类型。VBD类型的云硬盘只支持简单的SCSI读写命令。 SCSI类型: 您可以通过管理控制台创建SCSI类型的云硬盘,该类型的云硬盘支持SCSI指令透传,允许智能边缘云操作系统直接访问底层存储介质。除了简单的SCSI读写命令,SCSI类型的云硬盘还可以支持更高级的SCSI命令。 更多关于SCSI类型云硬盘的使用(如驱动安装),请参见“使用SCSI类型云硬盘需要安装驱动吗”。
  • 操作步骤 访问云商店 语音合成 商品页面,进入云商店的“语音合成”商品购买页面。 用户可以在界面下方查看商品详情,确定要购买的商品规格。 图1 云商店 选择“语音合成体验套餐”,单击“立即购买”,进入购买页面。 下面以购买“语音合成体验套餐”为例,进行操作说明。 图2 订单确认页面 阅读并勾选所有协议和相关授权,单击“去支付”,进入订单支付页面。 图3 订单支付页面 按照界面提示,选择您的付款方式,完成支付即可。 订单支付成功后,进入如图4所示的界面。 图4 订单支付成功
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域右下方的图标,切换视频的分辨率为横屏“16:9”或竖屏“9:16”。 画布制作完成后,需要制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间间隔,实现阅读的停顿。 多音字 如果文字存在多个发音,可选中文字,单击“多音字”,在弹出的提示框中,选择正确的发音。 局部语速 选中需要设置语速的文字段,设置局部语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 全局语速 设置全局语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 亲切女声 默认为“亲切女声”。 如需更换声音,可单击“亲切女声”,在弹出的对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考(可选)购买第三方声音。 试听 单击“试听”,可试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标,在视频中添加字幕。 仅文本驱动的方式,支持开启字幕功能。音频驱动方式,暂不支持。 图标 展示当前视频的分辨率。 图标 第一次单击可收起“文本驱动/视频驱动”板块的配置,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传,或直接拖拽本地音频文件至提示区域中,完成上传。单击图标,可试听音频效果。 图2 音频驱动 音频制作完成后,可单击“音量”,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景均设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入资产详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入 视频编辑 界面,更新视频内容,重新合成视频。 图5 我的视频
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身 视频直播 ”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。 参数配置说明,如表1所示。 图2 创建商品 表1 商品配置说明 参数 说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
  • 直播间界面 视频直播制作界面如图2所示。各区域详细说明,如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 设置视频直播的场景,包括如下内容: 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象。 背景:背景图片列表,可本地导入图片。可选择需要使用的背景图。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:无声音视频素材列表,可本地导入视频文件,目前仅支持MP4格式的视频文件。支持添加为背景视频。 商品:商品列表,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 视频直播画面,可以预览视频直播的效果。 ③ 如果直播包含多个背景或数字人形象,可以通过服务定义的场景来依次制作。 默认只有场景1,可以通过单击下方的图标“+”来增加多个场景。每个场景都需要设置对应的数字人形象、背景、声音等内容。 当前区域包含如下3个页签: 剧本驱动 包含下述三种方式: 文本驱动:需要输入文本,通过文本驱动数字人说话。 音频驱动:需要上传音频,通过音频驱动数字人说话。 即兴直播:无需设置剧本,直接开播。开播后数字人是不说话的,需要发送互动内容,或者开启真人接管,驱动数字人说话。 互动设置:支持弹幕、用户入场 、点赞和送礼设置。 直播配置:支持开播设置、输出设置、风控设置和更多设置。 ④ 左侧为当前视频直播的名称,支持自定义设置。 中间区域,从左往右依次为操作回退图标、操作恢复图标和屏幕布局,默认为“16:9”。 右侧依次为下述内容: :直播间保存图标,右侧展示最近一次保存的时间。 清空:单击“清空”,可以一次性清空直播间所有内容。
  • 视频直播首页面 分身视频直播首页面,如图1所示。各个页签的说明,如下所示: 直播管理:使用数字人创建直播间。操作请参考视频直播。 互动管理:支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。操作请参考互动管理。 商品管理:支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。操作请参考商品管理。 直播任务管理:用户创建的直播间列表。支持通过直播间任务进入直播间,修改直播间内容后,重新开播。操作请参考直播任务管理。 图1 首页面
  • 场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,实现第三方语言模型对接到智能交互服务,实现智能交互能力。 操作请参考创建智能交互数字人。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型。科大讯飞对接到智能交互服务,开发者基于SDK完成web界面开发。 操作请参考创建智能交互数字人(SDK场景)。 用户购买华为的 对话机器人 CBS服务,对接到智能交互服务,开发者基于SDK完成web界面开发。 操作请参考创建智能交互数字人(SDK场景)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。 操作请参考创建智能交互数字人(SDK+API场景)。 父主题: 智能交互
  • 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: 租户id:请输入项目ID,获取方式如获取项目ID所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。 租户取消成功后,租户未使用的资源将被收回。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。 图1 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图3所示。 输入互动库的名称。支持对互动库执行如下操作。 单击互动库右侧的,从下拉框中选择“重命名”,可以修改互动库的名称。 单击互动库右侧的,从下拉框中选择“复制”,可以复制当前互动库,生成一个新的互动库。 单击互动库右侧的,从下拉框中选择“删除”,删除当前互动库。 图2 互动库 图3 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“互动编辑”对话框,如图4所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如图4所示。 图4 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称 互动名称。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 支持选择下述一种方式设置回复内容。 文本回复:输入文本内容。当满足触发方式时,数字人会阅读文本内容。 音频回复:从本地上传录制好的音频文件。当满足触发方式时,自动播放音频文件。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
  • 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 系统提供如下声音制作服务,请选择一种声音制作服务。 基础版声音制作:仅需20条语料。音频格式为WAV文件。音频时长为3~10分钟,建议5分钟。 进阶版声音制作:仅需100条语料。音频格式为WAV文件。音频时长10~30分钟,建议15分钟。 高品质声音制作:需要500条语料。音频格式为WAV文件。音频时长1小时以上,建议1小时。仅支持录制成长音频,每句之间需要有2~3秒的停顿。 每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 定制声音名称 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示: 男生 女生 选择语言 声音的语言,包含如下选项: 中文 英文 选择声音标签 声音的标签,包含如下选项: 电商 新闻 营销 针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果按句录制方式(仅基础版和进阶版支持),且使用预置文案,必须选对标签。 请制作声音 制作声音的方式为: 语料上传:界面提供录音指导,需要按照指导,基础版录制20句音频,进阶版录制100句音频,高品质声音制作需要录制500句以上的音频。音频仅支持wav格式。建议整段录制生成一个长音频文件,直接上传,无需压缩,无需携带文案txt文件。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或100条合格的语料音频即可。 高品质声音制作,不支持在线录音方式。 如果选择“语料上传”的方式,且未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
  • 示例流程 图1 给用户授权MetaStudio权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予MetaStudio管理员权限“MetaStudio FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 新创建的用户登录控制台,验证MetaStudio FullAccess的管理员权限。 在“服务列表”中选择数字内容生产线,进入服务主界面,单击“分身形象制作”,并参考《用户指南》手册,制作分身数字人。如果制作成功,说明MetaStudio FullAccess”已生效。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示,对应操作说明如下所示: 除了系统预置的视频素材外,角色还可以自定义定制分身数字人,背景、贴图、视频还支持从本地导入使用。 从素材区域添加到视频直播区域中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择一种剧本驱动方式。 “剧本驱动”包含下述3种方式: 文本驱动 需要通过文本来驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,增加更多的场景或段落。 单击右上方的“导入”,从本地导入文本文件。文件必须为txt格式,字数不少于200字;如果多个段落,可通过换行来实现。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际一个段落需要满足至少200字,不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 全局声音(主播) 全局声音为直播间中的数字人主播使用的声音。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考(可选)购买第三方声音进行操作。 直播女生(助播) 直播间的数字人为主播,这是助播的声音。 在开播后的界面,可以单击如图3所示的图标,切换到助播声音,再输入互动内容,通过助播声音播放互动内容。 试听 单击“试听”,可以试听当前所有场景下文字内容。 也可以单击具体段落区域的试听图标,试听当前段落的内容。 场景操作 支持对场景,执行下述操作: :设置主播声音。 :复制当前场景,新增一个相同场景。 :修改场景名称,默认值为“场景1”。 :删除当前场景。 :移动场景的位置。 :新增1个空白段落。 段落操作 支持对段落,执行下述操作: :使用主播声音播报当前段落内容。 :修改段落名称,默认值为“段落1.1”。 :复制当前段落,新增一个相同段落。 :删除当前段落。 :移动段落的位置。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 用户也可以根据实际情况设置主播和助播的声音。开播后可单击如图5所示的图标,切换到主播或者助播的声音,再发送互动内容,系统会使用所选声音播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,即切换多个背景及其展示的内容,可以单击右侧“场景”区域下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图7所示。 包含如下4类设置: 弹幕 用户入场 点赞 送礼 上面4类设置的操作基本相同,下面以弹幕为例,进行操作说明,详情参见表2。 用户也可以直接导入已有的互动库使用,如互动管理所示。 图7 互动设置 表2 弹幕设置说明 参数 配置说明 间隔时间 同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120秒,不能小于60秒。 添加互动 单击“添加互动”,界面下方新增一条语料,如图7所示。用户可以根据实际情况,添加多条语料。 第一行输入框中,需要输入触发关键词,如果有多个,请以“|”分隔。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前语料内容。 示例:链接|型号|优惠 第二行输入框中,需要输入相应的回复内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 单击界面右侧的“直播配置”页签,如图8所示。 直播配置说明,如表3所示。 图8 我的视频 表3 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 输出设置 直播画面 选择视频直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 支持直接设置播放的次数,也可以选择“无限循环”。 风控设置 主播轮换 如果视频场景存在多场景,支持开启主播轮换,最多支持选择5个主播,以实现每轮场景更换时,相应的更换主播形象。 须知: 前面操作过程中,各个场景均已设置了相应的主播,即原主播;如果这里开启了“主播轮换”,且选择了主播,即备主播;那么直播时,可能随机选择原主播和备主播进行播放。所以直播画面的主播不一定是这里设置的备主播。 随机播放 仅“播放次数”选择“无限循环”时展示此参数。 如果开启随机播放,支持设置“随机规则”,包含如下选项: 按场景随机:视频直播过程中,随机选取任一场景进行播放,且确保场景不重复播放。场景中的段落仍按顺序播放。 按段落随机:视频直播过程中,场景播放顺序不变,场景内的段落随机进行播放,且确保段落不重复播放。 场景和段落都随机:视频直播过程中,随机选取任一场景中的任一段落进行播放,且确保所有场景的各个段落不重复播放。 更多设置 直播间ID 无需设置,当前视频直播保存后展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备直播”,准备开播。 即兴直播方式,无需执行本步骤的下述子步骤。 弹出“风险提示”对话框,如图9所示。 用户需要参照风险提示项,逐一核查并优化视频直播内容。 图9 风险提示 用户可以等直播风险消除后,再开播,也可以选择“承担风险开播”。 在“直播窗口”对话框中,选择“竖屏”或“全屏”,如图10所示。 图10 直播窗口 单击“继续”,等待直播启动。 直播启动成功后,视频制作界面的直播画面区域,会展示直播启动的进度。 开播后的效果如图11所示。界面右下方的操作说明,如表4所示。 图11 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可以切换为助播声音。 用户设置的互动内容列表,单击选择后发送,数字人会播报。 请输入互动内容,回车发送内容 输入互动内容,并发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,停止视频直播。
  • 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 资源购买入口有两个,用户可以选择其中一种方式进行购买。 单击“购买资源”,进入“购买MetaStudio服务”页面,如图2所示。 单击服务列表中,具体产品分类右侧的“购买”,进入“购买MetaStudio服务”页面,如图2所示。 “产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的产品分类、计费模式和购买数量,单击“去购买”。 进入“规格详情”页面,如图3所示。 图3 规格详情 阅读并勾选“我已阅读并同意《MetaStudio服务使用声明》《华为云隐私政策声明》”后,单击“去支付”。 进入订单生成页面,如图4所示。 图4 订单生成页面 查看云服务订单,并选择付款方式,单击“确认付款”。 订单支付成功后,返回如图5所示的页面,说明资源购买成功。 图5 订单支付成功
  • 操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:分身数字人支持更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 如果勾选“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 视频封面(可选) 视频封面。支持jpg、jpeg和png格式。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 身份认证及授权数据上传 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,才能进行算法训练操作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。 操作步骤详情如下所示: 在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“更换视频”,上传更新后的视频。 数字人定制任务重新进入审核流程。
  • 操作步骤 登录MetaStudio控制台,如图1所示。 如果SP用户已为当前租户分配了可用的资源,租户无需再从服务列表中购买资源了。 图1 控制台页面 在左侧导航栏中,选择“资源管理”,进入“资源管理”页面,如图2所示。 用户可以看到每种资源,已分配的资源总量、可用剩余量、创建时间和到期时间。 图2 资源管理 在左侧导航栏中,选择“服务概览”,回到MetaStudio控制台主页面。 单击“前往MetaStudio”,进入MetaStudio工作台,可以参考用户指南手册,进行相关操作了。
  • 视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“我的视频”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区域名称 说明 1 视频素材区域 设置视频的场景,包括如下内容: 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。 角色:自动展示系统预置的分身数字人列表,用户可以直接使用已有的数字人去创作生成视频。如果预置的数字人不满足用户需求,单击“定制数字人”,可以定制自己需要的数字人形象。 背景:背景图片列表,可本地导入图片。支持更换背景图。 PPT:PPT文件列表,需要用户从本地导入后使用。 贴图:各类贴图列表,可本地导入素材。支持在当前画面基础上,增加贴图,丰富视频画面。 视频:各类无声音视频列表,可本地导入视频文件。支持添加为背景视频。 音乐:各类音乐列表,可本地导入音频文件。支持添加为背景音乐。 文本:用于在画布中添加文本。 2 画面布局区域 画布区域,可以预览视频制作的效果。 3 音频制作区域 视频的音频制作区域,支持选择下述1种方式生成音频。 文本驱动:通过输入文本的方式生成音频。文本支持插入停顿、调整语速,如果是多音字可选择正确的发音,还可以选择不同的声音,试听生成的音频效果。如果选择“文本驱动”的方式,支持开启字幕展示功能。 音频驱动:从本地上传音频文件,作为视频的语音。如果使用音频驱动,暂不支持生成字幕。 还可以设置音频的音量,和调整画布的横竖屏展示。 4 视频场景区域 如果一个视频包含多场景,可以通过服务定义的场景依次制作,顺序播放。 5 文件设置区域 从左往右依次为: 单击文件名称右侧的图标,可自定义视频草稿的名称。 单击图标,保存视频制作任务。 单击图标,弹出“视频制作任务中心”对话框,可以看到视频制作任务列表,及当前任务的合成进展。 单击“合成视频”,合成数字人视频。 父主题: 视频制作
  • 录制内容提交规范 表3 录音提交内容规范 声音类型 音频说明 音频命名 基础版 支持整段录制或按句录制,详细说明如•(推荐)方式一:整段录制、•方式二:按句录制和•方式三:使用自定义语料按句录制所示。 符合手机录制音频-表1中“音频命名”的要求。 进阶版 高品质 仅支持整段录制,详细说明如•(推荐)方式一:整段录制所示。 音频文件命名无要求,可自定义,示例:VoiceClone.wav。 (推荐)方式一:整段录制 所有语料录制成一个长音频WAV文件,每句之间需要有2~3秒的停顿。直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动进行文本识别。 方式二:使用预置语料按句录制 每个音频文件时长约10秒,不能超过15秒,否则会导致声音模型训练失败。 使用预置语料,创建声音制作任务的时候,必须选对声音标签。并将所有音频文件压缩成一个zip文件,示例如图1所示。系统会自动匹配预置文本。 图1 音频压缩文件示例 方式三:使用自定义语料按句录制 每个音频文件时长为5~15秒,不能超过15秒,否则会导致声音模型训练失败。 每个音频文件需要匹配一个文本txt文件,且音频内容必须与文本内容完全一致,示例如图2所示。系统会自动使用传入的文本匹配音频。 图2 音频压缩文件示例
  • 制作声音模型 准备好音频文件后,就可以上传至MetaStudio控制台,进行声音训练。详细操作如下所示: 创建声音制作任务 查看声音 声音模型制作耗时,如下所示: 基础版:约1~3个工作日。 进阶版:约1~3个工作日。 高品质:约5个工作日。 自定义声音应用方式,如下所示: 自定义声音生成后,会自动展示在MetaStudio控制台声音列表中,可用于分身数字人视频制作、视频直播或智能交互等场景中。 通过MetaStudio的API调用自定义声音。
  • 开始录音 表2 录音注意事项 录音事项 说明 话筒间距 调整与麦克风之间的距离,以一拳距离为宜。不宜离麦太近,防止喷麦或录入呼吸声。 录音内容 每句文案起始数字编号无需阅读。 示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。 音频格式 推荐使用无损音质格式保存音频文件,如WAV格式。 原始录音数据,需未经MP3等编码器编码,且为48kHz采样率、16bit编码和单声道。 录制风格 全程风格保持一致。如直播场景时,录制风格需接近日常直播效果。 发音吐字 发音吐字清晰、准确,音量适中。如果出现喷麦或嘶嘶声音,建议当前句子重新录制。 语速节奏 语速自然、平稳,切忌过快过慢、忽快忽慢。 音量适中 音量不能过小、过大、或忽大忽小,甚至削波爆音。峰值 RMS 在-9左右,无削波。 停顿断句 在标点或适当断句处自然停顿,需轻声换气。 如果录制一个长音频文件时,每句之间需要有2~3秒的停顿。 重音位置 重音位置要合理,避免错误的重音。 阅读发音 按顺序读,确保音字一致。避免漏字多字、发音错误、阅读不流畅等问题。如有这些问题,需整句重新录制。
  • 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,避免出现汽车鸣笛、他人说话、走动等杂声。 可使用“分贝仪”应用来测试录音环境的底噪,建议底噪低于0dB。 同一批录音必须使用同一套录制设备和环境。 建议使用对应版本预置的文案样例:文案样例(基础版)、文案样例(进阶版)、文案样例(高品质)。 支持自定义文案,单句文案长短需和样例相当。 每个音频文件时长为5~15秒,不能超过15秒,否则会导致声音模型训练失败。 不建议临场即兴发挥录制,避免出现较多嗯、啊的语气词,影响连贯性。 进阶版 高品质 专业录音棚+高保真MIC录制。
  • 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面,如图2所示。 图2 租户列表 单击租户名称右侧的“分配”,弹出“分配资源”对话框,如图3所示。 用户需要参考表1进行配置,如果需要分配多种资源类型,可单击右侧的图标,新增资源行。 图3 分配资源 表1 参数说明 参数 说明 请选择资源类型 从下拉框中选择已购买的资源类型。 示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2023-11-14。 请选择资源数量 设置资源数量,不能超过所选资源实例包含的个数。 示例:5。 请选择日期 选择当前租户使用已分配资源的有效截止日期,超出此日期后,资源自动释放回资源包中。SP用户可再次分配给租户使用。 单击“确定”。在“租户列表”页面,查看分配效果,如图4所示。 以506租户的“分身形象制作(个)”列为例,“5 / 5”中第一个5说明当前资源实例分配了5个分身形象制作资源给当前租户;第二个5的含义为当前租户还剩余5个分身形象制作资源可用。 图4 租户列表 如需收回当前租户的资源,可单击租户右侧的“查看详情”,进入“租户详情”页面,如图5所示。 在下方的“资源列表”中,可以找到已分配的“分身数字人形象制作”资源。 图5 租户详情 单击资源右侧的“回收”,弹出“回收资源”对话框,如图6所示。 可以看到资源名称、可回收量、分配时间和到期时间。 图6 回收资源 根据实际情况,设置本次需要回收的数量(示例:2),单击“确定”。界面右上角提示“回收成功”,租户未使用的这些资源将被收回。 在“租户详情”页面的“资源列表”中可以看到,“分身数字人形象制作”的总量和可用量均从5降至3了。 图7 租户详情
  • 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 单击左侧的“资源管理”,进入“资源管理”页面,如图2所示。 图2 资源管理 单击“分身数字人形象制作”右侧的“激活”,弹出“激活资源”对话框,如图3所示。 可以看到资源名称、总量、可激活数量和激活截止时间。可以自主设置激活资源的数量,无需一次性全部激活。 图3 激活资源 根据实际情况,设置本次需要激活的数量,单击“确定”。 界面右上角提示“激活成功”,激活成功。
  • 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。 图1 数字人定制任务 数字人模型训练耗时约10个小时左右。等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图2所示。 查看生成的分身数字人形象是否满足。用户可以在当前界面,执行下述操作。 单击右上角的“编辑”,为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户也可以单击“定制任务详情”页面左上方的“返回”,回到任务列表界面,通过任务列表右侧的“同意”或“驳回”实现数字人形象的验收操作。 图2 数字人定制任务 服务管理员会根据用户反馈的问题,重新优化数字人形象。 数字人定制任务,会重新进行模型训练。等待模型训练完成后,用户可以二次审验,继续4的操作,直至生成符合要求的分身数字人形象。 此时,在如下界面,可以看到新增的数字人形象卡片。 在MetaStudio控制台首页“最近项目”区域,“我的数字人”页签中查看。 在“我的创作”菜单页面的“分身形象”页签中查看,如图3所示。 图3 用户数据页面
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“直播任务管理”,进入如直播任务管理所示的页面。 可以看到用户创建的所有直播间的开播任务列表。如果同一个直播间,开播多次,则生成对应个数的开播任务。 可以查看任务ID、直播名称、封面、创建时间、开播时间、结束时间和当前的直播状态(直播中或直播结束)。 如果直播结束,可单击直播间任务右侧的“查看详情”,进入当前直播间,修改直播间内容,重新开播。 图1 直播任务管理
共100000条