华为云用户手册

  • 直播中断异常处理 为方便处理直播中断异常,推荐用户开启“直播中断通知”,详见直播配置。当直播异常中断时,可以收到站内消息、短信和邮件告警,里面有详细的中断原因和解决方案。 MetaStudio常见的异常中断场景和解决方案,如表4所示。 表4 异常中断解决方案 异常中断场景 解决方案 网络等问题 可配置MetaStudio异常重连,详见直播配置。 如果已开启“直播中断通知”,用户可根据接收到的信息进行处理,闭环问题,恢复直播。 直播时长即将到达“直播最长时长” 如果直播时长即将到达“直播最长时长”,系统会提前发送预警通知。用户需要在直播时长到达前,修改“直播最大时长”,避免直播中断。“直播最长时长”配置,详见直播配置。 租户资源不足 如果直播资源即将耗尽,系统会提前发送预警通知。用户需要在资源耗尽前,开通按需或者购买包周期资源,避免直播中断。
  • 直播配置 在 视频直播 制作界面,单击界面右侧的“直播配置”页签,如图10所示。 直播配置说明,如表2所示。 图10 我的视频 表2 直播配置 区域 参数 说明 开播设置 选择开播方式 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 包含如下2种开播方式: 从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 须知: 使用RTMP推流时,关闭控制台页面不等于结束直播任务,画面会持续生成并计费。如需结束直播画面,需手动单击结束直播或通过API下发结束命令。 直播平台的规定及相关政策请自行了解,部分平台可能限制虚拟内容直播。 输出设置 直播画面 选择直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 设置直播循环播放的次数,或“无限循环”。 用户在直播时,完成“播放次数”后,触发直播结束,但是如果直播配置页面配置了“直播最大时长”,且两者的时长不一致,则默认以两者最小值来结束直播。 默认播放1次。 直播窗口 直播窗口展示尺寸,不同方案均可调整为竖向。支持在当前界面直接开播,或在弹出的新窗口界面开播。 弹出新窗口开播时,包含如下选项: 竖屏 全屏:推荐用全屏,捕获的画面更大,需在直播伴侣中旋转使用。 默认为“竖屏”。 当前窗口直接开播时,包含如下选项: 默认:保持现有直播界面的布局。 旋转:可展开预览区域,展示画面更大,推荐使用这种方式。 旋转并默认展开:默认旋转展开,画面更大的方式。 更多设置 事件回调地址 可在直播中返回场景、段落事件的字段,适用于接口调用或客户二次开发使用的场景。 直播间ID 无需设置,当前直播间保存后自动展示。 单击界面右上角的图标,保存直播配置。
  • 开播 在视频直播制作界面右下角有“直播计费类型”,请根据实际情况选择按需或使用包周期资源进行开播。 默认勾选“加载完自动直播”,单击界面右下方的“准备开播”,加载完成后会自动开播。 如果使用即兴直播方式开播,单击“准备开播”后立即启动直播,即执行5。 文本驱动和音频驱动方式,还需确认风险提示后,才能启动直播,即执行3。 如果取消勾选“加载完自动直播”,开播后需在相同位置单击“开始直播”后才会启动直播。 文本驱动和音频驱动方式,界面会弹出“风险提示”对话框,如图11所示。 用户需要参照风险提示项,逐一核查并优化直播内容。 图11 风险提示 用户可以等直播风险消除后再开播,也可以直接选择“承担风险开播”,启动直播。 直播加载时,可以在直播预览窗口看到加载进度。 开播后的效果如图12所示。界面右下方的操作说明,如表3所示。 图12 开播页面 表3 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,关闭当前直播。 须知: 关闭直播窗口不会停止直播,需单击“停止”才能停止直播。还可通过设置循环次数和直播最大时长来触发自动结束,当两者时长不一致时,以两者最小值结束直播。
  • 互动设置 所有场景的画面布局和剧本设置完成后,可以进行互动设置。互动设置支持:弹幕、用户入场、点赞和送礼。 用户可以在互动管理中设置好互动库后来这里导入,也可以直接在这里设置互动规则。所有类型总计可添加100个互动规则。 这4类互动规则的添加操作基本相同,下面以弹幕为例,进行操作说明。 在视频直播制作界面,单击右侧的“互动设置”页签,如图8所示。 图8 互动设置 单击图8中的“添加规则”,展示如图9所示的界面。 图9 弹幕设置 界面下方新增1个规则设置。 先设置用户弹幕触发规则的关键词,如果有多个,请以“|”分隔,示例“链接|型号|优惠”。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前规则内容。 在下方选择主播或助播回复用户问题,回复内容支持通过下述2种方式设置。 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。 图片和视频的添加和设置方式完全相同,下面以图片为例,进行操作说明。 单击下方的“+”区域框,从本地选择图片或视频,添加到“+”区域框中。 添加成功后,区域框展示图片缩略图,如所示。 将鼠标放在区域框中,区域框变化为形式。 单击“预览”,图片被添加到直播画面预览窗口中,可根据实际情况拖动图片的展示位置或者调整图片大小。 单击“新增”,可参考互动设置-步骤2,添加更多的弹幕回复规则。 等所有弹幕规则增加完成后,支持单击“新增兜底”,新增新增一条兜底规则,设置方式与互动设置-步骤2相同。 其含义为:用户问题如果未匹配到已有规则,可触发兜底回复,仅支持设置1条兜底回复。 支持对已有规则,执行下述操作: 批量管理:支持批量设置所选规则使用的场景,或批量删除所选规则。 弹幕回显:开启“弹幕回显”后,在直播画面中可以看到一条文本信息:正在回复[用户名称]:[弹幕内容]。 全部启用:可以直接“全部启用”所有规则。 :设置单规则使用的场景。 :启用或关闭当前规则。 :删除规则。
  • 剧本驱动设置 视频直播画面创作完成后,可以设置直播剧本,支持文本驱动、音频驱动和即兴直播三种方式,用户可以任选其一进行操作。 方式一:文本驱动 通过文本驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 须知:单场景须不少于200字,单段落须不多于2000字。 图2 文本驱动 文本内容的操作说明如表1所示。 不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文字,设置多音字的正确读音。 须知: 这里设置的多音字,仅对当前视频剧本有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频剧本有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。也可以单击“音标搜索”,在词典中输入单词搜索,直接复制正确的音标到这里。 全局语速 设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。 助播 选中一段文字,设置为助播来播报这段内容。 主播 主播全局声音,适用于直播间所有场景。如果单场景有单独设置声音,优先使用单场景的声音播报。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考购买出门问问声音套餐进行操作。 助播 助播全局声音,适用于直播间所有场景。单场景不支持单独设置助播声音。 开播后的效果,如图3所示。如需进行互动,可单击图标,切换到助播声音。输入并发送互动内容,主播暂停播报,并使用助播声音插播发送成功的互动内容。 导入 支持从本地导入文本文件,解析生成段落内容。 导入文件需满足: 支持txt格式,且字数不低于200字。 文本内容根据换行,自动解析为段落。 试听 单击“试听”,可以试听当前直播间剧本。 默认使用全局主播声音播报,如果单场景有单独设置声音,优先使用单场景的声音播报。单独标注助播的内容,会使用全局助播的声音进行播报。 也可以单击段落区域的试听图标,试听当前段落。 场景操作 支持对场景,执行下述操作: :修改场景名称,默认值为“场景1” :设置当前场景播报的声音,直播时会优先使用此声音播报当前场景内容。 :复制当前场景,新增一个相同场景。 :删除当前场景。 :调整场景的位置。 :为当前场景新增1个空白段落。 段落操作 支持对段落,执行下述操作: :修改段落名称,默认值为“段落1.1”。 :试听当前段落的播报效果。 :复制当前段落,新增一个相同段落。 :删除段落。 :调整段落在场景中的位置。 :新增1个空白段落。 图3 开播界面 如需制作更多场景,在直播画面预览窗口右侧,单击“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一场景的画面布局和剧本内容。 图4 直播间界面 方式二:音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图5所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用于开播后,使用主播或助播声音,播报发送的互动内容。 图5 音频驱动 音频上传完成后,单击“试听”,可试听音频。 开播后可单击如图6所示的图标,切换到全局主播或助播的声音,发送互动内容成功后,播报互动内容。 图6 开播页面 方式三:即兴直播 无需设置剧本,直接开播,界面如图7所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图7 即兴直播
  • 创建直播间 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示。 参考配置视频直播素材,完成视频直播画面创作。 在左侧的素材区域,除了系统预置的视频素材外,角色还可以自定义定制;背景、贴图、视频还可以从本地导入;商品也可以自主创建;文本也可以自主设置格式。 从素材区域添加到预览窗口中的贴图、视频、数字人支持图层管理,如:上移一层、下移一层、置顶、置底、复制、应用到全局、删除等操作。还支持调整大小,拖动位置。
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址 MetaStudio服务调用第三方语言模型的API地址。 MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题,共计3个问题。其他数值的配置效果,以此类推。 对话内容合规审核 开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束 语音识别 。建议该值大于500ms。 委托语言交互服务(SIS) SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权。开启委托后,会弹出“选择委托站点”对话框,选择购买SIS服务的站点,单击“确定”即可。如果授权过程中出现报错信息“没有委托操作权限”,可能是当前 IAM 用户没有权限授权,需要参考开通委托报错如何处理?处理。 开启委托授权后,新增展示如下配置: 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图3 应用发布
  • 如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑界面右侧,选择“对话配置”页签,如图1所示。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 参数配置说明如下所示,其他配置请参见对话配置。 语言:支持同时添加中文和英文,并设置其中一种语言为默认语言。 在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 声音:单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,英文语言则选择对应的英文声音,否则数字人表达会有问题。 图1 对话配置 父主题: FAQ
  • 前提条件 已购买OBS桶,详见OBS计费说明。推荐购买“华北-北京四”区域的OBS桶。 已创建OBS桶,详见创建桶。 已创建OBS桶策略,详见自定义创建桶策略(JSON视图),请选择使用OBS控制台方式操作。 桶策略JSON格式内容,请按照对应MetaStudio服务所在Region依次替换内容。其中,“桶名”为桶名称,请替换为实际使用的OBS桶名称。 华东-上海一: { "Statement": [ { "Sid": "MetaStudioDialogReportPolicy-cn-east-3", "Effect": "Allow", "Principal": { "Federated": [ "domain/2dd0b7e1241f4d3f9ee4a766b2b51011:identity-provider/*" ] }, "Action": [ "PutObject" ], "Resource": [ "{桶名}", "{桶名}/*" ] } ] } 华北-北京四: { "Statement": [ { "Sid": "MetaStudioDialogReportPolicy-cn-north-4", "Effect": "Allow", "Principal": { "Federated": [ "domain/2dd0b7e1241f4d3f9ee4a766b2b51011:identity-provider/*" ] }, "Action": [ "PutObject" ], "Resource": [ "{桶名}", "{桶名}/*" ] } ] } 亚太-新加坡: { "Statement": [ { "Sid": "MetaStudioDialogReportPolicy-ap-southeast-3", "Effect": "Allow", "Principal": { "Federated": [ "domain/599cda24c4d342659708b76cd74ebef0:identity-provider/*" ] }, "Action": [ "PutObject" ], "Resource": [ "{桶名}", "{桶名}/*" ] } ] }
  • 我的资源(租户) 租户在“我的资源”区域,可以看到资源剩余量详情,如表1所示。也可以单击左侧导航栏中的“我的资源”,查看所有资源的剩余量列表详情。 如果计费项支持按需计费,可按需开通或关闭按需计费,详细操作如下所示: 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 按需计费开通后单击“关闭”,在弹出的“关闭按需计费服务提示”对话框中,单击“确定”,关闭按需计费。 表1 我的资源 资源分类 资源 说明 分身数字人 Flexus分身数字人 左下角展示用户已购买资源的剩余量。 仅Flexus视频制作支持开通或关闭按需计费,Flexus数字人形象制作和Flexus声音模型训练均不支持按需计费。 分身数字人形象制作 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 声音制作 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频制作 左下角展示用户已购买资源的剩余量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频制作支持开通或关闭按需计费。 分身数字人视频直播 左下角展示用户当前剩余可用的视频直播路数,即用户还可以并发开启的视频直播数量。 分身数字人视频直播支持开通或关闭按需计费。 分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数,即用户还可以并发开启的数字人交互对话数量。 分身数字人名片制作 左下角展示用户已购买资源的剩余量。 分身数字人名片制作支持开通或关闭按需计费。 照片数字人视频制作 左下角展示用户已购买资源的剩余量。 照片数字人视频制作支持开通或关闭按需计费。 声音合成 这里的声音合成,仅针对使用声音API调用,通过MetaStudio控制台声音制作方式生成的声音,来合成音频的费用。 声音合成支持开通或关闭按需计费。 如需查看声音合成的使用量,单击左下角的“已使用量”,跳转至费用中心的“流水和明细账单”页面,搜索查看声音合成的详细账单。 资产管理 资产管理 左下角展示资产存储空间的已使用量,单位:GB。 须知: 用户首次使用MetaStudio服务,会免费赠送5G的存储空间。 资源总量默认包含免费赠送的5G存储空间。 目前资产管理,在内侧 免费体验 中,所以存储空间可以为负数。内测体验到期后,会在Metastudio控制台进行公告提醒。 届时请及时对超出使用额度的资源进行清理或及时购买扩容存储空间,以免造成资源丢失。
  • 我的资源(SP用户) 租户在“我的资源”区域,可以看到资源剩余量和总量详情,如表2所示。 也可以单击左侧导航栏中“资源管理”,查看所有资源用量的详情列表。 按需计费开通后,不支持关闭,请谨慎评估后再开通。 表2 我的资源 资源分类 资源 说明 分身数字人 Flexus分身数字人 左下角展示用户已购买Flexus分身数字人的剩余量和总量。 单击图标,可以查看Flexus分身数字人和Fluxus视频制作剩余量的详情列表。 分身数字人形象制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 声音制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 分身数字人视频直播 左下角展示用户当前剩余可用的视频直播路数和已购买的总路数,即用户还可以并发开启的视频直播数量及总购买数量。 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。 分身数字人智能交互 左下角展示用户当前剩余可用的智能交互路数和已购买的总路数,即用户还可以并发开启的数字人交互对话数量及购买的总数量。 单击图标,可以查看剩余量详情的列表数据。 分身数字人名片制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 照片数字人视频制作 左下角展示用户已购买资源的剩余量和总量。单击图标,可以查看剩余量详情的列表数据。 如需开通按需计费,需单击“去开通”,在弹出的“开通按需计费服务提示”对话框中,勾选同意协议。单击“确定”,开通按需计费。
  • 服务介绍 界面最上方提供MetaStudio服务介绍和下述操作入口: 前往MetaStudio工作台:仅租户有此操作入口。单击此入口,可以进入MetaStudio工作台,进行声音制作、形象制作、视频制作、视频直播制作等操作。 购买资源:SP用户和租户均有此入口。单击“购买资源”,进入购买资源页面。可以选择当前区域、服务类型、产品分类、计费模式等信息,购买对应的资源。各类产品的计费说明,详见计费说明。 关联租户:仅SP用户有此入口。单击“关联租户”,进入“关联租户”信息配置界面。输入租户所在区域的项目ID和租户名称,租户名称支持自定义。单击“创建”,租户新增完成。
  • 操作步骤 使用SP用户登录MetaStudio控制台,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 单击“购买资源”,进入“购买MetaStudio服务”页面,如图2所示。 “产品分类”中高亮展示的是SP用户可购买的资源包类型,置灰展示的是未对SP用户开放的资源包类型。 图2 购买页面 SP用户根据实际情况,选择需要的服务类型、产品分类、计费模式和购买数量,单击“加入清单”,依次添加至右侧的“购买清单”中。 待购买清单全部添加完成后,单击“确认订单”,进入“规格详情”页面,如图3所示。 图3 规格详情 阅读并勾选“我已阅读并同意《MetaStudio服务使用声明》 《华为云隐私政策声明》”后,单击“去支付”,进入云服务订单页面,如图4所示。 图4 云服务订单页面 查看云服务订单,并选择付款方式,单击“确认付款”。 订单支付成功后,返回如图5所示的页面,说明资源购买成功。 图5 订单支付成功
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明如表1所示。 图1 创建应用 表1 创建应用 参数 说明 第三方应用 配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。 如果科大讯飞AIUI开放平台应用应用使用星火大模型,则从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与AIUI开放平台应用的“应用名称”保持一致。 APPID 与AIUI开放平台应用的“APPID”保持一致。 APPKEY 与AIUI开放平台应用的“APPKEY”保持一致。 APISECRET 与AIUI开放平台应用的“APISECRET”保持一致。 对接生产环境 对接科大讯飞现网的自然语言模型,具体以“第三方应用”配置的模型为准,可提升应用运行的稳定性。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图3 应用发布
  • 操作步骤 租户登录MetaStudio控制台,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,选择“我的资源”,进入“我的资源”页面。 选择“SP分配资源”页签,如图2所示。 用户可以看到SP分配的每种资源剩余量、总量、到期时间和计费模式等信息。 图2 资源管理 在左侧导航栏中,选择“服务概览”。 单击“前往MetaStudio”,进入MetaStudio工作台,可参考用户指南、API参考等手册,使用MetaStudio服务。
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频制作”下方的“开始创建”,进入视频制作界面。 选择形象,“文本驱动”输入文本内容,其他均可自定义。 图1 视频制作 单击开启字幕图标,开启字幕。 字幕开启后,可以在界面左侧对字幕的字体、颜色、字幕位置等做调整,详情如图2所示。 图2 字幕设置 单击“生成预览”,选择“当前场景”或“全部场景”,生成预览视频,可以查看视频播放时的字幕展示效果。 如果是“文本驱动”直接提取文本生成字幕内容。如果是“音频驱动”,会将音频转化为文本后,再生成字幕内容。 界面左侧的“字幕设置”区域,可以看到生成的字幕内容,支持单击“字幕编辑”,修改展示的字幕内容,如图3所示。 音频驱动”方式目前仅支持中文普通话的场景开启字幕。 图3 字幕设置 字幕展示内容修改完成后,单击“保存”即可。
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“直播配置”,进入如图1所示的页面。 参数配置说明,如表1所示。 图1 直播配置页面 表1 播放设置说明 参数 说明 直播最长时长 可以根据实际情况,勾选“不限时长”或者勾选设置具体的时长。 单位:小时。 用户在直播时,会通过“直播最大时长”触发直播结束,但是如果直播间同时设置了播放次数,且两者的时长不一致时,默认以两者最小值来结束直播。 异常重连 如果资源未耗尽而直播异常中断,平台将自动重连。如果勾选“不设置”,则默认取值为3分钟,即3分钟内多次重连失败,直播将自动停止。用户可勾选自定义重连时长,如果设置为0说明系统将无限重连,直至直播恢复。 单位:分钟。 直播中断通知 开启后,需前往“消息接收配置”界面配置接收人及其接收通知的方式,详见设置直播中断通知方式。 开启后,您将收到通过邮箱、短信和站内消息发送的直播中断通知,具体哪些途径可以收到消息,以用户实际配置的为准。 单击“保存”,租户直播配置设置完成。
  • 操作步骤 使用SP用户登录MetaStudio控制台,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面,如图2所示。 图2 租户列表 单击租户名称右侧的“分配”,弹出“分配资源”对话框,如图3所示。 用户需要参考表1进行配置,如果需要分配多种资源类型,可单击右侧的图标,新增资源行。 图3 分配资源 表1 参数说明 参数 说明 请选择资源类型 从下拉框中选择已购买的资源类型。 示例:分身数字人形象制作。 请选择资源实例 从下拉框中选择已购买的资源实例。 示例:分身数字人形象制作 - 2025-11-01。 请选择资源数量 设置资源数量,不能超过所选资源实例已激活的数量。 示例:2。 请选择日期 资源激活后,从激活日期开始计算,有效期是一年。这里选择的日期,为有效期内的时间。 这里配置的日期,为当前租户使用已分配资源的截止日期。到达此日期后,资源自动释放回原有资源包中,SP用户可再次分配给租户使用。 单击“确定”,界面右上角提示“分配资源成功”。 在“租户列表”页面,可以查看分配效果,如图4所示。 以001租户的“分身形象制作(个)”列为例进行说明,“2 / 2”中第一个2说明当前资源实例分配了2个分身形象制作资源给当前租户;第二个2的含义为当前租户还剩余2个分身形象制作资源可用。 图4 租户列表 如需收回当前租户的资源,可单击租户右侧的“查看详情”,进入“租户详情”页面,如图5所示。 在下方的“资源列表”中,可以找到已分配的“分身数字人形象制作”资源。 图5 租户详情 单击资源右侧的“回收”,弹出“回收资源”对话框,如图6所示。 可以看到资源名称、可回收量、分配时间和到期时间。 图6 回收资源 根据实际情况,设置本次需要回收的数量(示例:1),单击“确定”。界面右上角提示“回收成功”,租户未使用的这些资源将被收回。 在“租户详情”页面的“资源列表”中可以看到,“分身数字人形象制作”的总量和可用量均从2降至1了。 图7 租户详情
  • 操作步骤 使用SP用户登录MetaStudio控制台,进入MetaStudio服务概览页面,如图1所示。 图1 服务概览页面 在左侧导航栏中,单击“资源管理”,进入“资源管理”页面,如图2所示。 图2 资源管理 单击“分身数字人形象制作”右侧的“激活”,弹出“激活资源”对话框,如图3所示。 可以看到资源名称、总量、可激活数量和激活截止时间。可以自主设置激活数量,无需一次性全部激活。 图3 激活资源 根据实际情况,设置本次需要激活的数量,单击“确定”。 界面右上角提示“激活成功”,说明激活已成功。
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“直播任务管理”,进入如图1所示的页面。 可以看到用户创建的所有直播间的开播任务列表。如果同一个直播间,开播多次,则生成对应个数的开播任务。 可以查看任务ID、直播名称、封面、创建时间、开播时间、结束时间、计费模式、错误码、错误原因和当前的直播状态。 如果直播结束,可单击直播间任务右侧的“查看详情”,进入当前直播间,修改直播间内容,重新开播。 图1 直播任务管理
  • 数字人相关问题 数字人相关问题集合,如表1所示。 表1 数字人问题 序号 问题 答案 1 数字人支持换脸吗? 不支持。 2 数字人支持换衣服吗? 不支持。 3 数字人支持添加动作吗? 需要同时满足下述2个条件,才可以添加动作: 提交工单申请开通动作编排能力。 生成数字人的形象采集训练视频需要包含动作编排,详见动作编排定制采集指南。 目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。添加动作时需注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。 4 数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。 智能交互的主要功能是通过数字人与用户进行交互问答,也就是用户提问,数字人说出知识库返回的答案。数字人回答的内容,是由大模型或知识库返回的答案决定的。 6 数字人支持 TTS 和ASR吗? 已支持TTS(文本转语音),详见创建TTS异步任务。MetaStudio不提供ASR(语音转文本),用户如有ASR需求,可以查看 语音交互 服务或其他ASR服务。 图1 视频制作 父主题: FAQ
  • 用户如何举报平台违规内容? 如果用户看到MetaStudio平台,有发布下述违反法律法规的内容: 涉黄、涉赌、涉毒、涉诈、侵权内容 盗版游戏/软件/盗版视频 P2P类金融诈骗信息 彩票类信息 违规医院和药品类信息 无法正常访问或内容不含有任何实质信息 可第一时间拨打华为云电话、提交工单,或者直接在举报中心举报违规内容。我们收到用户反馈后,会立即响应处理,共同维护合法合规的安全环境。 父主题: FAQ
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频制作”下方的“开始创建”,进入视频制作界面。 选择预置形象“云歌-动作编排”,“文本驱动”输入文本内容,其他可自定义。 图1 视频制作 将鼠标放在需要插入动作的文字右侧,单击“插入动作”,弹出“插入动作”对话框,如图2所示。 用户可以自定义插入动作,也可以开启服务智能动作插入能力,对应的参数说明,如表1所示。 图2 插入动作 表1 参数说明 参数 说明 智能动作插入 是否开启智能动作插入。 如果开启,生成的视频会同时包含手工插入的动作和系统根据文本语义智能插入的动作。智能插入的动作支持配置时间间隔,详见“智能动作间隔”参数配置。 如果关闭,生成的视频中仅包含用户手工插入的动作。 智能动作间隔 仅开启“智能动作插入”时,展示此配置。 除了用户自己插入的动作外,服务随机插入的动作支持配置动作间隔,取值如下: 间隔2秒:智能插入的动作较频繁。 间隔4秒:智能插入的动作适中。 间隔6秒:智能插入的动作较少。 自定义:如果间隔时间选项如果不符合您的要求,可以自定义时间间隔。 选择需要插入的动作,如“打招呼”,单击“确定”,动作添加完成。 用户可以根据实际情况,手工插入更多的动作。 动作编排暂不支持预览。 图3 插入动作
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须保持竖直。支持MP4、MOV格式的视频。 背景替换 选择“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,会在1个工作日内完成审核。任务审核通过后,才能进行算法训练,会在3个工作日内训练完成并生成数字人。 图2 制作任务提交成功 用户可以通过单击“查看制作任务列表”,进入分身数字人定制任务列表页面,如图所示。 图3 任务列表 单击任务所在行对应“操作”列的“查看详情”,进入“定制任务详情”页面,如图4所示。 查看分身数字人定制任务审核进展,当前状态为“系统审核中”。数字人定制任务提交成功后,会在1个工作日内完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的对话框中,单击“确认”,数字人形象制作完成。
  • 操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”,进入视频制作界面,界面详情如图1所示。 图1 视频制作界面 在视频画面预览区域,设置角色、背景、贴图、视频等内容,详细操作请参见视频制作素材操作详情 。 视频画面制作完成后,再制作视频语音。 选择“文本驱动”的方式。在文本输入框中,输入文本内容,以生成音频,如图2所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图2 文本驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 图3 场景区域 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“视频合成设置”对话框。 参数说明如表1所示。 表1 参数说明 参数 说明 导出为 输入导出文件的名称。 格式 合成视频的格式,默认为MP4格式。 如果视频背景选择透明背景,还支持导出为MOV格式。但是MOV格式导出功能默认不开放,需提交工单申请使用权限后,才会展示出来。且合成MOV格式视频有如下限制: 文本驱动所有场景不超过1500字符。 音频驱动所有场景的音频总时长不超过5分钟。 导出的MOV视频,不支持在MetaStudio控制台查看,需导出至本地后,在支持的视频软件中查看。 分辨率 选择合适的视频分辨率。 画质增强 开启后将提升视频清晰度,但合成的时间会相应变长。 请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图4所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。合成视频默认为激活状态,可以单击“取消激活”,取消激活视频资产。 MOV格式视频不支持在线预览,需下载至本地,在支持的视频软件中查看。 图4 视频详情
  • 查看直播任务 用户创建的直播间会以列表的形式,展示在分身视频直播首页面的“直播任务管理”页签中。支持通过直播任务进入直播间,修改直播内容后,重新开播。 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“直播任务管理”,进入如图14所示的页面。 可以看到用户创建的所有直播间任务列表。支持单击直播间任务右侧的“查看详情”,进入当前直播间,修改直播间内容,或者重新开播。 图14 直播任务管理
  • 创建直播间 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图6所示。 图6 视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如图7所示。 图7 视频直播制作界面 在直播画面预览窗口,设置角色、背景、贴图、视频等内容,详见视频直播公共配置。 新增商品中新增的商品会自动展示在“商品”页签中,可直接使用。 直播画面创作完成后,需要制作剧本。 服务有预置文本,可直接使用,如图8所示。也可以根据实际场景自定义文本内容,并单击图标,新增段落。 图8 文本驱动 如还需制作更多场景,在直播画面预览窗口右侧,单击“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一场景的画面布局和剧本内容。 图9 直播间界面 所有场景的画面布局和剧本均设置完成后,单击界面右侧的“互动设置”页签,如图10所示。 图10 互动设置 单击“导入”,弹出“导入互动”对话框。 勾选需使用的互动库及互动规则,支持同时勾选多个互动库及其互动规则。 单击“确认”。 界面下方,成功导入互动库中的互动规则列表。 单击界面右侧的“直播配置”页签,如图11所示。 直播配置保持默认值即可,如需修改配置可参考视频直播。 图11 我的视频 单击界面右上角的图标,保存直播配置。 在视频直播制作界面右下角有“直播计费类型”,请根据实际情况选择按需或使用包周期资源进行开播。 单击界面右下方的“准备开播”,弹出“风险提示”对话框,如图12所示。 用户需要参照风险提示项,逐一核查并优化直播内容。 图12 风险提示 用户可以等直播风险消除后再开播,也可以直接选择“承担风险开播”,启动直播。 直播加载时,可以在直播预览窗口看到加载进度。 开播后的效果如图13所示。界面右下方的操作说明,如表3所示。 图13 开播页面 表3 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可切换为助播声音。 单击快捷图标,选择预置的互动内容发送播报。 请输入互动内容,回车发送内容 手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,关闭当前直播。 须知: 关闭直播窗口不会停止直播,需单击“停止”才能停止直播。还可通过设置循环次数和直播最大时长来触发自动结束,当两者时长不一致时,以两者最小值结束直播。
  • 新增互动库 分身视频直播首页面的“互动管理”页签,支持新增互动库,及其相应的互动规则。互动库可以直接在直播间中导入使用。 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图3所示的页面。 图3 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图4所示。 输入互动库的名称。 图4 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图5所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如表2所示。 图5 互动规则 表2 互动规则配置说明 参数 说明 类型 互动类型,选择“弹幕”。 互动名称(可选) 互动名称,示例:欢迎进入直播间。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 无需设置。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
  • 新增商品 分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,作为视频直播的素材。 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。 参数配置说明,如表1所示。 图2 创建商品 表1 商品配置说明 参数 说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
  • 功能特性 数字内容生产线Metastudio通过AI学习真人形象和声音,来生成数字人模型,相应功能为形象制作、声音制作和Flexus分身数字人。再将模型用于音视频内容的创作,相应功能为视频制作、视频直播和智能交互,主要是生成画面内容。也可以直接通过静态的人脸照片生成视频,对应功能为照片数字人。 功能详情,如表1所示。 表1 功能特性 功能名称 功能描述 形象制作 拍摄形象采集视频,建模生成数字人形象。 数字人形象可用于生成音视频内容,应用于视频制作、视频直播和智能交互。 须知: 制作好的数字人模型不支持下载或导出至本地。 数字人模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 数字人不支持换脸、换衣服。 如果形象训练视频包含动作编排,那么生成的数字人卡片会有标识,说明当前数字人支持添加动作。 Flexus分身数字人 分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 须知: Flexus版视频制作和标准版视频制作的资源相互独立,各自计费。 声音制作 录制真人声音,建模生成声音模型。 声音模型可为数字人配音,生成音视频内容,应用于视频制作、视频直播和智能交互,或生成数字人名片和照片数字人。 须知: 制作好的声音模型不支持下载或导出至本地。 声音模型不是通用模型,不与第三方服务兼容。用户在MetaStudio制作的模型,仅支持在本服务内使用。 视频制作 使用系统预置或自定义生成的数字人形象、声音,制作音视频内容。 制作的视频可应用于教学、培训等各类场景中。 视频直播 使用系统预置或自定义的数字人形象、声音,制作音视频直播内容。 可通过下述方式,在直播平台开播。 RTMP直推方式,即华为云MetaStudio直接把画面传输给第三方直播平台,需从直播平台获取推流地址。如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 智能交互 对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。 支持转移声音和模型资产给其他租户使用。 此功能暂未对外开放,如需使用,需提交工单申请。 支持删除资产。 数字人名片 支持为分身数字人制作形象名片。通过名片可以查看数字人形象和说话效果。 照片数字人 支持通过静态的人脸照片生成视频。 SP用户 MetaStudio支持SP模式,此模式对大客户开放,用于分销场景。SP用户支持购买大颗粒度资源包,并分配资源给关联租户使用。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全