媒体应用-华为云

媒体应用-方案概述:方案架构

方案架构该解决方案基于函数工作流 FunctionGraph、媒体处理 MPC，实现视频超分辨率转换。解决方案架构图如下：图1 方案架构图该解决方案会部署如下资源：创建两个对象存储服务 OBS桶，一个用于上传原始视频并触发函数工作流，一个用于存储超分辨率转换后的视频结果。在统一身份认证服务 IAM上创建一个委托，将账号Region内对象存储服务 OBS和媒体处理服务 MPC的操作权限委托给函数工作流 FunctionGraph。创建函数工作流 FunctionGraph，用于实现视频超分辨率转换。当对象存储服务 OBS桶收到上传视频后，会自动调用函数服务转换视频超分辨率，并将结果存放到指定的对象存储服务 OBS桶。使用媒体处理 MPC，由函数工作流调用其新建转码接口创建转码任务，实现对原视频分辨率的转换。

媒体应用

媒体应用-准备工作:创建rf_admin_trust委托（可选）

创建rf_admin_trust委托（可选）进入华为云官网，打开控制台管理界面，鼠标移动至个人账号处，打开“统一身份认证”菜单。图1 控制台管理界面图2 统一身份认证菜单进入“委托”菜单，搜索“rf_admin_trust”委托。图3 委托列表如果委托存在，则不用执行接下来的创建委托的步骤如果委托不存在时执行接下来的步骤创建委托单击步骤2界面中的“创建委托”按钮，在委托名称中输入“rf_admin_trust”，委托类型选择“云服务”，选择“RFS”，单击“下一步”。图4 创建委托在搜索框中输入“Tenant Administrator”权限，并勾选搜索结果，单击“下一步”。图5 选择策略选择“所有资源”，并单击“下一步”完成配置。图6 设置授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功。图7 委托列表

媒体应用实施步骤

媒体应用-准备工作:给rf_admin_trust委托添加IAM Agency Management FullAccess策略（可选）

给rf_admin_trust委托添加IAM Agency Management FullAccess策略（可选）打开“统一身份认证”菜单图12 统一身份认证菜单进入“委托”菜单，选择rf_admin_trust委托图13 委托列表进入“授权记录”菜单，单击“授权”按钮图14 授权记录在搜索框输入IAM Agency Management FullAccess，勾选过滤出来的记录，单击下一步，并确认完成权限的配置图15 配置IAM Agency Management FullAccess策略配置好后的情况：rf_admin_trust委托拥有Tenant Administrator和IAM Agency Management FullAccess权限图16 授权记录列表

媒体应用实施步骤

媒体应用-准备工作:创建rf_admin_trust委托（可选）

创建rf_admin_trust委托（可选）进入华为云官网，打开控制台管理界面，鼠标移动至个人账号处，打开“统一身份认证”菜单图1 控制台管理界面图2 统一身份认证菜单进入“委托”菜单，搜索“rf_admin_trust”委托图3 委托列表如果委托存在，则不用执行接下来的创建委托的步骤如果委托不存在时执行接下来的步骤创建委托单击步骤2界面中的“创建委托”按钮，在委托名称中输入“rf_admin_trust”，委托类型选择“云服务”，输入“RFS”，单击“下一步” 图4 创建委托在搜索框中输入”Tenant Administrator”并勾选搜索结果，单击“下一步”。图5 选择策略选择“所有资源”，并单击下一步完成配置图6 设置授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功图7 委托列表

媒体应用实施步骤

媒体应用-准备工作:给rf_admin_trust委托添加IAM Agency Management FullAcces权限（可选）

给rf_admin_trust委托添加IAM Agency Management FullAcces权限（可选）打开“统一身份认证”菜单图12 统一身份认证菜单进入“委托”菜单，选择rf_admin_trust委托图13 委托列表进入“授权记录”菜单，单击“授权”按钮图14 授权记录在搜索框输入IAM Agency Management FullAcces，勾选过滤出来的记录，单击下一步，并确认完成权限的配置图15 配置IAM Agency Management FullAcces策略配置好后的情况：rf_admin_trust委托拥有Tenant Administrator和IAM Agency Management FullAccess权限图16 授权记录列表

媒体应用实施步骤

媒体应用-方案概述:方案架构

方案架构该解决方案基于华为云函数工作流 FunctionGraph、对象存储服务 OBS资源一键式部署，帮用户快速抽取视频中关键帧、场景转换帧。解决方案架构图如下：图1 方案架构图部署该方案中需要使用的资源：创建两个对象存储服务 OBS桶，一个用于上传视频触发函数工作流，一个用于存储视频抽取生成的关键帧、场景转换帧图片数据。函数工作流 FunctionGraph，用于调用对象存储服务 OBS的SDK相关接口和实现视频关键帧、场景转换帧的抽取，并将抽取结果上传至指定的目标OBS桶。通过统一身份认证服务 IAM的委托功能，将账号Region内对象存储服务 OBS的操作权限委托给函数工作流服务 FunctionGraph。

媒体应用

媒体应用-方案概述:方案架构

方案架构该解决方案基于华为云函数工作流 FunctionGraph、对象存储服务 OBS资源一键式部署，帮用户快速实现视频转GIF动图。解决方案架构图如下：图1 方案架构图部署该方案中需要使用的资源：创建两个对象存储服务 OBS桶，一个用于上传视频触发函数工作流，一个用于存储视频转GIF动图文件。函数工作流 FunctionGraph，用于调用媒体处理 MPC云服务的相关接口，实现视频转GIF动图功能，并将视频对应的GIF上传至指定的目标OBS桶。使用媒体处理 MPC云服务，由函数工作流调用其新建转动图相关接口创建任务，实现对原视频转换GIF。通过统一身份认证服务 IAM的委托功能，将账号Region内对象存储服务 OBS的操作权限委托给函数工作流服务 FunctionGraph。

媒体应用

媒体应用-快速部署

快速部署本章节主要帮助用户快速部署“视频转GIF动图”解决方案。表1 参数说明参数名称类型是否可选参数解释默认值 functiongraph_name string 必填函数工作流 FunctionGraph名称，不支持重名。取值范围：长度为2-57个字符，可包含字母、数字、_（下划线）和-（中划线），以字母开头。 converting-video-to-gif-demo video_input_bucket string 必填视频输入OBS桶名称，全局唯一。取值范围：1~63个字符，以小写字母或数字开头，仅支持小写字母、数字、中划线（-）。空 gif_output_bucket string 必填 GIF动图输出OBS桶名称，全局唯一。取值范围：1~63个字符，以小写字母或数字开头，仅支持小写字母、数字、中划线（-）。空 gif_frame_rate string 必填动图帧率。取值范围：1~75区间中的整数。 15 gif_width string 必填动图的宽。取值范围：0，-1或[32,3840]之间2的倍数。如设置为0，则取原始视频的宽，此时gif_height只能取0。如设置为-1，则宽根据高来自适应，此时变量gif_height不能取-1或0。 0 gif_height string 必填动图的高。取值范围：0，-1或[32,2160]之间2的倍数。如设置为0，则取原始视频的高，此时gif_width只能取0。如设置为-1，则高根据宽来自适应，此时变量gif_width不能取-1或0。 0 gif_start_time string 必填源视频中需要截取GIF的开始时间。取值范围：大于等于0的整数。单位：秒。注意：开始时间不能超过视频时长，超过视频时长则不生成gif。 0 gif_end_time string 必填源视频中需要截取GIF的结束时间。取值范围：大于0的整数。单位：秒。注意：（1、结束时间不能超过视频时长，如超过视频时长，在视频中截取GIF的结束时间为视频时长。2、GIF时长最大为60秒，即截取GIF的结束时间和开始时间最大差值60秒。）。 30 登录华为云解决方案实践，选择“视频转GIF动图”，单击“一键部署”，跳转至解决方案创建资源栈界面。图1 解决方案实施库在选择模板界面中，单击“下一步”。图2 选择模板在配置参数界面中，参考表1完成自定义参数填写，单击“下一步”。图3 配置参数在资源设置界面中，在权限委托下拉框中选择“rf_admin_trust”委托（可不选），单击“下一步”。图4 资源栈设置在配置确认界面中，单击“创建执行计划”。图5 配置确认在弹出的创建执行计划框中，自定义填写执行计划名称，单击“确定”。图6 创建执行计划单击“部署”，并且在弹出的执行计划确认框中单击“执行”。图7 执行计划图8 执行计划确认待“事件”中出现“Apply required resource success”，表示该解决方案已经部署完成。图9 部署完成父主题：实施步骤

媒体应用

媒体应用-准备工作:创建rf_admin_trust委托（可选）

创建rf_admin_trust委托（可选）进入华为云官网，打开控制台管理界面，鼠标移动至个人账号处，打开“统一身份认证”菜单图1 控制台管理界面图2 统一身份认证菜单进入“委托”菜单，搜索“rf_admin_trust”委托图3 委托列表如果委托存在，则不用执行接下来的创建委托的步骤如果委托不存在时执行接下来的步骤创建委托单击步骤2界面中的“创建委托”按钮，在委托名称中输入“rf_admin_trust”，委托类型选择“云服务”，输入“RFS”，单击“下一步” 图4 创建委托在搜索框中输入”Tenant Administrator”并勾选搜索结果，单击“下一步”。图5 选择策略选择“所有资源”，并单击下一步完成配置图6 设置授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功图7 委托列表

媒体应用实施步骤

媒体应用-准备工作:给rf_admin_trust委托添加IAM Agency Management FullAcces权限（可选）

给rf_admin_trust委托添加IAM Agency Management FullAcces权限（可选）打开“统一身份认证”菜单图12 统一身份认证菜单进入“委托”菜单，选择rf_admin_trust委托图13 委托列表进入“授权记录”菜单，单击“授权”按钮图14 授权记录在搜索框输入IAM Agency Management FullAcces，勾选过滤出来的记录，单击下一步，并确认完成权限的配置图15 配置IAM Agency Management FullAcces策略配置好后的情况：rf_admin_trust委托拥有Tenant Administrator和IAM Agency Management FullAccess权限图16 授权记录列表

媒体应用实施步骤

媒体应用-方案概述:应用场景

应用场景目前数字人已经广泛应用在众多行业的各类业务场景中，典型的行业客户及应用场景包括如下：银行：数字经理、理财视频、在线服务、直播营销、迎宾大屏、展示大屏、智能机柜、学习服务等。保险：计划书播报、保全服务、直播营销、客服咨询、代理人形象打造、内部服务等。基金：产品介绍、基金经理和销售人员克隆、直播营销、在线服务、内部服务等。党政：政策宣传、在线服务、党史学习、迎宾指导大屏等。广电：主持人克隆、新闻播报、活动发布、天气预报、内部服务等。教培：校园介绍、名师克隆、课件制作、展馆名人复刻、招生宣传、学习服务平台、健康校园打造等。文旅：景点介绍视频、直播宣传、线上咨询服务、线下服务大屏等。电商直播：店主克隆、产品介绍视频、直播带货、客服服务等。展示：历史人物克隆、重量嘉宾克隆、展示活动宣传、产品介绍视频、直播播报等。

媒体应用

媒体应用-方案概述:方案优势

方案优势市场侧竞争力较好的品牌知名度：华为云在虚拟数字人领域经过持续的投入，已经积累了较好的品牌知名度，同时作为合作伙伴的硅基智能在行业里也有较好的品牌知名度。很好的客户需求匹配度：硅基智能多模态仿真数字人解决方案包含的内容完整同时可以模块化单独部署，可以很好匹配客户各类应用场景的需要，包括部分客户分阶段规划分阶段部署的需要考虑。良好的服务支撑能力：华为云联合服务商合作伙伴硅基智能，具有全面的服务支撑能力，包括售前的咨询、方案的制定以、售后的部署、售后的运维运营支持等内容。技术侧竞争力交互能力先进：支持高还原度仿真数字人形象克隆、动作拟合、声音克隆与合成(TTSA)、支持语音与音乐合成(STA，AI歌唱)等多项仿真数字人核心技术；支持DUIX平台人机对话交互，以及2D卡通形象阿凡达模式数字人等特色功能。产品能力强：完善的数字人视频制作、数字人直播、数字人AI交互系统，并支持数字人和真人同屏交互，支持手机APP、H5、直播、大屏、电视、投影、全息等展示方式；支持全面SAAS服务，根据客户需要，按时长和并发数计费，弹性低门槛。实施效率高：快速定制数字人形象和进行语音克隆，最少仅需5分钟真人视频，甚至1张真人照片即可训练，语音克隆仅需2-3小时录音采样；最快一周即可完成形象和语音训练，投入商用。云服务竞争力灵活弹性的高性能云服务器：部署HPC头节点和工作节点，提供H1、H2计算增强型、M2内存优化型的ECS计算实例，该计算实例类型是H系列和M系列针对HPC业务的增强型实例，承载该实例的物理服务器提供最为强劲的计算能力。H2类型云服务器会挂载本地NVMe PCIe SSD，最大提供3.2T容量、300K IOPS、3000MBps带宽的存储能力。优良性能的裸金属服务器：按照专属物理服务器方式提供优良的计算性能，采用2路18核服务器，无虚拟化损耗，具备最佳的性能优势，用户可通过管理控制台实现裸金属服务器的自动化发放，满足HPC业务按需灵活弹性的需求。 Lustre高性能并行文件系统：使用经过优化的专用ECS、EVS规格部署Lustre文件系统，单OSS可提供最大4.5GBps吞吐量，最大提供2Tbps吞吐量，单文件支持最大32PB满足HPC的文件系统性能要求。分布式可扩展的块存储服务：基于分布式架构提供的可弹性扩展的块存储服务，每个弹性云服务器可按需挂载云硬盘，为HPC计算节点和存储节点提供存储空间，单盘最大支持32TB容量、30K IOPS、1Tbps吞吐量。优良性能的VPC网络：为HPC用户在公有云上构建安全隔离的虚拟网络环境，HPC计算网络通过RDMA EDR Infiniband 网络互连，节点间最低延时90ns，单节点最大带宽100Gbps，为用户提供高带宽的网络环境。海量的对象存储服务：基于对象的海量存储服务，为HPC应用提供存储空间，存储HPC算例数据结果数据，用户可通过对象存储服务灵活的上传、下载HPC计算数据。

媒体应用

媒体应用-硅基数字人形象克隆:具体过程介绍如下

具体过程介绍如下基础必读定制数字人需要拍摄一段3-5分钟的真人出镜口播视频，经过AI训练后可以得到一比一还原的数字人形象。具体出镜姿势、口播内容，可以根据最终的使用场景来确定，如后期用来制作财经知识视频，即可选择正装出镜，口播财经内容，这样整体情景比较一致。定制好的数字人口型可以根据文字、录音内容自动匹配。拍摄前(根据自己需要决定拍绿幕还是实景) 绿幕布景绿幕布景：绿幕拍摄后期可以自定义更换其它背景，拍摄时绿幕需要铺满整个画面，尽量不要有褶皱、阴影，否则会影响抠图效果，请务必得到满意布景后再开始拍摄。发型佩饰：避免佩戴会晃动的耳坠，耳坠晃动会影响口型学习，可佩戴固定耳钉。避免碎发太多，容易导致绿幕扣不干净，如果是实景拍摄则不受影响。衣服颜色：使用绿幕背景拍摄视频时，请不要穿搭绿幕相近色(如黄色、绿色)的衣服，以免影响抠图效果。实景布景实景布景：实景拍摄后期无法更换其它背景，拍摄时无特殊要求，请务必得到满意布景后再开始拍摄。灯光：均匀打光的光源，推荐使用"三点式打光"，如果想要下巴区域无阴影，推荐使用反光板、泡沫板(俗称"米菠萝”)来补光。相机拍摄参数设置(推荐) 视频分辨率尽量4K(3840*2160)，最低1080P(1920*1080) 视频尺寸为9:16或16:9，请根据自己的使用场景选择横屏或竖屏拍摄视频帧率：30帧或60帧镜头焦段：推荐50mm镜头(等效全画幅相机焦距)左右，想要脸瘦一点用85mm 镜头光圈：如拍摄绿幕，则光圈不宜太大如拍摄实景且想要虚化背景，建议根据实际情况调整光圈，保证人物主体清晰且背景虚化如使用手机拍摄，请选择最高画质(1080P以上)进行拍摄，苹果手机请选择“兼容性最佳”格式拍摄拍摄时(视频时长控制在5分钟以内) 拍摄步骤先保持静默10秒左右，闭口不要漏牙齿；正常口播3-4分钟，可以有自然的手势动作，但动作不要靠近脖子、嘴巴、面部区域；具体出镜姿势、口播内容，可以根据最终的使用场景来确定，如后期用来制作财经知识视频，即可选择正装出镜，口播财经内容，这样整体情景比较一致。实景拍摄到此即可，最终导出一段完整的视频即可；绿幕拍摄需要在口播之后，人物需要走出画面并将桌椅等前景道具搬离画面，仅保留绿幕继续拍摄10秒左右空镜头。注意事项眼神：注视镜头且录制连贯，有提词设备为佳收音：保持环境安静，无背景音及他人说话，有收音设备为佳说话时需吐字清晰，不能纯念数字1234 手势动作：不要出现在面部、嘴巴、脖子周边附近拍摄后(美颜处理) 视频拍摄完成后直接导出一整条视频，不要剪辑，否则训练出来的数字人模型会跳帧! 素材建议导出4k 25/30p，最低1080P 由于相机直出素材动态范围更大，细节保留更多，建议完成调色美颜后，再进行数字人训练定制数字人仅口型区域由AI生成，其他的头部动作(比如眨眼)、身体动作(比如手势)、美颜效果等都是保留录制时的样子，即根据所拍视频就可以预览数字人效果。

媒体应用

媒体应用-硅基数字人形象克隆:实施步骤介绍

实施步骤介绍真人模特选择：根据业务的具体需要，客户选择好数字人真人模特，可以是客户的营销、服务或者相关的主管领导的形象。绿幕视频录制：在数字人真人模特选好之后，根据业务需要及录制指导，录制2到5分钟的绿幕视频，并把录好的视频给到硅基。数字人模型训练：基于上面录好的绿幕视频，硅基基于训练平台加以专业的服务完成对模型训练，并发给客户进行确认。数字人模型绑定：上面训练好的数字人模型可以用于视频制作、直播或交互，根据客户的需要硅基把形象绑到相应的应用。

媒体应用

媒体应用-硅基数字人视频制作:具体过程介绍如下

具体过程介绍如下首先进入视频编辑页面，如下图：图2 视频编辑页面单击页面左上方“”按钮，可修改作品名称，如下图：图3 修改作品名称单击“”按钮，可查看当前可用合成时长余额，选择充值可以进行视频合成时长充值，如下图：图4 充值1 图5 充值2 单击“”按钮，可以复制当前编辑视频至新的操作界面进行编辑，如下图：图6 编辑单击“”按钮，可以保存当前设置，如下图图7 保存当前设置单击“”可切换视频横屏/竖屏展示，单击按钮，可撤销操作，如下图：图8 可撤销操作单击“”可以扩大或者缩小页面比例，如下图：图9 扩大或缩小比例单击“模板”，可选择切换不同的视频模板，如下图：图10 切换不同的视频模板单击“模特”可选择不同的模特，如下图：图11 可选择不同的模特选择好模特后，单击模特图层，可进行调整大小，移动位置等操作，如下图：图12 调整单击“添加”，可新增空白场景，选中场景单击场景上“”按钮，可复制当前场景，单击“”按钮可删除当前场景。如下图：图13 添加也可上传PPT或Word文档，作为视频场景或画中画，一键合成视频，PPT/Word即转化成视频，快捷又高效。如下面两图（PPT和WORD）：图14 上传PPT或Word文档1 图15 上传PPT或Word文档2 PPT、Word场景如下图所示，自动识别PPT、Word中讲解内容图16 上传PPT或Word文档2 场景设置完成后，接下来进行讲解内容设置。可在“讲解内容”栏输入需要讲解的内容，设置语音。可选择AI合成/上传录音两种方式，确定好音色，语速、音量及语调默认，也可根据需要手动调整；“应用到全局”可将调整好的音色应用到该视频下所有场景中。“我的”可选用用户在声音市场制作的音频文件。如下图：图17 内容设置也可单击“链接转剧本”，支持输入快手、小红书、美拍、微视、微博等平台链接，提取文本或录音；或者单击“视频转剧本”，支持导入本地视频提取文图18 提取文试听该语音，将鼠标置于需要插入停顿的文字后，单击插入停顿时长，可插入停顿，鼠标右击可设置该文本读音，如下图：图19 文本读音接下来进行字幕设置，点开“”按钮，可插入视频字幕，双击可设置字幕字体、颜色、间距等属性。如下图：图20 字幕设置上传录音：选择语音--上传录音，可从本地选择录音进行上传，如下图：图21 上传录音上传成功后，单击左下方“”按钮，可试听该语音，单击“重新上传”，可重新上传语音，如下图：图22 试听语音单击第三轨道“”，会自动解析添加字幕，如下图：图23 解析添加字幕解析成功后，选中下方字幕进度条，双击可修改字幕，如下图：图24 修改字幕拖动字幕条，可修改字幕长度，添加新字幕，如下图：图25 添加新字幕双击页面字幕框，或者单击右侧“字幕”可打开设置字幕属性，可设置字体、颜色、粗心、间距等属性，如下图：图26 字幕属性页面右侧素材库中，“我的素材”可从本地上传图片、背景、视频、音乐等至我的素材中，插入到视频；也可使用系统提供的背景、图片、音乐、视频等素材一键替换视频背景，插入图片、音乐、视频等；“文本”中可输入文本插入视频中；选择添加字幕样式，设置字幕间距；设置该场景停留时长。在视频展示区选中该图层，可灵活拖动图层位置、大小，设置图层位置，查看及删除图层等操作。如下图：图27 素材库所有场景设置完成后，单击“合成”按钮，即可进行视频合成。如下图：图28 视频合成

媒体应用

云服务器内容精选

媒体应用

7*24

备案

专业服务

退订

建议反馈

售前咨询热线