云服务器内容精选

  • MetaStudio权限 默认情况下,新建的IAM用户没有任何权限,您需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 MetaStudio部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京四)对应的项目(cn-north-4)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于各服务之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。角色并不能满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要求。 策略:IAM最新提供的一种细粒度授权的能力,可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。 如表1所示,包括了MetaStudio的所有系统策略。 表1 MetaStudio系统权限 策略名称 描述 策略类别 策略内容 MetaStudio FullAccess MetaStudio管理员权限,拥有该权限的用户可以拥有MetaStudio支持的全部权限。 系统策略 MetaStudio FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。 系统策略 MetaStudio ReadOnlyAccess策略内容
  • MetaStudio FullAccess策略内容 { "Version": "1.1", "Statement": [ { "Action": [ "metastudio:*:*" ], "Effect": "Allow" } ] }
  • MetaStudio ReadOnlyAccess策略内容 { "Version": "1.1", "Statement": [ { "Action": [ "metastudio:*:show*" ], "Effect": "Allow" } ] }
  • 新闻播报风格文案(100句) 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变。 近日,关于互联网电视收费乱象的话题不断冲上热搜, 互联网电视平台套娃式的充会员看视频的模式让不少网友直呼太反感。 随着版权保护意识的加强,用户已经愿意以付费方式来收看影视内容, 可商家在收费之余却忽视了消费者的观看体验。 视频平台应该更多的向自身挖掘内容,而不是一味的向用户涨价。 无论哪方都需要多方面考量,结合多终端兼容的市场需要, 为人民带来更加丰富的资源,才能走得长远。 网络暴力是当前社会面临的一大问题。 在社交媒体上,人们可以随意发表言论, 但是也需要意识到这些言论所带来的后果。 预防和治理网络暴力是一个需要全社会共同关注和解决的庞大课题, 除了平台方需要倾注努力,还需监管部门、用户、媒体等多方主体的协作支持、共同参与。 在一场网络暴力事件中,用户可能是直接施暴者、直接或间接传播者,也可能是受害者。 用户应注重规范自身“文明上网”的行为习惯, 严守言论自由的义务边界,提高对于网络暴力行为的识别能力, 及时举报相关内容,学习了解有关平台防范网络暴力的功能机制, 做好自我防护,避免网络暴力再次发生。 近日,旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。 多方纷纷站出来为丫丫发声,盼望它早日归来。 从网友的评论中和声援中,感受到了华人的温度, 前路依然充满荆棘,但我们绝不放弃,永不退缩。 “熊猫外交”也增强了国家文化的生命力、创新力、凝聚力和传播力。 八月二十四日中午十二时,日本福岛第一核电站启动核污染水排海。 海洋是全人类赖以生存的蓝色家园, 不顾大众反对坚持将核污染水排海这一自私行为,会使海洋受到严峻挑战。 爱护海洋,是当今每个国家义不容辞的责任, 保护海洋就是守护我们共同家园,造福后代。 日本排污未经得大众同意,此行为必将受到严厉谴责, 海洋安全也将受到不可估量的破坏。 心软的神终于又拿起了拯救世人的手术刀, 天才眼科医生陶勇,医术高超的他,一天甚至可以做八十六台手术, 到现在为止,让一点五万患者重获光明。 他却被自己治愈的患者砍伤,无法再拿起手术刀。 可他忍着剧痛,日复一日做手部康复训练, 在每一日的痛苦哀嚎背后,是他想要重回手术台,救助更多患者的决心。 只要有烟火,黑暗终究被驱散, 终于,他花了三年时间,在那条看不清未来的路上,找到了光。 这位心软的神,又来缝缝补补这个世界了! 小男孩,今年七岁, 在前不久落幕的湖南省青少年锦标赛中,他一举拿下五金两银。 他说,梦想是长大后成为奥运冠军。 他的父母均是残障人士,全家生活困苦。 生活的艰辛,训练的困苦,他都没有退缩, 功夫不负有心人,他取得了亮眼的成绩, 他双眼炯炯有神,说长大后要成为奥运冠军! “五一”黄金周迎来旅游热潮, 无论是从游客出行距离,消费活跃度还是客流量来看, 今年的旅游热度均创下近年来的历史新高。 便利快捷的交通出行方式,让民众实现旅游自由, 多样化的旅游选择,满足各类民众的游玩需求, “五一”旅游热潮,无疑成为各地经济发展的有效“助推器”。 中国梦的本质是国家富强,民族振兴,人民幸福。 实现伟大梦想,必须进行伟大斗争、建设伟大工程、推进伟大事业。 青年兴则国家兴,青年强则国家强。 广大青年要勇做时代的弄潮儿, 在实现中国梦的实践中放飞青春梦想,在为人民利益的奋斗中书写人生华章。 三月二日,神舟十五号乘组进行了二次出舱活动, 在轨三个月取得多项阶段性成果。 自二零二一年神舟十二号载人飞行任务以来, 四个航天员乘组累计开展十次出舱活动,突破掌握了一系列关键技术, 目前出舱活动已成为在轨员的例行性工作, 后续将根据任务需要继续常态化开展。 第三十一届世界大学生运动会在成都隆重开幕,市民健康跑迎接大运会。 青春绽放势不可挡,青年力量如日中天。 各国青年健儿汇聚在成都大运会的舞台上, 用汗水浇灌最美好的梦想,用奋斗绘就最亮丽的底色,共赴一场盛大的“青春之约”。 同时也激励着我们树立远大理想,练就自身本领, 在人生的赛道上不懈奋斗,以青春的活力促进国家繁荣与民族复兴。 俗话说得好:读万卷书,不如行万里路。 “课本游”作为一种旅游新模式,不仅能丰富旅游内涵、提高旅游质量; 更能让孩子切身实地的感受到学习与实践的知行合一,提高学习兴趣与效率, 同时也能在他们心里埋下一颗文化传承的种子, 有助于我国优秀传统文化的弘扬与传播。 黑猩猩是与人类一样能够直立行走的动物, 喜欢集群生活,能使用简单工具,是已知仅次于人类的最聪慧的动物。 其行为和社会行为都更近似于人类,在人类学研究上具有重大意义。 从中国音乐家发布的数据来看,国内有超过四千万孩子学习钢琴。 占全球总数的百分之八十,且每年以百分之十的速度增长。 近日,中国探月航天形象太空兔正式对外公布名称, 中文名“兔星星”。 据悉,今年上半年,中国造船三大指标全面增长, 造船完工量,新接订单量,手持订单量,三大指标的国际市场份额均为全球第一。 二零二三年八月十五日,著名学术期刊《科学通报》刊发了最新研究成果, 中国科学家实现了从二氧化碳到糖的精准合成,人工合成糖迈出关键一步。 八月十五日,自然资源部发布《中国生态保护红线蓝皮书》, 这是我国首次以蓝皮书形式发布的生态保护红线成果。 蓝皮书表示,全国划定生态保护红线面积合计约三百一十九万平方公里, 涵盖我国全部三十五个生物多样性保护优先区域,百分之九十以上的典型生态系统类型。 九月四日,贵州茅台和瑞幸联名推出的“酱香拿铁”咖啡正式上线, 交警提示大家:为了安全,喝了含有酒精的饮品禁止开车。 今年第十一号台风“海葵”在今日早晨五点前后登陆福建省东山县沿海地区, 中心附近最大风力有八级(二十米/秒),中心最低气压为九百九十五百帕。 今日,福州全市中小学、幼儿园决定停课一天。 近期台风频发,希望大家一切安好! 父主题: 文案样例(进阶版)
  • 操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:分身数字人支持更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 如果勾选“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 视频封面(可选) 视频封面。支持jpg、jpeg和png格式。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 身份认证及授权数据上传 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。 数字人定制任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,才能进行算法训练操作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。 操作步骤详情如下所示: 在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“更换视频”,上传更新后的视频。 数字人定制任务重新进入审核流程。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域右下方的图标,切换视频的分辨率为横屏“16:9”或竖屏“9:16”。 画布制作完成后,需要制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间间隔,实现阅读的停顿。 多音字 如果文字存在多个发音,可选中文字,单击“多音字”,在弹出的提示框中,选择正确的发音。 局部语速 选中需要设置语速的文字段,设置局部语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 全局语速 设置全局语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 亲切女声 默认为“亲切女声”。 如需更换声音,可单击“亲切女声”,在弹出的对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考(可选)购买第三方声音。 试听 单击“试听”,可试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标,在视频中添加字幕。 仅文本驱动的方式,支持开启字幕功能。音频驱动方式,暂不支持。 图标 展示当前视频的分辨率。 图标 第一次单击可收起“文本驱动/视频驱动”板块的配置,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传,或直接拖拽本地音频文件至提示区域中,完成上传。单击图标,可试听音频效果。 图2 音频驱动 音频制作完成后,可单击“音量”,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景均设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入资产详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入视频编辑界面,更新视频内容,重新合成视频。 图5 我的视频
  • 在科大讯飞构建同名技能后,导入技能文件 执行本操作前,需要在科大讯飞平台完成账号注册操作。 访问科大讯飞的AIUI开放平台。 单击界面上方的“技能工作室”。进入“技能控制台”页面,如图7所示。 图7 技能控制台 单击“创建技能”,弹出如图8所示的对话框。 参数配置说明,如下所示: 技能名称:技能名称。必须与MetaStudio服务创建的技能一一对应,如6所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:需要与MetaStudio服务新能技能的“技能标识”一致,如6所示。 图8 创建技能 输入完成后,单击“创建”。 界面提示“创建成功”,并自动跳转至“意图”页面,如图9所示。 图9 意图页面 单击“批量操作”,从下拉框中选择“批量覆盖”,在弹出的确定对话框中,单击“确定覆盖”。 从本地选择MetaStudio服务中导出的技能文件,如10所示。界面提示“批量覆盖成功”,效果如图10所示。 图10 意图页面 单击界面右上方的“构建技能”,开始构建技能。 界面提示“构建成功”,说明技能构建成功。 在左侧导航栏中,单击“发布”。进入“发布”页面,如图11所示。 图11 发布页面 确认信息无误后,单击“发布上线”。 界面提示“发布成功”,说明技能发布完成。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。 参数配置说明,如表1所示。 图2 创建商品 表1 商品配置说明 参数 说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
  • 场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。 用户购买华为的对话机器人CBS服务,对接到智能交互服务,开发者基于SDK完成web界面开发。操作请参考创建智能交互数字人(华为云CBS)。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型。科大讯飞对接到智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(科大讯飞)。 还支持出门问问的奇妙问对接至智能交互服务,操作请参考。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作请参考创建智能交互数字人(二次开发场景)。 父主题: 智能交互
  • 操作步骤 登录MetaStudio控制台,如图1所示。 图1 控制台页面 在左侧导航栏中,选择“租户管理”,进入“租户列表”页面。 单击“关联租户”,进入“关联租户”页面,如图2所示。 参数说明如下所示: 租户id:请输入项目ID,获取方式如获取项目ID所示。租户的项目ID必须与SP用户申请成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。 租户取消成功后,租户未使用的资源将被收回。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。 图1 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图3所示。 输入互动库的名称。支持对互动库执行如下操作。 单击互动库右侧的,从下拉框中选择“重命名”,可以修改互动库的名称。 单击互动库右侧的,从下拉框中选择“复制”,可以复制当前互动库,生成一个新的互动库。 单击互动库右侧的,从下拉框中选择“删除”,删除当前互动库。 图2 互动库 图3 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“互动编辑”对话框,如图4所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如图4所示。 图4 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称 互动名称。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 支持选择下述一种方式设置回复内容。 文本回复:输入文本内容。当满足触发方式时,数字人会阅读文本内容。 音频回复:从本地上传录制好的音频文件。当满足触发方式时,自动播放音频文件。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
  • 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 请选择声音制作服务 系统提供如下声音制作服务,请选择一种声音制作服务。 基础版声音制作:仅需20条语料。音频格式为WAV文件。音频时长为3~10分钟,建议5分钟。 进阶版声音制作:仅需100条语料。音频格式为WAV文件。音频时长10~30分钟,建议15分钟。 高品质声音制作:需要500条语料。音频格式为WAV文件。音频时长1小时以上,建议1小时。仅支持录制成长音频,每句之间需要有2~3秒的停顿。 每种声音制作服务后面都会展示剩余次数,需要保证剩余次数充足。 其中,进阶版和高品质声音制作需要更多语料,训练时长更长,声音效果更佳。 定制声音名称 输入声音名称。 示例:欢快女声。 请选择声音性别 声音的性别,如下所示: 男生 女生 选择语言 声音的语言,包含如下选项: 中文 英文 选择声音标签 声音的标签,包含如下选项: 电商 新闻 营销 针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果按句录制方式(仅基础版和进阶版支持),且使用预置文案,必须选对标签。 请制作声音 制作声音的方式为: 语料上传:界面提供录音指导,需要按照指导,基础版录制20句音频,进阶版录制100句音频,高品质声音制作需要录制500句以上的音频。音频仅支持wav格式。建议整段录制生成一个长音频文件,直接上传,无需压缩,无需携带文案txt文件。 在线录音:需要用户在线录制,先单击“开始环境检测”。首次录制界面会弹出提示,需要允许使用您的麦克风。当界面显示“录制环境合格”时,单击下方的“开始录音”。界面会弹出提示,开始录音后,将不能更改前面设置的基础信息,单击“确定”。单击“开始录音”,启动录制。根据界面提示,录制20条或100条合格的语料音频即可。 高品质声音制作,不支持在线录音方式。 如果选择“语料上传”的方式,且未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景;如果选择“在线录音”的方式,服务会根据声音标签,生成其对应格式的音频文件,界面不展示音频文件格式,用户可不关注。 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。 如果用户确认无误,单击“确认提交”。 声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。 声音制作任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,启动声音制作。 图2 制作任务提交成功 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。 当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。
  • 示例流程 图1 给用户授权MetaStudio权限流程 创建用户组并授权 在IAM控制台创建用户组,并授予MetaStudio管理员权限“MetaStudio FullAccess”。 创建用户并加入用户组 在IAM控制台创建用户,并将其加入1中创建的用户组。 用户登录并验证权限 新创建的用户登录控制台,验证MetaStudio FullAccess的管理员权限。 在“服务列表”中选择数字内容生产线,进入服务主界面,单击“分身形象制作”,并参考《用户指南》手册,制作分身数字人。如果制作成功,说明MetaStudio FullAccess”已生效。
  • 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。 进入分身数字人直播首页面,如图1所示。 图1 分身视频直播首页面 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 界面详情如视频直播界面说明所示,对应操作说明如下所示: 除了系统预置的视频素材外,角色还可以自定义定制分身数字人,背景、贴图、视频还支持从本地导入使用。 从素材区域添加到视频直播区域中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 视频直播画面创作完成后,请根据实际情况,选择一种剧本驱动方式。 “剧本驱动”包含下述3种方式: 文本驱动 需要通过文本来驱动数字人说话。支持下述2种方式,增加文本内容。 直接在各个场景的段落框中输入文本内容。可单击图标,增加更多的场景或段落。 单击右上方的“导入”,从本地导入文本文件。文件必须为txt格式,字数不少于200字;如果多个段落,可通过换行来实现。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际一个段落需要满足至少200字,不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢? 图2 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 全局声音(主播) 全局声音为直播间中的数字人主播使用的声音。 有默认声音,用户也可以根据实际情况选择其他声音。 如果需要使用标注“第三方”的系统声音,请参考(可选)购买第三方声音进行操作。 直播女生(助播) 直播间的数字人为主播,这是助播的声音。 在开播后的界面,可以单击如图3所示的图标,切换到助播声音,再输入互动内容,通过助播声音播放互动内容。 试听 单击“试听”,可以试听当前所有场景下文字内容。 也可以单击具体段落区域的试听图标,试听当前段落的内容。 场景操作 支持对场景,执行下述操作: :设置主播声音。 :复制当前场景,新增一个相同场景。 :修改场景名称,默认值为“场景1”。 :删除当前场景。 :移动场景的位置。 :新增1个空白段落。 段落操作 支持对段落,执行下述操作: :使用主播声音播报当前段落内容。 :修改段落名称,默认值为“段落1.1”。 :复制当前段落,新增一个相同段落。 :删除当前段落。 :移动段落的位置。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 图4 音频驱动 音频上传完成后,单击“试听”,可试听音频。 用户也可以根据实际情况设置主播和助播的声音。开播后可单击如图5所示的图标,切换到主播或者助播的声音,再发送互动内容,系统会使用所选声音播报互动内容。 图5 开播页面 即兴直播 无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。 图6 即兴直播 如果还需要制作多场景,即切换多个背景及其展示的内容,可以单击右侧“场景”区域下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图7所示。 包含如下4类设置: 弹幕 用户入场 点赞 送礼 上面4类设置的操作基本相同,下面以弹幕为例,进行操作说明,详情参见表2。 用户也可以直接导入已有的互动库使用,如互动管理所示。 图7 互动设置 表2 弹幕设置说明 参数 配置说明 间隔时间 同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120秒,不能小于60秒。 添加互动 单击“添加互动”,界面下方新增一条语料,如图7所示。用户可以根据实际情况,添加多条语料。 第一行输入框中,需要输入触发关键词,如果有多个,请以“|”分隔。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前语料内容。 示例:链接|型号|优惠 第二行输入框中,需要输入相应的回复内容。 示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。 单击界面右侧的“直播配置”页签,如图8所示。 直播配置说明,如表3所示。 图8 我的视频 表3 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。 输出设置 直播画面 选择视频直播画面的清晰度。 包含如下选项: 流畅 高清 超清 默认值:高清。 播放次数 支持直接设置播放的次数,也可以选择“无限循环”。 风控设置 主播轮换 如果视频场景存在多场景,支持开启主播轮换,最多支持选择5个主播,以实现每轮场景更换时,相应的更换主播形象。 须知: 前面操作过程中,各个场景均已设置了相应的主播,即原主播;如果这里开启了“主播轮换”,且选择了主播,即备主播;那么直播时,可能随机选择原主播和备主播进行播放。所以直播画面的主播不一定是这里设置的备主播。 随机播放 仅“播放次数”选择“无限循环”时展示此参数。 如果开启随机播放,支持设置“随机规则”,包含如下选项: 按场景随机:视频直播过程中,随机选取任一场景进行播放,且确保场景不重复播放。场景中的段落仍按顺序播放。 按段落随机:视频直播过程中,场景播放顺序不变,场景内的段落随机进行播放,且确保段落不重复播放。 场景和段落都随机:视频直播过程中,随机选取任一场景中的任一段落进行播放,且确保所有场景的各个段落不重复播放。 更多设置 直播间ID 无需设置,当前视频直播保存后展示。 上述操作完成后,需要单击界面右上角的图标,保存直播内容。 单击界面右下方的“准备直播”,准备开播。 即兴直播方式,无需执行本步骤的下述子步骤。 弹出“风险提示”对话框,如图9所示。 用户需要参照风险提示项,逐一核查并优化视频直播内容。 图9 风险提示 用户可以等直播风险消除后,再开播,也可以选择“承担风险开播”。 在“直播窗口”对话框中,选择“竖屏”或“全屏”,如图10所示。 图10 直播窗口 单击“继续”,等待直播启动。 直播启动成功后,视频制作界面的直播画面区域,会展示直播启动的进度。 开播后的效果如图11所示。界面右下方的操作说明,如表4所示。 图11 开播页面 表4 界面说明 界面元素 说明 00:01:20 直播计时,当前已直播1分20秒。 切换互动内容播报的声音。默认为主播声音,可以切换为助播声音。 用户设置的互动内容列表,单击选择后发送,数字人会播报。 请输入互动内容,回车发送内容 输入互动内容,并发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。 真人接管 单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。 真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。 暂停 单击“暂停”,暂停播报。 单击“继续”,可恢复播报。 停止 单击“停止”,停止视频直播。
  • 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“任务中心”。 在“分身数字人”页签,单击数字人定制任务右侧的“查看详情”,进入“定制任务详情”页面。 审核通过后,任务状态变更为“算法训练中”,如图1所示。 图1 数字人定制任务 数字人模型训练耗时约10个小时左右。等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图2所示。 查看生成的分身数字人形象是否满足。用户可以在当前界面,执行下述操作。 单击右上角的“编辑”,为数字人添加标签。标签添加完成后,单击“保存”,保存修改。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。 输入“问题标题”、“问题描述”,并上传相应的附件,如更新后的绿幕视频文件等内容。如果存在多个问题,可以单击界面右上角的“添加问题”,增加多个问题描述。问题全部添加完成后,单击“确认”,等待服务管理员处理。 用户也可以单击“定制任务详情”页面左上方的“返回”,回到任务列表界面,通过任务列表右侧的“同意”或“驳回”实现数字人形象的验收操作。 图2 数字人定制任务 服务管理员会根据用户反馈的问题,重新优化数字人形象。 数字人定制任务,会重新进行模型训练。等待模型训练完成后,用户可以二次审验,继续4的操作,直至生成符合要求的分身数字人形象。 此时,在如下界面,可以看到新增的数字人形象卡片。 在MetaStudio控制台首页“最近项目”区域,“我的数字人”页签中查看。 在“我的创作”菜单页面的“分身形象”页签中查看,如图3所示。 图3 用户数据页面