云服务器内容精选
-
配置应用 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图3 应用配置页面 配置“自然语言模型”,保持默认值“AIUI通用语义模型”。 单击“管理技能配置”,弹出“配置应用需要的技能”对话框,如图4所示。 在“自定义”区域,找到创建的技能,需要依次完成如下操作: 开启卡片区域右上角的开关。 单击卡片区域右下角的开关,在弹出的“技能设置”对话框中选择需要使用的技能版本。 此时,应用已具备基础的对话能力,可以回答已配置的语料内容。 图4 配置应用需要的技能 单击右上方的“保存配置”。界面提示“保存成功”,回到“应用配置”页面。 单击界面右上方的“保存修改”。界面提示“保存成功”,说明应用配置完成。
-
(可选)新增English情景模式 前面的所有操作,都是main情景模式下的配置,如果配置对话时,语言选择“中文”,则main情景模式下的配置生效。 如果配置对话时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 操作步骤,如下所示: 在界面上方的主菜单中,单击“我的应用”。 单击新增应用所在行的图标,进入“应用配置”页面。 图16 应用配置页面 单击“情景模式”右侧的“+”图标,弹出“新增情景模式”对话框。 一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 参数配置说明,如下所示: 情景模式名称:必须配置为“English”。 保持“语音语义”不变。 图17 新增情景模式 单击“确定”,English情景模式新增成功。 界面参数配置说明,如下所示: 语音识别:从下拉框中选择“通用-英文-进场”。 自然语言模型:保持默认值“AIUI通用语义模型”。 管理技能配置:English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能,相应操作请参考配置应用需要的技能。 (可选)开启闲聊技能:可选能力,操作请参考(可选)开启闲聊功能。 模拟测试:操作请参考模拟测试。 图18 English情景模式 单击如图18所示界面右上方的“保存修改”。 界面提示“保存成功”,说明应用的English情景模式配置完成。
-
创建应用 访问科大讯飞的AIUI开放平台。 在界面上方的主菜单中,单击“我的应用”,进入“我的应用”页面。 单击“创建应用”,进入“创建应用”页面,如图1所示。 参数配置说明,如下所示: 应用名称:应用名称。 应用分类:从下拉框中选择当前应用所属分类。应用分类可以任意选择,不影响实际使用。 设备信息:勾选设备具备的条件。 应用描述:应用描述。 图1 创建应用 单击“确定创建”。界面提示“创建成功”,并弹出如图2所示的对话框。 图2 选择设备需要的AI能力 选择并开启设备需要的AI能力后,单击“确定”。 应用创建成功,自动进入新增应用的“应用配置”页面。
-
操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数 说明 分身数字人训练数据上传 角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 支持提供如下2类视频,训练生成数字人形象。 分身数字人:从本地上传已录制好,且符合拍摄要求的真人人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 训练生成的分身数字人形象与真人形象完全相同,如图2所示。 虚拟数字人:从本地上传3分钟以上的虚拟形象动作和说话视频。 视频时长建议3分钟以上,分辨率≥1080P(4K最佳),宽高比16:9(横屏)或9:16(竖屏),建议优先提供竖屏视频。支持MP4、MOV格式的视频。 视频中的虚拟数字人形象,是基于真人风格化后的形象,如图2所示。需客户自己准备形象,并生成其动作和说话视频。 背景替换 分身数字人是否支持更换背景。 包含如下选项,请根据实际情况选择: 抠除拍摄背景:分身数字人支持更换背景。 保留拍摄背景:分身数字人使用拍摄时的原背景,不支持更换背景。 如果勾选“抠除拍摄背景”,制作分身数字人视频时,可以替换背景。 视频封面(可选) 视频封面。支持jpg、jpeg和png格式。 身份认证及授权数据上传 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。 单击“点击上传人像面”,从本地选择身份证人像面照片上传。 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 身份认证及授权数据上传 第三方用户ID(可选) 第三方用户ID,为查询资产列表接口参数“X-App-UserId”的值。 仅需调用查询资产列表接口,通过参数“X-App-UserId”过滤查询2D数字人模型资产时填写。 图2 数字人说明 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图3所示。 数字人定制任务提交成功后,需要等待1天左右的时间审核。任务审核通过后,才能进行算法训练操作。 图3 制作任务提交成功 用户可以单击“查看制作任务列表”,进入分身数字人定制任务列表页面。 单击任务所在行的“查看详情”,进入“定制任务详情”页面。 查看分身数字人定制任务审核进展。当前状态为“系统审核中”,需要等待服务管理员审核通过后,状态变更为“待算法训练”。 如果数字人定制任务被驳回,需要查看驳回原因,并重新按照要求录制视频并上传。 操作步骤详情如下所示: 在服务主界面,单击左侧导航栏中的“任务中心”。 查看“分身数字人”页签的数字人定制任务列表,找到被驳回的数字人定制任务。 任务状态为“审核未通过”。 单击任务右侧的“查看原因”,在弹出的“审核未通过”对话框中,查看审核未通过的原因。 按照规范重新录制或提供符合规范的视频。 单击任务右侧的“更换视频”,上传更新后的视频。 数字人定制任务重新进入审核流程。
-
场景说明 智能交互包含如下场景: 场景一:用户开箱即用的智能交互数字人场景。 在MetaStudio控制台完成交互配置,包括LLM或者大模型配置,通过Web页面浏览,无需开发。 图1 智能交互 场景二:用户使用第三方语言模型,自主开发API实现与数字人对话场景。 开发者基于智能交互服务定义的API接口结构,自主开发第三方语言模型API,对接第三方语言模型到智能交互服务,实现智能交互能力。操作请参考创建智能交互数字人(第三方语言模型)。 场景三:用户使用智能交互API或SDK,自主开发实现与数字人对话场景。 用户购买华为的对话机器人CBS服务,对接到智能交互服务,开发者基于SDK完成web界面开发。操作请参考创建智能交互数字人(华为云CBS)。 用户购买非华为的LLM或者大模型,当前支持科大讯飞AIUI通用语义模型及星火大模型、出门问问的数字人平台。 科大讯飞对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(科大讯飞)。 出门问问的数字人平台对接至智能交互服务,开发者基于SDK完成web界面开发,操作请参考创建智能交互数字人(奇妙问)。 开发者自己提供LLM或者大模型,调用智能交互的文本驱动数字人能力。智能交互服务不感知用户自己的LLM或者大模型,只提供API接口和Web SDK。操作请参考创建智能交互数字人(二次开发场景)。 父主题: 智能交互
-
操作步骤 访问数字人工作台。 输入有效手机号和验证码,或者通过密码方式登录。 图1 数字人工作台 单击“登录”,进入数字人工作台“创建角色”页面,如图2所示。 图2 创建角色 在左侧导航栏中,选择“我的知识库”,进入“我的知识库”页面,如图3所示。 在当前页面可以看到普通文件和问答题库的上传入口。 图3 我的知识库 上传普通文件操作。 单击“上传普通文件”区域的“上传文件”,进入“文件上传”页面,如图4所示。 图4 文件上传 设置“知识库名称”。 一个知识库可以是一堆文件的集合。 上传文件。 支持上传TXT,PDF,PPTX,DOCX,XLSX,XLM,MD,HTML,CSV,TSV格式的文件,支持同时上传多个文件,每个文件不能超过20M。 单击“下一步”,进入“文档清洗”页面,如图5所示。 参数配置说明,如表1所示。 图5 文档清洗 表1 参数说明 参数 说明 分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。 手动分段:自定义分隔符和分割长度的方式,对文档进行分段处理。 索引配置 配置索引的类型。 包含如下选项: 标准版 高配版 单击“保存”。 保存成功后,在“普通文档”页签中,新增一行知识库。请根据实际情况,对知识库进行编辑、设置或删除操作。 图6 我的知识库 上传问答题库的操作。 单击“上传问答题库”区域的“上传文件”,进入“文件上传”页面,如图7所示。 图7 文件上传 从下拉框中选择问答文件的语言类型。 默认为:中文。 单击“问答模板下载”,下载模板文件至本地,必须按照模板准备问答文件。 单击“选择文件”,上传已准备好的问答文件。 支持上传xlsx、xlm格式的文件,支持同时上传多个文件,每个文件不能超过20M。 单击“下一步”,进入“问题预览”页面,如图8所示。 可以预览上传成功的问答列表。 图8 问题预览 单击“保存”。 保存成功后,在“问答题库”页签中,新增一行问答库。请根据实际情况,对问答库进行编辑、设置或删除操作。 图9 我的知识库
-
操作步骤 访问数字人工作台。 输入有效手机号和验证码,或者通过密码方式登录。 图1 数字人工作台 单击“登录”,进入数字人工作台“创建角色”页面,如图2所示。 界面右侧有“创建角色”入口,下方的“角色中心”区域展示系统预置的角色,可以直接克隆使用。 图2 创建角色 单击“创建角色”,进入“创建角色”页面,如图3所示。 参数配置说明,如表1所示。 图3 创建角色 表1 参数说明 参数 说明 语言 包含中文和英语。 单语言场景,可直接切换语言类型。 多语言场景,可单击右侧的“添加语言”,将中文和英语都添加上。 角色名称 互动数字人的角色名称。 示例:售货员。 角色描述 互动数字人的角色描述信息。 示例:负责介绍便利店及其产品信息。 选择模型 选择AI模型。 包含如下选项: 初阶模型 中阶模型 高阶模型 多轮对话 是否开启多轮会话。 如果开启,会根据上下文的信息进行语义理解,以生成连贯的对话。 提示词 用户长时间不提问时,互动数字人的提示语。 示例:您好!请问您还有什么需要了解的内容? 欢迎语 互动数字人的开场欢迎语。 示例:您好!很高兴为您服务。 常见问题 常见用户提问,支持添加多个。 示例:请问您需要什么商品? 插件工具 系统预置的插件工具,支持多选。 如“天气查询工具”,可以用于回答天气的问题。 知识库 单击“添加”,在弹出的“选择知识库”对话框中,勾选对应的知识库。 这里的知识库均为“普通文本”类型,其来源请参考新增知识库-上传普通文件。 回答仅限于文档 是否开启回答仅限于文档。 如果开启此设置, 数字人仅回答知识库中内容。如果超出知识库范围,数字人使用兜底话术答复。 回答来源 是否开启回答来源。 如果开启此设置,当回答引用了文档或者使用了网页查询工具时,会展示问答来源。 问答库 单击“添加”,在弹出的“选择知识库”对话框中,勾选对应的问答题库。 问答题库来源,请参见新增知识库-上传问答题库。 兜底话术 当用户提问超出问答范围时的回复话术。 示例:很抱歉,我们无法提供此类信息。 回答前缀 互动数字人回答问题之前的话术。 示例:让我思考一下你的问题。 敏感词话术 如果用户问题中有敏感词,使用此话术作答。 示例:哎呦,这个问题我没有听懂哦!请您重新提问。 单击“在线演示”,可以在界面右侧演示模型对话效果,如图4所示。 图4 在线演示 单击界面右上角的“保存”,在弹出的“保存成功”提示框中,单击“确定”。 角色创建完成。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“互动管理”,进入如图1所示的页面。 图1 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图3所示。 输入互动库的名称。支持对互动库执行如下操作。 单击互动库右侧的,从下拉框中选择“重命名”,可以修改互动库的名称。 单击互动库右侧的,从下拉框中选择“复制”,可以复制当前互动库,生成一个新的互动库。 单击互动库右侧的,从下拉框中选择“删除”,删除当前互动库。 图2 互动库 图3 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图4所示。 可以给当前互动库,新增1条互动规则。参数配置说明,如图4所示。 图4 互动规则 表1 互动规则配置说明 参数 说明 类型 互动类型。 包含如下选项: 弹幕 用户入场 点赞 送礼 互动名称 互动名称。 触发方式 当前互动触发的方式,请根据实际情况设置。 回复方式 请先选择主播或助播,再使用下述一种方式设置回复内容。 文本回复:输入文本内容。当满足触发方式时,数字人会阅读文本内容。 音频回复:从本地上传录制好的音频文件。当满足触发方式时,自动播放音频文件。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。 单击互动规则右侧的“删除”,删除当前互动规则。
-
MetaStudio权限 默认情况下,新建的IAM用户没有任何权限,您需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 MetaStudio部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区域级项目”,然后在指定区域(如华北-北京四)对应的项目(cn-north-4)中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于各服务之间存在业务依赖关系,因此给用户授予角色时,可能需要一并授予依赖的其他角色,才能正确完成业务。角色并不能满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要求。 策略:IAM最新提供的一种细粒度授权的能力,可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。 如表1所示,包括了MetaStudio的所有系统策略。 表1 MetaStudio系统权限 策略名称 描述 策略类别 策略内容 MetaStudio FullAccess MetaStudio管理员权限,拥有该权限的用户可以拥有MetaStudio支持的全部权限。 系统策略 MetaStudio FullAccess策略内容 MetaStudio ReadOnlyAccess MetaStudio只读权限,拥有该权限的用户仅能查看MetaStudio数据。 系统策略 MetaStudio ReadOnlyAccess策略内容
-
MetaStudio FullAccess策略内容 { "Version": "1.1", "Statement": [ { "Action": [ "metastudio:*:*" ], "Effect": "Allow" } ] }
-
MetaStudio ReadOnlyAccess策略内容 { "Version": "1.1", "Statement": [ { "Action": [ "metastudio:*:show*" ], "Effect": "Allow" } ] }
-
新闻播报风格文案(100句) 我国是世界上首个国内发明专利有效量超三百万件的国家, 我国发明专利有效量已位居世界第一。 截至二零二二年底,高价值发明专利拥有量达到一百三十二点四万件, 占发明专利有效量的比重超过四成。 我国正在从知识产权引进大国向知识产权创造大国转变, 知识产权工作正在从追求数量向提高质量转变。 近日,关于互联网电视收费乱象的话题不断冲上热搜, 互联网电视平台套娃式的充会员看视频的模式让不少网友直呼太反感。 随着版权保护意识的加强,用户已经愿意以付费方式来收看影视内容, 可商家在收费之余却忽视了消费者的观看体验。 视频平台应该更多的向自身挖掘内容,而不是一味的向用户涨价。 无论哪方都需要多方面考量,结合多终端兼容的市场需要, 为人民带来更加丰富的资源,才能走得长远。 网络暴力是当前社会面临的一大问题。 在社交媒体上,人们可以随意发表言论, 但是也需要意识到这些言论所带来的后果。 预防和治理网络暴力是一个需要全社会共同关注和解决的庞大课题, 除了平台方需要倾注努力,还需监管部门、用户、媒体等多方主体的协作支持、共同参与。 在一场网络暴力事件中,用户可能是直接施暴者、直接或间接传播者,也可能是受害者。 用户应注重规范自身“文明上网”的行为习惯, 严守言论自由的义务边界,提高对于网络暴力行为的识别能力, 及时举报相关内容,学习了解有关平台防范网络暴力的功能机制, 做好自我防护,避免网络暴力再次发生。 近日,旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。 多方纷纷站出来为丫丫发声,盼望它早日归来。 从网友的评论中和声援中,感受到了华人的温度, 前路依然充满荆棘,但我们绝不放弃,永不退缩。 “熊猫外交”也增强了国家文化的生命力、创新力、凝聚力和传播力。 八月二十四日中午十二时,日本福岛第一核电站启动核污染水排海。 海洋是全人类赖以生存的蓝色家园, 不顾大众反对坚持将核污染水排海这一自私行为,会使海洋受到严峻挑战。 爱护海洋,是当今每个国家义不容辞的责任, 保护海洋就是守护我们共同家园,造福后代。 日本排污未经得大众同意,此行为必将受到严厉谴责, 海洋安全也将受到不可估量的破坏。 心软的神终于又拿起了拯救世人的手术刀, 天才眼科医生陶勇,医术高超的他,一天甚至可以做八十六台手术, 到现在为止,让一点五万患者重获光明。 他却被自己治愈的患者砍伤,无法再拿起手术刀。 可他忍着剧痛,日复一日做手部康复训练, 在每一日的痛苦哀嚎背后,是他想要重回手术台,救助更多患者的决心。 只要有烟火,黑暗终究被驱散, 终于,他花了三年时间,在那条看不清未来的路上,找到了光。 这位心软的神,又来缝缝补补这个世界了! 小男孩,今年七岁, 在前不久落幕的湖南省青少年锦标赛中,他一举拿下五金两银。 他说,梦想是长大后成为奥运冠军。 他的父母均是残障人士,全家生活困苦。 生活的艰辛,训练的困苦,他都没有退缩, 功夫不负有心人,他取得了亮眼的成绩, 他双眼炯炯有神,说长大后要成为奥运冠军! “五一”黄金周迎来旅游热潮, 无论是从游客出行距离,消费活跃度还是客流量来看, 今年的旅游热度均创下近年来的历史新高。 便利快捷的交通出行方式,让民众实现旅游自由, 多样化的旅游选择,满足各类民众的游玩需求, “五一”旅游热潮,无疑成为各地经济发展的有效“助推器”。 中国梦的本质是国家富强,民族振兴,人民幸福。 实现伟大梦想,必须进行伟大斗争、建设伟大工程、推进伟大事业。 青年兴则国家兴,青年强则国家强。 广大青年要勇做时代的弄潮儿, 在实现中国梦的实践中放飞青春梦想,在为人民利益的奋斗中书写人生华章。 三月二日,神舟十五号乘组进行了二次出舱活动, 在轨三个月取得多项阶段性成果。 自二零二一年神舟十二号载人飞行任务以来, 四个航天员乘组累计开展十次出舱活动,突破掌握了一系列关键技术, 目前出舱活动已成为在轨员的例行性工作, 后续将根据任务需要继续常态化开展。 第三十一届世界大学生运动会在成都隆重开幕,市民健康跑迎接大运会。 青春绽放势不可挡,青年力量如日中天。 各国青年健儿汇聚在成都大运会的舞台上, 用汗水浇灌最美好的梦想,用奋斗绘就最亮丽的底色,共赴一场盛大的“青春之约”。 同时也激励着我们树立远大理想,练就自身本领, 在人生的赛道上不懈奋斗,以青春的活力促进国家繁荣与民族复兴。 俗话说得好:读万卷书,不如行万里路。 “课本游”作为一种旅游新模式,不仅能丰富旅游内涵、提高旅游质量; 更能让孩子切身实地的感受到学习与实践的知行合一,提高学习兴趣与效率, 同时也能在他们心里埋下一颗文化传承的种子, 有助于我国优秀传统文化的弘扬与传播。 黑猩猩是与人类一样能够直立行走的动物, 喜欢集群生活,能使用简单工具,是已知仅次于人类的最聪慧的动物。 其行为和社会行为都更近似于人类,在人类学研究上具有重大意义。 从中国音乐家发布的数据来看,国内有超过四千万孩子学习钢琴。 占全球总数的百分之八十,且每年以百分之十的速度增长。 近日,中国探月航天形象太空兔正式对外公布名称, 中文名“兔星星”。 据悉,今年上半年,中国造船三大指标全面增长, 造船完工量,新接订单量,手持订单量,三大指标的国际市场份额均为全球第一。 二零二三年八月十五日,著名学术期刊《科学通报》刊发了最新研究成果, 中国科学家实现了从二氧化碳到糖的精准合成,人工合成糖迈出关键一步。 八月十五日,自然资源部发布《中国生态保护红线蓝皮书》, 这是我国首次以蓝皮书形式发布的生态保护红线成果。 蓝皮书表示,全国划定生态保护红线面积合计约三百一十九万平方公里, 涵盖我国全部三十五个生物多样性保护优先区域,百分之九十以上的典型生态系统类型。 九月四日,贵州茅台和瑞幸联名推出的“酱香拿铁”咖啡正式上线, 交警提示大家:为了安全,喝了含有酒精的饮品禁止开车。 今年第十一号台风“海葵”在今日早晨五点前后登陆福建省东山县沿海地区, 中心附近最大风力有八级(二十米/秒),中心最低气压为九百九十五百帕。 今日,福州全市中小学、幼儿园决定停课一天。 近期台风频发,希望大家一切安好! 父主题: 文案样例(进阶版)
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频制作”下方的“开始创建”。 进入视频制作界面,界面详情如图1所示。操作说明如下所示: 视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域右下方的图标,切换视频的分辨率为横屏“16:9”或竖屏“9:16”。 画布制作完成后,需要制作语音。 支持下述2种方式生成语音。每个场景仅支持选择一种音频生成方式。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间间隔,实现阅读的停顿。 多音字 如果文字存在多个发音,可选中文字,单击“多音字”,在弹出的提示框中,选择正确的发音。 局部语速 选中需要设置语速的文字段,设置局部语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 全局语速 设置全局语速。 取值范围为[0.5x,2x],含义如下所示: 0.5x:音频使用0.5倍速播放,即减速播放。 2x:音频使用2倍速播放,即加速播放。 亲切女声 默认为“亲切女声”。 如需更换声音,可单击“亲切女声”,在弹出的对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考(可选)购买第三方声音。 试听 单击“试听”,可试听语音效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标,在视频中添加字幕。 仅文本驱动的方式,支持开启字幕功能。音频驱动方式,暂不支持。 图标 展示当前视频的分辨率。 图标 第一次单击可收起“文本驱动/视频驱动”板块的配置,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传,或直接拖拽本地音频文件至提示区域中,完成上传。单击图标,可试听音频效果。 图2 音频驱动 音频制作完成后,可单击“音量”,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容已制作完成。 如果还需要制作更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景均设置完成后,单击界面右上角的“合成视频”,弹出“合成设置”对话框。 参数设置说明如下所示: 分辨率:根据实际情况,选择视频的分辨率。 导出为:输入导出文件的名称。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入资产详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。 图3 视频详情 如果用户对合成的视频不满意,可以参考下述步骤,进行二次制作,重新合成。 在左侧导航栏中,选择“工作台”。 在“最近项目”区域,选择“视频项目”页签后,右侧页签选择“视频草稿”,查看视频草稿列表,如图4所示。 图4 视频项目 将鼠标移至卡片的文字描述区域,单击“编辑视频”,如图5所示。 进入视频编辑界面,更新视频内容,重新合成视频。 图5 我的视频
-
在科大讯飞构建同名技能后,导入技能文件 执行本操作前,需要在科大讯飞平台完成账号注册操作。 访问科大讯飞的AIUI开放平台。 单击界面上方的“技能工作室”。进入“技能控制台”页面,如图7所示。 图7 技能控制台 单击“创建技能”,弹出如图8所示的对话框。 参数配置说明,如下所示: 技能名称:技能名称。必须与MetaStudio服务创建的技能一一对应,如6所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:需要与MetaStudio服务新能技能的“技能标识”一致,如6所示。 图8 创建技能 输入完成后,单击“创建”。 界面提示“创建成功”,并自动跳转至“意图”页面,如图9所示。 图9 意图页面 单击“批量操作”,从下拉框中选择“批量覆盖”,在弹出的确定对话框中,单击“确定覆盖”。 从本地选择MetaStudio服务中导出的技能文件,如10所示。界面提示“批量覆盖成功”,效果如图10所示。 图10 意图页面 单击界面右上方的“构建技能”,开始构建技能。 界面提示“构建成功”,说明技能构建成功。 在左侧导航栏中,单击“发布”。进入“发布”页面,如图11所示。 图11 发布页面 确认信息无误后,单击“发布上线”。 界面提示“发布成功”,说明技能发布完成。
-
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。 参数配置说明,如表1所示。 图2 创建商品 表1 商品配置说明 参数 说明 商品名称 商品名称。 描述 商品描述。 类别 商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品所在行的“查看”,进入商品详情界面,支持单击“编辑”,修改商品信息。 单击商品所在行的“编辑”,进入商品修改页面,修改商品信息后,单击“保存”。 单击商品所在行的“删除”,删除当前商品。
更多精彩内容
CDN加速
GaussDB
文字转换成语音
免费的服务器
如何创建网站
域名网站购买
私有云桌面
云主机哪个好
域名怎么备案
手机云电脑
SSL证书申请
云点播服务器
免费OCR是什么
电脑云桌面
域名备案怎么弄
语音转文字
文字图片识别
云桌面是什么
网址安全检测
网站建设搭建
国外CDN加速
SSL免费证书申请
短信批量发送
图片OCR识别
云数据库MySQL
个人域名购买
录音转文字
扫描图片识别文字
OCR图片识别
行驶证识别
虚拟电话号码
电话呼叫中心软件
怎么制作一个网站
Email注册网站
华为VNC
图像文字识别
企业网站制作
个人网站搭建
华为云计算
免费租用云托管
云桌面云服务器
ocr文字识别免费版
HTTPS证书申请
图片文字识别转换
国外域名注册商
使用免费虚拟主机
云电脑主机多少钱
鲲鹏云手机
短信验证码平台
OCR图片文字识别
SSL证书是什么
申请企业邮箱步骤
免费的企业用邮箱
云免流搭建教程
域名价格