云服务器内容精选
-
验证对话链接有效性 创建并发布完成的数字人智能交互对话项目,会生成如下所示内容: 发布链接:https://IP/icswebclient?robot_id=2c9080********************e105e5 激活码:CP*****TL 在发布链接后面可以补充如表1所示的参数,可以在与数字人对话的界面实现参数对应的功能。链接拼接示例:https://IP/icswebclient?robot_id=2c9080********************e105e5&enableLocalWakeup=1,可以开启语音唤醒能力,体验语音唤醒能力,默认唤醒词详见Web语音唤醒。 表1 参数说明 参数 默认值 类型 描述 enableCaption 1 0|1 是否显示字幕。 enableJobCache 1 0|1 是否启用任务缓存。 enableNetworkCheck 1 0|1 是否开启网络质量检测。 enableLocalWakeup 0 0|1 是否启用语音唤醒能力。 enableVadInterrupt 0 0|1 是否启用人声打断能力。 firstCreateLocalStream 0 0|1 是否优先创建本地流。 enableMediaViewer 1 0|1 是否启用图片预览。 enableCollectAudioDemand 0 0|1 是否按需采集麦克风声音。 enableOriginCutAlgorithm 0 0|1 是否使用原来的透明背景算法。 enableVerbatim 0 0|1 是否开启字幕逐字显示。 useWorkerWakeup 1 0|1 是否启用worker进程。 showDebugTools 0 0|1 是否开启调试模式。 父主题: 智能交互
-
在科大讯飞平台创建应用(AIUI通用语义模型) AIUI通用语义模型应用,不支持直接切换为星火交互认知大模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(星火交互认知大模型)单独为其创建应用。 在科大讯飞AIUI开放平台,创建AIUI通用语义模型的应用。 详细操作如下所示,具体的操作步骤请参见科大讯飞的文档中心。 创建应用:在科大讯飞的AIUI开放平台创建应用。 配置应用:应用需要使用AIUI通用语义模型,并启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞AIUI通用语义模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。 (可选)开启闲聊功能:闲聊功能可以丰富数字人问答内容,如:天气、旅游、假期等日常闲聊信息。 需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用户问题,进行用户问题模拟,查看对话效果。 (可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“中文”,则main情景模式下的配置生效。如果对话配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 情景模式名称必须为“English”,English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能。一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 父主题: 创建智能交互对话项目(科大讯飞)
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明如表1所示。 图1 互动问答 表1 互动问答配置 参数 说明 第三方应用 配置说明如下所示: 如果科大讯飞AIUI开放平台应用使用AIUI通用语义模型,则从下拉框中选择“科大讯飞AIUI通用语义模型”。 如果科大讯飞AIUI开放平台应用应用使用星火大模型,则从下拉框中选择“科大讯飞星火交互认知大模型”。 应用名称 与AIUI开放平台应用的“应用名称”保持一致。 APPID 与AIUI开放平台应用的“APPID”保持一致。 APPKEY 与AIUI开放平台应用的“APPKEY”保持一致。 APISECRET 与AIUI开放平台应用的“APISECRET”保持一致。 对接生产环境 对接科大讯飞现网的自然语言模型,具体以“第三方应用”配置的模型为准,可提升应用运行的稳定性。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束 语音识别 。建议该值大于500ms。 单击“确定”,应用创建完成,效果如图2所示。 可单击“修改”,修改互动问答配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图3 应用发布
-
在科大讯飞平台创建应用(星火交互认知大模型) 星火交互认知大模型应用,不支持直接切换为AIUI通用语义模型。因为已配置内容不适用,建议参考在科大讯飞平台创建应用(AIUI通用语义模型)单独为其创建应用。 在科大讯飞AIUI开放平台,创建星火交互认知大模型的应用。 详细操作如下所示,具体的操作步骤请参见科大讯飞的文档中心。 创建应用:在科大讯飞的AIUI开放平台创建应用。 (可选)创建文档问答库:星火交互认知大模型应用,支持创建文档问答库。非必须创建,可根据实际情况选择使用。 MetaStudio服务目前仅支持读取docx(包含图文)、txt和md格式,其他格式暂不支持。 docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图1和图2所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理解文档库文档的内容,重新组织语言来回答问题,不会完全按照问答对提供的答案去答复。 图1 标题 图2 分级标题 配置应用:应用先开启“星火大模型”,再开启文档问答库,然后启用创建技能中已创建的技能。 查看应用信息:在MetaStudio服务创建“科大讯飞星火交互认知大模型”智能交互对话项目时,需要使用这里的应用信息,包括:应用名称、APPID、APPKEY和APISECRET。 (可选)开启闲聊功能:闲聊功能可以丰富数字人问答内容,如:天气、旅游、假期等日常闲聊信息。 需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用户问题,进行用户问题模拟,查看对话效果。 (可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“中文”,则main情景模式下的配置生效。如果对话配置时,语言选择“英文”,当前应用需要新增English情景模式,才能对话成功。 情景模式名称必须为“English”,English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能。一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 父主题: 创建智能交互对话项目(科大讯飞)
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身视频制作”下方的“开始创建”,进入视频制作界面,详见视频制作界面说明-图1。 参考视频制作公共配置,进行视频画面制作。 视频素材区域,除了系统预置素材外,角色还可以自定义新增;背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加至视频预览区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 单击视频预览区域上方的图标,可以切换视频画面比例为横屏“16:9”或竖屏“9:16”。 Flexus分身数字人左上角会有标识。未带有标识的数字人均为标准版形象。 需注意Flexus视频制作和标准版视频制作分开计费,从各自的套餐包中扣除费用。 Flexus视频制作:必须使用Flexus形象,声音使用不受限制。 按视频制作时长计费,计费项为“Flexus分身数字人视频制作”,详见计费说明。 系统声音和Flexus声音免费使用。第三方声音的计费方式,详见购买出门问问 语音合成 套餐包。 标准版视频制作:必须使用标准版形象,声音不支持使用Flexus声音。 按视频制作时长计费,计费项为“分身数字人视频制作”,详见计费说明。 系统声音免费使用。第三方声音的计费方式,详见购买出门问问语音合成套餐包。 视频语音制作。 支持如下2种方式,可以按场景各选一种方式生成语音。 文本驱动 在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。 表1 操作说明 操作 说明 音色设置 单击音色名称,在弹出的声音对话框中,选择需要的声音。 无标注的系统声音,均为免费声音,可直接选用。 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。 带有标识的为Flexus声音,仅支持搭配Flexus数字人使用。如果视频为标准版形象,不支持选择Flexus声音进行视频合成。 风格/情感 单击“风格/情感”,在弹出的浮动框中,选择需要的风格/情感类型即可。可以通过试听,查看效果。 须知: 仅选择的声音,具备风格/情感音色,才支持设置“风格/情感”。 风格/情感须按场景设置,每个场景仅支持设置一种风格/情感类型。 插入动作 插入动作的详细操作说明,请参见插入动作。 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音字”,在弹出的提示框中,选择正确的发音或者自定义发音。 这里设置的多音字,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 这里设置的别名,仅对当前视频草稿有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示: 数字:一零二四 数值:一千零二十四 日期:十月二十四 电话:幺零二四 示例英文“API”的读法如下所示: 字母:API 单词:api 音标 选中英文单词,输入合适的音标。也可以单击“音标搜索”,在词典中输入单词搜索,直接复制正确的音标到这里。 局部语速 选中需要变速播报的文本,设置局部语速。 取值范围[0.5x,2x],含义如下所示: 0.5x:0.5倍速播报,即减速播报。 2x:2倍速播报,即加速播报。 全局语速 设置全局语速。 取值范围[0.5x,2x],含义如下所示: 0.5x:0.5倍速播报,即减速播报。 2x:2倍速播报,即加速播报。 特殊词表 支持开启或关闭“特殊词表”配置。通过特殊词表配置,可对特定文本设置拼音、音标、连读、别名、数字英文,并一键应用至全局,详见配置特殊词表。 试听 单击“试听”,试听语音效果。 生成预览 单击“生成预览”,选择“当前场景”或“所有场景”,以预览其对应的音频和字幕播放效果。 须知:预览视频为静态页面,需合成视频后,才能查看视频动态播放效果。动作编排效果也不支持预览。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 字幕设置。开启字幕的操作如下所示,也可查看设置字幕。 单击图标开启字幕。 单击“生成预览”,选择“当前场景”或“全部场景”,生成字幕内容和预览视频。 如果是“文本驱动”直接提取文本生成字幕内容。如果是“音频驱动”,会将音频转化为文本后,再生成字幕内容。 画布左侧展示字幕内容,支持修改字幕内容、调整字幕样式。 须知:“音频驱动”方式目前仅支持中文普通话的场景开启字幕。 图标 展示当前视频的宽高比。 图标 第一次单击可折叠“文本驱动/音频驱动”,第二次单击后恢复展示。 音频驱动 需从本地上传已录制好的音频。音频文件格式需要为WAV、MP3或M4A,大小不能超过100M。 可单击“导入”上传音频,也可以直接拖拽本地音频文件至提示区域中,完成上传。单击左侧的图标,可试听音频效果。如果音频效果不佳,可以单击“导入”,覆盖更新音频。 图2 音频驱动 音频制作完成后,可单击音量图标,调整音频的音量。 上述操作全部完成后,第一个场景的视频内容制作完成。 如需更多场景,可单击“场景”区域的“+”图标,新增场景。制作过程参考第一个场景即可。 如果视频内容是分享PPT,可在“PPT”页签,先从本地导入PPT,再插入需要分享的PPT页,详见PPT。每页PPT会对应生成一个场景,依次设置完成所有场景即可。 所有场景设置完成后,单击界面右上角的“合成视频”,弹出“视频合成设置”对话框。 参数说明如表2所示。 表2 参数说明 参数 说明 导出为 输入导出文件的名称。 格式 合成视频的格式,默认为MP4格式。 如果视频背景选择透明背景,还支持导出为MOV格式。但是MOV格式导出功能默认不开放,需提交工单申请使用权限后,才会展示出来。且合成MOV格式视频有如下限制: 文本驱动所有场景不超过1500字符。 音频驱动所有场景的音频总时长不超过5分钟。 导出的MOV视频,不支持在MetaStudio控制台查看,需导出至本地后,在支持的视频软件中查看。 分辨率 选择合适的视频分辨率。 画质增强 开启后将提升视频清晰度,但合成的时间会相应变长。 请根据实际情况确定是否开启。 单击“确定”,弹出“视频制作任务中心”对话框。 可查看视频合成任务的进度,直至合成成功。 单击“合成成功”状态右侧的图标,进入视频详情页面,如图3所示。 单击“预览”,可以看到合成的视频。预览过程中,可全屏播放,或下载视频到本地。合成视频默认为激活状态,可以单击“取消激活”,取消激活视频资产。 须知: MOV格式视频不支持在线预览,需下载至本地,在支持的视频软件中查看。 如果视频合成失败,可参考视频合成失败如何处理?处理。 可通过如何查看视频制作已购资源包的分钟消耗数?查看视频制作已购资源包的消耗量。 视频制作时,如果使用透明背景合成视频,导出时仅支持生成WEBM格式视频。可参考如何将WEBM视频转成MOV格式?转换为MOV格式。 图3 视频详情
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 互动问答 表1 互动问答配置 参数 说明 第三方应用 从下拉框中选择“第三方驱动”。 应用名称 输入自定义的应用名称。 “互动问答”页签配置完成后,还需执行下述操作,对应的操作流程图,如图2所示。 下载并集成智能交互Web SDK,操作请参考智能交互SDK。 在Web SDK的create接口入参eventListeners中,监听事件jobInfoChange的通知,以获取任务ID。 建立WebSocket连接,实现用户与数字人对话,详见智能交互驱动。 图2 操作流程图 单击“确定”,应用创建完成,效果如图3所示。 可单击“修改”,修改互动问答配置。 图3 互动问答 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图4所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图4 应用发布
-
在科大讯飞创建同名技能并导入技能文件 在科大讯飞的AIUI开放平台创建技能,详细操作请参见科大讯飞的文档中心。 技能配置要求,如表4所示。技能创建完成后,需要导入MetaStudio服务导出的技能文件。 表4 创建技能 参数 说明 技能名称 输入技能名称,必须与MetaStudio服务创建的技能一一对应,如4所示。 为方便识别和记忆,两边的技能名称可以设置一致。 技能标识 需要与MetaStudio服务新能技能的“技能标识”一致,如4所示。
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“分身 视频直播 ”下方的“开始创建”,进入分身数字人直播首页面。 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。 参数配置说明,如表1所示。 图1 智能交互设置 表1 参数说明 参数 说明 应用 请先参考后续步骤6,创建完成应用后,再从下拉框中选择此应用。 弹幕触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 用户入场触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条达到互动条件的用户入场规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 点赞触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条点赞规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 送礼触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条送礼规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 单击“去设置”,弹出“智能交互”对话框,如图2所示。 需要创建智能交互应用,详细的参数配置说明如表2所示。 图2 智能交互 表2 互动问答配置 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址 MetaStudio服务调用第三方语言模型的API地址。 MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题,共计3个问题。其他数值的配置效果,以此类推。 对话内容合规审核 开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权。开启委托后,会弹出“选择委托站点”对话框,选择购买SIS服务的站点,单击“确定”即可。如果授权过程中出现报错信息“没有委托操作权限”,可能是当前 IAM 用户没有权限授权,需要参考开通委托报错如何处理?处理。 开启委托授权后,新增展示如下配置: 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。 单击“确定”,智能交互应用创建完成。
-
注意事项 推荐使用Chrome浏览器访问MetaStudio控制台。 如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 如果华为云账号被冻结,将无法对MetaStudio服务进行增删改操作,仅支持查看服务内容。如果华为云账号处于受限状态,将无法订购MetaStudio服务资源或开通按需。为避免因账号冻结或受限引发的服务不可用问题,请及时处理账号冻结或受限问题,详见提示账户被冻结、注销、余额不足怎么办?。 如果MetaStudio服务被冻结,将不能使用MetaStudio服务,但不影响订购业务。为不影响业务使用,请提交工单向MetaStudio服务申请解冻处理。
-
前提条件 开通MetaStudio服务,如下所示: 注册华为账号 :单击进入注册页面。 完成实名认证:单击进入实名认证。 知:国际站用户在以下情况下,才需要进行账号实名认证。 根据中国大陆相关法规要求,购买和使用中国大陆节点云产品服务的用户需要实名认证。购买数字内容生产线服务时,如果您选择的区域包含中国大陆,则需要实名认证。 账户充值:为确保正常使用MetaStudio,您需要进行账户充值。 开通MetaStudio服务:单击进入MetaStudio控制台,根据开通引导完成服务开通。
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明如表1所示。 图1 互动问答 表1 互动问答配置 参数 说明 第三方应用 从下拉框中选择“奇妙问”。 应用名称 设置当前智能交互数字人应用的名称。 账号 注册奇妙问的账号,即用户的手机号。 APPSECRET 用户在奇妙问创建角色的AppSecret。 RoleId 用户在奇妙问创建角色的RoleId。 对话内容合规审核 开启后,自动审核用户提问内容。若存在违禁词,将自动拦截,并返回默认答案。如果关闭,将无法审核用户提问内容。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权。开启委托后,会弹出“选择委托站点”对话框,选择购买SIS服务的站点,单击“确定”即可。如果授权过程中出现报错信息“没有委托操作权限”,可能是当前IAM用户没有权限授权,需要参考开通委托报错如何处理?处理。 开启委托授权后,新增展示如下配置: 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。 单击“确定”,应用创建完成,效果如图2所示。 可单击“修改”,修改互动问答配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图3 应用发布
-
场景说明 方式一、方式二均需和智能交互助手一起提供预集成ASR服务,即华为SIS服务,需客户单独购买并授权给MetaStudio服务使用。 方式三不提供ASR服务,由客户自备。 MetaStudio数字人智能交互对外提供三种集成方式: 方式一:MetaStudio预集成数字人大脑和大模型,集成商或客户基于SDK开发智能交互应用。 预集成大脑和大模型类型包括: 华为云CBS,详见创建智能交互对话项目(华为云CBS)。 科大讯飞AIUI通用语义模型,详见创建智能交互对话项目(科大讯飞)。 科大讯飞星火交互认知大模型,详见创建智能交互对话项目(科大讯飞)。 出门问问奇妙问,详见创建智能交互对话项目(奇妙问)。 方式二:MetaStudio对接开放第三方大脑和大模型,同时由集成商或客户基于SDK开发智能交互应用。 第三方大脑和大模型需要基于MetaStudio的LLM回调接口二次开发,对接至MetaStudio,详见创建智能交互对话项目(第三方语言模型)。 第三方大脑和大模型包括: Dify+MAAS+基于华为昇腾部署的第三方大模型,如DS。 客户自有部署的大脑和大模型。 方式三:MetaStudio接口由实时推理直接提供(文本实时驱动数字人),不提供智能交互助手。集成商或客户完成大模型和ASR的集成,同时基于SDK开发智能交互应用。 详见创建智能交互对话项目(二次开发场景)。 父主题: 智能交互
-
背景 背景界面详情,如图2所示。上传后的背景图片不支持修改。如需修改图片内容,需本地修改完成后,再上传至控制台使用。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。也可直接将图片拖拽至图片列表区域。 背景搜索框,可输入背景名称进行精准搜索。 示例:科技。 筛选条件 支持通过来源筛选展示背景图片。 图片列表 默认展示全量背景图片。单击图片,自动替换至当前画面中。 第一张图为透明背景,单击透明背景后,仅智能交互预览页面会替换为透明背景。如果需要透明背景正式生效,还需要设置如下智能交互SDK的任一参数。透明背景支持的浏览器及版本,详见客户端SDK参考-快速入门-表3。 设置create接口参数config内的配置参数useDefaultBackground,其默认值为true,需修改为false。 代码示例,如下所示: HwI CS UiSdk.create({ serverAddress: 'serverAddress', onceCode: 'onceCode', robotId: 'robotId', containerId: 'ics-root', config: { useDefaultBackground: false }, }); 设置setConfig接口参数useDefaultBackground,其默认值为true,需修改为false。 代码示例,如下所示: HwICSUiSdk.setConfig({ useDefaultBackground: false });
-
角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 数字人搜索框,可输入数字人名称进行精准搜索。 示例:云岚。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率,筛选数字人。 数字人卡片 默认展示全量数字人卡片。单击数字人形象,自动替换至当前画面中。
-
创建角色 支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。客户经理的联系方式,可以在云商店语音合成商品页面查看,如图1所示。 图1 查看联系方式 操作步骤如下所示,详细操作请联系奇妙问平台客服,如图1所示。 新增知识库:可以上传普通文件或者新增问答题库。 创建角色:在奇妙问创建问答角色。 查看角色信息:查看奇妙问创建角色的RoleId和AppSecret,即MetaStudio平台API调用所需的角色ID和角色密钥。 支持在奇妙问平台查看角色的所有会话记录。 父主题: 创建智能交互对话项目(奇妙问)