-
验证对话链接有效性 创建并发布完成的数字人智能交互对话项目,会生成如下所示内容: 发布链接:https://IP/icswebclient?robot_id=2c9080********************e105e5 激活码:CP*****TL 在发布链接后面可以补充如表1所示的参数,可以在与数字人对话的界面实现参数对应的功能。链接拼接示例:https://IP/icswebclient?robot_id=2c9080********************e105e5&enableLocalWakeup=1,可以开启语音唤醒能力,体验语音唤醒能力,默认唤醒词详见Web语音唤醒。 表1 参数说明 参数 默认值 类型 描述 enableCaption 1 0|1 是否显示字幕。 enableJobCache 1 0|1 是否启用任务缓存。 enableNetworkCheck 1 0|1 是否开启网络质量检测。 enableLocalWakeup 0 0|1 是否启用语音唤醒能力。 enableVadInterrupt 0 0|1 是否启用人声打断能力。 firstCreateLocalStream 0 0|1 是否优先创建本地流。 enableMediaViewer 1 0|1 是否启用图片预览。 enableCollectAudioDemand 0 0|1 是否按需采集麦克风声音。 enableOriginCutAlgorithm 0 0|1 是否使用原来的透明背景算法。 enableVerbatim 0 0|1 是否开启字幕逐字显示。 useWorkerWakeup 1 0|1 是否启用worker进程。 showDebugTools 0 0|1 是否开启调试模式。 父主题: 智能交互
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 互动问答 表1 互动问答配置 参数 说明 第三方应用 从下拉框中选择“第三方驱动”。 应用名称 输入自定义的应用名称。 “互动问答”页签配置完成后,还需执行下述操作,对应的操作流程图,如图2所示。 下载并集成智能交互Web SDK,操作请参考智能交互SDK。 在Web SDK的create接口入参eventListeners中,监听事件jobInfoChange的通知,以获取任务ID。 建立WebSocket连接,实现用户与数字人对话,详见智能交互驱动。 图2 操作流程图 单击“确定”,应用创建完成,效果如图3所示。 可单击“修改”,修改互动问答配置。 图3 互动问答 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图4所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图4 应用发布
-
在科大讯飞创建同名技能并导入技能文件 在科大讯飞的AIUI开放平台创建技能,详细操作请参见科大讯飞的文档中心。 技能配置要求,如表4所示。技能创建完成后,需要导入MetaStudio服务导出的技能文件。 表4 创建技能 参数 说明 技能名称 输入技能名称,必须与MetaStudio服务创建的技能一一对应,如4所示。 为方便识别和记忆,两边的技能名称可以设置一致。 技能标识 需要与MetaStudio服务新能技能的“技能标识”一致,如4所示。
-
背景 背景界面详情,如图2所示。上传后的背景图片不支持修改。如需修改图片内容,需本地修改完成后,再上传至控制台使用。 图2 背景界面 背景界面说明,如表2所示。 表2 界面元素说明 界面元素 说明 本地导入 单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。也可直接将图片拖拽至图片列表区域。 背景搜索框,可输入背景名称进行精准搜索。 示例:科技。 筛选条件 支持通过来源筛选展示背景图片。 图片列表 默认展示全量背景图片。单击图片,自动替换至当前画面中。 第一张图为透明背景,单击透明背景后,仅智能交互预览页面会替换为透明背景。如果需要透明背景正式生效,还需要设置如下智能交互SDK的任一参数。透明背景支持的浏览器及版本,详见客户端SDK参考-快速入门-表3。 设置create接口参数config内的配置参数useDefaultBackground,其默认值为true,需修改为false。 代码示例,如下所示: HwI
CS UiSdk.create({
serverAddress: 'serverAddress',
onceCode: 'onceCode',
robotId: 'robotId',
containerId: 'ics-root',
config: {
useDefaultBackground: false
},
}); 设置setConfig接口参数useDefaultBackground,其默认值为true,需修改为false。 代码示例,如下所示: HwICSUiSdk.setConfig({
useDefaultBackground: false
});
-
角色 角色界面详情,如图1所示。 图1 角色界面 角色界面说明,如表1所示。 表1 界面元素说明 界面元素 说明 定制数字人 单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务。 数字人搜索框,可输入数字人名称进行精准搜索。 示例:云岚。 刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。 筛选条件 支持通过角色、性别、姿势、行业、区域和分辨率,筛选数字人。 数字人卡片 默认展示全量数字人卡片。单击数字人形象,自动替换至当前画面中。
-
创建角色 支持在奇妙问平台创建角色,并配置已上传的外部知识库和问答库给大模型学习使用,让角色的问答信息更丰富。 用户使用奇妙问前,需要联系奇妙问的客户经理注册开通服务。客户经理的联系方式,可以在云商店
语音合成 商品页面查看,如图1所示。 图1 查看联系方式 操作步骤如下所示,详细操作请联系奇妙问平台客服,如图1所示。 新增知识库:可以上传普通文件或者新增问答题库。 创建角色:在奇妙问创建问答角色。 查看角色信息:查看奇妙问创建角色的RoleId和AppSecret,即MetaStudio平台API调用所需的角色ID和角色密钥。 支持在奇妙问平台查看角色的所有会话记录。 父主题: 创建智能交互对话项目(奇妙问)
-
操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 互动问答 表1 互动问答配置 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址 MetaStudio服务调用第三方语言模型的API地址。 MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题,共计3个问题。其他数值的配置效果,以此类推。 对话内容合规审核 开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束
语音识别 。建议该值大于500ms。 委托语言交互服务(SIS) SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权。开启委托后,会弹出“选择委托站点”对话框,选择购买SIS服务的站点,单击“确定”即可。如果授权过程中出现报错信息“没有委托操作权限”,可能是当前
IAM 用户没有权限授权,需要参考开通委托报错如何处理?处理。 开启委托授权后,新增展示如下配置: 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。 单击“确定”,应用创建完成,效果如图2所示。 可单击“修改”,修改互动问答配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图3 应用发布
-
富媒体展示效果(SDK默认展示方式) 用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。 修改create方法中param参数的config配置项,即修改是否显示字幕字段enableCaption的值为true。 await HwICSUiSdk.create({
serverAddress: 'serverAddress',
robotId: 'robotId',
onceCode: 'onceCode',
containerId: 'containerId',
config: {
enableCaption: true
}
}); 修改setConfig方法是否显示字幕的配置项enableCaption的值为true。 HwICSUiSdk.setConfig({
enableCaption: true
}); 表1中导入的图片使用SDK默认方式时,在智能交互页面的展示效果,如图1所示。 图1 SDK默认方式展示效果
-
对话数据字段说明 保存至OBS桶中的智能交互对话数据的字段说明,如表2所示。 表2 对话数据字段说明 字段名称 字段类型 描述 session_id string 会话ID wakeup_type string 唤醒类型,取值如下所示: BUTTON:交互按钮唤醒 VOICE:语音唤醒 RADAR:雷达唤醒 INFRARED:红外门禁唤醒 CAMERA:摄像头唤醒 默认值:BUTTON。 wakeup_time long 唤醒时间 end_time long 结束时间 rounds int 对话轮数 client_info Object of ClientInfo 客户端信息 detail_info_list Arrays of DetailInfo 对话明细列表 表3 ClientInfo 字段名称 字段类型 描述 client_id string 客户端ID(门店GID) client_code string 客户端编号(门店编号) client_sn string 客户端设备SN(数字人设备SN号) client_type string 客户端类型,取值如下所示: CASH_REGISTER:收银机 DIGITAL_CLERK_SCREEN:独立大屏 表4 DetailInfo 字段名称 字段类型 描述 round int 对话轮数 intention string 意图 question_time long 提问时间 question string 提问内容 answer_time long 问答时间 answer string 问答内容
-
前提条件 已购买OBS桶,详见OBS计费说明。推荐购买“华北-北京四”区域的OBS桶。 已创建OBS桶,详见创建桶。 已创建OBS桶策略,详见自定义创建桶策略(JSON视图),请选择使用OBS控制台方式操作。 桶策略JSON格式内容,请按照对应MetaStudio服务所在Region依次替换内容。其中,“桶名”为桶名称,请替换为实际使用的OBS桶名称。 华东-上海一: {
"Statement": [
{
"Sid": "MetaStudioDialogReportPolicy-cn-east-3",
"Effect": "Allow",
"Principal": {
"Federated": [
"domain/2dd0b7e1241f4d3f9ee4a766b2b51011:identity-provider/*"
]
},
"Action": [
"PutObject"
],
"Resource": [
"{桶名}",
"{桶名}/*"
]
}
]
} 华北-北京四: {
"Statement": [
{
"Sid": "MetaStudioDialogReportPolicy-cn-north-4",
"Effect": "Allow",
"Principal": {
"Federated": [
"domain/2dd0b7e1241f4d3f9ee4a766b2b51011:identity-provider/*"
]
},
"Action": [
"PutObject"
],
"Resource": [
"{桶名}",
"{桶名}/*"
]
}
]
} 亚太-新加坡: {
"Statement": [
{
"Sid": "MetaStudioDialogReportPolicy-ap-southeast-3",
"Effect": "Allow",
"Principal": {
"Federated": [
"domain/599cda24c4d342659708b76cd74ebef0:identity-provider/*"
]
},
"Action": [
"PutObject"
],
"Resource": [
"{桶名}",
"{桶名}/*"
]
}
]
}
-
如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑界面右侧,选择“对话配置”页签,如图1所示。 如果是展厅场景,需要切换到“华北-北京四”区域。因为展厅的配置,均在“华北-北京四”区域。 参数配置说明如下所示,其他配置请参见对话配置。 语言:支持同时添加中文和英文,并设置其中一种语言为默认语言。 在数字人智能交互界面,自动展示默认语言,并用默认语言与用户进行问答。可通过界面右上方的语言切换图标,切换语言。 声音:单击声音右侧的图标,切换数字人声音。 这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,英文语言则选择对应的英文声音,否则数字人表达会有问题。 图1 对话配置 父主题: 智能交互
-
CBS委托授权失败怎么处理? CBS委托授权失败,是因为当前操作的用户子账户没有被授予“Security Administrator”权限导致。详细说明,如下所示: 华为云主账号默认拥有admin用户组权限,admin用户组是拥有所有操作权限的用户组,已默认包含“Security Administrator”权限,所以不会出现因为权限不足而导致CBS委托授权失败的问题。 由华为云主账号创建的IAM用户,如果没有被授予“Security Administrator”权限,则CBS委托授权失败,需参考下述操作添加“Security Administrator”权限。 创建用户组并授权 使用华为云主账号登录IAM控制台,创建用户组并授予“Security Administrator”权限。 将IAM用户加入用户组 使用华为云主账号登录IAM控制台,找到IAM用户,并将其加入1中创建的用户组。 父主题: 智能交互