操作步骤 登录MetaStudio控制台,进入MetaStudio服务概览页面。 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。 单击“智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。 查看界面右侧的“互动问答”页签,如图1所示。 参数配置说明,如表1所示。 图1 互动问答 表1 互动问答配置 参数 说明 第三方应用 选择“第三方语言模型”。 应用名称 输入自定义的应用名称。 APPID MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。 APPKEY MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。 第三方语言模型地址 MetaStudio服务调用第三方语言模型的API地址。 MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。 流式响应 MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。 多轮语境理解能力 配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。 配置说明,如下所示: 如果设置为“1”,则问答请求时,不支持携带历史会话。 如果设置为非“1”,则问答请求时,携带历史会话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2个问题,共计3个问题。其他数值的配置效果,以此类推。 对话内容合规审核 开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。 配置检查 单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。 尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束
语音识别 。建议该值大于500ms。 委托语言交互服务(SIS) SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权。开启委托后,会弹出“选择委托站点”对话框,选择购买SIS服务的站点,单击“确定”即可。如果授权过程中出现报错信息“没有委托操作权限”,可能是当前
IAM 用户没有权限授权,需要参考开通委托报错如何处理?处理。 开启委托授权后,新增展示如下配置: 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。 SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。 单击“确定”,应用创建完成,效果如图2所示。 可单击“修改”,修改互动问答配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。 并发数 同时使用当前激活码进入智能交互对话项目链接的用户数。请根据实际需要进行配置,否则当用户同时访问数大于这里配置的并发数时,智能交互界面会报“MSS.20010135”错误,即对话资源不足。 有效期 从发布开始的智能交互可用时长。 单击界面右上角的“发布”,发布数字人智能交互对话。 发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。 也可以单击“复制分享”,复制发布链接和激活码,分享给其他用户使用。还可以参考查看对话项目,获取对话项目的发布链接和激活码。 图3 应用发布