-
步骤一:获取DeepSeek模型服务 在MaaS服务中获取DeepSeek模型服务,并记录API地址、模型名称和API Key,用于接入
KooSearch 。 登录ModelArts管理控制台,区域选择“西南-贵阳一”。 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。 参考使用ModelArts Studio的DeepSeek-R1模型框架实现对话问答,在MaaS服务中获取DeepSeek模型服务。 在DeepSeek模型服务的调用说明页面,获取并记录“API地址”和“模型名称”,根据页面提示获取并记录API Key。 图1 获取DeepSeek模型服务信息 最多支持创建5个密钥,密钥只会在新建后显示一次,请妥善保存。 当密钥丢失将无法找回,请新建API Key获取新的访问密钥。
-
方案优势 开箱即用:上传文档后,即可进行基于文档的问答,并支持灵活的API接入。支持非结构化和结构化数据入库,提供多轮问答、可溯源及图文输出功能。 高精度:集成高精度文本Embedding模型,提供智能文档解析、重组及搜索规划服务,检索准确率高。 高性能:内置
CSS 向量数据库,具备高精度和高性能,支持Flat、Graph、IVF、IVF_Graph、PQ等多种索引,并兼容Elasticsearch生态。 安全:支持物理多租、租户隔离、全托管服务,独享资源更稳定、性能更高。 强大的知识检索与生成能力:集成DeepSeek模型服务,使得RAG系统能够从大规模知识库中高效检索相关信息,并生成高质量、准确的答案。
-
步骤二:KooSearch对接公网 通过配置NAT网关和弹性公网IP将KooSearch对接到公网,便于接入MaaS服务中的DeepSeek模型服务。 登录NAT网关管理控制台。 在公网NAT网关列表页面,单击“购买公网NAT网关”,进入购买公网NAT网关页面。 在购买公网NAT网关页面,配置NAT网关。 关键参数请参见表1配置,其他参数可以保持默认值或基于业务场景配置。 表1 购买公网NAT网关 参数 说明 计费模型 建议选择“按需计费”。 区域 和KooSearch保持一个区域,选择“西南-贵阳一”。 虚拟私有云 和KooSearch选择同一个VPC。 子网 和KooSearch选择同一个子网。 单击“立即购买”,确认产品规格无误后,单击“提交”,开始创建公网NAT网关。当状态为“运行中”时,表示公网NAT网关创建成功。 当公网NAT网关创建成功后,在公网NAT网关列表页面,单击操作列的“设置规则”,在弹窗中单击“添加规则”。 在“SNAT规则”页面,单击“添加SNAT规则”,在弹窗中配置公网NAT网关的SNAT规则。 表2 添加SNAT规则 参数 说明 使用场景 选择“虚拟私有云”。 网段 选择“使用已有”,选择和KooSearch同一个VPC。 公网IP类型 选择“弹性公网IP”,勾选满足要求的IP。 如果没有可选的弹性公网IP,可以单击“查看弹性公网IP”跳转到弹性公网IP列表页,申请弹性公网IP。 弹性公网IP的建议配置如下: “计费模式”:“按需计费” “公网带宽”:“按流量计费” “带宽大小”:“20” 单击“确定”完成SNAT规则的添加。
-
体验知识问答 创建知识库。 在KooSearch控制台的左侧导航栏选择“知识库管理”,进入知识库管理页面。 单击右上角“新建知识库”,进入新建知识库页面。 在“新建知识库”页面设置知识库信息。 在“模型设置”页签,设置“NLP模型服务”,选择上一步新建的模型服务。 其他参数可以保持默认值或基于业务场景配置。 设置好后,单击“确定”完成知识库创建。 在知识库列表,选择新建知识库,单击操作列的“文档管理”。进入知识库详情页面。 选择“文档管理”页签,单击“上传”。在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图3 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 选择知识库。 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。 单击右上角,在“资料来源”对话框勾选新建的知识库,单击“确定”。 体验问答。 KooSearch同时支持由大模型自身知识回答和通过文章内容回答。 在“体验平台”页面右上角单击“问答”,切换至问答体验页面。 在输入框中输入问题,单击,查看返回的答案。 图4 体验问答
-
配置问答 在“体验平台”页面,单击右上角,在配置页面进行问答配置。 表2 问答配置 参数分类 参数 说明 搜索配置 问答配置 相关性阈值 超过相关度阈值的搜索结果才能在搜索结果页展示,否则被过滤。 NLP模型服务 选择NLP模型服务。 Query改写 开启后,将根据用户历史多轮对话,对query进行多轮改写和分解,改写后的query仅用于文档检索。 意图分类 勾选意图分类。 人设类:你叫什么名字? 天气类:今天天气怎样? 行业知识类: 对于行业知识类,建议使用前缀匹配,后续可能继续扩展。如:行业知识类-金融:贷款重组的定义是什么。 行业知识类-制造:我国的制造业到了什么阶段? 行业知识类-医疗:医疗事故有哪些? 行业知识类-政务:《国务院关于印发新一代人工智能发展规划的通知》的指导思想是什么? 行业知识类-金融:今天的股市怎么样? 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。 通用知识类:豆汁和豆浆的区别。 闲聊类:坐火车累死了。 说明: 未选择分类的先使用知识库检索再进行大模型总结,选中的分类直接使用大模型回答。 拒答回复 开启后,可以自己设置拒答回复语,当搜索的问题没有答案时,则会回复设置的回复语。 通用自定义prompt 使用场景:主要用于非RAG场景下的模型生成阶段。(非RAG场景:对话生成任务中,不使用检索步骤进行信息检索,直接使用生成模型生成回复。) 组成要素:用户问题、任务指令以及其他要求。 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。 QA问题生成自定义prompt 你是问题抽取专家,请根据下面的文档文本内容,归纳生成最多{0}个高质量问题,要求: (1)生成的问题可以根据所提供的文档文本内容进行回答 (2)以知识库问答的口语化个人提问方式呈现 (3)生成问题不能特指该文档文本内容 (4)生成知识点丰富全面的多样性问题 (5)生成的问题不能过于简单,确保生成问题的质量文档文本内容:{1} 注意:其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为 【文档名称】:{title1}
【文档内容】:{content1}
【文档名称】:{title2}
【文档内容】:{content2}
......
检索的query将被填充至{1}所在位置后进行生成。 QA答案生成自定义prompt 你是问题抽取专家,请根据下面的文档文本内容,归纳生成最多{0}个高质量问题,要求: (1)生成的问题可以根据所提供的文档文本内容进行回答 (2)以知识库问答的口语化个人提问方式呈现 (3)生成问题不能特指该文档文本内容 (4)生成知识点丰富全面的多样性问题 (5)生成的问题不能过于简单,确保生成问题的质量文档文本内容:{1} 注意:其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为
【文档名称】:{title}
【文档内容】:{content}
生成的问题将被填充至{1}所在位置后进行对应答案生成。 引用相关度阈值 超过相关度阈值的搜索结果会提交给大模型进行总结,否则被过滤。 FAQ搜索直出阈值 超过阈值的FAQ会作为答案直接输出,不需要经过大模型总结。 模型配置 文本多样性(top_p) 通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。默认值为0.1。 模型生成最大新词数(max_tokens) 控制文本的最大生成长度,值越大有助于生成较长或完整的回复;值较小,生成的内容越简洁。默认值为2048。 说明: 如果选择NLP模型-昇腾云类型的模型服务进行问答,建议设置模型生成最大新词数不超过512。 非搜索增强模型生成多样性(temperature) 控制非搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.8。 搜索增强模型生成多样性(temperature) 控制搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.3。 文本重复度(presence_penalty) 用于控制生成文本中特定单词或短语出现的频率。值越高生成的文本会使用更多样的单词和短语,减少重复性。默认值为0。 单击“确定”。
-
体验问答 在“体验平台”页面右上角单击“问答”,切换至问答体验页面。 在输入框中输入问题,单击,查看返回的答案。 图1 体验问答 表1 图标说明 图标 说明 认同内容,直接单击即可。 不认同内容,在针对问题、针对搜索、针对回答中选出您认为的不合理的意见,也可以在对话框中输入您认为更理想的回答,单击“提交”。 复制内容。 刷新内容。 查看答案参考源。在参考列表中,单击“阅读全文”,可查看文档原文。 说明: 当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。 问答体验页面上还有“对话配置”和“对话清空”按钮,如下图所示。 图2 按钮说明 “对话配置”:如果您在对话过程中想修改配置,可以单击“对话配置”按钮,具体的配置参数请参考配置问答小节。 “对话清空”:单击“对话清空”按钮可以清空当前对话页面,清空之后再进行问答,会默认进行下一轮问答。
-
修改知识库设置 针对已创建的知识库,支持修改知识库设置。 在KooSearch控制台,左侧导航栏选择“知识库管理”。 进入知识库管理页面。 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”。 进入文档管理页面。 单击右上角的“设置”,修改解析拆分设置和更多设置。 解析拆分设置 参考表1与表2修改设置。 更多设置 修改“搜索模型设置”、“NLP模型设置”和“高级设置”,如何修改请参考新建知识库中步骤5和步骤6。 同时支持新增“其他”设置。 表6 其他设置 参数 说明 topk召回数量 设置topk召回数量。 召回结果中topk的文档将被精排模型使用。 topk未配置时,将使用默认值50。 参考文档数量 设置RAG大模型参考的文档数量。 参考文档数量未配置时,将使用默认值3 精排 知识库精排开关默认为开启状态,如果未配置,则为开启状态。 注意: 关闭精排时相关性得分范围为0-200,开启精排时相关性得分为0-1,在开启或关闭精排后需要重新设置相关性阈值和引用相关度阈值,否则会影响过滤效果! Query改写 开启后,将根据用户历史多轮对话,对输入query进行问题拆分和改写,改写后的query仅用于文档检索。 意图分类 勾选意图分类。 人设类:你叫什么名字? 天气类:今天天气怎样? 行业知识类: 对于行业知识类,建议使用前缀匹配,后续可能继续扩展。如:行业知识类-金融:贷款重组的定义是什么。 行业知识类-制造:我国的制造业到了什么阶段? 行业知识类-医疗:医疗事故有哪些? 行业知识类-政务:《国务院关于印发新一代人工智能发展规划的通知》的指导思想是什么? 行业知识类-金融:今天的股市怎么样? 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。 通用知识类:豆汁和豆浆的区别。 闲聊类:坐火车累死了。 说明: 未选择分类的先使用知识库检索再进行大模型总结,选中的分类直接使用大模型回答。 拒答回复 开启后,可以自己设置拒答回复语,当搜索的问题没有答案时,则会回复设置的回复语。 通用自定义prompt 使用场景:主要用于非RAG场景下的模型生成阶段。(非RAG场景:对话生成任务中,不使用检索步骤进行信息检索,直接使用生成模型生成回复。) 组成要素:用户问题、任务指令以及其他要求。 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。 QA问题生成自定义prompt 你是问题抽取专家,请根据下面的文档文本内容,归纳生成最多{0}个高质量问题,要求: (1)生成的问题可以根据所提供的文档文本内容进行回答 (2)以知识库问答的口语化个人提问方式呈现 (3)生成问题不能特指该文档文本内容 (4)生成知识点丰富全面的多样性问题 (5)生成的问题不能过于简单,确保生成问题的质量文档文本内容:{1} 注意:其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为 【文档名称】:{title1}
【文档内容】:{content1}
【文档名称】:{title2}
【文档内容】:{content2}
......
检索的query将被填充至{1}所在位置后进行生成。 QA答案生成自定义prompt 你是问题抽取专家,请根据下面的文档文本内容,归纳生成最多{0}个高质量问题,要求: (1)生成的问题可以根据所提供的文档文本内容进行回答 (2)以知识库问答的口语化个人提问方式呈现 (3)生成问题不能特指该文档文本内容 (4)生成知识点丰富全面的多样性问题 (5)生成的问题不能过于简单,确保生成问题的质量文档文本内容:{1} 注意:其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为
【文档名称】:{title}
【文档内容】:{content}
生成的问题将被填充至{1}所在位置后进行对应答案生成。 单击“确定”,完成知识库设置的修改。 修改完配置之后,已经导入的文件需要重新导入才能使知识库设置生效。
-
新建知识库 在KooSearch控制台,左侧导航栏选择“知识库管理”。 进入知识库管理页面。 在知识库管理页面,单击右上角“新建知识库”。 在“新建知识库”页面设置知识库信息。 在创建知识库页签填写“知识库名称”、选择“知识库语言”,填写知识库“描述”,单击“下一步”。 图1 创建知识库 在“解析拆分设置”页签配置解析设置和拆分设置,然后单击“下一步”。 解析设置:勾选需要解析的能力。 表1 解析设置 参数 说明 OCR增强 勾选后,即可调用OCR服务进行智能文档识别,如表格解析或扫描文件等。 解析图片 未勾选,在文档中遇到图片默认跳过,不处理图片。 勾选后,有两种解析方式可供选择: 提取图片文本:识别图片内文字。 仅保留原图:将图片提取后上传OBS桶,便于问答图文展示。 解析页眉页脚 未勾选,解析结果中不包含页眉页脚。 勾选后,解析结果中包含页眉页脚。 解析目录页 未勾选,解析结果中不包含目录页。 勾选后,解析结果中包含目录页。 拆分设置:即分段设置,选择分段方式。 表2 拆分设置 参数 说明 自动分段 系统根据文档特点自动选择合适的分段方式。 长度分段 默认按照段落进行拆分合并,如果段落过长则通过标识符进行分段。 分段标识符:分段方式为遇到所选符号即截断,符号之间没有优先级,最终分割后合并到预计最大长度。自定义分段中如果未命中分段标识符,分段将会失败。 分段预计长度:分段的最大长度,文档的正文如果超过设定的[最大长度],则截取[最大长度]的片段为新文档,随后回溯[分段重叠]字符,继续向后检查,直到文档结束。 层级分段 先按照文章的标题层级分段,再按照段落进行拆分合并,如果段落过长则通过标识符进行分段。 层级解析模式:可选择自动解析和规则解析。选择规则解析需要自定义层级规则。 层级分段详情如表3所示。 表3 层级分段 参数 说明 层级解析模式 自动解析:按照系统规则自动解析。 规则解析: 由于不同文档的层次结构多样且不一致,针对不同的文档可自定义其文档层次解析规则,更好地解析切分文档从而提升基于文档知识问答的准确率。 自定义默认规则 将最常见的规则,作为默认规则可选,详情请参见提供的默认规则示例。 自定义解析规则 当前解析规则采用正则语言编写,可参见如表5示例。 标题层级深度 选择文章的标题层级深度。 标题保存方式 可选择“保存多标题组合”和“保存最后一级标题”。 分段标识符 分段方式为遇到所选符号即截断,符号之间没有优先级,最终分割后合并到预计最大长度。自定义分段中如果未命中分段标识符,分段将会失败。 分段预计长度 分段的最大长度,文档的正文如果超过设定的[最大长度],则截取[最大长度]的片段为新文档,随后回溯[分段重叠]字符,继续向后检查,直到文档结束。 跨标题合并 打开“跨标题合并”开关:不同标题段落文字较少时,会自动合并到指定的分段长度,有助于生成更全面的结果。关闭“跨标题合并”开关:不会自动合并不同标题。 说明: “层级分段”页签中有此按钮,可以自己设置开关。 “自动分段”页签中没有此按钮,在“自动分段”中跨标题合并功能默认打开。 “长度分段”不涉及此功能。 表4 规则解析默认规则示例 类别 规则 描述 第一章 第一节 第一条 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})章 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})节 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})条 以章的规则为例: 中括号内大写的阿拉伯可以匹配,例如:第一章。 支持1-9的阿拉伯数字匹配,例如: 第1章。 最大支持中间位数出现的位数有7位。例如:第一千一百三十七章。 节和条的规则类似。 表5 自定义规则解析示例 类别 规则 描述 第一章 第一节 第一条 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})章 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})节 ^第([零〇一二三四五六七八九十百千万1-9]{1,7})条 / 1 1.1 1.1.1 ^(\d+\.)(?=\s) ^(\d+)(\.\d+)(?!\.)(?=\s) ^(\d+)(\.\d+)(\.\d+)(?!\.)(?=\s) 可以匹配数字开头的段落。 备注: [\u4e00-\u9fa5]+ 限制中文) 例如: 1. 简介 1.1 说明 1.1.1 详细说明 一、 (一) 1、 1) ^([零〇一二三四五六七八九十百千万]+)[、] ^(([零〇一二三四五六七八九十百千万]+)) ^[\d+]、 ^[\d+]) / 图2 自定义规则解析示例 在“模型设置”页签配置好模型后,单击“下一步”。 搜索模型设置 选择Embedding模型服务、精排模型服务、搜索规划模型服务。 Embedding模型服务:基于盘古大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、聚类、推荐等场景。 精排模型服务:基于盘古大模型技术的文本表示模型,将文本转化为用数值表示的向量形式,用于文本检索、聚类、推荐等场景,语义搜索场景下,加入了精排模型,提升搜索的效果。 搜索规划模型服务:搜索规划模型服务提供了意图分类、多轮查询改写、复杂查询分解、时间抽取等功能,在搜索增强生成任务中,通过意图分类的结果将路由到后续不同的流程;通过改写查询词及查询分解以提高搜索的准确率。 NLP模型设置 选择NLP模型服务。基于盘古大模型的人工智能语言模型,可进行对话互动、回答问题、协助创作。 扩展长上下文: 如果打开了此参数,模型在解析过程中会扩展长上下文以生成更全面结果。 有效输入长度(K):如果打开“扩展长上下文”按钮,则需要设置有效输入长度,输入令牌的有效长度以保证最佳输出。 进入“高级设置”页面,设置好后,单击“确定”。 引用定位:针对回答结果定位到原文位置。 图文结合:展示原文引用关联图片。打开后,有以下两种解析方式可供选择: 仅召回语义相关图片:引用文段中图片的上下文与生成文段语义相似即召回,否则不召回。(默认选项)。 全部图片:引用文段中图片全部召回。 知识库缓存:如果打开知识库缓存按钮,您的搜索效率会相对高效。使用知识库缓存需要选择以下几个参数。 缓存生成模型服务:选择一个模型服务。 缓存阈值:达到缓存阈值,就会使用缓存输入值必须在0.1到1之间。 缓存策略:达到缓存阈值,如果有多个答案,可以设置最高分或者随机。 过期策略配置:缓存过期的方式,有3种选择。 Least Recently Used:根据当前时间与最后一次访问时间的差值超过存活时间时删除。 First In First Out:根据当前时间与创建时间的差值超过存活时间时删除。 Least Frequency Used:小于缓存命中阈值且当前时间与创建时间大于存活时间时清除,大于阈值时保留 存活时间(秒):可以自己设置缓存的存活时间,或者直接设置成永久。 知识库创建好后,可以在知识库管理页面查看到新创建的知识库基本信息,包括知识库ID、知识库名称、知识库状态等信息。
-
场景描述 KooSearch服务开通成功后,会自动创建KooSearch API。在KooSearch服务详情页的API管理页签,可以看到
知识管理 和文档解析两类API。 知识管理:该类API主要用于知识库管理,例如上传文档、刷新文档等。 文档解析:该类API主要用于对文档数据进行处理,例如切分文档内容。 将KooSearch API发布到不同环境后,支持在环境中调用API使用KooSearch服务。操作流程如下: 在APIG服务配置API网关:配置API网关。 在
CS S服务发布KooSearch API:发布KooSearch API。 在业务环境中调用已发布的KooSearch API:调用已发布的KooSearch API。 当已发布的KooSearch API需要修改安全认证方式时,可以编辑API。 当已发布的KooSearch API不希望被调用时,可以下线API。
-
调用已发布的KooSearch API 在业务环境中调用已发布的KooSearch API。 构造API请求,KooSearch API的请求说明请参见《KooSearch API参考》。 为API请求添加认证信息。 表2 认证方式 认证方式 API请求参数配置 APP认证 表示由API网关服务负责接口请求的安全认证。推荐使用APP认证方式。 关于使用APP认证的方法,具体请参考使用APP认证调用API。 华为
IAM 认证 表示借助IAM服务进行安全认证。 关于IAM认证的方法,具体请参考使用IAM认证调用API。 说明: 选择“华为IAM认证”时,任何API网关租户均可以访问此API,可能存在恶意刷流量,导致过量计费的风险。
-
升级前检查 为了保证升级成功,需要做升级前检查,升级前检查主要包括如下事项: 表1 升级前检查项 检查项 检查方式 描述 正常状态 集群状态 系统检查 升级任务启动后,系统会自动检查集群状态。“集群状态”为“可用”,表示集群可以正常提供服务。 “集群状态”为“可用”。 资源充足 系统检查 升级任务启动后,系统会自动检查资源。升级过程中会切换OS镜像,需要保证有资源可用。 资源可用且配额充足。 非标操作 人工检查 确认是否存在非标操作。非标操作指的是没有被记录下来的手动操作,这些操作在升级过程中无法自动传递,比如修改系统配置、回程路由等。 未记录到系统中的非标改动,在升级过程中将不会继承下来,升级后可能会影响您的业务,需要提前备份。
-
场景描述 升级原理 升级过程采用的是one-by-one的方式。升级时,先下线一个节点,然后对该节点执行切换OS镜像的动作,再将已下线节点的网卡port挂载回来,以此保留节点IP地址,再进行初始化节点启动进程,待节点信息更新后,再依次将其余节点镜像进行替换。升级过程中存在节点下线再上线的动作,可能会中断服务,请在业务低峰期执行。 升级流程 进行升级前检查:升级前检查 升级前检查大部分支持系统检查,少部分需要人工检查。 创建升级任务,启动升级:创建升级任务
-
上传结构化数据 提前在本地准备好待上传的结构化数据文件。 支持UTF-8编码的JSONL文件格式,单个文件最大50M,自定义数据长度应在4-1024个字符之间,且文件中仅能使用一种操作。模板如下所示: {"cmd":"ADD","id":"100001","content":"content for the first data"}
{"cmd":"ADD","id":"100002","title":"title for the second data","content":"content for the second data","url":"","docTime":"2015/01/01 12:10:30","category":"category1","tags":["tag1","tag2","tag3"]}
{"cmd":"UPDATE","id":"100002","content":"The content for the second data is updated","category":"newCategory"}
{"cmd":"DELETE","id":"100002"} 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”,进入“文档管理”页面。 单击“结构化数据”,切换至“结构化数据”页签。 单击“上传”,在上传对话框中单击“选择文档”,本地选择已提前准备好的结构化数据文件。 单击“确认”。 文件上传后,可在结构化数据页签查看已上传的文件,当“导入状态”为“正常”,说明文件已上传成功。
-
创建FAQ 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”。 进入“文档管理”页面。 单击“FAQ管理”,切换至“FAQ管理”页签。 单击“创建”,在“新建问答”对话框中输入“标准问题”和“答案”,单击“添加相似问题”,可输入多个相似问题。 在对话框中单击“确认”。 FAQ创建后,可在FAQ管理页签查看已创建的问答。 管理FAQ。 单击操作列的“编辑”,可重新编辑FAQ。 单击操作列的“删除”,可删除已创建的FAQ。
-
上传文档 提前在本地准备好待上传的文档。 支持格式为 .doc, .docx, .pdf, .pptx, .ppt, .xlsx, .xls, .csv, .wps, .png, .jpg, .jpeg, .bmp, .gif, .tiff, .tif, .webp, .pcx, .ico, .psd, .dps, .et, .txt, .ofd 的多个文档,单个文档不能超过128MB(超过60MB建议通过API上传),当前版本中图片上传、文档内单张图片上传最大不超过10MB。 在KooSearch控制台,左侧导航栏选择“知识库管理”,进入“知识库管理”页面。 在知识库管理页面,选择已创建的知识库,单击操作列的“文档管理”,进入“文档管理”页面。 图1 进入文档管理页面 默认进入“文档管理”页签,单击“上传”。 在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。 图2 上传文档 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。 文档上传成功后,可以单击文档名称,进入文档信息详情页查看切片效果,单击页面右边的切片内容可以跳转到原文对应的地方(此功能目前只支持.pdf文件)。 图3 单击文档名称 图4 切片效果 管理文档数据。 单击操作列的“下载”,可下载文档至本地。 单击操作列的“删除”,可删除已上传的文档。 单击操作列的“QA生成”,可将上传的文档生成问答模式的Excel文档,生成任务在“任务管理”页签可以查看。 单击操作列的“重试”,可对已上传的文档重新进行切片,生成任务在“任务管理”页签可以查看。