什么是向量模型
向量检索广泛应用于基于LLM模型的搜索、问答、Chat等场景,典型如缓存系统的搭建、搜索系统的选型等;高性价比/高精度的向量检索引擎为其提供了快速响应、高可扩展性、高精度等保障。
多模态检索 利用多模态向量技术,可以实现文搜图、实现结果的“图文并茂+”。 文本向量模型 可更加精准找到相关文本,不同于向量模型输出向量,直接计算query和doc的相关性更加准确,可用于对向量召回结果的重新排序。 向量检索 向量数据库的向量检索特性,支持根据文本的向量的相似度进行召回。
多模态检索 利用多模态向量技术,可以实现文搜图、实现结果的“图文并茂+”。 文本向量模型 可更加精准找到相关文本,不同于向量模型输出向量,直接计算query和doc的相关性更加准确,可用于对向量召回结果的重新排序。 向量检索 向量数据库的向量检索特性,支持根据文本的向量的相似度进行召回。
语义搜索效果增强 语义搜索效果增强 基于盘古大模型技术的文本向量大模型效果业界遥遥领先 自研向量检索引擎,极致性价比,ann-benchmarks打榜第一 多场景覆盖,满足各类检索需求 站内搜索 全场景日志分析 数据库查询加速 向量检索 站内搜索 站内搜索 对网站内容进行关键字检索、对电商网站商品进行检索与推荐。
语义搜索效果增强 语义搜索效果增强 基于盘古大模型技术的文本向量大模型效果业界遥遥领先 自研向量检索引擎,极致性价比,ann-benchmarks打榜第一 多场景覆盖,满足各类检索需求 站内搜索 全场景日志分析 数据库查询加速 向量检索 站内搜索 站内搜索 对网站内容进行关键字检索、对电商网站商品进行检索与推荐。
速上线视频等新闻业务。图形化拖拽开发界面,帮助用户视频处理效率提升50%,内容发布时间缩减30%。 文档与学习成长 快速入门 快速入门 什么是对象存储服务 对象存储服务应用场景 快速通过OBS控制台上传下载文件 快速通过OBS Browser+上传下载文件 查看更多 最佳实践 最佳实践
将中文文本切分成以独立的词为单位的序列 将中文文本切分成以独立的词为单位的序列 词向量 将自然语言中的词进行向量化表示,输入文本语料库,输出每个词的词向量表示 将自然语言中的词进行向量化表示,输入文本语料库,输出每个词的词向量表示 命名实体识别 挖掘出文本中的实体,如人名、机构名、地名等 挖掘出文本中的实体,如人名、机构名、地名等
ClickHouse应用开发指导 查看更多 常见问题 常见问题 CloudTable集群能够提供什么服务? 为什么要选择CloudTable服务? 使用CloudTable服务时需要关注什么? 查看更多
创建MBM Space操作账号 创建工厂模型 查看更多 产品介绍 产品介绍 什么是数字化制造云平台 产品优势 产品功能 应用场景 查看更多 用户指南 用户指南 制造数据模型管理 计划管理 生产管理 质量管理 查看更多 常见问题 常见问题 为什么在使用数字化制造云平台时提示无权限操作?
设备巡检 使用基础模型结合行业知识,解决设备巡检场景训练样本少、故障种类多、目标尺度差异大等挑战。 智慧城市 利用万物检测、万物分割满足智慧城市海量长尾需求,通过语言交互方式高效发现城市事件。 文档与学习成长 盘古大模型 盘古大模型 什么是盘古大模型 盘古CV大模型能力与规格 盘古大模型用户指南
基于Atlas500的边缘计算,连接摄像头进行行为的视频实时分析与预警,与业务系统对接,提升营业厅服务能力。在智能化设备基础上,利用人工智能和大数据技术打造智慧营业厅建设,以客户为中心,为客户提供一个更方便、更安全、更高效、更人性化的服务平台,实现快捷、高效的超值服务。 基于Atlas
根据工业生产制造过程中 AOI 设备拍摄的产品图像,识别出产品中所存在的质量缺陷,并依照设定的业务规则对缺陷进行编码分类。通过 AI 技术可以替代目前使用人力进行重复性劳动。人工智能结合物联网和大数据技术,能够实现对产品质量的自动检测扩展到生产的全流程,从而不仅提高质检效率,甚至
)有限公司是一家集数字(包括VR)内容创作、技术研发、智能融媒体垂直应用平台开发与运营的文化科技公司,注册于北京市东城区。公司专注于5G+媒体融合创新应用,自主研发的“精品内容+专属平台+智能硬件”三者耦合解决方案,已广泛应用于文化、教育及数字文旅等领域。未来新视界是一家秉承原创
Weaviate 是一个开源的向量数据库,可以同时存储对象和向量,将向量搜索和结构化过滤相结合, 从而创建一个稳健、故障容许的搜索引擎。Weaviate 是一个开源的向量数据库,可以同时存储对象和向量,将向量搜索和结构化过滤 (structured filtering) 相结合,
智慧监控AI模型综合集成了人脸识别模型、安全帽识别模型、口罩佩戴识别模型、车牌识别模型、车辆占道识别模型5种AI模型。一,人脸识别服务 人脸识别模型目前提供授权认证、模型加载、人脸注册、人脸识别、人脸删除、特征提取六个接口服务。 授权认证:需先进行授权认证,才能够正常使用人脸识别服务;
性,为销量预测模型提供可靠的数据支持3、指导品牌方利用模型正确输出预测结果。详细讲解销量预测模型的输出原理和方法,让品牌方掌握正确输出及解读预测结果的技巧4、指导品牌方对模型调优,以提高模型预测准确度。指导品牌方进行模型参数调整、数据更新和算法优化等工作,传授模型调优的方法和技巧
出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语言生成和语音识别等不同任务。出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型
《互联网信息服务算法推荐管理规定》明确,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息 方便
. 模型更新后,将新模型部署至相应环境。 十一、模型评测1. 设计模型评测方案,对大模型各类指标进行评测。2. 能够按评测标准对大模型各项能力进行打分,输出大模型评测报告。 十二、Agent开发1. 基于场景,设计并开发Agent工具。2. 基于langchain等大模型框架,完
训练作业的“/cache”目录是否安全? ModelArts训练作业的程序运行在容器中,容器挂载的目录地址是唯一的,只有运行时的容器能访问到。因此训练作业的“/cache”是安全的。 如何查看训练作业资源占用情况? 在ModelArts管理控制台,选择“训练管理>训练作业”,进入
GaussDB是什么 GaussDB是什么 GaussDB是华为基于openGaussDB自研生态推出的企业级分布式关系型数据库,具备企业级复杂事务混合负载能力,支持分布式事务强一致,同城跨AZ部署,数据0丢失,支持1000+扩展能力,PB级海量存储。同时拥有云上高可用,高可靠,
I、SDK。 什么是OBS对象(Object) 对象(Object)是OBS中数据存储的基本单位,一个对象实际是一个文件的数据与其相关属性信息(元数据)的集合体。用户上传至OBS的数据都以对象的形式保存在桶中。 什么是OBS桶(Bucket) 桶(Bucket)是OBS中存储对象
务_什么是HBase MapReduce服务_什么是HetuEngine_如何使用HetuEngine MapReduce服务_什么是HDFS_HDFS特性 MapReduce服务_什么是Flink_如何使用Flink MapReduce服务_什么是Flume_如何使用Flume
什么是CDN产品 什么是CDN产品 内容分发网络 CDN 内容分发网络 CDN CDN产品是通过将源站内容分发至靠近用户的加速节点,使用户可以就近获得所需的内容,解决Internet网络拥挤的状况,提高用户访问的响应速度和成功率,从而提升您业务的使用体验。 CDN产品是通过将源站
志分析平台,助力企业实现数据驱动运维,数据驱动运营;它的向量检索能力可以帮助客户快速构建基于AI的图搜、推荐、语义搜索、人脸识别等丰富的应用。 立即购买 管理控制台 关于CSS云搜索服务 什么是云搜索服务CSS 云搜索服务是一个基于Elasticsearch且完全托管的在线分布式
00个基模型空间,通过模型推荐、融合两步优化策略,构建图网络架构AI模型。 了解详情 盘古科学计算大模型 科学计算大模型是面向气象、医药、水务、机械、航天航空等领域,采用AI数据建模和AI方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用AI模型更快更准的解决科学计算问题。
商业智能与大数据分析软件镜像。 CAXA PLM协同管理软件实施服务的服务商是哪家公司? CAXA PLM协同管理软件实施服务的服务商是北京数码大方科技股份有限公司。 介绍一下CAXA PLM协同管理软件实施服务的服务商。 数码大方是中国领先的工业软件和工业云服务公司,提供CAXA PLM协同管
好会计:结账 好会计:结账 好会计:结账,是把一定时期内发生的全部经济业务登记入账的基础上,计算并记录本期发生额和期末余额后,将余额结转下期或新的账簿的会计行为。会计基础中的结转,或期末结转,指期末结账时将某一账户的余额或差额转入另一账户。这里涉及两个账户,前者时转出账户,后者时
什么是向量模型
操作场景
本文通过调用一系列知识中心的API,介绍从零开始创建知识库并进行检索的基本流程。API调用方法请参见如何调用API。
前提条件
准备一篇名为“问题.txt”的文档,文档内容为:
“什么是量子计算?它是一种利用量子力学原理进行信息处理的计算方式。====
什么是RAG?它是一种通过整合检索系统和生成模型的优势,来提升模型生成文本的质量和上下文相关性。====”
操作流程
步骤一:创建数据集
{ "name": "测试", "description": "测试", "data_type": "TEXT", "tags": [ "对话问答", "文案生成" ], "ingestion_config": { "data_source": "FILE_UPLOAD", "file_types": [ "txt" ] }, "schedule_config": { "schedule_type": "ONCE" }, "preprocess_config": { "cleaning_methods": [ "invisible" ], "pdf_preprocess_type": "NO_PREPRO CES S" }, "chunk_config": { "slicing_configs": { "txt": { "slicing_method": "sentence", "sentence_slicing_config": { "slicing_strategy": "equivalent", "spec_symbols": [ "====" ], "contain_separator": false, "chunk_size": 26, "chunk_overlap": 0 } } } }, "extraction_config": { "extraction_example": "今天天气如何?答:还不错哦。", "extraction_mode": "RULE_EXTRACTION", "rule_extraction_configs": [ { "extraction_rule": "SEPARATOR", "field_name": "question", "separator_extraction": { "contain_separator": false, "extraction_code": 2, "separator": "?" } }, { "extraction_rule": "TEMPLATE", "field_name": "answer", "template_extraction": { "contain_end": true, "contain_start": false, "end_with": "。", "extraction_code": 1, "start_with": "它是" } } ] }, "index_config": { "description": "索引配置", "long_text_solution": "TRUNCATE_MODE", "name": "索引配置", "rag_type": "VECTOR_RAG", "retrieval_configs": [ { "category": "FULL_CHUNK", "name": "chunk", "retrieval_return": false, "text_filter": false, "vector_retrieval": false }, { "category": "CHUNK_FRAGMENT", "name": "question", "retrieval_return": true, "text_filter": true, "vector_retrieval": true }, { "category": "CHUNK_FRAGMENT", "name": "answer", "retrieval_return": true, "text_filter": true, "vector_retrieval": false } ], "vector_model_service_key": "GPT-4" } }
在创建知识数据集中,有几个参数需要注意:
- ingestion_config内的data_source:表明数据来源,FILE_UPLOAD为文件上传,您需上传文件; OBS _IN GES TION表示OBS接入,您需添加OBS信息的配置。
- chunk_config:表示如何对文本进行切分。
- extraction_config:表明要对切片做提取操作,切片提取出的字段可以在索引配置中使用。
- index_config:索引配置,其中retrieval_configs配置完整切片内容,以及提取出的字段内容,在知识库检索时如何使用。
{ "data" : "3f28e62-xxxxxxxx-a15be0d638a2" }
步骤二:查询知识数据集创建结果
调用查询知识数据集最新执行记录接口查询创建结果,该接口所需的知识数据集id为步骤一:创建数据集返回的内容。
根据返回结果响应:
{ "data" : { "id" : "djh28e62-3a81-4018-a48f-a15be0d63812", "result" : "SU CCE SS", "progress" : 100.0, "run_time" : 27684, "start_time" : "2024-11-22T03:15:49.000+00:00", "end_time" : "2024-11-22T03:16:17.000+00:00", "log_detail" : "开始任务......结束任务" } }
- 如果result字段值为SUCCESS,则表明数据集创建成功。
- 如果result字段值为RUNNING,则表明数据集正在创建,请稍候。
- 如果result字段值为FAILURE,则表明数据集创建失败,请检查文件是否符合要求。
步骤三:查询数据集版本和索引信息
知识数据集创建成功后,调用查询知识数据集详情接口,查询数据集版本和索引信息,响应示例如下:
{ "data" : { "data_set_versions" : [ { "id" : "askdjh28e62-xxxxxxxxx-a15be0d63812", "version" : "v2024-11-21T11:36:55Z", "created_date" : "2024-11-11 19:36:57", "last_updated_date" : "2024-11-21 19:36:57" } ], "index_configs" : [ { "id" : "d3f28e62-xxxxxxx-a15be0d638a2", "name" : "索引配置名称", "description" : "索引配置", "data_set_id" : "d3f28e62-3a81-4018-a48f-a15be0d638a2", "vector_model_service_key" : "service_key", "index_vector_config" : { "long_text_solution" : "TRUNCATE_MODE" } } ] } }
保存创建知识库对应的数据集版本id、版本号、索引配置id。数据集版本和索引可能有多个,可以任意组合。
步骤四:创建知识库
调用创建知识库接口创建知识库。根据保存的数据集id,数据集版本号,索引配置id,构建请求体,创建知识库即可。请求体如下:
{ "name": "知识库名称", "description": "知识库描述", "retrieval_status": "ENABLE", "rag_type": "VECTOR_RAG", "retrieval_config": { "retrieval_modes": [ "SEMANTIC_RETRIEVAL", "FULL_TEXT_RETRIEVAL" ], "retrieval_hybrid_mode": "RRF" }, "knowledge_data_sets": [ { "data_set_id": "djh28e62-xxxxxxxxx-a15be0d63812", "data_set_version": "v2024-11-21T11:36:55Z", "index_config_id": "d3f28e62-xxxxxxx-a15be0d638a2" } ] }
注意:retrieval_status字段设置知识库是否启用检索,如果启用,则检索前不需要再调用修改知识库召回状态接口启用知识库。
将创建接口响应内容保存起来,该内容为知识库id:
{ "data" : "3f28e62-xxxxxxxx-a15be0d638a2" }
步骤五:查询知识库创建结果
调用查询知识库最新执行记录接口查询创建结果。该接口所需的知识库id为步骤四:创建知识库返回的内容。
返回结果响应如下:
{ "data" : { "id" : "djh28e62-3a81-4018-a48f-a15be0d63812", "result" : "SUCCESS", "progress" : 100.0, "run_time" : 27684, "start_time" : "2024-11-22T03:15:49.000+00:00", "end_time" : "2024-11-22T03:16:17.000+00:00", "log_detail" : "开始任务......结束任务" } }
- 如果result字段值为SUCCESS,则表明知识库创建成功。
- 如果result字段值为RUNNING,则表明知识库正在创建,请稍候。
- 如果result字段值为FAILURE,则表明知识库创建失败,请检查文件是否符合要求。
步骤六:启用或停用知识库召回功能
调用修改知识库召回状态接口启用或停用知识库召回功能。
若创建知识库时已经启用知识库,则不需要执行此步骤。否则需启用知识库,请求体为:
ENABLE
若响应如下,则启用成功。
{ "data" : true }
步骤七:检索知识库数据
调用检索知识库数据接口检索知识库(知识库召回状态需为启用),请求体示例如下:
{ "keyword" : "什么是", "similarity_min" : "0.78", "limit" : 10, "filter" : { "group_type" : "AND", "expressions" : [ { "field" : "metadata.answer", "field_type" : "STRING", "operator" : "EQUAL", "values" : [ "一种利用量子力学原理进行信息处理的计算方式。" ] } ] }, "order_by" : { "order_items" : [ { "field" : "metadata.order", "field_type" : "INT", "order_type" : "DESC" } ] }, "data_sets" : [ { "data_set_id" : "a31ed909-xxxx-xxxx-xxxx-10958c90b3f7" } ] }
根据索引配置,返回结果为:
{ "data" : [ { "id" : "812857ef-xxxx-xxxx-xxxx-24ba9fd5e95c", "document" : "什么是量子计算?它是一种利用量子力学原理进行信息处理的计算方式。", "chunk" : "什么是量子计算?它是一种利用量子力学原理进行信息处理的计算方式。", "chunk_fragments" : { "question" : "什么是量子计算。", "answer" : "一种利用量子力学原理进行信息处理的计算方式" }, "similarity" : 0.87, "metadata" : { "order" : 10, "file_name" : "问题.txt", "path" : "问题.txt ", "question" : "什么是量子计算。", "answer" : "一种利用量子力学原理进行信息处理的计算方式。" }, "download_addresses" : { "xxx.png" : "https://xxxx" }, "download_address" : null, "data_set_id" : "3967c49d-xxxx-xxxx-xxxx-5eda056a1f1b" } ] }
响应参数解释:
- document:表示向量化检索内容,索引配置时选择某个字段为向量化字段,检索命中时返回该字段内容,即vector_retrieval为true。
- chunk:表示完整切片,索引配置时配置chunk作为附加字段返回时,该字段有内容,即索引配置中category为FULL_CHUNK,retrieval_return为true。
- chunk_fragments:表示切片提取字段,索引配置时配置所提取的字段作为附加字段返回时,该字段有内容,即索引配置中category为CHUNK_FRAGMENT,retrieval_return为true。
- metadata:默认包含order、file_name、path三个字段,若索引配置时配置所提取的字段作为文本过滤字段时,即索引配置中category为CHUNK_FRAGMENT,text_filter为true时,metadata下会新增该字段及其内容。
什么是向量模型常见问题
更多常见问题 >>-
产品模型用于描述设备具备的能力和特性。开发者通过定义产品模型,在物联网平台构建一款设备的抽象模型,使平台理解该款设备支持的服务、属性、命令等信息,如颜色、开关等。当定义完一款产品模型后,在进行注册设备时,就可以使用在控制台上定义的产品模型。
-
模型转换,即将开源框架的网络模型(如Caffe、TensorFlow等),通过ATC(Ascend Tensor Compiler)模型转换工具,将其转换成昇腾AI处理器支持的离线模型。
-
安全控制是在数据库应用系统的不同层次提供对有意和无意损害行为的安全防范。
-
ModelArts模型训练旨在提升开发者模型训练的开发效率及训练性能。提供了可视化作业管理、资源管理、版本管理等功能,基于机器学习算法及强化学习的模型训练自动超参调优;预置和调优常用模型,简化模型开发和全流程训练管理。
-
GaussDB是华为公司倾力打造的自研企业级分布式关系型数据库,该产品具备企业级复杂事务混合负载能力,同时支持优异的分布式事务,同城跨AZ部署,数据0丢失,支持1000+扩展能力,PB级海量存储等企业级数据库特性。
-
OSI 参考模型的层次是什么?有 7 个 OSI 层:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。
更多相关专题
增值电信业务经营许可证:B1.B2-20200593 | 域名注册服务机构许可:黔D3-20230001 | 代理域名注册服务机构:新网、西数