[快速入门]CSS兼容Elasticsearch吗
Flexus企业搜索服务

Flexus企业搜索服务 Flexus企业搜索服务 基于开源Elasticsearch提供在线分布式搜索、日志统计报表、语义搜索等功能 基于开源Elasticsearch提供在线分布式搜索、日志统计报表、语义搜索等功能 基于Dify集成CSS与DeepSeek构建智能问答助手 购买

向量数据库

CSS 向量数据库 GaussDB向量数据库 基于华为云自研的向量搜索引擎,针对大规模的向量检索场景提供了业界性能领先的向量数据库服务。 基于华为云自研的向量搜索引擎,针对大规模的向量检索场景提供了业界性能领先的向量数据库服务。 购买 价格计算器 文档 云原生高可用 全球首款在云

智能数据湖_FusionInsight_数据湖应用场景_大数据-华为云

软硬协同性能提升30%,兼容标准SQL 全托管NoSQL 表格存储服务 CloudTable 千万级TPS,毫秒级随机读写能力 兼容开源Elasticsearch的在线分布式搜索 云搜索服务 CSS 向量检索能力相比开源ES提升10+倍 图引擎服务 图引擎服务 GES 国内首个商用且拥有自主知识产权

数据仓库服务 GaussDB(DWS)兼容性

数据仓库服务 GaussDB(DWS)兼容性 GaussDB(DWS)采用开放性的设计理念,不但支持标准数仓功能,还致力于融合大数据平台、与云原生服务互联互通。 无缝对接Hadoop GaussDB(DWS)可以无缝对接HDFS存储,通过外表机制,能够交互式查询分析Hadoop平

华为云Flexus云服务

Flexus企业搜索服务CSS 经济集群 APP搜索、网页搜索,、日志分析,针对中小型客户,如数据量小于100GB,轻松构建网站及APP搜索功能,或提供站点监控和流量分析等能力 用于完成基本业务诉求 Flexus企业搜索服务CSS 经济集群 APP搜索、网页搜索,、日志分析,针对

资源专属服务

古大模型能力,构筑自己的模型推理服务;、 搭配使用 专属计算集群 DCC 专属分布式存储DSS 裸金属服务器 BMS AI开发平台 ModelArts 可支持云服务 资源服务 基础服务 数据库服务 安全服务 应用服务 大数据服务 专属计算集群服务 为租户提供物理隔离的云上专属计算

云计算_云存储_云网络_云安全_云数据库_云管理与部署-华为云

成本最优,极致安全可靠的数据底座 计算 弹性云服务器 ECS 可随时自动获取、弹性伸缩的云服务器 Flexus云服务 新一代性能倍增、体验跃级的云服务系列 GPU加速云服务器 GACS 提供GPU计算资源的弹性云服务器 FPGA加速云服务器 FACS 提供FPGA计算资源的弹性云服务器 裸金属服务器 BMS 高性能、高安全的云上物理服务器

华为云数据湖探索服务 DLI

查看更多 即刻 免费试用 开启您的上云之旅 免费试用 您可能感兴趣的产品 您可能感兴趣的产品 MapReduce服务 MRS 企业级大数据集群云服务 云搜索服务 CSS 提供多条件检索与分析能力 云数据仓库 GaussDB(DWS) 极致性能、稳定、按需扩展的数据仓库

云数据库GeminiDB

GeminiDB兼容DynamoDB接口 GeminiDB兼容DynamoDB接口 什么是GeminiDB兼容DynamoDB接口 如何连接GeminiDB兼容DynamoDB实例 如何将DynamoDB迁移至GeminiDB兼容DynamoDB接口 使用GeminiDB兼容DynamoDB接口时要注意什么

[相关产品]CSS兼容Elasticsearch吗
tinypace兼容测试服务

兼容性测试服务,包括脚本兼容测试、标准兼容测试和专家兼容测试三项服务内容,深度发现并定位APP 兼容性问题,帮助定位提升产品,提供详细测试报告。1.脚本兼容测试在海量手机上自动执行,从安装、启动、运行、功能、UI等多维度,深度发现并定位APP 兼容性问题,可定制测试脚本,覆盖所需

java环境 Anolis 兼容CentOS

此镜像为Java环境,操作系统:Anolis(兼容 CentOS ),更新时间2024年8月。您可以一键快速搭建自己的Java环境服务器。一、镜像说明此镜像为Java环境,操作系统:Anolis(兼容 CentOS ),更新时间2024年8月。您可以 一键快速搭建自己的Java环境服务器。二、java环境信息外网地址:

LAMP环境 Anolis兼容CentOS

,系统Anolis 兼容CentOS,该版本已做安全加固,系统已更新至最新。您可以 一键快速搭建自己的LAMP环境服务器。一、产品说明此镜像为LAMP环境镜像 ,系统Anolis 兼容CentOS,该版本已做安全加固,系统已更新至最新。您可以 一键快速搭建自己的LAMP环境服务器。二、镜像信息外网地址:

IPsec VPN Anolis兼容CentOS

VPN,操作系统:Anolis(兼容CentOS),您可以一键快速搭建自己的 IPsec VPN 服务器。支持 IPsec/L2TP协议。一、镜像说明:此镜像为IPsec VPN,系统:Anolis(兼容CentOS),更新时间2024年8月。您可以一键快速搭建自己的IPsec VPN 服务器。支持I

LNMP环境 Anolis兼容CentOS

,系统 Anolis 兼容 CentOS ,更新时间2024年8月。您可以 一键快速搭建自己的LNMP环境服务器。一、产品介绍此镜像为LNMP环境镜像 ,系统 Anolis 兼容 CentOS ,更新时间2024年8月。您可以 一键快速搭建自己的LNMP环境服务器。二、镜像信息外网地址:

泽众兼容性测试

、分辨率、系统版本机型上的兼容性问题,并提供详细的测试报告。兼容性测试在海量机型上通过自动化与人工复核的方式,针对安装、启动、运行、功能、性能、UI等多维度定位应用在不同品牌、分辨率、系统版本机型上的兼容性问题,并提供详细的测试报告。帮助企业避免由于兼容性问题而引起的客户投诉、客

Node.js Anolis 兼容CentOS

,系统Anolis(兼容 CentOS ),更新时间 2024 年 8 月。您可以一键快速搭建自己的Nodejs服务器 。一、商品介绍此镜像为Nodejs镜像 ,系统Anolis(兼容 CentOS ),更新时间 2024 年 8 月。您可以一键快速搭建自己的Nodejs服务器 。二、服

OpenHarmony硬件适配获取XTS兼容性测评证书

提供面向OpenHarmony商用化的 硬件适配、性能调优、认证服务深资专家坐镇 , 经验丰富

国际快递物流轨迹订阅

发送国  "sendLogisticsCompany": "00173", // 发件地快递公司  "purposeCountry": "BRONX, NY, 10462, US, United States", // 目的国  "purposeLogisticsCompany": "00172"

[相似文章]CSS兼容Elasticsearch吗
CSS是什么_云搜索服务_CSS功能

华为云云搜索服务 CSS 华为云云搜索服务 CSS 云搜索服务(Cloud Search Service,简称CSS),是华为云ELK生态的一系列软件集合,为您全方位提供托管的ELK生态云服务兼容Elasticsearch、Kibana、Cerebro等软件。 云搜索服务中El

Elasticsearch镜像下载

Elasticsearch镜像下载 移动端下载镜像请点击展开详情 Elasticsearch镜像 是Elastic组件,开源的分布式、RESTful 风格的搜索和数据分析引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定

云数据库TaurusDB_兼容MySQL

IP地址和端口。 2、对象存储服务(Object Storage Service,简称OBS)上的备份文件以及TaurusDB服务使用的弹性云服务器(Elastic Cloud Server,简称ECS),都对用户不可见,它们只对TaurusDB服务的后台管理系统可见。 3、查看

什么是数据湖探索服务_数据湖探索DLI用途与特点

查询分析,数据格式兼容CSV、JSON、Parquet和ORC主流数据格式。 DLI用户可以通过可视化界面、Restful API、JDBC、ODBC、Beeline等多种接入方式对云上CloudTable、RDS和DWS等异构数据源进行查询分析,数据格式兼容CSV、JSON、Parquet和ORC主流数据格式。

Node-Sass镜像下载

令人难以置信的速度将.scss文件本地编译为css,并通过连接中间件自动编译。 Sass是一种预处理器脚本语言,可以解释或编译成层叠样式表(CSS)。Sass包含两种语法:较旧的语法使用缩进将代码块和换行符分隔为单独的规则;较新的语法SCSS使用像CSS这样的块格式。它使用大括号

Kibana镜像下载

Kibana镜像下载 移动端下载镜像请点击展开详情 Kibana镜像 Kibana是一个为 Elasticsearch 平台分析和可视化的开源平台,使用 Kibana 能够搜索、展示存储在 Elasticsearch 中的索引数据。使用它可以很方便用图表、表格、地图展示和分析数据。 更多详情请下载文件查看

Atom镜像下载

集 【Elasticsearch镜像】Elastic组件,开源的分布式、RESTful 风格的搜索和数据分析引擎 【ChromeDriver镜像】Chrome浏览器引擎驱动 【Kibana镜像】Elastic组件,开源的分析和可视化平台,设计用于和Elasticsearch一起工作

MariaDB镜像下载

集 【Elasticsearch镜像】Elastic组件,开源的分布式、RESTful 风格的搜索和数据分析引擎 【ChromeDriver镜像】Chrome浏览器引擎驱动 【Kibana镜像】Elastic组件,开源的分析和可视化平台,设计用于和Elasticsearch一起工作

io.js镜像下载

集 【Elasticsearch镜像】Elastic组件,开源的分布式、RESTful 风格的搜索和数据分析引擎 【ChromeDriver镜像】Chrome浏览器引擎驱动 【Kibana镜像】Elastic组件,开源的分析和可视化平台,设计用于和Elasticsearch一起工作

CSS兼容Elasticsearch吗

CSS服务结合搜索大模型的知识搜索能力,在传统字符搜索的基础上集成语义搜索能力,通过向量化技术提升搜索结果相关性。本方案兼容开源Elasticsearch生态,业务仅需适配multi_match查询语句即可实现语义检索。

应用场景

Elasticsearch AI语义搜索适用于以下场景:
  • 知识库检索:企业知识库、FAQ系统等需要理解用户查询意图的场景。
  • 内容推荐:基于语义相似度的内容推荐系统。

方案架构

图1 语义检索架构图

数据写入:使用Elasticsearch原生Bulk接口写入数据,搜索大模型插件自动调用Embedding模型将文本转换为向量,生成的语义向量存储在CSS向量 数据库 中。

语义查询:使用Elasticsearch原生multi_match查询语句,搜索大模型插件自动转换查询语句为语义向量查询,执行多路召回(关键词+向量相似度),调用精排模型对结果进行二次排序,返回最终结果。

方案优势

  • 提升搜索精度:通过语义理解与精排实现多路召回与重排序,提升结果相关性。
  • 兼容开源生态:兼容开源Elasticsearch,适配multi_match语句。
  • 易用性高:通过插件方式实现,仅需配置模型服务和索引,无需改造业务代码。

约束限制

Elasticsearch AI搜索功能依赖Embedding节点,该节点的配置采用白名单机制,如需试用,请提交工单申请权限。

前提条件

  • 确认Elasticsearch集群满足以下条件。
    • 集群状态:可用
    • 集群版本:7.10.2(在基本信息页面查看“集群版本”
    • 配置要求:已配置Embedding节点(在依赖服务页面查看是否存在“可用”状态的独享版集群)
  • 获取独享版集群的访问地址。
    1. 登录云搜索服务管理控制台
    2. 在左侧导航栏,选择“集群管理 > Elasticsearch”
    3. 在集群列表,单击目标集群名称,进入集群详情页。
    4. 选择“依赖服务管理”页签,进入依赖服务列表。
    5. 在依赖服务列表,选择目标服务,单击操作列的“查看详情”跳转到独享版集群的基本信息页面。
    6. 获取“内网访问IPv4地址”即独享版集群的访问地址,后续配置模型服务需要使用。
      图2 获取集群访问地址

步骤一:登录Kibana

登录Kibana进入命令执行页面。Elasticsearch集群支持多种客户端访问,本文仅以CSS服务集成的Kibana为例介绍配置指导。

  1. 登录云搜索服务管理控制台
  2. 在左侧导航栏,选择“集群管理 > Elasticsearch”
  3. 在集群列表,选择目标集群,单击操作列的“Kibana”,登录Kibana。
  4. 在Kibana左侧导航栏选择“Dev Tools”,进入操作页面。

步骤二:启用搜索大模型插件

在Kibana中执行以下命令,启用搜索大模型插件。
PUT _cluster/settings
{
  "persistent": {
    "pg_search.inference.enable": true
  }
}

返回如下信息,表示成功启用搜索大模型插件。

{
  "acknowledged" : true,
  "persistent" : {
    "pg_search" : {
      "inference" : {
        "enable" : "true"
      }
    }
  },
  "transient" : { }
}

步骤三:配置模型服务

  1. 在Kibana中执行以下命令,配置Embedding模型服务。
    PUT _inference/model_service/pangu_vector  // pangu_vector为模型服务名称,支持自定义
    {
      "description": "搜索大模型-语义向量化模型", // 服务描述信息
      "service_config": {
        "semantic_vector": {          // 模型类型
          "service_urls": [           // Embedding模型服务的访问地址列表(数组格式)
            "http://{endpoint}/app/search/v1/vector" // 替换{endpoint}为独享版集群的访问地址,例如访问地址为10.20.30.40:18088,则此处应填写"http://10.20.30.40:18088/app/search/v1/vector"
          ],
          "algorithm": "GRAPH",      // 使用图算法进行近似最近邻搜索
          "metric": "inner_product", // 相似度度量方式:内积
          "dimension": "768"        // 向量维度768
        }
      }
    }
  2. 在Kibana中执行以下命令,配置Rerank模型服务。
    PUT _inference/model_service/pangu_ranking  // pangu_ranking为模型服务名称,支持自定义
    {
      "description": "搜索大模型-精排模型", // 服务描述信息
      "service_config": {
         "reorder": {                 // 模型类型
          "service_urls": [           // Rerank模型服务的访问地址列表(数组格式)
            "http://{endpoint}/app/search/v1/rerank" // 替换{endpoint}为独享版集群的访问地址,例如访问地址为10.20.30.40:18088,则此处应填写"http://10.20.30.40:18088/app/search/v1/rerank"
          ]
        }
      }
    }

更多配置参数及说明请参见配置模型服务

步骤四:创建向量索引

在Kibana中执行以下命令,创建向量索引,如pangu_index,并将上一步配置的Embedding和Rerank模型服务关联到索引中。

PUT pangu_index
{
  "aliases": {                    // 定义索引别名
    "pangu_wiki": {}              // 通过pangu_wiki别名访问索引
  },
  "mappings": {                   // 字段映射定义
    "properties": {
      "title": {                  // 文档标题字段
        "type": "text"            // 全文检索类型
      },
      "desc": {                   // 描述字段
        "type": "text"            // 全文检索类型
      },
      "content": {                // 正文内容字段
        "type": "text"            // 全文检索类型
      },
      "author": {                 // 作者字段
        "type": "keyword"         // 精确值类型,适合过滤和聚合
      }
    }
  },
  "settings": {                   // 索引设置
    "index.vector": true,         // 启用向量索引功能
    "index.inference.semantic_search_enabled": true, // 启用语义搜索
    "index.inference.field": [    // 参与向量化的字段及权重
      "title:100",               // 标题字段,权重100
      "desc:80",                 // 描述字段,权重80
      "content:30"               // 内容字段,权重30
    ],
    "index.inference.embedding_model": "pangu_vector", // Embedding模型服务的名称
    "index.inference.reorder_enabled": true, // 启用结果重排序
    "index.inference.reorder_model": "pangu_ranking", // 重排序模型服务的名称
    "index.inference.semantic_search_type": "vector", // 语义搜索类型为向量搜索
    "number_of_shards": 3         // 索引分片数为3(根据数据量调整)
  }
}

步骤五:导入数据

在Kibana中,使用Bulk API批量导入数据到上一步创建的索引pangu_index。

// 操作类型为index(创建/更新文档),并指定文档ID为1
// title字段值(文本类型,将被向量化),desc字段值(文本类型,将被向量化),content字段值(文本类型,将被向量化),author字段值(关键字类型,用于精确匹配)
PUT pangu_index/_bulk
{"index":{"_id":"1"}}
{"title":"热带雨林","desc":"丰富的热带植物世界","content":"生态系统","author":"李雷"}

批量导入说明:

  • 向量生成过程:系统会自动将title(权重100)、desc(权重80)、content(权重30)拼接,调用pangu_vector模型生成768维的语义向量,向量数据存储在_inference.semantic_vector字段。
  • 如果某条文档失败,不会影响其他文档的导入,Bulk API的详细使用说明请参见Bulk API
  • 性能建议:大批量导入时建议每批次500~1000个文档。
  • 数据格式建议:
    • 文本字段建议做基础清洗,去除特殊字符等。
    • 关键业务字段建议设置非空校验。
    • 中文文本不需要预先分词,大模型会自动处理。

步骤六:语义检索

在Kibana中执行以下命令,使用multi_match语句在pangu_index索引中执行语义检索。

GET pangu_index/_search
{
  // 控制返回结果的字段内容
  "_source": {
    "excludes": [ 
      "_inference"  // 排除返回结果中可能包含敏感或冗余信息的字段
    ]
  },

  // 查询主体部分
  "query": {
    // 布尔查询
    "bool": {
      // 必须满足的条件列表(逻辑AND)
      "must": [
        {
          // 多字段匹配查询,目标字段匹配时会自动转换为语义向量搜索
          "multi_match": {
            "query": "橡胶树在哪里",  // 用户输入的搜索关键词/句
            "fields": ["title","content","desc"]  // 搜索的目标字段列表,必须和索引配置的index.inference.field字段对应
          }
        }
      ]
      // 可选添加其他逻辑条件:
      // "filter": [...]    // 不影响评分的过滤条件
      // "should": [...]    // 逻辑OR条件
      // "must_not": [...]  // 排除条件
    }
  }

  // 可选添加搜索优化参数:
  // "size": 20,            // 返回结果数量
  // "explain": true,       // 显示相关性评分计算细节
  // "highlight": { ... }   // 关键词高亮配置
}
检索说明:
  • 该查询同时搜索title、content、desc三个字段,寻找与“橡胶树在哪里”相关的内容。
  • 通过bool查询结构确保结果必须满足multi_match条件。
  • 排除_inference字段可减少网络传输数据量并保护内部处理细节。

CSS兼容Elasticsearch吗常见问题

更多常见问题 >>
  • CSS是什么_云搜索服务_CSS功能

  • Elasticsearch是一个兼有搜索引擎和NoSQL数据库功能的开源系统,基于Lucene构建,可以用于全文搜索,结构化搜索以及近实时分析。

  • Elasticsearch是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。

  • ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎。

  • Elastic组件,开源的分布式、RESTful 风格的搜索和数据分析引擎。是一个基于Lucene的搜索服务器,它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。

  • 云搜索服务(Cloud Search Service,简称CSS)是一个基于Elasticsearch且完全托管的在线分布式搜索服务,为用户提供结构化、非结构化文本、以及基于AI向量的多条件检索、统计、报表。