[快速入门]ai模型推荐
盘古预测大模型

Gallery百模千态社区 AI Gallery百模千态社区 优质昇腾云AI模型专区 几行代码自由部署AI应用 丰富多样的AI训练数据集 场景化AI案例,助力AI赋能千行百业 查看全部 学习资源 学习资源 AI开发基本流程介绍 自动学习简介 使用预置算法构建模型 使用自定义算法构建模型 查看全部 即刻领取

ModelArts Edge

场景介绍 在线将AI应用部署到带一定AI算力的边缘设备上。AI应用在边缘计算设备上推理,在云上管理,并支持业务系统集成 挑战 AI需求多样,需灵活迭代更新AI应用;模型在边缘运行,需保障模型商用安全;边缘资源优先,需高效利用;部分场景需本地运维 产品价值 便捷更新与扩展AI应用 支持A

CV大模型

什么是盘古大模型 盘古CV大模型能力与规格 盘古大模型用户指南 如何调用盘古CV大模型API 查看全部 AI Gallery百模千态社区 AI Gallery百模千态社区 优质昇腾云AI模型专区 几行代码自由部署AI应用 丰富多样的AI训练数据集 场景化AI案例,助力AI赋能千行百业 查看全部

AI平台ModelArts入门

AI开发平台ModelArts入门 AI平台ModelArts入门 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 购买 控制台 专家咨询

AI科学计算服务

AI科学计算服务 AI科学计算服务 AI科学计算服务(AI for Science Service),是一个致力于将人工智能技术与科学研究相结合的创新平台。 面向生物医药、计算化学、地球科学、电磁学、流体等科学领域,提供开箱即用的澎湃算力及调度能力, 内置丰富的各领域AI模型、分

大模型混合云

赋能千行万业 全链路专业服务,让大模型从可用到好用 · 6大阶段30+专业服务,覆盖大模型建设全流程,加速政企落地大模型 · 创新运营服务模式,实现全场景模型经验沉淀、全流程运营赋能产业,快速孵化大模型场景化应用 大模型混合云十大创新技术 大模型混合云十大创新技术 了解详情 十大创新技术

AI平台ModelArts资源

AI平台ModelArts资源 AI平台ModelArts资源 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 面向开发者的一站式AI开发平台,可快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级 购买 控制台 文档 资源与工具

盘古NLP大模型

优质昇腾云AI模型专区 几行代码自由部署AI应用 丰富多样的AI训练数据集 场景化AI案例,助力AI赋能千行百业 查看全部 学习资源 学习资源 AI开发基本流程介绍 自动学习简介 使用预置算法构建模型 使用自定义算法构建模型 查看全部 即刻领取 免费试用 产品 开启您的大模型之旅 企业免费试用

盘古行业大模型

能源快速构建企业AI智能化底座,实现生产全流程的智能感知、数据融合与决策优化,推动煤矿开采向少人化、无人化转型升级。 文档与学习成长 盘古大模型 盘古大模型 什么是盘古大模型 盘古NLP大模型能力与规格 盘古大模型快速入门 如何调用盘古大模型API 查看全部 AI Gallery百模千态社区

[相关产品]ai模型推荐
智慧监控AI模型

智慧监控AI模型综合集成了人脸识别模型、安全帽识别模型、口罩佩戴识别模型、车牌识别模型、车辆占道识别模型5种AI模型。一,人脸识别服务 人脸识别模型目前提供授权认证、模型加载、人脸注册、人脸识别、人脸删除、特征提取六个接口服务。 授权认证:需先进行授权认证,才能够正常使用人脸识别服务;

AI大模型 算法备案

《互联网信息服务算法推荐管理规定》明确,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息  方便

AI大模型专业服务

湘江鲲鹏目前在人工智能模型领域拥有算力、数据、算法三大关键要素的经验积累,构建了大模型三个方面的差异化竞争力,盘古大模型AI专业服务覆盖从前期咨询、规划设计,到数据工程、模型训练,再到应用工程及模型运维的完整流程。基于华为盘古提供的AI专业服务包,致力于为企业提供一站式人工智能解决方案

企业级AI模型开发

云坞网络专注于利用先进的AI云计算、大数据和人工智能技术,为企业提供卓越的ChatGPT行业解决方案。帮助企业快速实现数字化、智能化和绿色化转型。 系统定制开发:我们可以为客户提供系统的定制开发服务,帮助客户实现更多的个性化功能和业务流程需求。,数据迁移:我们帮助客户将现有系统的

大模型及AI应用配套服务

angChain等流行的大模型开发框架,构建企业级AI应用;团队拥有成熟的软件工程技术和管理能力。6. 大模型使用的技术支持,用户使用大模型平台,解答用户使用过程遇到的问题;大模型与应用对接集成,以及进行日常巡检、故障处理、模型升级等服务。4. 工业数据模型(CAD模型、CAE模

天尊大模型AIGC场景解决方案

太杉天尊大模型AIGC场景解决方案是以AI场景解决方案为核心的全栈Maas综合方案,助力政企客户灵活部署(可公有可私有部署)。具备自研的行业模型能力,主要用于政府/公安/教育等行业的数据处理、文本处理以及多模态处理等多场景。太杉天尊大模型AIGC场景解决方案,是一款专为满足政府企

人工智能AI大模型技术研发定制服务

公司集成了世界领先的底层大模型,具备打通跨模型和工具链的平台,提供从需求分析、数据收集、模型设计、训练优化、评估、系统集成、用户界面设计、部署维护、合规性检查、技术支持、性能监控、扩展性设计、定制服务到持续研发一站式AI模型定制研发服务。光启慧语是一家围绕大模型全栈开展技术研发和产品

博匠行业AI大模型专业服务

数据质量。4. 模型训练:设计调优方案,实施模型训练,并进行模型评测。熟悉盘古大模型工作流和云服务操作,确保模型效果优化。5. 应用工程:提供基于大模型能力的Agent开发和应用对接服务。具备良好的软件开发和沟通能力,实现大模型与应用的无缝对接。6. 模型运维: 提供技

天尊大模型AIGC场景解决方案配套服务

天尊大模型AIGC场景解决方案配套服务是太杉AIGC解决方案的人工服务,是以AI应用解决方案为核心的全栈Maas综合方案,助力政企客户灵活部署(可公有可私有部署)。主要用于政府/公安/教育等行业的数据处理、文本处理以及多模态处理等多场景。天尊大模型AIGC场景解决方案配套服务是太

[相似文章]ai模型推荐
华为云盘古大模型_华为云AI大模型_盘古人工智能

了解详情 盘古预测大模型 盘古预测大模型是面向结构化类数据,基于10类2000个基模型空间,通过模型推荐、融合两步优化策略,构建图网络架构AI模型。 了解详情 盘古科学计算大模型 科学计算大模型是面向气象、医药、水务、机械、航天航空等领域,采用AI数据建模和AI方程求解的方法;从海

ModelArts推理部署_模型_AI应用来源-华为云

ModelArts支持本地准备模型包,编写模型配置文件和模型推理代码,将准备好的模型包上传至对象存储服务OBS,从OBS导入模型创建为AI应用。 制作模型包,则需要符合一定的模型包规范。模型包里面必需包含“model”文件夹,“model”文件夹下面放置模型文件,模型配置文件,模型推理代码文件。

ModelArts模型训练_模型训练简介_如何训练模型

模型训练亮点特性 收起 展开 训练模式选择 收起 展开 针对MindSpore类引擎,ModelArts提供训练模式选择,支持用户根据实际场景获取不同的诊断信息。在训练作业创建页面,支持普通模式、高性能模式和故障诊断模式,默认设置为普通模式。 了解更多 收起 展开 模型训练可视化 收起 展开 M

X实例推荐

EulerOS,在千万量级核数规模下,对 CPU、内存资源规格进行不停机调整,无中断算力升级 一直加速一直快 一直加速一直快 大模型底层智能调度:首创大模型QoS保障,智能全域调度,算力分配长稳态运行,一直加速一直快 业务应用智能加速:业界首个X86业务应用智能加速,覆盖网络应用、

GaussDB数据库模型_GaussDB是什么_高斯数据库模型

0%的同时,耗费时间从天下降到分钟级。 智能索引推荐 通过启发式推荐算法,实现了语句级+负载级智能索引推荐,将效率从小时级别提升到秒级,并在benchmark测试中实测性能提升了约40倍。 GaussDB数据库模型 产品优势 高性能 性能强劲,32节点规模下提供高达1500万tp

免费AI客服电话_AI智能语音外呼系统_AI人工语音智能电话

000.00元/年 免费AI客服电话-智能AI客户联络中心-AI智能电话机器特征 免费AI客服电话-智能AI客户联络中心-AI智能电话机器特征 免费AI客服电话-内置ASR引擎 支持ASR,NLP,NLU,TTS等技术数据整合识别、响应飞速提升 免费AI客服电话-多轮会话 领先的

.email域名注册_如何注册.email域名

.email域名注册 什么是.email域名注册? 域名注册(Domain Registration)是用户付费获取Internet上某一域名一段时间使用权的过程。华为云域名注册服务提供域名的注册、购买、实名认证以及管理功能。 华为云的域名注册服务与新网合作,因此通过华为云注册的

CDN怎么用_CDN推荐_CDN怎么收费

登录华为云控制台,在控制台首页左上角选择“服务列表 > CDN与智能边缘 > 内容分发网络 CDN”。 2.单击“前往开通”,进入服务开通界面。 3.选择您的计费方式,如图所示,单击“立即开通”。 图1 选择计费方式 CDN推荐 CDN推荐华为云 哪家CDN比较好,CDN推荐就选华为云CDN,华为云CDN加速

人工智能学习入门

应用场景 AI技术应用场景--视觉处理与识别 AI技术应用场景--语音识别 AI技术应用场景--自然语言处理 AI技术应用场景--推荐系统 AI技术应用场景--知识图谱 AI技术应用场景--视觉处理与识别 AI技术应用场景--语音识别 AI技术应用场景--自然语言处理 AI技术应用场景--推荐系统

ai模型推荐

搜索大模型插件通过模型服务将AI能力集成到Elasticsearch集群中,实现语义向量搜索、语义排序等高级功能。其核心流程是基于业务需求(如语义搜索、智能推荐)定义模型类型(Embedding/Rerank等),并绑定对应的AI服务地址,确保上层应用能通过向量索引正确调用服务接口。

典型应用场景:
  • 语义搜索:依赖Embedding模型服务,将文本转换为向量,实现相似性检索。
  • 智能推荐:组合使用Embedding模型服务(生成用户/物品向量)和Rerank模型服务,优化推荐结果排序。

前提条件

确认Elasticsearch集群已启用搜索大模型插件,操作指导请参见开启搜索大模型插件

支持的模型服务

搜索大模型插件支持接入多种模型服务,具体支持的模型服务清单如表1 支持的模型服务所示。

表1 支持的模型服务

模型服务

模型类型

模型服务的功能介绍

Embedding模型服务

semantic_vector

搜索语义向量化模型,提供将文本转换为向量的功能。

Rerank模型服务

reorder

搜索精排模型,提供对语义查询结果进行精排的功能。

获取独享版集群的访问地址

配置模型服务时,会用到搜索大模型的endpoint,即独享版集群的访问地址。
  1. 登录 云搜索服务 管理控制台。
  2. 在左侧导航栏,选择“集群管理 > Elasticsearch”
  3. 选择目标集群,单击集群名称进入基本信息页面。
  4. 在左侧导航栏,选择“依赖服务管理”
  5. 在服务列表,选择目标服务,单击操作列的“跳转”进入独享版集群的基本信息页面。
  6. 获取“内网访问IPv4地址”即独享版集群的访问地址,后续配置模型服务需要使用。
    图1 获取集群访问地址

配置模型服务

当模型创建完成后,根据业务需要配置模型服务。下面介绍了各类模型服务的配置指导。

管理模型服务

搜索大模型插件深度集成Kibana命令行界面(CLI),支持对模型服务进行更新、监控、扩缩容等全生命周期管理。如表4所示,可以通过标准CLI命令执行更新(update)、删除(delete)等核心操作管理模型服务。

表4 模型服务管理的核心操作

操作类型

API命令

请求示例

响应示例

更新模型服务

POST  _inference/model_service/{service_name}/update

更新Embedding模型服务:

POST  _inference/model_service/pangu_vector/update
{
  "description": "搜索大模型-语义向量化模型更新",
  "service_config": {
    "semantic_vector": {
      "service_urls": ["http://{endpoint}/app/search/v1/vector"],
      "timeout_ms": 60000
    }
  }
}

返回更新后的模型服务信息:

{
  "service_name" : "pangu_vector",
  "service_type" : "remote",
  "description" : "搜索大模型-语义向量化模型更新",
  "create_time" : 1747966388508,
  "service_config" : {
    "semantic_vector" : {
      "embedding_type" : "query2doc",
      "service_urls" : [
"http://{endpoint}/app/search/v1/vector"],
      "method" : "POST",
      "timeout_ms" : 60000,
      "max_conn" : 200,
      "security" : false,
      "dimension" : "768",
      "algorithm" : "GRAPH",
      "metric" : "inner_product"
    }
  }
}

检查模型服务连通性

GET _inference/model_service/{service_name}/check

检查Embedding模型服务的连通性:

GET _inference/model_service/pangu_vector/check
{
  "acknowledged" : true
}

查看模型服务

  • 查看全部模型服务的配置信息
    GET _inference/model_service
  • 查看单个模型服务的配置信息
    GET _inference/model_service/{service_name}

查看Embedding模型服务的配置信息:

GET _inference/model_service/pangu_vector

返回模型服务信息:

{
  "count" : 1,
  "model_service_configs" : [
    {
      "service_name" : "pangu_vector",
      "service_type" : "remote",
      "description" : "搜索大模型-语义向量化模型",
      "create_time" : 1747966388508,
      "service_config" : {
        "semantic_vector" : {
          "embedding_type" : "query2doc",
          "service_urls" : ["http://{endpoint}/app/search/v1/vector"],
          "method" : "POST",
          "timeout_ms" : 60000,
          "max_conn" : 200,
          "security" : false,
          "dimension" : "768",
          "algorithm" : "GRAPH",
          "metric" : "inner_product"
        }
      }
    }
  ]
}

删除模型服务配置(删除后,索引将无法使用该模型服务)

DELETE _inference/model_service/{service_name}

删除Embedding模型服务配置:

DELETE _inference/model_service/pangu_vector
{
  "acknowledged" : true
}

设置模型服务的数量上限(最多支持创建几个模型服务)

PUT _cluster/settings
{
  "transient": {
    "pg_search.inference.max_inference_model_service": 100  //最大值是1000,最小值是1,默认值是100。
  } 
}

设置模型服务的数量上限为10:

PUT _cluster/settings
{
  "transient": {
    "pg_search.inference.max_inference_model_service": 10
  } 
}
{
  "acknowledged" : true,
  "persistent" : { },
  "transient" : {
    "pg_search" : {
      "inference" : {
        "max_inference_model_service" : "10"
      }
    }
  }
}

ai模型推荐常见问题

更多常见问题 >>
  • 模型转换,即将开源框架的网络模型(如Caffe、TensorFlow等),通过ATC(Ascend Tensor Compiler)模型转换工具,将其转换成昇腾AI处理器支持的离线模型。

  • 盘古大模型致力于深耕行业,打造金融、政务、制造、矿山、气象、铁路等领域行业大模型和能力集,将行业知识know-how与大模型能力相结合,重塑千行百业,成为各组织、企业、个人的专家助手。

  • AI一站式开发平台ModelArts横空出世,零基础AI开发人员的福音。学习本课程,带你了解AI模型训练,不会编程、不会算法、不会高数,一样可以构建出自己专属的AI模型。

  • 近年来越来越多的行业采用AI技术提升效率、降低成本,然而AI落地的过程确并不容易,AI在具体与业务结合时常常依赖于业务数据的采集、处理、模型训练、调优、编排、部署和运维等很多环节。华为云ModelArts是全流程AI开发平台,包含了AI应用的开发、部署和分享交易,通过解决AI开发各个环节所遇到的核心问题,ModelArts有效解决了AI落地难的问题,将极大促进AI技术的普惠。本议题将分享ModelArts的主要关键技术和应用案例。

  • ModelArts是一个一站式的开发平台,能够支撑开发者从数据到AI应用的全流程开发过程。包含数据处理、模型训练、模型管理、模型部署等操作,并且提供AI Gallery功能,能够在市场内与其他开发者分享模型。

  • 随着边缘设备数量指数级增长,以及设备性能的提升,数据量爆发式增长,数据规模已由原来的EB级扩展到ZB级。数据回传中心云处理成本太高,边缘计算的价值已经被证明。数据在哪,计算就应在哪,人工智能正逐步向边缘迁移,将云上AI能力下沉到边缘节点,做到本地处理,打通AI的最后一公里。虽然边缘AI技术的相关研究和应用都有着显著的进展,然而在成本、性能、安全方面仍有诸多挑战: