ai大模型推荐
围绕工业、城市、政务等重点场景打造以盘古CV大模型为中心的通用视觉能力,助力企业实现CV模型“工业化”生产,并打通模型监控-数据回传-持续学习-自动评估-持续更新的AI全链路闭环。在工业场景已有多个应用。
实现最优算法推荐及结果输出 提升开发效率、降低落地门槛 支持二次微调,实现领域知识累积,提供特征重要性等结果辅助分析能力 文档与学习成长 盘古大模型 盘古大模型 什么是盘古大模型 盘古预测大模型能力与规格 盘古大模型快速入门 如何调用盘古大模型API 查看全部 AI Gallery百模千态社区
全链路专业服务,让大模型从可用到好用 · 6大阶段30+专业服务,覆盖大模型建设全流程,加速政企落地大模型 · 创新运营服务模式,实现全场景模型经验沉淀、全流程运营赋能产业,快速孵化大模型场景化应用 大模型混合云十大创新技术 大模型混合云十大创新技术 了解详情 十大创新技术 加速构建企业专属大模型
盘古大模型 PanguLargeModels 盘古大模型 PanguLargeModels 盘古大模型是面向B端行业的大模型,包含L0中5类基础大模型、L1行业大模型及L2场景模型三层架构 盘古大模型是面向B端行业的大模型,包含L0中5类基础大模型、L1行业大模型及L2场景模型三层架构
体验 政企知识检索 智能创意营销 行业API助手 行业研发助手 政企会议助手 文档与学习成长 盘古大模型 盘古大模型 什么是盘古大模型 盘古NLP大模型能力与规格 盘古大模型快速入门 如何调用盘古大模型API 查看全部 AI Gallery百模千态社区 AI Gallery百模千态社区
提供高精度的全球模型,无需定制和训练,直接订阅即可推理 多种部署形态 支持公有云、混合云、边缘多种形态,满足不同需求 文档与学习成长 盘古大模型 盘古大模型 什么是盘古大模型 盘古科学计算大模型能力与规格 盘古大模型用户指南 如何调用盘古大模型API 查看全部 AI Gallery百模千态社区
广汽借助华为云盘古多模态大模型,打造业界首个支持点云生成的大模型,为其端到端仿真高效迭代提供强有力支撑。 文档与学习成长 盘古大模型 盘古大模型 什么是盘古大模型 盘古多模态大模型能力与规格 用户指南 如何调用盘古大模型API 查看全部 AI Gallery百模千态社区 AI Gallery百模千态社区
大模型混合云TOP N 场景 大模型混合云TOP N 场景 1对1咨询 了解华为云Stack 大模型行业场景落地三要素 大模型行业场景落地三要素 场景是大模型行业落地的关键所在,而在场景落地过程中,数据、经验和生态是核心要素,数据的数量和质量决定模型效果上限;经验就像“名师指导”
多语种内容审核,平台全面保护 一站式大模型开发平台 一站式大模型开发平台 ModelArts Studio大模型开发平台是集数据管理、模型训练、模型部署于一体的综合平台,专为开发和应用大模型而设计,旨在为开发者提供简单、高效的大模型开发和部署方式 为什么选择大模型开发平台ModelArts
盘古NLP大模型 最贴合行业落地的NLP大模型 盘古CV大模型 赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务 盘古预测大模型 基于神经网络Transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力
《互联网信息服务算法推荐管理规定》明确,具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息 方便
湘江鲲鹏目前在人工智能大模型领域拥有算力、数据、算法三大关键要素的经验积累,构建了大模型三个方面的差异化竞争力,盘古大模型AI专业服务覆盖从前期咨询、规划设计,到数据工程、模型训练,再到应用工程及模型运维的完整流程。基于华为盘古提供的AI专业服务包,致力于为企业提供一站式人工智能解决方案
angChain等流行的大模型开发框架,构建企业级AI应用;团队拥有成熟的软件工程技术和管理能力。6. 大模型使用的技术支持,用户使用大模型平台,解答用户使用过程遇到的问题;大模型与应用对接集成,以及进行日常巡检、故障处理、模型升级等服务。4. 工业数据模型(CAD模型、CAE模
太杉天尊大模型AIGC场景解决方案是以AI场景解决方案为核心的全栈Maas综合方案,助力政企客户灵活部署(可公有可私有部署)。具备自研的行业模型能力,主要用于政府/公安/教育等行业的数据处理、文本处理以及多模态处理等多场景。太杉天尊大模型AIGC场景解决方案,是一款专为满足政府企
公司集成了世界领先的底层大模型,具备打通跨模型和工具链的平台,提供从需求分析、数据收集、模型设计、训练优化、评估、系统集成、用户界面设计、部署维护、合规性检查、技术支持、性能监控、扩展性设计、定制服务到持续研发一站式AI大模型定制研发服务。光启慧语是一家围绕大模型全栈开展技术研发和产
数据质量。4. 模型训练:设计调优方案,实施模型训练,并进行模型评测。熟悉盘古大模型工作流和云服务操作,确保模型效果优化。5. 应用工程:提供基于大模型能力的Agent开发和应用对接服务。具备良好的软件开发和沟通能力,实现大模型与应用的无缝对接。6. 模型运维: 提供技
. 模型更新后,将新模型部署至相应环境。 十一、模型评测1. 设计模型评测方案,对大模型各类指标进行评测。2. 能够按评测标准对大模型各项能力进行打分,输出大模型评测报告。 十二、Agent开发1. 基于场景,设计并开发Agent工具。2. 基于langchain等大模型框架,完
天尊大模型AIGC场景解决方案配套服务是太杉AIGC解决方案的人工服务,是以AI应用解决方案为核心的全栈Maas综合方案,助力政企客户灵活部署(可公有可私有部署)。主要用于政府/公安/教育等行业的数据处理、文本处理以及多模态处理等多场景。天尊大模型AIGC场景解决方案配套服务是太
出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语言生成和语音识别等不同任务。出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模
华为云盘古大模型 华为云盘古大模型 AI for Industries 大模型重塑千行百业 AI for Industries 大模型重塑千行百业 盘古大模型致力于深耕行业,打造金融、政务、制造、矿山、气象、铁路等领域行业大模型和能力集,将行业知识know-how与大模型能力相结合
ModelArts支持本地准备模型包,编写模型配置文件和模型推理代码,将准备好的模型包上传至对象存储服务OBS,从OBS导入模型创建为AI应用。 制作模型包,则需要符合一定的模型包规范。模型包里面必需包含“model”文件夹,“model”文件夹下面放置模型文件,模型配置文件,模型推理代码文件。
模型训练亮点特性 收起 展开 训练模式选择 收起 展开 针对MindSpore类引擎,ModelArts提供训练模式选择,支持用户根据实际场景获取不同的诊断信息。在训练作业创建页面,支持普通模式、高性能模式和故障诊断模式,默认设置为普通模式。 了解更多 收起 展开 模型训练可视化 收起 展开 M
CPU、内存资源规格进行不停机调整,无中断算力升级 一直加速一直快 一直加速一直快 大模型底层智能调度:首创大模型QoS保障,智能全域调度,算力分配长稳态运行,一直加速一直快 业务应用智能加速:业界首个X86业务应用智能加速,覆盖网络应用、数据库、虚拟桌面、分析索引、微服务、CI/CD等通用负载场景,最高可达业界同规格6倍性能
免费AI客服电话-云蝠智能AI客户联络中心 免费AI客服电话-云蝠智能AI客户联络中心 “云蝠智能”企业提供AI客户联络中心,包含智能语音电话机器人、智能语音呼叫、短信分发及企业微信SCRM的业务体系。通过提供AI会员回访、通知、精准营销的系统进行产品服务和赋能。 “云蝠智能”企
端口。 高斯数据库模型-应用场景 金融核心交易 ERP/CRM 政企OA/办公 金融核心交易 金融核心交易 适用于各类银行核心交易系统分布式改造,数据库的原生分布式能力可以极大的降低改造和迁移工作量。两地三中心等极致高可用能力,可以为核心业务保驾护航。 优势 大容量高扩展:支持T
华为云CDN全球精准IP库,并具备自我进化能力,全网链路质量大数据实时分析、预测,为用户精准调度最优节点,保障访问质量。 华为云CDN独创AICache技术+多级缓存调度,实时跟踪全局热度,超高速、大容量SSD存储,有效提升缓存命中率、减少用户访问等待时间。 华为云具备AAA级CDN企业信用评估、IPv6认证、可信云等认证,为加速提供保障。
安全云脑_综合态势大屏 安全云脑_综合态势大屏 在现场讲解汇报、实时监控等场景下,为了获得更好的演示效果,通常需要将安全云脑服务的分析结果展示在大型屏幕上。 安全云脑默认提供一个综合感知态势大屏,可以还原攻击历史,感知攻击现状,预测攻击态势,为用户提供强大的事前、事中、事后安全管理能力,实现一屏全面感知。
.email域名注册 什么是.email域名注册? 域名注册(Domain Registration)是用户付费获取Internet上某一域名一段时间使用权的过程。华为云域名注册服务提供域名的注册、购买、实名认证以及管理功能。 华为云的域名注册服务与新网合作,因此通过华为云注册的
ai大模型推荐
搜索大模型插件通过模型服务将AI能力集成到Elasticsearch集群中,实现语义向量搜索、语义排序等高级功能。其核心流程是基于业务需求(如语义搜索、智能推荐)定义模型类型(Embedding/Rerank等),并绑定对应的AI服务地址,确保上层应用能通过向量索引正确调用服务接口。
- 语义搜索:依赖Embedding模型服务,将文本转换为向量,实现相似性检索。
- 智能推荐:组合使用Embedding模型服务(生成用户/物品向量)和Rerank模型服务,优化推荐结果排序。
前提条件
确认Elasticsearch集群已启用搜索大模型插件,操作指导请参见开启搜索大模型插件。
支持的模型服务
搜索大模型插件支持接入多种模型服务,具体支持的模型服务清单如表1 支持的模型服务所示。
获取独享版集群的访问地址
- 登录 云搜索服务 管理控制台。
- 在左侧导航栏,选择“集群管理 > Elasticsearch”。
- 选择目标集群,单击集群名称进入基本信息页面。
- 在左侧导航栏,选择“依赖服务管理”。
- 在服务列表,选择目标服务,单击操作列的“跳转”进入独享版集群的基本信息页面。
- 获取“内网访问IPv4地址”即独享版集群的访问地址,后续配置模型服务需要使用。
图1 获取集群访问地址
配置模型服务
当模型创建完成后,根据业务需要配置模型服务。下面介绍了各类模型服务的配置指导。
配置Embedding模型服务
在Kibana中执行以下命令,配置Embedding模型服务。其中,模型类型必须是semantic_vector。
PUT _inference/model_service/{service_name} { "description": "搜索大模型-语义向量化", "service_config": { "semantic_vector": { "service_urls" : ["http://{endpoint}/app/search/v1/vector"], "algorithm": "GRAPH", "metric": "inner_product", "dimension": "768", "timeout_ms": 30000 } } }
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
service_name |
是 |
String |
模型服务的名称。自定义,如pangu_vector。 |
service_urls |
是 |
List<String> |
访问模型服务的接口URL。 支持配置多个访问地址,用逗号分隔。 配置格式:http://{endpoint}/app/search/v1/vector,endpoint参考获取独享版集群的访问地址获取。 举例:http://192.168.0.85:18088/app/search/v1/vector |
method |
否 |
String |
模型服务的访问方法。 由Embedding模型服务决定,搜索大模型使用的是POST,保持默认值即可。 取值范围:POST、GET、PUT 默认值:POST |
algorithm |
否 |
String |
模型服务支持的向量索引算法。 取值范围:
默认值:GRAPH |
metric |
否 |
String |
计算向量之间距离的度量方式。 取值范围:
默认值:inner_product |
dimension |
否 |
String |
向量数据维度。 由Embedding模型服务决定,必须配置为768,保持默认值即可。 取值范围:1~4096 默认值:768 |
timeout_ms |
否 |
int |
访问模型服务的超时时间,超时会请求失败。 单位:ms(毫秒) 最小值:3000 默认值:10000 |
content_length |
否 |
int |
模型服务支持单个文档属性的最大值,超过最大值将进行文本截断。 默认值:-1(小于0代表不进行长度截断) |
embedding_type |
否 |
String |
配置Embedding模型的查询类型。
取值范围:
默认值:query2doc |
配置Rerank模型服务
在Kibana中执行以下命令,配置Rerank模型服务。其中,模型类型必须是reorder。
PUT _inference/model_service/{service_name} { "description": "搜索大模型-精排模型", "service_config": { "reorder": { "service_urls": ["http://{endpoint}/app/search/v1/rerank"], "timeout_ms": 60000 } } }
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
service_name |
是 |
String |
模型服务的名称。自定义,如pangu_ranking。 |
service_urls |
是 |
List<String> |
访问模型服务的接口URL。 支持配置多个访问地址,用逗号分隔。 配置格式:http://{endpoint}/app/search/v1/rerank,endpoint参考获取独享版集群的访问地址获取。 举例:http://192.168.0.85:18088/app/search/v1/rerank |
method |
否 |
String |
模型服务的访问方法。 由Rerank模型服务决定,搜索大模型使用的是POST,保持默认值即可。 取值范围:POST、GET、PUT 默认值:POST |
timeout_ms |
否 |
int |
访问模型服务的超时时间,超时会请求失败。 单位:ms(毫秒) 最小值:3000 默认值:10000 |
content_length |
否 |
int |
模型服务支持单个文档属性的最大值,超过最大值将进行文本截断。 默认值:-1(小于0代表不进行长度截断) |
管理模型服务
搜索大模型插件深度集成Kibana命令行界面(CLI),支持对模型服务进行更新、监控、扩缩容等全生命周期管理。如表4所示,可以通过标准CLI命令执行更新(update)、删除(delete)等核心操作管理模型服务。
操作类型 |
API命令 |
请求示例 |
响应示例 |
---|---|---|---|
更新模型服务 |
POST _inference/model_service/{service_name}/update |
更新Embedding模型服务: POST _inference/model_service/pangu_vector/update
{
"description": "搜索大模型-语义向量化模型更新",
"service_config": {
"semantic_vector": {
"service_urls": ["http://{endpoint}/app/search/v1/vector"],
"timeout_ms": 60000
}
}
} |
返回更新后的模型服务信息: {
"service_name" : "pangu_vector",
"service_type" : "remote",
"description" : "搜索大模型-语义向量化模型更新",
"create_time" : 1747966388508,
"service_config" : {
"semantic_vector" : {
"embedding_type" : "query2doc",
"service_urls" : [
"http://{endpoint}/app/search/v1/vector"],
"method" : "POST",
"timeout_ms" : 60000,
"max_conn" : 200,
"security" : false,
"dimension" : "768",
"algorithm" : "GRAPH",
"metric" : "inner_product"
}
}
} |
检查模型服务连通性 |
GET _inference/model_service/{service_name}/check |
检查Embedding模型服务的连通性: GET _inference/model_service/pangu_vector/check |
{ "acknowledged" : true } |
查看模型服务 |
|
查看Embedding模型服务的配置信息: GET _inference/model_service/pangu_vector |
返回模型服务信息: {
"count" : 1,
"model_service_configs" : [
{
"service_name" : "pangu_vector",
"service_type" : "remote",
"description" : "搜索大模型-语义向量化模型",
"create_time" : 1747966388508,
"service_config" : {
"semantic_vector" : {
"embedding_type" : "query2doc",
"service_urls" : ["http://{endpoint}/app/search/v1/vector"],
"method" : "POST",
"timeout_ms" : 60000,
"max_conn" : 200,
"security" : false,
"dimension" : "768",
"algorithm" : "GRAPH",
"metric" : "inner_product"
}
}
}
]
} |
删除模型服务配置(删除后,索引将无法使用该模型服务) |
DELETE _inference/model_service/{service_name} |
删除Embedding模型服务配置: DELETE _inference/model_service/pangu_vector |
{ "acknowledged" : true } |
设置模型服务的数量上限(最多支持创建几个模型服务) |
PUT _cluster/settings { "transient": { "pg_search.inference.max_inference_model_service": 100 //最大值是1000,最小值是1,默认值是100。 } } |
设置模型服务的数量上限为10: PUT _cluster/settings { "transient": { "pg_search.inference.max_inference_model_service": 10 } } |
{ "acknowledged" : true, "persistent" : { }, "transient" : { "pg_search" : { "inference" : { "max_inference_model_service" : "10" } } } } |
ai大模型推荐常见问题
更多常见问题 >>-
盘古大模型致力于深耕行业,打造金融、政务、制造、矿山、气象、铁路等领域行业大模型和能力集,将行业知识know-how与大模型能力相结合,重塑千行百业,成为各组织、企业、个人的专家助手。
-
模型转换,即将开源框架的网络模型(如Caffe、TensorFlow等),通过ATC(Ascend Tensor Compiler)模型转换工具,将其转换成昇腾AI处理器支持的离线模型。
-
本次Serverless应用中心上线文生图应用,用户无需下载源代码、了解各种安装部署知识、安装复杂的依赖,通过华为云Serverless应用中心即可一键创建AI文生图应用,体验 “0” 构建门槛、“0” 资源闲置并具备极致弹性的Serverless AI绘图能力。
-
华为云Serverless技术极大的优化了AI应用开发过程,一键部署AI应用、提升开发团队工作效率。让AI团队可以更关注业务实现,而无需关注底层技术细节。
-
在自然语言处理(NLP)领域中,使用语言模型预训练方法在多项NLP任务上都获得了不错的提升,广泛受到了各界的关注。本课程将简单介绍一下预训练的思想,几个代表性模型和它们之间的关系。
-
知识图谱(KG)和大语言模型(LLM)都是知识的表示形式。KG是符号化的知识库,具备一定推理能力,且结果可解释性较好。但存在构建成本高、泛化能力不足、更新难等不足。
更多相关专题
增值电信业务经营许可证:B1.B2-20200593 | 域名注册服务机构许可:黔D3-20230001 | 代理域名注册服务机构:新网、西数