云服务器内容精选

  • 为什么使用AI原生应用引擎 一站式AI原生应用平台 平台提供数据准备、模型选择/调优、知识工程、可视化画布流程编排、开箱即用的Prompt模板应用、应用部署及应用集成能力,为企业打造专属的AI原生应用。 丰富多样的模型选择 广泛纳入业界优秀大模型,快速接入模型,提供行业模型评测能力,对多系列、多规格、多版本、多领域、多场景的大模型完成分级分权等精细化管理。 安全可信 构建企业应用与大模型之间的安全隔离带,保障AI原生应用安全可信。
  • AI原生应用引擎功能介绍 AI原生应用引擎的主要功能如表1所示。 表1 AI原生应用引擎功能介绍 主要功能 功能简介 Agent管理 支持一站式创建专属AI原生应用,对于创建的Agent进行体验调测,并通过API或Web方式发布后即可对外提供服务。 同时,您可以体验平台预置的Agent,享受AI带来的便利和乐趣。 数据管理 除平台预置的数据集外,同时还支持创建知识数据集和微调数据集。丰富的知识数据集及强大的索引配置是构建专业化、结构化知识库的基础;微调数据集是模型微调的基础,通过在微调数据集上进行训练,您可以获得改进后的新模型以适应特定任务。 模型管理 支持通过API接入模型服务,同时支持将平台预置模型进行微调后,部署为模型服务,为检验模型的准确性及反应效果,您可以通过调测模型能力进行体验调测,确保模型能够在实际应用中正常运行。 提示语管理 平台预置了丰富的提示语模板,并支持用户自创建提示语模板。同时,平台提供的提示语优化及推理结果获取等功能,有效地提升了提示语模板的准确性,使得提示语模板更符合情境,引导Agent提供更加精准的回答。 知识库管理 用户可以自定义创建并管理知识库,用于组织和管理大量的数据信息,且创建的知识库启用后可在创建并发布Agent时引用。
  • AI原生应用引擎应用场景 面向不同的企业需求,AI原生应用引擎提供不同的功能服务。 例如,智能对话、以文搜图、NL2SQL等通用应用场景,可在AI原生应用引擎体验各大模型推理云服务,并通过可视化画布流程编排进行业务集成。 细分领域如金融、电网场景,需要对推理结果进行定制调整,则可在AI原生应用引擎使用模型在线微调训练功能,快速生成行业场景定制模型服务,满足用户特定需求。 借助AI原生应用引擎提供的功能服务,用户可以便捷地搭建各类Agent: 知识问答 通过对话沟通,快速理解并响应用户的需求,提供高效的解决方案或信息。对于涉及行业和领域的专业知识或技术,用户可以使用平台提供的知识库功能上传相关数据,实现数据的高效管理与存储。在Agent中添加知识库,选择“自动调用”模式,保证Agent的每轮对话回答内容均来自用户提供的专业数据库,确保所提供建议和指导的准确性、专业性。 举例:儿科知识问答Agent,不仅可以迅速响应用户问题,还可为患者提供专业且权威的儿科医学知识。 图1 知识问答 智能助手 理解用户意图并进行动态响应,为用户提供个性化服务,通常需要访问外部资源(如实时数据、 API服务 等),或者需要进行复杂的逻辑处理。在单一模型的基础上添加技能(工具、工作流),对Agent进行能力拓展。 举例:旅游助手Agent,根据实时天气及火车票查询结果规划最优旅行方案,为用户提供全面的旅游辅助服务。 图2 智能助手 智能客服 对于用户需求相对固定、单一的场景,通常不需要进行复杂的分析和决策。AI原生应用引擎提供了丰富的工作流节点,用户可以灵活快速地搭建工作流,在Agent中用户与工作流进行对话,确保用户需求按照既定的流程响应处理。 例如,订单查询Agent,可以直接根据预设工作流进行问答,而不需要进行复杂的判断逻辑。 图3 智能客服
  • 更多操作 文件夹创建完成后,可执行如表3所示操作。 表1 更多操作 操作 说明 新建数据库表 具体操作请参见新建数据库表。 新建Excel数据集 具体操作请参见新建Excel数据集。 重命名文件夹 将鼠标移至文件夹上,单击“...”,选择“重命名”,对文件夹进行重命名。 移动文件夹 将鼠标移至文件夹上,单击“...”,选择“移动到”,将文件夹移动到目标位置。 删除文件夹 将鼠标移至文件夹上,单击“...”,选择“删除”,在弹出的提示框中单击“确定”。
  • 约束与限制 该解决方案部署前,需 注册华为账号 并开通华为云,完成实名认证,且账号不能处于欠费或冻结状态。如果计费模式选择“包年包月”,请确保账户余额充足以便一键部署资源的时候可以自动支付;或者在一键部署的过程进入费用中心,找到“待支付订单”并手动完成支付。 如果选用 IAM 委托权限部署资源,请确保使用的华为云账号有IAM的足够权限,具体请参考创建rf_admin_trust委托;如果使用华为主账号或admin用户组下的IAM子账户可不选委托,将采用当前登录用户的权限进行部署。
    AI
  • 方案架构 该解决方案帮助您快速部署Dify LLM应用开发平台。 图1 方案架构图(社区版单机部署) 图2 方案架构图(知识库搜索增强版) 图3 方案架构图(CCE容器高可用版) 该解决方案将会部署如下资源: 社区版单机部署: 创建1台华为云Flexus云服务器X实例(FlexusX),用于搭建Dify-LLM应用开发平台。 创建1个弹性公网IP EIP并关联FlexusX实例,提供访问公网和被公网访问能力。 创建1个安全组,通过配置安全组规则,为云服务器提供安全防护。
    AI
  • 方案优势 成本优化 提供高性价比的云服务器,按需选择资源规格、支持自动扩展,减少资源闲置,优化成本投入,进一步降低客户的运营成本。 高可用性 通过云容器引擎 CCE、云数据库 RDS for PostgreSQL、 云搜索服务 CSS OpenSearch部署应用,更好地托管与简化维护应用实例,确保系统的高性能和可扩展性。 一键部署 一键轻松部署,即可完成云服务资源的创建及Dify-LLM应用开发平台的搭建。
    AI
  • 创建工作流 单击“工作室”,访问dify平台工作室。 图28 工作室 导入工作流。在工作室页面,单击“导入DSL文件”,在弹出的页面中选择“URL”,复制下面的地址,粘贴到DSL URL路径里,如下图所示: https://documentation-samples.obs.cn-north-4.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-moudle/building-a-dify-llm-application-development-platform/workflow/DeepSeek_searXNG%E8%81%94%E7%BD%91%E6%90%9C%E7%B4%A2_%E7%9F%A5%E8%AF%86%E5%BA%93.yml 图29 导入工作流 图30 工作流模板 配置知识库。添加知识库:单击“知识检索”节点,单击“+”按钮添加知识库,选择知识库,单击“添加”。 图31 配置知识库 选择联网搜索插件,单击授权按钮,并添加URL。单机版部署填写Dify服务器私网IP:http://{E CS 私网IP}:8080;高可用部署填写URL:http://searxng:8080。如下图所示,单击“保存”后,即可设置成功。(ECS私网IP是部署Dify的虚机的内网ip,如连接不通,请检查虚机的安全组是否放通8080端口号)。 图32 授权联网搜索 图33 单机版URL 图34 高可用版URL 调整模型。若大模型处有提示感叹号如下图所示,即表示该模型不存在,需要调整为Dify平台已经添加好的模型。单击大模型名称,在右侧弹窗继续单击模型名称旁边的下拉列表,继续单击模型名称,在下拉列表中选择一个模型即可。其余大模型按照此步骤重复操作即可。 图35 模型不存在提示 图36 替换模型 至此,工作流配置已完成,单击右上角“预览”进行对话。 图37 联网搜索 图38 知识检索
    AI
  • Dify配置公网 域名 (社区版单机部署) 您需要在域名解析系统中,添加一条A记录,值为Dify服务器的公网IP。本文档以华为云云解析服务 DNS为例。如在华为云购买域名,默认直接添加到公网域名,可供管理华为云域名购买链接:https://www.huaweicloud.com/product/domain.html。如果不是通过华为云购买的域名,可参考创建公网域名。 进入公网域名列表页面,选择要使用的域名,单击“管理解析”。 图46 管理解析 单击“添加记录集”,填写配置信息如下 记录类型:“A – 将域名指向IPv4地址” 主机记录:解析域名的前缀。 例如创建的域名为“example.com”,其“主机记录”设置包括: www:用于网站解析,表示解析的域名为“www.example.com”。 空:用于网站解析,表示解析的域名为“example.com”。 主机记录置为空,还可用于为空头域名“@”添加解析。 abc:用于子域名解析,表示解析的域名为“example.com”的子域名“abc.example.com”。 mail:用于邮箱解析,表示解析的域名为“mail.example.com”。 *:用于泛解析,表示解析的域名为“*.example.com”,匹配“example.com”的所有子域名。 记录值:域名对应的IPv4地址。最多可以输入50个不重复地址,多个地址之间以换行符分隔。本文值为Dify的公网ip地址。 图47 添加记录集 登录弹性云服务 ECS控制台,选择部署Dify的服务器,单击“远程登录”。选择“VNC登录”,输入服务器密码,登录服务器。 图48 远程登录 图49 VNC登录 将SSL证书文件命名为dify.crt、dify.key并上传至:/dify/docker/nginx/ssl 图50 上传SSL证书 修改环境变量,在命令行执行如下命令,解析的域名为步骤二获取,例如www.example.com: sh /dify/docker/configure_dify_domain_name.sh ${解析的域名} 图51 配置环境变量 浏览器即可通过配置的域名访问Dify平台。 图52 访问Dify平台
    AI
  • 安全组规则修改(可选) 该解决方案使用80端口用来访问Dify,默认全放通,请参考修改安全组规则,配置IP地址白名单。 该解决方案使用22端口用来以SSH方式远程登录云服务器,若需远程登录云服务器,请参考修改安全组规则,配置IP地址白名单,以便能正常访问服务。 该解决方案部署成功后,环境初始化预计5-10分钟,受网络、带宽影响,部署时间会有波动部署完成之后方可正常访问。 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
    AI
  • 与一键部署DeepSeek对接 该章节为成功部署快速搭建DeepSeek推理系统解决方案后,将DeepSeek大模型对接至Dify平台时参考使用。 右侧单击用户名称,下拉并单击“设置”。 图14 设置 单击左侧“模型供应商”,在Ollama下单击“添加模型”。 图15 添加Ollama模型 模型名称填写快速部署中选择部署的模型,如“deepseek-r1:7b”,基础URL填写中获取的私网IP地址(如果部署的Dify应用和DeepSeek-R1蒸馏版模型不在同一服务器且不在同一VPC下,需填写DeepSeek-R1蒸馏版模型所在服务器的公网IP),端口号11434(使用公网连接时,模型服务器所在安全组需放通11434端口),单击右下角“保存”并关闭“设置”。 图16 模型配置
    AI
  • 与MaaS服务对接 登录ModelArts Studio 平台,本文以部署华东二的DeepSeek-R1-Distill-Qwen-32B-4K为例。 图4 ModelArts Studio 在ModelArts Studio左侧导航栏中,选择“在线推理”进入“预置服务”服务列表,选择“免费服务”。 图5 免费服务 领取免费调用额度。在免费服务列表,选择所需的服务,单击右侧操作列的“领取额度”。当领取置灰时,表示该服务的免费额度已领取。 图6 领取额度 成功领取后,在免费服务列表,选择所需的服务,单击“调用说明”,在调用弹窗中接口类型选择“OpenAI SDK”获取API地址和模型名称。 图7 调用说明 免费服务中单个模型提供200万token推理额度,额度消耗完后可开通使用商用级别的推理API服务(仅限贵阳一),或前往我的服务部署为我的服务后付费使用。 图8 商用服务 图9 调用说明 在调用MaaS部署的模型服务时,需要填写API Key用于接口的鉴权认证。在左侧导航栏,单击“API Key管理”(最多可创建30个密钥。每个密钥仅在创建时显示一次,请确保妥善保存。如果密钥丢失,无法找回,需要重新创建API Key以获取新的访问密钥)。 图10 API Key管理 在“API Key管理”页面,单击右上角“创建API Key”,填写标签(自定义API Key的标签,标签具有唯一性,不可重复。仅支持大小写英文字母、数字、下划线、中划线,长度范围为1~100个字符)和描述(自定义API Key的描述,长度范围为1~100个字符)信息后,单击“确定”。标签和描述信息在创建完成后,不支持修改。 图11 创建API Key 对接Dify平台。打开您的Dify平台界面,单击右上角用户名称,下拉并单击“设置”。 进入模型供应商页签,选择OpenAI-API-compatible供应商。 图12 选择供应商 Dify 1.0版本以上,需先安装模型供应商插件再添加模型。 配置模型信息:“模型名称”及“API endpoint URL”填写上述本节步骤4或步骤5“调用说明”中的“模型名称”及“API地址”;"API Key"填写步骤7中创建的API Key,填写完成后单击“保存”。 图13 设置
    AI
  • CCE容器高可用版 表5 资源和成本规划(按需计费) 华为云服务 配置示例 数量 每月预估花费 虚拟私有云 VPC 区域:华北-北京四 VPC网段:192.168.0.0/16 1 0.00 子网 Subnet 区域:华北-北京四 子网网段:192.168.1.0/24, 192.168.2.0/24, 192.168.3.0/24, 192.168.4.0/24 网关:192.168.0.1, 192.168.1.1,192.168.2.1,192.168.3.1 4 0.00 安全组 SecurityGroup 区域:华北-北京四 4 0.00 华为云Flexus云服务器X实例 按需计费:1.42元/小时 区域:华北-北京四 规格:Flexus云服务器X实例 | 性能模式(关闭)| x1.16u.16g | 16核 | 16 GB 镜像:Ubuntu 22.04 server 64bit 系统盘:高IO | 40GB 数据盘:高IO | 100 GiB 3 3064.18元 华为云Flexus云服务器X实例 按需计费:4.53元/小时 区域:华北-北京四 规格:Flexus云服务器X实例 | 性能模式(开启)| x1e.32u.32g | 32核 | 32 GB 镜像:Ubuntu 22.04 server 64bit 系统盘:通用型SSD | 40GB 1 3262.18元 弹性公网IP EIP 区域:华北-北京四 计费模式:按需计费 线路:动态BGP 公网带宽:按流量计费 带宽大小:300Mbit/s 3 0.80元/GB 对象存储服务 OBS 区域:华北-北京四 存储空间:数据存储(多AZ存储) 默认存储类别:标准存储 桶策略:私有 请求费用:GET/PUT 0.01元/万次,DELETE 免费 存储空间:0.1390元/GB/月 流量费用: 内/公网流入流量(数据上传到OBS):0元 内网流出流量(通过 ECS云服务器 下载OBS的数据): 0元公网流出流量 / 00:00-08:00(闲时):0.2500元/GB 公网流出流量 / 08:00-24:00(忙时): 0.5000元/GB 1 详细请参考每月账单。计费说明参考价格详情 云容器引擎 CCE 按需计费:2.91元/小时 区域:华北-北京四 计费模式:按需计费 规格:cce.s2.small(50节点) 集群 master 实例数: 3 集群 node 实例数: 3 类型:CCE 1 2095.20元 分布式缓存服务Redis®*版 按需计费:0.58元/小时 区域:华北-北京四 计费模式:按需计费 规格:4G (基础版)| 副本数:2 实例类型:Redis(主备) 1 414.72元 云数据库 RDS for PostgreSQL 按需计费:1.24元/小时 区域:华北-北京四 计费模式:按需计费 规格:rds.pg.n1.large.2.ha | 2 vCPU | 4 GB (通用型) 储存:SSD云盘 | 100GB 数据库引擎:PostgreSQL(主备) 1 892.80元 云搜索 服务 CSS 按需计费:3.98元/小时 区域:华北-北京四 计费模式:按需计费 规格: ess.spec-4u8g | 4 vCPUs | 8 GB 节点存储总容量:超高I/O | 120GB 集群类型:OpenSearch 节点数:3 1 2864.16元 弹性负载均衡 ELB 区域:华北-北京四 可用区数量:2 计费模式:按需计费 独享型负载均衡 网络型 | 弹性规格、应用型 | 弹性规格 按需计费:¥0.15/小时+应用型LCU费用:¥0.05/个·小时(按实际使用量收取LCU费用) 1 108元 + 应用型LCU费用 NAT网关 NAT 按需计费:12元/天 区域:华北-北京四 规格:小型 SNAT规则数:3 1 360元 合计 - - 13061.24元 + 应用型LCU费用 + 弹性公网IP EIP费用 + 对象存储服务OBS存储及流量费用
    AI
  • (可选)创建rf_admin_trust委托 进入华为云官网,打开控制台管理界面,鼠标移动至个人账号处,打开“ 统一身份认证 ”菜单。 图1 控制台管理界面 图2 统一身份认证菜单 进入“委托”菜单,搜索“rf_admin_trust”委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤 如果委托不存在时执行接下来的步骤创建委托 单击步骤2界面中的“创建委托”按钮,在委托名称中输入“rf_admin_trust”,委托类型选择“云服务”,输入“ RFS ”,单击“完成”。 图4 创建委托 单击“立即授权”。 图5 委托授权 在搜索框中输入”Tenant Administrator”并勾选搜索结果,单击“下一步”。 图6 选择策略 选择“所有资源”,并单击“确定”完成配置。 图7 设置最小授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功。 图8 委托列表
  • 大模型微调需要的数据有要求吗? AI原生应用引擎用于大模型微调的数据集任务领域为“自然语言处理”、数据集格式为“对话文本”。 文件内容要求为标准json数组,例如: [{"instruction": "aaa", "input": "aaa", "output": "aaa"},{"instruction": "bbb", "input": "bbb", "output": "bbb"}] 父主题: AI原生应用引擎
提示

您即将访问非华为云网站,请注意账号财产安全