华为云用户手册

  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 账号的token Content-Type 是 String MIME类型 表3 请求Body参数 参数 是否必选 参数类型 描述 change_security_group 是 ChangeSecurityGroup object change_security_group对象 表4 ChangeSecurityGroup 参数 是否必选 参数类型 描述 security_group_id 是 String 需要修改的目标安全组ID。
  • 如何解决进程偶现卡死的问题? 问题现象:在调用.NET SDK方法时,进程偶现卡死的情况。 解决办法:如果遇到该问题,可以将方法调用加上using方式。 以下示例展示使用using方式调用接口。 // 初始化配置参数 ObsConfig config = new ObsConfig(); config.Endpoint = "https://your-endpoint"; // 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全;本示例以ak和sk保存在环境变量中为例,运行本示例前请先在本地环境中设置环境变量AccessKeyID和SecretAccessKey。 // 您可以登录访问管理控制台获取访问密钥AK/SK,获取方式请参见https://support.huaweicloud.com/usermanual-ca/ca_01_0003.html string accessKey= Environment.GetEnvironmentVariable("AccessKeyID", EnvironmentVariableTarget.Machine); string secretKey= Environment.GetEnvironmentVariable("SecretAccessKey", EnvironmentVariableTarget.Machine); // 创建ObsClient实例 ObsClient client = new ObsClient(accessKey, secretKey, config); try { GetObjectMetadataRequest request = new GetObjectMetadataRequest(); // 指定存储桶名称 request.BucketName = "bucketname"; // 指定对象,此处以 example/objectname 为例 request.ObjectKey = "example/objectname"; // 获取对象元数据 using (GetObjectMetadataResponse response = client.GetObjectMetadata(request)) { Console.WriteLine("Get object metadata response: {0}", response.StatusCode); // 获取对象的ETag值 Console.WriteLine("Object etag {0}: ", response.ETag); // 获取对象的版本号 Console.WriteLine("Object versionId {0}: ", response.VersionId); // 获取对象数据的长度,单位是字节 Console.WriteLine("Object contentLength {0}: ", response.ContentLength); } } catch (ObsException ex) { Console.WriteLine("Message: {0}", ex.Message); } 父主题: 常见问题
  • 其他使用前须知 请确认您已经熟悉OBS的基本概念,如桶(Bucket)、对象(Object)、访问密钥(AK和SK)等。 您可以先参考OBS客户端通用示例,了解OBS .NET SDK接口调用的通用方式。 使用OBS客户端进行接口调用操作完成后,没有异常抛出,则表明返回值有效;如果抛出异常,则说明操作失败,此时应从SDK自定义异常实例中获取错误信息。 使用OBS客户端进行接口调用成功后,均会返回包含响应头信息的SDK公共响应头实例。
  • 变更说明 如表1所示,本节将为您展示.NET SDK的版本变更情况和兼容性说明。 表1 .NET SDK版本变更及兼容性说明 版本 变更类型 说明 是否兼容 v3.22.11.4 - 在NuGet中提供.NET Framework版本。 是 v3.22.11.3 - 在NuGet中提供.NET Core版本。 是 v3.22.3 新特性 支持Content-Disposition标准元数据接口。 是 低于v3.22.3(停止配套,EOM) - 版本过低,已停止维护,建议及时升级版本。 -
  • 文件介绍 {widget}.js为组件逻辑文件,整个Widget的渲染核心JS,在组件编辑状态和页面最终的发布运行态都会被加载执行。一个推荐的组件架构,应包含表1中API。其中,init、render和beforeDestory为组件的通用生命周期函数,其余为推荐模板实现。 表1 组件架构组成 API名称 API解释 是否必须 init(生命周期函数) 组件初始化入口API,初始化组件通用能力,负责注册组件事件和组件动作。 是 render(生命周期函数) 组件核心渲染API,负责组件的实例化、数据调用及事件、动作的实际实现。 是 beforeDestroy(生命周期函数) 组件销毁回调事件,负责组件在销毁期间的内存释放逻辑实现,需要把组件绑定的一些dom事件及全局的引用销毁。 是 initContainer render中抽取的独立逻辑,初始化组件container,所有组件逻辑统一。 统一实现,无需改动。 getInitProps render中抽取的独立逻辑,基于默认prop和组件配置的props进行融合处理,并返回。 建议实现。 initI18n 初始化组件message-en/message-zh的多语言信息,统一注册到独立的i18nVue实例中,供组件获取桩数据、获取默认配置、初始化组件统一使用。 建议实现。 initReaderVm render中抽取的独立逻辑,初始化运行态组件VM实例。在实例中获取数据并实现组件的核心渲染。 建议实现。 registerWidgetActionAndEvent init中抽取的独立逻辑,注册组件对外暴露的的事件和动作。 按需实现,组件定义事件和动作时使用。 getMockData 组件在没有对接外部数据源时,使用的获取桩数据的API自定义实现。考虑数据集天然支持二维数组对象,桩数据结构统一为二维数组对象[{id:3,name:'zhangsan'}]。某些场景假如只需要一个简单值val,可以设置组件桩数据设置为简单二维对象数组[{val:123}]。 -
  • 认识Widget包目录结构 解压下载到本地的组件Widget包,认识组件结构。如解压EchartsWidgetTemplate组件包,其目录结构如图2所示。 图2 Widget包目录结构 为了便于描述,对于名称不固定的手册,统一采用“{widget}”来命名。 i18n.json:组件的国际化资源文件,用于配置多语言。例如,messages-zh.json为中文,messages-en.json为英文。 packageinfo.json:组件的元数据描述文件。 {widget}.css:组件的样式文件,在该文件中编写组件的 CSS 样式。 {widget}.editor.js:组件核心渲染文件。组件属性定义文件,负责组件编辑状态时需要渲染的界面和逻辑。 {widget}.flt:组件DOM结构文件,需要在服务端提前渲染的部分可以写在此文件中,相当于HTML文件,负责样式展示。 {widget}.js:组件逻辑文件,整个Widget的渲染核心JS,在组件编辑状态和页面最终的发布运行态都会被加载执行。
  • Fabric SQL使用流程 Fabric SQL使用流程如表1所示。 表1 操作流程 操作步骤 说明 准备工作 注册华为账号 并开通华为云,实名认证,为账户充值,已开通LakeFormation、OBS权限并进行了委托确认。 创建SQL端点 创建一个新的SQL端点,此步骤为可选,如果使用公共端点可直接跳过。 规划并创建OBS并行文件系统并导入数据 创建OBS并行文件系统及文件夹,用于数据存储,并导入样例数据。 规划并创建Catalog、数据库、表 在LakeFormation界面进行Catalog、数据库、表的创建,并指定OBS并行文件系统目录。 查询数据 在SQL编辑器界面进行SQL查询。 父主题: Fabric SQL
  • 操作步骤 创建客户端将产生费用,实际扣费以账单为准。详细信息,请参见计费模式。 登录华为云控制台,在页面左上角单击,在服务列表中选择“数智融合计算服务 DataArtsFabric”。 图1 打开服务列表 在Fabric工作空间管理台,单击“接入管理”,进入客户端列表页,单击“创建客户端”。 在“创建客户端”页面,输入“客户端名称”,选择“虚拟私有云”和“所属子网”,勾选“我已阅读、知晓并同意以上的内容”,单击“确定”完成创建。 图2 创建客户端 表1 创建客户端参数说明 参数 说明 客户端名称 自定义客户端的名称,只能包含字母、数字、下划线、中划线,且长度为4~32个字符。 虚拟私有云 在下拉列表选择虚拟私有云。关于如何创建私有虚拟云,请参见创建虚拟私有云和子网。 所属子网 在下拉列表选择所属子网。关于如何创建子网,请参见创建虚拟私有云和子网。 当客户端的“状态”变为“运行中”,表示客户端创建完成。 单击客户端名称,进入客户端详情页,可以查看 域名 和接入连接表的IP地址。 通过域名和IP地址访问服务时,均需要将请求头中的HOST指定为域名。 使用域名调用: curl -kv https://fabric-ep.{region}.myhuaweicloud.com/healthcheck -H "host:fabric-ep.{region}.myhuaweicloud.com" 使用IP调用: curl -kv https://192.168.0.200/healthcheck -H "host:fabric-ep.{region}.myhuaweicloud.com" 图3 客户端详情页
  • 操作流程 表1 操作流程 操作步骤 说明 准备工作 注册华为账号并开通华为云,实名认证,为账户充值,已开通LakeFormation、OBS权限并进行了委托确认。 创建SQL端点 创建一个新的SQL端点,此步骤为可选,如果使用公共端点可直接跳过。 规划并创建OBS并行文件系统并导入数据 创建OBS并行文件系统及文件夹,用于数据存储,并导入样例数据。 规划并创建Lakeformation实例、Catalog、数据库、表 在LakeFormation界面进行Catalog、数据库、表的创建,并指定OBS并行文件系统目录。 查询数据 在Fabric的SQL编辑器界面进行SQL查询。
  • 大模型推理使用流程 Fabric平台提供了一个Serverless化的从数据到模型部署的AI全流程开发体验,针对每个环节,其使用是相对独立自由的。本章节梳理了Fabric使用流程详解,您可以选择其中一种方式完成AI开发。 表1 使用流程说明 流程 说明 详细指导 创建工作空间 创建一个工作空间,后续所有的能力都承载在工作空间中。 创建工作空间 创建端点 创建一个端点,根据业务类型不同,创建不同类型的端点。 创建推理端点 注册模型 用户可以将存储在OBS的微调模型文件,在模型管理的界面注册为自己的微调模型。 创建模型 部署服务 Fabric支持部署用户基于基模型微调的微调模型 创建推理服务 访问服务 微调模型部署完成后,用户可以使用Fabric提供的推理接口直接进行推理。 使用推理服务进行推理 父主题: 大模型推理场景
  • Ray、XDS计费项 Fabric服务根据RAY、推理业务场景有不同的策略进行计费。详细的计费项及说明请参考表1。 表1 计费项信息 计费项 计费说明 RAY资源 此处根据您创建的RAY资源规格和数量按照使用时间进行计费,不同的数据处理单元或AI计算单元规格的价格不同,支持包周期和按需付费两种模式。 模型算力单元时 此处根据您创建推理端点后部署模型实例所消耗的推理模型单元时长进行收费,支持按需付费。按照推理端点下实际的模型实例数量* 算力单元资源数量 * 使用时长按照秒级上报使用量,不同基模型对应的算力单元要求参考公共模型。 父主题: 计费项
  • 计费样例 以下案例中出现的费用价格仅供参考,实际价格请参见各服务价格详情。 Fabric服务Ray资源 RAY资源的“按需计费”模式都是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,某一RAY资源按需实例,fabric.ray.dpu.d1x规格价格为0.2元/小时,购买数量为5的按需实例根据规格数量 * 实际使用时长、按秒计费。 使用30分钟,根据实际使用时长按秒计费:(0.2/3600)*5*30*60=0.5元。 使用1小时,根据实际使用时长按秒计费:(0.2/3600)*5*60*60=1元。 Fabric服务模型算力单元MU时 MU时的“按需计费”模式都是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,某一基模型为LLAMA3_8B推理端点实例,每个实例部署消耗2MU算力,假设MU时价格为30.0元/小时。根据部署模型实例数量 * MU换算比例 * 实际使用时长,按秒计费。 使用30分钟,部署1个模型服务实例且数量无变化,根据实际使用时长按秒计费:(1/3600)*1*2*30*60=30元。 使用1小时,其中一段15分钟时间内,服务实例数为2,剩余时间内实例数为1,根据实际使用时长按秒计费:(30/3600)*1*2*45*60 + (30/3600)*2*2*15*60=75元。
  • 计费项 Fabric服务根据Ray、推理业务场景有不同的策略进行计费。详细的计费项及说明请参考表1。 表2 计费项信息 计费项 计费说明 Ray资源 此处根据您创建的RAY资源规格和数量按照使用时间进行计费,不同的数据处理单元或AI计算单元规格的价格不同,支持包周期和按需付费两种模式。 模型算力单元时 此处根据您创建推理端点后部署模型实例所消耗的推理模型单元时长进行收费,支持按需付费。按照推理端点下实际的模型实例数量* 算力单元资源数量 * 使用时长按照秒级上报使用量,不同基模型对应的算力单元要求参考公共模型。
  • 计费模式 Fabric服务提供包年包月、按需计费两种计费模式供您灵活选择。 包年包月:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买周期越长,享受的折扣越大。一般适用于计算资源需求量长期稳定的成熟业务。 按需:一种后付费模式,即先使用再付费,按照计算资源的实际使用时长计费,秒级计费,按小时结算。按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。一般适用于资源需求波动的场景,可以即开即停。 详细的计费区别请参考表1。 表1 Fabric服务计费模式 计费模式 付费方式 计费周期 适用计费项 包年包月 预付费 按照订单的购买周期结算。 按订单的购买周期计费。 RAY资源。 按需 后付费 按照云服务器实际使用时长计费。 按照资源实际使用量,每小时出话单扣费。 RAY资源、MU时、SQL预热资源、SQL算力单元时。 Fabric服务不同业务场景的计费模式如图1所示。
  • 停止计费 在查看账单后,如果您需要对某些资源停止计费可参考以下步骤: 在账单中获取资源ID或资源名称等其他资源信息。 根据上一步的信息,在云服务的控制台找到云服务资源。 将资源停止计费。 具体操作如下: RAY资源:停止RAY资源的计费,需要删除/退订RAY资源,删除后可能导致已有的RAY集群不可用。 推理MU时:删除推理端点下的推理服务实例或者删除推理端点后,则不会产生费用。 SQL: 对于SQL预热资源,在端点创建后会持续产生费用,需要删除端点后才能停止计费。 对于公共端点的SQL算力单元时,不使用公共端点执行SQL作业则不会产生费用。 父主题: 计费说明
  • 计费样例 以下案例中出现的费用价格仅供参考,实际价格请参见各服务价格详情。 SQL预热资源 SQL预热资源的“按需计费”模式是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即可得到每秒价格。 示例:某一SQL预热资源按需实例,fabric.sql.dcu.std规格价格为0.4592元/核/小时,购买预热资源数为4的按需实例,根据预热资源数量 * 实际运行时长秒级计费 运行30分钟,根据实际运行时长按秒计费:(0.4592/3600)*4*30*60=0.9184元。 运行1小时,根据实际运行时长按秒计费:(0.4592/3600)*4*60*60=1.8368元。 SQL算力单元时 SQL算力单元时的“按需计费”模式是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例:Pay By Query(按需查询)的按需实例,fabric.sql.query规格价格为0.597元/核/小时,根据运行SQL占用的DPU时(核秒数)计算费用,按秒计费。 在9:00~10:00 之间,执行了三条SQL语句,语句1占用 2.4秒、语句2占用3.5秒、语句3占用6.3秒,当前小时的总DPU时=2.4+3.5+6.3=12.2秒,根据实际使用量按秒计费:(0.597/3600)*12 =0.00199元 在10:00~11:00之间,执行了一条SQL语句,语句1在执行过程中被取消,语句1在取消之前占用了18秒DPU时,运行中被取消的SQL语句也会被计费,根据实际使用量按秒计费:(0.597/3600)*18=0.002985元。
  • 计费项 Fabric SQL服务根据业务场景实际使用的资源进行计费。详细的计费项及说明请参考表2。 表2 计费项信息 计费项 计费说明 SQL预热资源 此处根据您创建的SQL端点的预热资源的运行时长进行收费,按需付费,按照SQL端点实际的预热资源数量*运行时长计算使用量,按照秒级上报使用量。 SQL算力单元时 此处根据您下发SQL执行过程中占用的公共端点中的SQL算力单元资源数量 * 使用时长计算使用量,按需付费,每个自然小时按照秒级上报使用量。
  • 计费模式 Fabric SQL服务提供Pay By Resource和Pay By Query两种Serverless按需计费模式供您灵活选择。 Pay By Resource:按照创建的SQL端点的预热资源数量*运行时长计费,可以即开即停,秒级计费,按小时结算,每个自然小时出账单并从您的账户余额中扣减费用。专属使用,SLA高。 Pay By Query:按照在公共端点中运行SQL占用的SQL算力单元时计费,秒级计费,按小时结算,每个自然小时出账单并从您的账户余额中扣减费用。共享使用,SLA中。 详细的计费区别请参考表1。 表1 Fabric SQL服务计费模式 计费模式 付费方式 计费周期 适用计费项 Pay By Resource 后付费。按照云服务器购买的预热资源数的运行时长计费。 按照预热资源的运行时间计费,每小时出话单扣费。 SQL预热资源 Pay By Query 后付费。按照在公共端点中运行SQL占用的SQL算力单元时计费。 按每小时运行SQL占用的SQL算力单元时,每小时出话单扣费。 SQL算力单元时
  • 计费模式 Fabric服务提供包年包月、按需计费两种计费模式供您灵活选择。 包年包月:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买周期越长,享受的折扣越大。一般适用于计算资源需求量长期稳定的成熟业务。 按需:一种后付费模式,即先使用再付费,按照计算资源的实际使用时长计费,秒级计费,按小时结算。按需计费模式允许您根据实际业务需求灵活地调整资源使用,无需提前预置资源,从而降低预置过多或不足的风险。一般适用于资源需求波动的场景,可以即开即停。 详细的计费区别请参考表1。 表1 Fabric服务计费模式 计费模式 付费方式 计费周期 适用计费项 包年包月 预付费 按照订单的购买周期结算。 按订单的购买周期计费。 RAY资源。 按需 后付费 按照云服务器实际使用时长计费。 按照资源实际使用量,每小时出话单扣费。 RAY资源、MU时、SQL预热资源、SQL算力单元时。 Fabric服务不同业务场景的计费模式如图1所示。 图1 Fabric计费模式 父主题: 计费说明
  • Fabric SQL计费项 Fabric SQL服务根据业务场景实际使用的资源进行计费。详细的计费项及说明请参考表1 SQL计费项信息。 表1 SQL计费项信息 计费项 计费说明 SQL预热资源 此处根据您创建的SQL端点的预热资源的运行时长进行收费,按需付费,按照SQL端点实际的预热资源数量*运行时长计算使用量,按照秒级上报使用量。 SQL算力单元时 此处根据您下发SQL执行过程中占用的公共端点中的SQL算力单元资源数量 * 使用时长计算使用量,按需付费,每个自然小时按照秒级上报使用量。 父主题: 计费项
  • 计费样例 以下案例中出现的费用价格仅供参考,实际价格请参见各服务价格详情。 样例1:Fabric服务Ray资源 Ray资源的“按需计费”模式都是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,某一Ray资源按需实例,fabric.ray.dpu.d1x规格价格为0.2元/小时,购买数量为5的按需实例根据规格数量 * 实际使用时长、按秒计费。 使用30分钟,根据实际使用时长按秒计费:(0.2/3600)*5*30*60=0.5元。 使用1小时,根据实际使用时长按秒计费:(0.2/3600)*5*60*60=1元。 样例2:Fabric服务模型算力单元MU时 MU时的“按需计费”模式都是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,某一基模型为LLAMA3_8B推理端点实例,每个实例部署消耗2MU算力,假设MU时价格为30.0元/小时。根据部署模型实例数量 * MU换算比例 * 实际使用时长,按秒计费。 使用30分钟,部署1个模型服务实例且数量无变化,根据实际使用时长按秒计费:(1/3600)*1*2*30*60=30元。 使用1小时,其中一段15分钟时间内,服务实例数为2,剩余时间内实例数为1,根据实际使用时长按秒计费:(30/3600)*1*2*45*60 + (30/3600)*2*2*15*60=75元。 样例3:SQL预热资源(Pay By Resource) SQL预热资源的“按需计费”模式是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即可得到每秒价格。 示例,某一SQL预热资源按需实例,fabric.sql.dcu.std规格价格为0.4592元/核/小时,购买预热资源数为4的按需实例,根据预热资源数量 * 实际运行时长秒级计费 运行30分钟,根据实际运行时长按秒计费:(0.4592/3600)*4*30*60=0.9184元。 运行1小时,根据实际运行时长按秒计费:(0.4592/3600)*4*60*60=1.8368元。 样例4:SQL算力单元时(Pay By Query) SQL算力单元时的“按需计费”模式是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,Pay By Query(按需查询)的按需实例,fabric.sql.query规格价格为0.597元/核/小时,根据运行SQL占用的DPU时(核秒数)计算费用,按秒计费。 在9:00 ~ 10:00 之间,执行了三条SQL语句,语句1占用 2.4秒、语句2占用3.5秒、语句3占用6.3秒,当前小时的总DPU时=2.4+3.5+6.3=12.2秒,根据实际使用量按秒计费:(0.597/3600)*12 =0.00199元 在10:00 ~ 11:00之间,执行了一条SQL语句,语句1在执行过程中被取消,语句1在取消之前占用了18秒DPU时,运行中被取消的SQL语句也会被计费,根据实际使用量按秒计费:(0.597/3600)*18=0.002985元。 父主题: 计费说明
  • 变更配置 当前Fabric服务计费项仅支持修改RAY资源和SQL预热资源,其他业务场景都是按使用量按需计费,不涉及订单变更流程,且暂时不支持计费方式变更,因此变更配置只涉及Ray资源和SQL预热大小变更场景。 修改Ray资源或者SQL预热资源大小对费用影响如表1所示: 表1 费用影响 当前计费模式 变更场景 对费用的影响 按需 RAY资源数量变更(升配/降配) 变更成功后,新的计费方式将立即生效。 按需 SQL预热资源数量变更(升配/降配) 变更成功后,新的计费方式将立即生效。 包年包月 RAY资源数量增加(补差价升配) 升配后新资源数量将在原来已有的时间周期内立即生效。需按照与原规格的价格差异,结合已使用的时间周期,补上差价。 例如:(以下价格仅作示例,实际价格以价格详情为准) 客户于2024/11/1 购买了数量为1,规格为fabric.compute.dpu.d1x的RAY资源,购买时长为1个月,此时价格为18.4元/月,客户使用余额支付18.4元,实付金额为18.4元。 客户在2018/11/24 将Ray资源数量升级为5,价格为92元/月。 这时,剩余天数为 30 - 24 = 6天,升配费用=92 / 30 * 6 - 18.4 / 30 * 6 = 14.72元。 了解更多变更资源计费信息,请参见变更资源费用说明。 包年包月 RAY资源数量减少(即时降配) 降配成功后新的资源大小将在原来已有的时间周期内立即生效。按照与原规格的价格差异,结合已使用的时间周期,退款差价。 例如:(以下价格仅作示例,实际价格以价格详情为准) 客户于2024/11/1 购买了数量为5,规格为fabric.compute.dpu.d1x的RAY资源,购买时长为1个月,此时价格为18.4元/月,客户使用余额支付92元,实付金额为92元。 客户在2018/11/24 将Ray资源数量降级为4,价格为18.4元/月。 这时,剩余天数为 30 - 24 = 6天,降配退差价=92 / 30 * 6 - 18.4 / 30 * 6 = 14.72元。 了解更多变更资源计费信息,请参见变更资源费用说明。 父主题: 计费说明
  • 产品优势 Fabric服务具有以下优势: 数智一站式开发,提供统一的开发体验 一个工作空间,提供多种工作负载,包含SQL、基于Ray的数据工程、模型推理。 基于LakeFormation统一管理结构化、半结构化、非结构化数据,数智开发全流程,一份元数据和一份权限控制。 数据+AI共享一份数据,客户无需进行数据复制。 开箱即用,资源弹性,按需使用 预置开源主流三方大模型的推理服务,客户可直接调用预置推理服务API下发文本对话等任务,无需购买资源,按需付费。 推理服务支持自动扩缩。 全托管Ray支持Pod级自动扩缩,应对客户请求波峰压力,实现资源动态分配。 SQL支持按资源计费与按查询计费两种模式,计算资源支持查询级别快速弹性。 开源生态 基于昇腾生态提供开源Ray的能力,并在开源Ray的能力上提供Redis高可靠。 Ray dashboard提供可视化监控、故障排查、性能调优以及管理应用运行情况。 SQL基于开放湖仓生态,支持ORC、Parquet、Iceberg等数据格式。
  • 模型推理产品规格 表1 模型推理产品规格 类型 规格 算力 MU mu.llama3.8b 为llama3.8b模型,提供短token场景约400RPM算力。 mu.llama3.70b 为llama3.70b模型,提供短token场景约100RPM算力。 mu.llama3.1.8b 为llama3.1.8b模型,提供短token场景约190RPM算力。 mu.llama3.1.70b 为llama3.1.70b模型,提供短token场景约130RPM算力。 mu.qwen2.72b 为qwen2.72b模型,提供短token场景约1700RPM算力。 mu.glm4.9b 为glm4.9b模型,提供短token场景约110RPM算力。
  • Ray集群产品规格 表2 ray产品规格 类型 规格 算力 DPU fabric.ray.dpu.d1x 提供约4CPU16G内存算力。 fabric.ray.dpu.d2x 提供约8CPU32G内存算力。 fabric.ray.dpu.d4x 提供约16CPU64G内存算力。 fabric.ray.dpu.d8x 提供约32CPU128G内存算力。 fabric.ray.dpu.d16x 提供约64CPU256G内存算力。 fabric.ray.dpu.d32x 提供约128CPU512G内存算力。 APU fabric.ray.apu.b1.1x 提供昇腾AI加速型(B1)1卡算力 fabric.ray.apu.b2.1x 提供昇腾AI加速型(B2)1卡算力 fabric.ray.apu.b3.1x 提供昇腾AI加速型(B3)1卡算力 fabric.ray.apu.b1.8x 提供昇腾AI加速型(B1)8卡算力 fabric.ray.apu.b2.8x 提供昇腾AI加速型(B2)8卡算力 fabric.ray.apu.b3.8x 提供昇腾AI加速型(B2)8卡算力
  • 产品架构 Fabric提供高性能、高可靠、低时延、低成本的海量存储系统,与华为云的大数据服务组合使用,可大幅度降低成本,帮助企业简单快捷地管理大数据。 SQL引擎 Fabric提供分布式SQL引擎,实现了元数据服务、计算、缓存和存储的分层解耦和弹性,让每一层动态分配资源而不会影响另一层的性能或可用性。语句级别的弹性扩缩、高性能分布式分析引擎可帮助您在几秒钟内查询TB级别数据,在几分钟内查询PB级别数据。 分布式Ray Fabric支持分布式计算框架Ray,来帮助客户解决规模日益增大的数据处理和机器学习/深度学习任务对分布式计算的问题,也为数据工程和机器学习工程提供统一的完整Workflow。Fabric Ray支持Ray-Data、Ray-Train、Ray-Serve模块,分别满足分布式数据预处理、分布式训练、分布式模型推理服务的应用场景。 在线推理 Fabric提供自研的高性能弹性推理引擎,支持客户基于默认的推理服务下发推理作业,也支持客户独立部署自定义模型。 异构资源管理 Fabric支持CPU+NPU资源统一纳管、统一资源分配;资源调度粒度支持容器级和Actor级,并且支持安全沙箱来实现资源隔离、可靠容错。 多语义缓存加速 Fabric提供跨引擎、多模态、多语义加速,例如数据缓存、模型缓存、CheckPoint缓存。 图1 产品架构图
  • 大模型LICENSE约束 不同的开源大模型有不同的LICENSE约束,详细请见下表: 表1 大模型LICENSE约束 模型名称 LICENSE地址 Llama 3 8B Chinese Instruct https://github.com/meta-llama/llama/blob/main/LICENSE Llama 3 70B https://github.com/meta-llama/llama/blob/main/LICENSE Llama 3.1 8B Chinese Chat https://huggingface.co/meta-llama/Meta-Llama-3.1-8B/blob/main/LICENSE Llama 3.1 70B https://huggingface.co/meta-llama/Meta-Llama-3.1-8B/blob/main/LICENSE Qwen 2 72B Instruct https://huggingface.co/Qwen/Qwen2-72B-Instruct/blob/main/LICENSE Glm 4 9B Chat https://huggingface.co/THUDM/glm-4-9b-chat/blob/main/LICENSE
  • Fabric SQL服务使用限制 表1 Fabric SQL服务使用限制 事项 说明 开通服务 一个账号支持开通一个Fabric SQL服务,并且该账号各子用户共用一个服务。 连接服务 提供了SQL编辑器,JDBC,SDK,API接口等多种连接方式。 运维操作 Serverless形态,不涉及扩容、升级、备份恢复、容灾等运维操作。 超时限制 由于用户授权Token存在时效性(8小时),单次请求时间如果超过Token有效期会导致语句执行失败。 SQL语法 参见数据库操作使用限制。
  • 数据库操作使用限制 表2 数据库操作 类别 语法 是否支持 基本功能 CREATE EXTERNAL TABLE 是 DROP TABLE 是 CREATE VIEW 是 DROP VIEW 是 INSERT 是 SELECT 是 TRUNCATE 是 EXPLAIN 是 ANALYZE 是 ALTER TABLE DROP PARTITIONS 是 ALTER TABLE SET TABLEPROPERTIES 是 ALTER TABLE UNSET TABLEPROPERTIES 是 ALTER TABLE DROP COLUMNS 否(仅Iceberg支持) ALTER TABLE ADD COLUMNS 否(仅Iceberg支持) ALTER TABLE COLUMN RENAME 否(仅Iceberg支持) CREATE EXTERNAL TABLE AS 是
  • 发布帖子 登录圆桌。 选择创建入口。 个人创建入口 在选择圈子页面选择“ME”圈子,进入个人圈子页面。 圈子创建入口 在选择圈子页面选择具体圈子,进入圈子页面。 在圈子页面,单击右上角的,进入“圈子内应用”页面,选择“帖子”。 在“帖子”页面输入标题、内容,选择来源。 来源提供原创和转载两种方式。 图1 帖子事件 发布设置和高级设置,具体设置请参见创建事件。 发布设置:选择接收人、密送开关、关联的圈子、归属圈子、公开范围。 高级设置:设置事件是否允许被转发、评论、点赞、评论等。 打开“必达”开关,事件发布成功后,可在web端事件详情页的评论区单击“回执”查看信息阅读情况。 以上步骤设置完成后,单击“发布”,即可完成帖子发布。 发布成功后支持创建人在web端事件详情页再次编辑帖子内容。
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全