联的网络,打通VPC。打通VPC网络后,网络列表和资源池详情页面将显示VPC名称,单击后可以跳转至VPC详情页面。 图2 查看网络配置 图3 打通VPC VPC下创建弹性云服务器 登录弹性云服务器ECS控制台,单击右上角“购买弹性云服务器”,进入购买弹性云服务器页面,完成基本配置
文长度有较高要求。请使用ModelArts Studio(MaaS)控制台的DeepSeek-R1-671B-32K或DeepSeek-V3-671B-32K模型服务,低于32k上下文长度的模型接入会出现调用失败的情况。 在ModelArts Studio(MaaS)控制台左侧导航栏,单击“在线推理”。
dataset_type 否 Integer 根据数据集类型查询数据集列表,与data_type参数二选一。可选值如下: 0:图像分类 1:物体检测 3: 图像分割 100:文本分类 101:命名实体 102:文本三元组 200:声音分类 201:语音内容 202:语音分割 400:表格数据集
会话对象,初始化方法请参见Session鉴权。 dataset_type 否 Integer 根据数据集类型查询数据集列表,默认为空。可选值如下: 0:图像分类 1:物体检测 3: 图像分割 100:文本分类 101:命名实体 102:文本三元组 200:声音分类 201:语音内容 202:语音分割 400:表格数据集
在创建训练作业时参数train_instance_count选择了2,则可选值为"worker-0","worker-1",依次类推。 表3 返回参数说明 参数 参数类型 描述 metrics Array of objects 运行指标。 表4 metrics 参数 参数类型 描述
导致页面展示异常或者训练/推理异常) samples 否 Array of strings 样本ID列表。 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 error_code String 操作失败的错误码。 error_msg String 操作失败的错误信息。
a object 插件模板的metadata信息。 spec PluginTemplateSpec object 插件模板的规格信息。 表3 PluginTemplateMetadata 参数 参数类型 描述 name String 插件模板的名称。 表4 PluginTemplateSpec
在标签框中输入相应的标签后,单击“新增标签”,新生成的标签会展示在标签行的下方,您可以同时增加多个标签。标签增加完成后,单击“确定”,标签即可生成。 图3 新增标签 生成了标签的Workflow,支持在搜索框中按照标签筛选对应的Workflow。 父主题: 管理Workflow
登录“统一身份认证服务”控制台,左侧菜单选择“权限管理 > 权限”,单击右上角“创建自定义策略”,创建自定义策略权限。 图2 统一身份认证服务添加权限 图3 创建自定义策略 权限内容如下: { "Version": "1.1", "Statement": [ {
97269-c9b6-4c77-b31e-58b0cb4e02e3,那么上报到账单中的资源名称为:service_predictor_name-b9c97269-c9b6-4c77-b31e-58b0cb4e02e3。 根据上报账单的资源名称在费用中心查看资源账单。 进入“费用中心
__WORKFORCE_SAMPLED_REJECTED__:采样已驳回 __AUTO_ANNOTATION__:待确认 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 data_path String 数据集数据存储路径。 data_spliting_enable Boolean
__WORKFORCE_SAMPLED_REJECTED__:采样已驳回 __AUTO_ANNOTATION__:待确认 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 data_path String 数据集数据存储路径。 data_spliting_enable Boolean
Array 训练作业使用的数据集。不可与data_url或dataset_id/dataset_version_id同时使用。详情请参见表3。 engine_id 是 Long 训练作业选择的引擎ID,默认为“1”。请从查询作业引擎规格接口获取引擎规格ID。 train_url 否
取值范围:枚举类型,取值如下: -ASCEND_SNT9 -ASCEND_SNT9B -ASCEND_SNT3 默认取值:不涉及。 请求参数 无 响应参数 状态码:200 表3 响应Body参数 参数 参数类型 描述 current Integer 参数解释:当前页数。 取值范围:正整数。
String 参数解释:镜像的资源类型。 取值范围:枚举类型,取值如下: ASCEND_SNT9 ASCEND_SNT9B ASCEND_SNT3 请求示例 GET https://{endpoint}/v1/{project_id}/images/{id} 响应示例 状态码:200 OK。
String 每页显示的条目数量。 offset 否 String 偏移量,表示从此偏移量开始查询,offset大于等于0。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户token。 响应参数 状态码:200
取值范围:布尔类型: true:删除镜像内容。 false:不删除镜像内容。 默认取值:false。 请求参数 无 响应参数 状态码:200 表3 响应Body参数 参数 参数类型 描述 arch String 参数解释:该镜像所支持处理器架构类型。 取值范围:枚举类型,取值如下: X86_64:x86处理器架构。
每个节点必须是8卡,不能出现2卡或4卡的情况。 必须是Snt9b或Snt9b23的Ascend资源。 实例数 选择的实例数必须大于或等于3。 场景二:使用自定义镜像+Pytorch+NPU训练 当使用自定义镜像和Ascend资源池创建训练作业时,可以参考表2创建训练作业实现动态
创建一个Notebook实例,并开启远程SSH开发,配置远程访问IP白名单。该实例状态必须处于“运行中”,具体参见创建Notebook实例(默认页面)章节。 Step3 登录插件 使用访问密钥完成登录认证操作如下: 打开已安装ToolKit工具的PyCharm,在菜单栏中选择“ModelArts > Edit
此参数。此参数配置是可选的。指定后,提供的列表将合并到从所选DNS策略生成的基本搜索域名中,并删除重复的域名。Kubernetes最多允许3个搜索域。 ndots(可选) 开启“DNSConfig自动注入”后需要配置此参数。 该参数的含义是当域名的“.”个数小于ndots的值,会