云服务器内容精选

  • 购买弹性云服务器ECS 如果您需要在服务器上部署相关业务,较之物理服务器,弹性云服务器的创建成本较低,并且可以在几分钟之内快速获得基于云服务平台的弹性云服务器设施,并且这些基础设施是弹性的,可以根据需求伸缩。下面介绍如何在管理控制台购买弹性云服务器。 购买流程: 步骤一:基础配置 步骤二:网络配置 步骤三:高级配置 步骤四:确认订单 购买时需注意,ECS需要和SFS买到同一个VPC才能挂载SFS存储。
  • 添加资源池 登录GaussDB(DWS) 管理控制台。 在集群列表中单击需要访问“资源管理”页面的集群名称。 切换至“资源管理”页签。 单击资源池列旁的“添加资源池”按钮添加资源池。 最多可创建63个资源池。 参见表1填写资源池的名称和相关资源配置。 表1 资源池参数 参数项 描述 是否必选 默认值 名称 资源池的名称。 是 - CPU资源(%) 共享配额:关联在当前资源池的用户在执行作业时可以使用的CPU时间比例,取值范围为1-99的整数。 专属限额:限定资源池中数据库用户在执行作业时可使用的最大CPU核数占总核数的百分比,取值范围为0-100的整数,0表示不限制。 说明: 所有资源池的总和不能超过99%。当配置CPU共享配额后,如果当前只有一个资源池时,该参数不生效。 共享配额非绝对限制,只有在发生CPU竞争时才生效。例如,资源池A和B被绑定在CPU1运行,当A和B均运行时参数生效,只有A运行则参数不生效。 所有资源池的CPU专属限额总和最大不能超过100%,系统默认的CPU专属限额(%)为0。 CPU专属限额仅8.1.3及以上集群版本支持。 是 - 内存资源(%) 资源池所占用的内存百分比。 注意: 内存和查询并发支持单独管控和联合管控,联合管控时必须同时满足并发和内存要求时作业才能下发。 是 0(不限制) 存储资源(MB) 可使用的永久表空间大小。 注意: 该值是资源池下所有DN的表空间总值,单DN节点可用空间=设置值 / DN节点数。 是 -1(不限制) 复杂语句并发 资源池中的最大查询并发数。 注意: 内存和查询并发支持单独管控和联合管控,联合管控时必须同时满足并发和内存要求时作业才能下发。 是 10 网络带宽权重 网络调度时权重值。取值范围为1~2147483647的整数,默认配置为-1。 注意: 网络带宽权重仅8.2.1及以上集群版本支持。 是 -1(不限制) 核对信息后,单击“确定”,添加资源池完成。 父主题: 资源池
  • 1个节点的专属资源池,能否部署多个服务? 支持。 在部署服务时,选择专属资源池,在选择“计算节点规格”时选择“自定义规格”,设置小一些或者选择小规格的服务节点规格,当资源池节点可以容纳多个服务节点规格时,就可以部署多个服务。如果使用此方式进行部署推理,选择的规格务必满足模型的要求,当设置的规格过小,无法满足模型的最小推理要求时,则会出现部署失败或预测失败的情况。 图1 设置自定义规格 父主题: 资源池
  • 新建代理 完成新建资源池后,在资源池列表中找到目标资源池,单击资源池名称,进入“代理列表”页面。 单击“新建代理”,页面弹出对话框。 根据需要完成参数配置。 配置主机所需的网络环境。 表3 步骤一配置 配置项 配置说明 自动安装JDK 主机需要具备Java 8环境。 开启此开关后,将为主机自动安装JDK至“/usr/local”目录中。 如果关闭此开关,则需手动安装。如何安装Java 8? 说明: 仅资源池类型为“LINUX”或“LINUX_DOCKER”时显示此配置项。 自动安装Git 主机需要具备Git环境。 开启此开关后,将为主机自动安装Git。 如果关闭此开关,则需手动安装。如何安装Git? 说明: 仅资源池类型为“LINUX”或“LINUX_DOCKER”时显示此配置项。 自动安装Docker 主机需要具备Docker环境。 开启此开关后,将为主机自动安装Docker至“/usr/bin”目录中。安装完成后将自动注册服务并启动docker服务。 如果关闭此开关,则需手动安装。如何安装Docker? 说明: 仅资源池类型为“LINUX”或“LINUX_DOCKER”时显示此配置项。 配置身份认证信息。 表4 步骤二配置 配置项 配置说明 AK Access Key Id。 在通过获取AK/SK下载的访问密钥文件中获取。 SK Secret Access Key。 在通过获取AK/SK下载的访问密钥文件中获取。 代理名称 代理(Agent)的名称,同一台主机不可以安装相同名称的代理。 请根据实际情况填写。为了方便管理,命名建议清晰,建议关联代理机IP,如:10.10.10.10-agent-01。 代理工作空间 代理在主机上运行的工作目录,任务执行的工作空间,同一台主机的不同代理不可以使用同样的代理工作空间。 请根据实际情况填写。为了方便管理,建议关联数据盘,例如: Linux:/opt/cloud/agent01。 Windows:C:/opt/cloud/agent01。 MAC:/opt/cloud/agent01。 生成命令。 完成参数配置,勾选“我已阅读并同意”,单击“生成命令”,命令框中自动生成安装代理命令。 单击“复制命令”,复制此命令。 登录主机,执行上一步复制的安装命令。 Linux主机:使用root账号登录主机,执行安装命令。 Windows主机:使用管理员身份登录主机,打开Git Bash,执行安装命令。 MAC主机:使用root账号登录主机,执行安装命令。 当命令终端显示如下提示时,表示安装结束。 图1 安装成功回显 返回“代理列表”页面,关闭弹窗。 等待10-30秒,刷新页面,在列表中可查看到已经安装的代理实例状态为“空闲中”,表示安装成功。
  • 后续操作 查看代理列表 在资源池列表中找到目标资源池,单击资源池名称,进入“代理列表”页面。 代理列表可显示代理机状态、内存使用率、可用硬盘等信息。 代理机有以下五种状态: 表5 代理机状态说明 代理机状态 说明 运行中 代理机正在执行任务。 空闲中 代理机处于连接状态,未运行任务。 停用 代理机处于连接状态,但被停用无法执行任务。 下线 代理机处于掉线断开状态,如需上线请登录代理机重新注册,否则删除即可。 删除中 代理机正在被删除中。 删除代理 在“代理列表”页面,单击操作列,可以删除指定的代理机。 “运行中”状态的代理机无法删除。 启动/停用代理 在“代理列表”页面,单击操作列,可停用对应代理,停用后,状态列显示为“停用”;单击,可以重新启用代理,状态列恢复为“空闲中”。 查看资源池详情 在“代理列表”页面,单击“资源池详情”页签,可以查看资源池的详细信息(资源池所有者、资源池类型、资源池创建时间以及描述信息)。
  • 后续操作 查看代理列表 在资源池列表中找到目标资源池,单击资源池名称,进入“代理列表”页面。 代理列表可显示代理机状态、内存使用率、可用硬盘等信息。 代理机有以下五种状态: 表5 代理机状态说明 代理机状态 说明 运行中 代理机正在执行任务。 空闲中 代理机处于连接状态,未运行任务。 停用 代理机处于连接状态,但被停用无法执行任务。 下线 代理机处于掉线断开状态,如需上线请登录代理机重新注册,否则删除即可。 删除中 代理机正在被删除中。 删除代理 在“代理列表”页面,单击操作列,可以删除指定的代理机。 “运行中”状态的代理机无法删除。 启动/停用代理 在“代理列表”页面,单击操作列,可停用对应代理,停用后,状态列显示为“停用”;单击,可以重新启用代理,状态列恢复为“空闲中”。 查看资源池详情 在“代理列表”页面,单击“资源池详情”页签,可以查看资源池的详细信息(资源池所有者、资源池类型、资源池创建时间以及描述信息)。
  • 新建代理 完成新建资源池后,在资源池列表中找到目标资源池,单击资源池名称,进入“代理列表”页面。 单击“新建代理”,页面弹出对话框。 根据需要完成参数配置。 配置主机所需的网络环境。 表3 步骤一配置 配置项 配置说明 自动安装JDK 主机需要具备JAVA8+环境。 开启此开关后,将为主机自动安装JDK至“/usr/local”目录中。 如果关闭此开关,则需手动安装。如何安装JAVA8+? 说明: 仅资源池类型为“LINUX”或“LINUX_DOCKER”时显示此配置项。 自动安装Git 主机需要具备Git环境。 开启此开关后,将为主机自动安装Git。 如果关闭此开关,则需手动安装。如何安装Git? 说明: 仅资源池类型为“LINUX”或“LINUX_DOCKER”时显示此配置项。 自动安装Docker 主机需要具备Docker环境。 开启此开关后,将为主机自动安装Docker至“/usr/bin”目录中。安装完成后将自动注册服务并启动docker服务。 如果关闭此开关,则需手动安装。如何安装Docker? 说明: 仅资源池类型为“LINUX”或“LINUX_DOCKER”时显示此配置项。 配置身份认证信息。 表4 步骤二配置 配置项 配置说明 AK Access Key Id。 在通过获取AK/SK下载的访问密钥文件中获取。 SK Secret Access Key。 在通过获取AK/SK下载的访问密钥文件中获取。 代理名称 代理(Agent)的名称,同一台主机不可以安装相同名称的代理。 请根据实际情况填写。为了方便管理,命名建议清晰,建议关联代理机IP,如:10.10.10.10-agent-01。 代理工作空间 代理在主机上运行的工作目录,任务执行的工作空间,同一台主机的不同代理不可以使用同样的代理工作空间。 请根据实际情况填写。为了方便管理,建议关联数据盘,例如: Linux:/opt/cloud/agent01。 Windows:C:/opt/cloud/agent01。 MAC:/opt/cloud/agent01。 生成命令。 完成参数配置,勾选“我已阅读并同意”,单击“生成命令”,命令框中自动生成安装代理命令。 单击“复制命令”,复制此命令。 登录主机,执行上一步复制的安装命令。 Linux主机:使用root账号登录主机,执行安装命令。 Windows主机:使用管理员身份登录主机,打开Git Bash,执行安装命令。 MAC主机:使用root账号登录主机,执行安装命令。 当命令终端显示如下提示时,表示安装结束。 图1 安装成功回显 返回“代理列表”页面,关闭弹窗。 等待10-30秒,刷新页面,在列表中可查看到已经安装的代理实例状态为“空闲中”,表示安装成功。
  • 边缘资源池简介 边缘资源池是边缘服务部署专用的资源池,是租户边缘侧的运行节点集合。推理服务在边缘池上运行,用户创建对应异步服务或边缘同步服务后,边缘服务会调度选择合适的节点运行异步算法容器,进行异步服务或边缘同步服务的处理。 节点 边缘节点是ModelArts平台提供的用于部署边缘服务的终端设备。创建边缘资源池之前需要先创建ModelArts边缘节点并激活节点。 资源池 边缘资源池是边缘服务部署专用的资源池。创建边缘资源池时,可以添加ModelArts边缘节点设备,也可以添加IEF纳管的边缘节点设备。 图1 创建边缘资源池流程图 父主题: 边缘资源池
  • 响应示例 { "is_success": true, "message": "", "count": 2, "elastic_resource_pools": [ { "owner": "ei_dlics_d00352221", "id": 1026, "elastic_resource_pool_name": "elastic_pool_0622_10", "description": "", "max_cu": 0, "min_cu": 0, "actual_cu": 0, "cidr_in_vpc": "172.16.0.0/12", "create_time": 1624366266826, "current_cu": 64, "status": "AVAILABLE", "resource_id": "ecc98d89-3fd1-4dec-b572-aa6e2ef82391", "fail_reason": "", "enterprise_project_id": "0", "prepay_cu": 0, "charging_mode": 1 }, { "owner": "ei_dlics_d00352221", "id": 1002, "elastic_resource_pool_name": "elastic_pool_0622_0", "description": "test", "max_cu": 684, "min_cu": 0, "actual_cu": 0, "cidr_in_vpc": "172.16.0.0/12", "create_time": 1624353878084, "status": "AVAILABLE", "resource_id": "ecc98d89-3fd1-4dec-b572-aa6e2ef82391", "fail_reason": "", "enterprise_project_id": "0", "prepay_cu": 0, "charging_mode": 1 } ] }
  • URI URI格式 GET /v3/{project_id}/elastic-resource-pools 参数说明 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目编号,用于资源隔离。获取方式请参考获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 limit 否 Integer 每页的数量。默认为100。 name 否 String 通过弹性资源池名称进行模糊匹配。 offset 否 Integer 偏移量。默认为0。 status 否 String 弹性资源池状态。具体参数范围如下: AVAILABLE:可使用 SCALING:规格变更中 CREATING:创建中 FAILED:已失败 tags 否 String 查询根据标签进行过滤。
  • 管理资源池权限 资源池涉及以下几种角色: 表1 资源池角色表 角色名称 说明 所有者 默认为资源池的创建者。 所有者可以转移,当前的所有者、以及租户账号可以完成转移所有者操作。 管理者 对当前资源池拥有所有操作权限,包括资源池的查看、使用与配置修改等。 资源池使用者 可以查询当前资源池内详细信息、资源池的操作历史、代理列表、使用资源池中的代理机执行任务。 完成新建资源池后,在资源池列表中找到目标资源池,单击资源池名称,进入“代理列表”页面。 单击“权限管理”页签,可以对资源池权限进行管理。 图1 权限管理 表2 权限管理 操作 说明 转移所有者 单击所有者后的,在下拉列表中选择用户,单击,完成所有者的转移。 设置管理者 单击管理者后的“添加”,在下拉列表中选择用户,单击,可以将所选用户设置为资源池管理者。 单击已设置为管理者的用户名后的,可以取消该用户的管理者权限。 设置资源池使用者 单击开关,可以配置授权租户下所有用户为资源池使用者。 单击项目后的“添加”,在下拉列表中选择项目名称,单击,可以将所选项目下的所有成员设置为资源池使用者。 单击已授权的项目名称后的,可以取消该对该项目下成员的授权。
  • 请求示例 修改弹性资源池关联队列的扩缩容策略。 { "queue_scaling_policies" : [ { "priority" : 100, "impact_start_time" : "10:00", "impact_stop_time" : "22:00", "min_cu":"64", "max_cu":"752" }, { "priority" : 50, "impact_start_time" : "22:00", "impact_stop_time" : "10:00", "min_cu":"64", "max_cu":"752" } ] }
  • 请求消息 表2 请求参数说明 参数 是否必选 参数类型 描述 queue_scaling_policies 是 Array of objects 该队列在该弹性资源池下的扩缩容策略信息。单条策略信息包含时间段、优先级和CU范围。每个队列至少要配置一条时间段为[00:00, 24:00]的默认扩缩容策略。详细参数说明请参考表3。 表3 queue_scaling_policies 参数 是否必选 参数类型 描述 impact_start_time 是 String 生效开始时间。 impact_stop_time 是 String 生效结束时间。 priority 是 Integer 优先级。 min_cu 是 Integer 最小CU数量。 max_cu 是 Integer 最大CU数量。
  • URI URI格式 PUT /v3/{project_id}/elastic-resource-pools/{elastic_resource_pool_name}/queues/{queue_name} 参数说明 表1 路径参数 参数 是否必选 参数类型 描述 elastic_resource_pool_name 是 String 弹性资源池名称。 project_id 是 String 项目编号,用于资源隔离。获取方式请参考获取项目ID。 queue_name 是 String 绑定的队列名称。
  • 处理步骤 进入训练作业详情页,在左侧获取SFS Turbo的名称。 图1 获取SFS Turbo的名称 登录弹性文件服务SFS控制台,在SFS Turbo列表找到训练作业挂载的SFS Turbo,单击名称进入详情页。获取VPC信息、安全组信息和endpoint信息。 VPC信息:SFS Turbo详情页的“虚拟私有云”。 安全组信息:SFS Turbo详情页的“安全组”。 endpoint信息:SFS Turbo详情页的“共享路径”,去除“:/”即为sfs-turbo-endpoint。例如共享路径为“4ab556b5-d689-44f1-9302-24c09daxxxxc.sfsturbo.internal:/”,则sfs-turbo-endpoint为“4ab556b5-d689-44f1-9302-24c09daxxxxc.sfsturbo.internal”。 查看SFS Turbo的VPC网段是否满足如下2个条件。 条件一:SFS Turbo网段不能与192.168.20.0/24重叠,否则会和专属资源池的网段发生冲突,因为专属资源池的默认网段为192.168.20.0/24。专属资源池实际使用的网段可以在资源池的详情页面查看“网络”获取。 条件二:SFS Turbo网段不能与172网段重叠,否则会和容器网络发生冲突,因为容器网络使用的是172网段。 若不满足条件,则修改SFS Turbo的VPC网段,推荐网段为10.X.X.X。具体操作请参见修改虚拟私有云网段。 若满足条件,则继续下一步。 查看SFS Turbo的VPC网段的安全组是否被限制了。 在所选专属资源池中新建一个未挂载的SFS Turbo的训练作业,当训练作业处于“运行中”时,通过Cloud Shell功能登录训练作业worker-0实例,使用curl {sfs-turbo-endpoint}:{port}命令检查port是否正常打开,SFS Turbo所需要入方向的端口号为111、445、2049、2051、2052、20048,具体请参见创建文件系统的“安全组”参数。Cloud Shell功能的操作指导请参见使用CloudShell登录训练容器。 是,则修改安全组的配置,具体操作请参见修改安全组规则。 否,则继续下一步。 确认SFS Turbo是否存在异常。 新建一个和SFS Turbo在同一个网段的ECS,用ECS去挂载SFS Turbo,如果挂载失败,则表示SFS Turbo异常。 是,联系SFS服务的技术支持处理。 否,联系ModelArts的技术支持处理。