云服务器内容精选

  • 负载均衡 表3 Service ELB 高危操作 导致后果 误操作后解决方案 禁止通过ELB的控制台删除已绑定CCE集群的ELB实例 导致Service/Ingress访问不通。 不建议删除。 通过ELB的控制台停用已绑定CCE集群的ELB实例 导致Service/Ingress访问不通。 不建议停用,请自行恢复。 通过ELB的控制台修改ELB的IPv4私有IP 基于IPv4私有IP进行私网流量转发功能会出现中断 Service/Ingress的YAML中status字段下的IP变化 不建议修改,请自行恢复。 通过ELB的控制台解绑ELB的IPv4公网IP 解绑公网IP后,该弹性负载均衡器变更为私网类型,无法进行公网流量转发。 请自行恢复。 通过ELB的控制台在CCE管理的ELB创建自定义的监听器 若ELB是创建Service/Ingress时自动创建的,在Service/Ingress删除时无法删除ELB的自定义监听器,会导致无法自动删除ELB。 通过Service/Ingress自动创建监听器,否则需要手动删除ELB。 通过ELB的控制台删除CCE自动创建的监听器 导致Service/Ingress访问不通。 在集群升级等需要重启控制节点的场景,所做修改会被CCE侧重置。 重新创建或更新Service/Ingress。 通过ELB的控制台修改CCE创建的监听器名称、访问控制、超时时间、描述等基本配置 如果监听器被删除,在集群升级等需要重启控制节点的场景,所做修改会被CCE侧重置。 不建议修改,请自行恢复。 通过ELB的控制台修改CCE创建的监听器后端服务器组,添加、删除后端服务器 导致Service/Ingress访问不通。 在集群升级等需要重启控制节点的场景,所做修改会被CCE侧重置: 用户删除的后端服务器会恢复 用户添加的后端服务器会被移除 重新创建或更新Service/Ingress。 通过ELB的控制台更换CCE创建的监听器后端服务器组 导致Service/Ingress访问不通。 在集群升级等需要重启控制节点的场景,后端服务器组中的后端服务器会被CCE侧重置。 重新创建或更新Service/Ingress。 通过ELB的控制台修改CCE创建的监听器转发策略,添加、删除转发规则 导致Service/Ingress访问不通。 如果该转发规则由Ingress添加,在集群升级等需要重启控制节点的场景,所做修改会被CCE侧重置。 不建议修改,请自行恢复。 通过ELB的控制台修改CCE管理的ELB证书 在集群升级等需要重启控制节点的场景,后端服务器组中的后端服务器会被CCE侧重置。 通过Ingress的YAML来自动管理证书。
  • 网络 表2 网络 高危操作 导致后果 误操作后解决方案 修改内核参数net.ipv4.ip_forward=0 网络不通 修改内核参数为 net.ipv4.ip_forward=1 修改内核参数net.ipv4.tcp_tw_recycle=1 导致nat异常 修改内核参数 net.ipv4.tcp_tw_recycle=0 修改内核参数net.ipv4.tcp_tw_reuse=1 导致网络异常 修改内核参数 net.ipv4.tcp_tw_reuse=0 节点安全组配置未放通容器CIDR的53端口udp 集群内DNS无法正常工作 参照新建集群的安全组进行修复,放通安全组。 删除default-network的network-attachment-definitions的crd资源 容器网络不通,集群删除失败等 误删除该资源需要使用正确的配置重新创建default-network资源。 启动iptables防火墙 CCE默认不开启iptables防火墙,开启后可能造成网络不通 说明: 不建议开启iptables防火墙。如必须启动iptables防火墙,请在测试环境中确认/etc/sysconfig/iptables和/etc/sysconfig/ip6tables中配置的规则是否会对网络连通性造成影响。 关闭iptables防火墙,并检查/etc/sysconfig/iptables和/etc/sysconfig/ip6tables中配置的规则。
  • 集群/节点 表1 集群及节点高危操作 分类 高危操作 导致后果 误操作后解决方案 Master节点 修改集群内节点安全组 说明: 安全组命名规则:集群名称-cce-control-随机数 可能导致Master节点无法使用 参照新建集群的安全组进行修复,放通安全组。详情请参见集群安全组规则配置。 节点到期或被销毁 该Master节点不可用 不可恢复。 重装操作系统 Master组件被删除 不可恢复。 自行升级Master或者etcd组件版本 可能导致集群无法使用 回退到原始版本。 删除或格式化节点/etc/kubernetes等核心目录数据 该Master节点不可用 不可恢复。 更改节点IP 该Master节点不可用 改回原IP。 自行修改核心组件(etcd、kube-apiserver、docker等)参数 可能导致Master节点不可用 按照推荐配置参数恢复,详情请参见集群配置管理。 自行更换Master或etcd证书 可能导致集群不可用 不可恢复。 Node节点 修改集群内节点安全组 说明: 安全组命名规则:集群名称-cce-node-随机数 可能导致节点无法使用 参照新建集群的安全组进行修复,放通安全组。详情请参见集群安全组规则配置。 修改节点DNS配置(/etc/resolv.conf) 导致内部域名无法正常访问,可能出现插件异常、节点重置升级等基本功能异常 说明: 如果业务需要使用自建DNS,可以在工作负载中配置DNS,请勿修改节点本身的DNS地址,详情请参见工作负载DNS配置说明。 参考新建节点中的DNS配置还原。 节点被删除 该节点不可用 不可恢复。 重装操作系统 节点组件被删除,节点不可用 重置节点,具体请参见重置节点。 升级内核或容器平台依赖组件(如openvswitch/ipvlan/docker/containerd) 可能导致节点无法使用或网络异常 说明: 节点运行依赖系统内核版本,如非必要,请不要使用yum update命令更新或重装节点的操作系统内核(使用原镜像或其它镜像重装均属高危操作) EulerOS 2.2恢复方式请参见如何解决yum update升级操作系统导致容器网络不可用问题? 非EulerOS 2.2您可以重置节点,具体请参见重置节点。 更改节点IP 节点不可用 改回原IP。 自行修改核心组件(kubelet、kube-proxy等)参数 可能导致节点不可用、修改安全相关配置导致组件不安全等 按照推荐配置参数恢复,详情请参见节点池配置管理。 修改操作系统配置 可能导致节点不可用 尝试还原配置项或重置节点,具体请参见重置节点。 删除或修改/opt/cloud/cce、/var/paas目录,删除数据盘 节点不可用 重置节点,具体请参见重置节点。 修改节点内目录权限、容器目录权限等 权限异常 不建议修改,请自行恢复。 对节点进行磁盘格式化或分区,包括系统盘、Docker盘和kubelet盘 可能导致节点不可用 重置节点,具体请参见重置节点。 在节点上安装自己的其他软件 导致安装在节点上的Kubernetes组件异常,节点状态变成不可用,无法部署工作负载到此节点 卸载已安装软件,尝试恢复或重置节点,具体请参见重置节点。 修改NetworkManager的配置 节点不可用 重置节点,具体请参见重置节点。 删除节点上的cce-pause等系统镜像 导致无法正常创建容器,且无法拉取系统镜像 请从其他正常节点复制该镜像恢复 在ECS侧对节点池下的节点进行规格变更 节点的规格与节点池定义的规格不一致,导致在弹性扩缩容时出现非预期现象(多扩或者少扩) 重新将节点规格变更为节点池下定义的规格,或者删除该节点重新扩容。
  • 彻底删除个人回收站文件(夹) 登录KooDrive服务业务面。 目前仅支持使用华为账号登录KooDrive服务业务面。 在左侧导航选择“回收站”,系统默认进入个人回收站页面。 彻底删除个人回收站文件(夹)。 彻底删除单个文件(夹)。 鼠标移至待恢复文件(夹)所在行,单击“彻底删除”。 在“彻底删除”对话框中了解删除文件(夹)的影响后,如果确认要删除,单击“确定”。 批量彻底删除文件(夹)。 勾选待恢复文件(夹)前的复选框,单击列表上方“彻底删除”。 最多可勾选1000个文件(夹)进行彻底删除操作。 在“彻底删除”对话框中了解删除文件(夹)的影响后,如果确认要删除,单击“确定”。 彻底删除的文件不可恢复,请谨慎操作。
  • 恢复个人回收站文件(夹) 登录KooDrive服务业务面。 目前仅支持使用华为账号登录KooDrive服务业务面。 单击左侧导航“回收站”,系统默认进入个人回收站页面。 恢复个人回收站文件(夹)。 恢复单个文件(夹)。 在个人回收站页面,鼠标移至待恢复文件(夹)所在行,单击“恢复”,页面上方弹出恢复信息,文件(夹)按照“原始目录”还原。 批量恢复文件(夹)。 在个人回收站页面,勾选待恢复文件(夹)前的复选框,单击列表上方“恢复”,文件(夹)按照“原始目录”还原。 最多可勾选1000个文件(夹)进行恢复操作。 恢复时若父目录不存在,则按名称重建父目录。 恢复时若存在文件及目录重名,则恢复后的文件或目录通过增加时间戳后缀的方式进行重命名。
  • 标准客户端登录 建议使用Chrome 108.0.5359.125及以上版本浏览器进行登陆。 登录IMC https://macroverse.huaweicloud.com,点击首页SparkPack 企业ERP应用卡片 进入到如下页面,首次使用标准客户端之前,请先下载并安装SparkPack 企业ERP客户端。 点击标准客户端的“登陆”按钮,会自动登录到SparkPack 企业ERP标准客户端。 父主题: ERP用户指南
  • 用户中心首页介绍 在用户中心首页,您可以查看组织的全部应用及最近使用应用、查看登录登出日志或退出登录等操作。 图1 用户中心首页 用户中心首页主要包含以下部分: 最近使用:展示您近期使用的应用,可单击应用直接免登录访问应用。 全部应用:展示组织的所有应用,可单击应用直接免登录访问应用。 登录登出日志:展示您的登录登出日志详情,包括时间、操作者、操作类型和IP地址。 帐号的下拉菜单:支持退出登录。 父主题: 普通用户指南
  • 规格说明 Autopilot会自动规整不支持的规格,向上规整为最接近的vCPU与内存配置,以确保Pod始终拥有运行所需的资源。 表3 Autopilot支持的vCPU与内存组合 vCPU 内存(GiB) 0.25 vCPU 0.5GiB、1GiB、2GiB 0.5 vCPU 1GiB、2GiB、3GiB、4GiB 1 vCPU 2GiB、3GiB、4GiB、5GiB、6GiB、7GiB、8GiB 2 vCPU 4GiB、5GiB、... 、15GiB、16GiB(以 1GiB 为增量) 4 vCPU 8GiB、9GiB、... 、31GiB、32GiB(以 1GiB 为增量) 8 vCPU 8GiB、12GiB、... 、60GiB、64GiB(以 4GiB 为增量) 16 vCPU 16GiB、24GiB、... 、120GiB、128GiB(以 8GiB 为增量) 32 vCPU 32GiB、64GiB、128GiB、256GiB 48 vCPU 96GiB、192GiB、384GiB 64 vCPU 128GiB、256GiB、512GiB
  • 按需计费区域单价 表2 按需计费区域单价 区域 集群管理费用 Pod 华南-广州友好 公测期间免收集群管理费用 CPU:0.000049元/秒/Core 内存:0.00000613元/秒/GiB 西南-贵阳一 公测期间免收集群管理费用 CPU:0.000044元/秒/Core 内存:0.00000552元/秒/GiB 华南-广州 公测期间免收集群管理费用 CPU:0.000049元/秒/Core 内存:0.00000613元/秒/GiB 华东-上海一 公测期间免收集群管理费用 CPU:0.000049元/秒/Core 内存:0.00000613元/秒/GiB
  • 修订记录 表1 修订记录 文档版本 发布日期 修改说明 13 2023-11-02 修改 购买系统资源 12 2023-04-27 新增 Nextflow 计算资源节点扩缩容 11 2023-01-15 新增: 购买存储套餐包 支持导入用户 归档数据 资产市场新增流程:MetaGenome Kraken2 pipeline、RNA Cufflinks transcriptome analysis process、RNA Hisat2-Stringtie analysis process、Human NGS data CNV detection 并发投递多个作业后,部分作业运行失败,日志中显示IO读写相关错误 修改: 购买存储资源、性能加速 用户管理模块 恢复数据 10 2022-10-15 新增: 支持资源统计功能。 系统设置 系统标签管理根据界面优化描述。 项目管理 新增设置项目存储容量。 数据管理 新增发布数据、禁止/允许删除数据内容。 镜像管理 新增发布镜像内容。 工具管理 新增发布应用、发布流程、下载应用或流程内容。 分析作业管理 新增作业失败后,修改作业参数描述。 大规模药物虚拟筛选 配体分子文件支持格式。 09 2022-07-30 新增: 作业管理 创建自动作业。 作业页面增加“完成时间”列,并支持搜索完成时间。 作业执行成功后,支持在“事件”页签查看实例的事件详情和YAML文件。 资产市场 新增AutoGenome镜像、RNA-Seq Analysis Based on STAR流程、RNA-Seq测试数据及参考基因组数据集。 数据管理 支持差异分页。 资源看板 支持GPU、显存、主机相关监控图表。 数据库 支持新增、编辑、删除数据行。 08 2022-03-30 新增: 计算节点标签 支持计算节点添加标签;在创建和编辑应用时可选择计算节点标签,运行作业时会将该应用调度到对应的计算节点上。 IO加速节点调度优化 在IO加速场景下,支持用户选择自动调度模式;增加IO加速节点容量控制,超出容量阈值之后,作业将不会投递至该节点。 数据引用功能增强 支持引用其他项目或者OBS桶中的数据;增大单次可引用目录至50个。 跨区域归档功能 任务批处理优化 增加批量导出任务的元数据,增加任务的批量删除,取消和重试。 数据透明加密 支持数据的透明加密,加密的数据可直接通过挂载进行计算。 数据审计功能优化 增加数据审计配置,可以导出用户的写操作和读操作。 07 2022-01-30 医疗智能体平台支持按需计费,提供多种算力、存储、数据库规格,满足基因组数据管理分析、虚拟药物筛选等需求。 06 2021-12-30 新增: 应用和流程新增分类标签 新增系统资源管理界面,支持计算资源、性能加速、数据库资源动态调整 支持购买药物平台 优化 上传数据支持上传最大为1GB的单个文件 支持多个作业并发运行 分析作业支持批量操作 Notebook开发环境支持自研的基础镜像 05 2021-08-23 新增: 数据库管理 药物虚拟筛选服务 04 2021-03-30 新增: 资产市场,提供官方发布的镜像、数据、应用、流程资产。 镜像支持命令行工具上传、下载。 运行中的作业支持强制终止,断点续运行。 支持通过URL导入数据。 流程编辑功能优化。 03 2021-03-08 新增: 支持消息、邮件、安全、商标设置。 支持通过命令行工具对平台进行管理和使用,支持Windows、Linux系统。 优化: 优化流程的搭建和运行过程。 02 2020-11-24 新增: 新增项目功能,以项目为粒度对数据、分析作业、开发环境和镜像进行分组。实现项目资源的访问、共享和协作。 支持项目成员角色划分和权限划分。 支持跨项目数据引用、导入。 新增预置分析流程(Cell Ranger、GATK、NGS、Druglikeness)。 流程、应用支持多版本选择,支持X86、ARM运行。 消息中心支持异步任务提示。 01 2020-08-29 第一次正式发布。 父主题: 用户指南(基因平台)
  • 查看模型列表 在AI模型页签下支持查看创建的所有模型。包括模型的名称、模型类型、创建时间、完成时间、创建者、状态、组织共享、操作等信息。 查看模型指标 查看loss值:loss代表模型训练的损失变化 单击相应模型操作列的“查看loss”即可查看相应的训练集Loss。 删除模型 单击相应模型操作列的“删除”,在弹窗中单击“确定”,即可删除掉对应的模型。 查看评价指标 在模型列表页,单击某个模型名称左侧的按钮,可展示当前模型的相关指标,包括模型的数据量、描述、区间范围、评价指标、模型数据。 其中,评价指标的值代表了训练完成的模型在测试集上的好坏。
  • 操作步骤 进入用户门户登录页面。 请联系企业管理员获取用户访问域名,如https://example.huaweioneaccess.com。 用户在登录页面单击“立即注册”。 在注册页面,输入手机号。 单击“发送验证码”,将收到的验证码输入在验证码输入框。 单击“下一步”,输入密码、确认新密码和用户名。 具体需要输入哪些用户信息是由管理员在用户属性定义中将用户的哪些字段的“注册信息采集”属性设置为“显示”决定的。 【可选】勾选开启及配置用户协议中设置的用户协议。 当开启了用户协议配置,具体操作请参考开启及配置用户协议,注册帐号必须勾选配置的协议。 单击“保存”帐号注册成功并进入用户门户网站。 新注册的帐号所属组织默认为根组织。若您在注册帐号时想自定义选择帐号所属组织,可联系管理员将“组织”字段的“注册信息采集”属性设置为“显示”,具体操作请参见修改用户属性。
  • 操作步骤 访问OrgID。 输入帐号名和密码,单击“登录”。 通过管理员手动添加组织成员的方式创建的帐号,首次登录需要设置新密码,如图1所示。设置密码后,下次才可使用帐号名密码登录。如忘记密码,请单击登录页面的“忘记密码”,并根据界面提示找回密码。 图1 设置密码 设置的密码需要满足以下规则: 至少8个字符。 至少包含字母和数字,不能包含空格。 阅读并同意“管理式华为帐号服务协议”。 选择授权给OrgID的信息,单击“授权”。 图2 华为帐号授权 登录后进入组织的用户中心首页。
  • 流式训练 流式训练接入用户行为数据,进行在线训练,以分钟级更新在线服务依赖的排序模型,减少排序模型的效果衰减。 前提条件 已存在运行成功的排序策略。建议“优化器类型”选择“ftrl”。 已存在运行成功的在线服务。该在线服务“排序方式”为“点击率预估”并且“模型文件路径”为1排序策略生成的模型存储路径。 流式训练仅支持2019年12月4日0点之后创建的排序策略和在线服务。 流式训练使用到的排序策略不支持“核函数特征交互神经网络-PIN”算法。 建议您定期“重新执行”条件1对应的离线排序任务。重新执行排序策略后,在线服务和流式训练作业将自动同步新产生的模型,无需重新配置或重新执行在线服务和流式训练作业。 在线服务可以减少排序模型的效果衰减,但仍需定期重新执行离线任务。 表5 流式训练参数说明 参数名称 说明 默认值 策略别名 策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。 默认流式训练。 数据源 服务名:添加已经进行资源绑定的DIS资源。 输入流位置:行为数据流的输入配置。将实时近线任务需要的实时物品日志数据添加到输入流指定的DIS通道中,推荐系统通过读取该数据进行近线计算。 通道名称:DIS的数据通道名称,不同类型的数据需要创建不同的通道。 起始位置:读取DIS数据的起始位置,latest表示从最新的数据开始读取,earliest表示从最旧的数据开始读取。 输出流位置:行为数据流处理后的输出配置。选择对应的DIS通道名称进行存放。输出流存放的数据属于流式训练作业的中间数据,用户无需获取或发送数据到输出流绑定的数据通道,只需确保该通道仅供本作业作为输出流使用。 服务名默认DIS。 通道名无。 起始位置默认为latest。 窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10s。 算子参数 在线服务名:使用的在线服务的名称。该在线服务需满足前提条件的要求。 流程名:在线服务对应的在线流程名称。 异常数据输出路径:单击右侧的按钮,选择数据在OBS中的存放路径,此路径下会记录不符合任务要求的输入数据。 - 训练设置 计算节点规格:您可以根据业务需求选择节点规格,“8核|16GiB”、“8核|32GiB”、“8核|64GiB”、“16核|128GiB”。 模型更新间隔:模型更新时间间隔,更新模型文件。 默认“8核|16GiB” 时间间隔10min 优化策略相关参数 优化器类型:ftrl。适用于处理超大规模数据的,含大量稀疏特征的在线学习的常见优化算法 学习率:优化算法的参数,决定优化器在最优方向上前进步长的参数。默认0.1。 初始梯度累加和:梯度累加和用来调整学习步长。默认0.1。 L1正则项系数:叠加在模型的1范数之上,用来对模型值进行限制防止过拟合。默认0。 L2正则项系数:叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。默认0。 -
  • 基于用户的标签搜索候选集 基于用户的标签搜索候选集可以持续为用户召回新的候选集,召回频率可达秒级。以DIS中的实时行为日志为数据源,分析用户喜好,并以此为依据为用户召回候选集。此任务包含两种召回方式: 根据兴趣标签召回候选集 根据实时标签召回候选集 表2 基于用户的兴趣标签搜索候选集参数说明 参数名称 说明 默认值 策略别名 策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。 默认基于用户的标签搜索候选集。 数据源 服务名:DIS。将实时近线任务需要的实时行为日志数据添加到DIS中,推荐系统通过读取该数据进行近线计算。 通道名称:数据通道名称,不同类型的数据需要创建不同的通道。 起始位置:读取DIS数据的起始位置,latest表示从最新的数据开始读取,earliest表示从最旧的数据开始读取。 服务名默认DIS。 通道名无。 起始位置默认为latest。 行为类型 用户行为包含如下几种类型: view:物品曝光 click:用户点击物品 collect:用户收藏了某个物品 uncollect:用户取消收藏某个物品 search_click:用户点击搜索结果中的物品 comment:用户对物品的评论 share:分享 like:点赞 dislike:点衰 grade:评分 consume:消费 use:观看视频/听音乐/阅读。 默认选取所有行为。 窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10 过滤历史记录 生成的候选集中是否过滤历史记录,如需要过滤历史记录,则开启此项。 默认关闭。 候选集的排序策略 生成候选集的排列规则,其排列顺序包括: 随机排序:不对候选集排序。 热度排序:根据物品属性表里的物品热度排序,由基于行为数据的用户画像更新生成,热度越大排序越靠前。 时间排序:根据时间对候选集进行排序。时间排序需要指定特征名称和推荐天数。 特征名称:值为时间戳(10位)的特征的名称,任务会根据此特征对候选集进行排序。 推荐天数:推荐数据的时间段,该时间段从当前开始往前推N天,默认15天。 默认热度排序。 候选集最大长度 生成候选集的最大长度,每次计算更新的候选集中的个数不会超过最大值。 默认50。 候选集的召回策略 召回候选集的策略。 兴趣标签召回候选集:根据用户画像的兴趣标签召回候选集。 实时标签召回候选集:根据用户实时操作的物品的标签召回候选集。 默认兴趣标签召回候选集。 兴趣宽度 生成候选集中的兴趣宽度,值越小候选集中的类型越少。 说明: 选择兴趣宽度数量对应的,权重值最高的兴趣标签个数进行检索,得到与标签匹配的物品候选集。 默认3。 全局特征信息文件 用户在使用近线策略之前,需要提供全局特征信息文件,该文件为JSON格式,包含特征名、特征大类、特征值类型。当上传的数据中的特征有变化时,需要同步更新该文件。全局特征信息文件示例请参考全局特征信息文件。 - 异常数据输出路径 单击右侧的按钮,选择数据在OBS中的存放路径,此路径下会记录不符合任务要求的输入数据。 - 自定义搜索 改变默认搜索条件,按照所选自定义搜索规则进行搜索。自定义搜索的内容来自于全局特征信息文件。您可以单击添加自定义搜索,在下拉选项中选择用户的兴趣标签,单击转换为另外的标签体系进行召回。 说明: 存在不同标签体系时可使用此功能,自定义搜索条件。一般情况下不建议使用。 - 用户画像存储 指定存储用户画像的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及。 物品画像存储 指定存储物品画像的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及。 过滤存储 指定存储过滤集合的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及 候选集存储 指定存储候选集的存储平台信息。服务名默认CloudTable,指定集群名称和表名用于存储更新后的用户画像。 不涉及。