云服务器内容精选

  • 操作须知 将主机纳管至VMS,需要完成如下操作: 步骤一:刷新未纳管主机:首先需要刷新未纳管主机,将华为云其他主机同步至未纳管主机列表中。 步骤二:安装OpsAgent:纳管前需要为主机安装OpsAgent。 步骤三:分配主机:纳管主机需要将主机分配到对应的服务及环境下。 绑定已规划的业务账号(可选):主机纳管后需要为主机绑定已规划的业务账号,如果纳管前主机上已有业务账号,分配主机时会自动绑定该业务账号,不需要再单独绑定。 重置密码(可选):主机纳管后可以选择主动重置主机的root账号和所有业务账号的密码,将密码托管给AppStage平台。如果不重置密码将密码托管给AppStage平台,那么系统将不会自动创建主机管理员账号及运维账号。 如果不想密码被修改,需要在纳管主机前配置密码白名单。如果没有配置密码白名单规则,业务密码会定期90天修改一次。
  • 步骤二:安装OpsAgent 在“未纳管主机”页面,单击“部署OpsAgent”。 安装方式选择“远程安装”或“手动安装”。 手动安装:首次安装OpsAgent时,必须使用手动安装方式。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 表1 OpsAgent基本信息参数说明 参数名称 参数说明 租户账号 选择租户账号,为租户VPC下的主机安装OpsAgent。 归属Region 选择租户VPC所属的Region。 OpsAgent版本 选择需要安装的OpsAgent的版本号。 VPC 选择虚拟私有云VPC,为该VPC下的主机安装OpsAgent。 说明: 可选VPC为已纳管VPC,如无可选VPC,请完成VPC纳管。 接入方式 当前支持“直接接入(内网)”的接入方式,为华为云主机接入安装OpsAgent。 单击LINUX命令后的,复制安装命令。 使用root账号远程登录主机后,执行安装命令安装OpsAgent。 安装完成后,未纳管主机列表中,该主机的OpsAgent状态为“在线”。 远程安装:选择虚拟私有云下已经安装了OpsAgent的主机作为安装机,安装机将作为中间桥梁安装OpsAgent到同虚拟私有云下的其他主机。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 选择安装机,选择一台已安装OpsAgent的主机作为安装机。 添加主机,选择需要安装OpsAgent的主机所在行“操作”列的“编辑”,输入主机root密码后单击“确定”,然后在列表中勾选该主机。 单击“确定”,安装机将作为执行机为主机安装OpsAgent。
  • 步骤二:安装OpsAgent 在“未纳管主机”页面,单击“部署OpsAgent”。 安装方式选择“远程安装”或“手动安装”。 手动安装:首次安装OpsAgent时,必须使用手动安装方式。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 表1 OpsAgent基本信息参数说明 参数名称 参数说明 租户账号 选择租户账号,为租户VPC下的主机安装OpsAgent。 归属Region 选择租户VPC所属的Region。 OpsAgent版本 选择需要安装的OpsAgent的版本号。 VPC 选择虚拟私有云VPC,为该VPC下的主机安装OpsAgent。 说明: 可选VPC为已纳管VPC,如无可选VPC,请完成VPC纳管。 接入方式 当前支持“直接接入(内网)”的接入方式,为华为云主机接入安装OpsAgent。 单击LINUX命令后的,复制安装命令。 使用root账号远程登录主机后,执行安装命令安装OpsAgent。 安装完成后,未纳管主机列表中,该主机的OpsAgent状态为“在线”。 远程安装:选择虚拟私有云下已经安装了OpsAgent的主机作为安装机,安装机将作为中间桥梁安装OpsAgent到同虚拟私有云下的其他主机。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 选择安装机,选择一台已安装OpsAgent的主机作为安装机。 添加主机,选择需要安装OpsAgent的主机所在行“操作”列的“编辑”,输入主机root密码后单击“确定”,然后在列表中勾选该主机。 单击“确定”,安装机将作为执行机为主机安装OpsAgent。
  • 操作须知 将主机纳管至VMS,需要完成如下操作: 步骤一:刷新未纳管主机:首先需要刷新未纳管主机,将华为云其他主机同步至未纳管主机列表中。 步骤二:安装OpsAgent:纳管前需要为主机安装OpsAgent。 步骤三:分配主机:纳管主机需要将主机分配到对应的服务及环境下。 绑定已规划的业务账号(可选):主机纳管后需要为主机绑定已规划的业务账号,如果纳管前主机上已有业务账号,分配主机时会自动绑定该业务账号,不需要再单独绑定。 重置密码(可选):主机纳管后可以选择主动重置主机的root账号和所有业务账号的密码,将密码托管给AppStage平台。如果不重置密码将密码托管给AppStage平台,那么系统将不会自动创建主机管理员账号及运维账号。 如果不想密码被修改,需要在纳管主机前配置密码白名单。如果没有配置密码白名单规则,业务密码会定期90天修改一次。
  • 操作须知 将主机纳管至VMS,需要完成如下操作: 步骤一:刷新未纳管主机:首先需要刷新未纳管主机,将华为云其他主机同步至未纳管主机列表中。 步骤二:安装OpsAgent:纳管前需要为主机安装OpsAgent。 步骤三:分配主机:纳管主机需要将主机分配到对应的服务及环境下。 绑定已规划的业务账号(可选):主机纳管后需要为主机绑定已规划的业务账号,如果纳管前主机上已有业务账号,分配主机时会自动绑定该业务账号,不需要再单独绑定。 重置密码(可选):主机纳管后可以选择主动重置主机的root账号和所有业务账号的密码,将密码托管给AppStage平台。如果不重置密码将密码托管给AppStage平台,那么系统将不会自动创建主机管理员账号及运维账号。 如果不想密码被修改,需要在纳管主机前配置密码白名单。如果没有配置密码白名单规则,业务密码会定期90天修改一次。
  • 步骤二:安装OpsAgent 在“未纳管主机”页面,单击“部署OpsAgent”。 安装方式选择“远程安装”或“手动安装”。 手动安装:首次安装OpsAgent时,必须使用手动安装方式。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 表1 OpsAgent基本信息参数说明 参数名称 参数说明 租户账号 选择租户账号,为租户VPC下的主机安装OpsAgent。 归属Region 选择租户VPC所属的Region。 OpsAgent版本 选择需要安装的OpsAgent的版本号。 VPC 选择虚拟私有云VPC,为该VPC下的主机安装OpsAgent。 说明: 可选VPC为已纳管VPC,如无可选VPC,请完成VPC纳管。 接入方式 当前支持“直接接入(内网)”的接入方式,为华为云主机接入安装OpsAgent。 单击LINUX命令后的,复制安装命令。 使用root账号远程登录主机后,执行安装命令安装OpsAgent。 安装完成后,未纳管主机列表中,该主机的OpsAgent状态为“在线”。 远程安装:选择虚拟私有云下已经安装了OpsAgent的主机作为安装机,安装机将作为中间桥梁安装OpsAgent到同虚拟私有云下的其他主机。 填写基本信息,OpsAgent基本信息参数说明如表1所示。 选择安装机,选择一台已安装OpsAgent的主机作为安装机。 添加主机,选择需要安装OpsAgent的主机所在行“操作”列的“编辑”,输入主机root密码后单击“确定”,然后在列表中勾选该主机。 单击“确定”,安装机将作为执行机为主机安装OpsAgent。
  • 步骤二:纳管VPC 在“VPC纳管”页面,单击“纳管”。 配置VPC纳管参数,配置参数如表2所示,配置完成后,单击“确定”。 纳管后该VPC会显示在VPC列表中。 表2 VPC纳管参数说明 参数名称 参数说明 HWS 账号 选择需要纳管的VPC所属的华为云账号。 HWS 区域 选择需要纳管的VPC所在的区域。 VPC名称 选择需要纳管的VPC。 终端节点子网 选择为需要纳管的VPC创建终端节点的子网。 说明: 如果该VPC下存在多个子网,其他子网需要与该子网保持网络互通。
  • 安装方式说明 ICAgent有两种安装方式,您可以按照您的场景进行选择。您需要注意的是,下述两种安装方式,都不适用于容器节点(通过ServiceStage、CCE创建的集群容器节点)。容器节点不需要手动安装ICAgent,只需要在创建集群或部署应用时进行操作。 安装方式见表1: 表1 安装方式 方式 适用场景 首次安装 当满足以下条件时,您需要按照该方式安装: 该服务器上未安装过ICAgent。 继承安装 当满足以下条件时,您需要按照该方式安装: 您有多个服务器需要安装ICAgent,其中一个服务器绑定了EIP,而剩余的没有绑定EIP。其中一个服务器已经通过首次安装方式装好了ICAgent,对于没有绑定EIP的服务器,您可以采用该安装方式。 请参考继承安装。
  • 步骤四:提供映射信息至AppStage侧处理 获取并提供如表1所示信息给AppStage侧人员处理,完成数据映射,将云监控服务CES告警接入AppStage。 表1 映射信息 信息 信息说明 eps_id 已创建CSE告警规则进行监控的资源所属的企业项目ID。 即已创建并且完成资源迁移的企业项目ID,在企业项目管理页面,单击待查询企业项目的名称,进入该企业项目详情页即可查看企业项目ID。 eps_name 已创建CSE告警规则进行监控的资源所属的企业项目名称。 即已创建并且完成资源迁移的企业项目名称。 scope 需要映射的AppStage的信息,可使用AppStage中录入服务的服务英文名称。 在运维中心控制台,将鼠标悬停在右上角的用户名,选择下拉列表中“租户管理”,在“我的租户”页面获取服务英文名称。
  • 相关说明 纳管成功后会在集群中新增一个ers-manager命名空间,并拉起一个名称为ers-cluster-agent-XXX的POD,用来定期向ERS上报数据,约占用0.5C2Gi的资源。安装的插件最小规格如下: ers-agent-register 500m/2Gi kube-rbac-proxy filebeat 100m/1Gi 上报数据维度不同,纳管后AppStage侧会为集群安装ERS monitoring插件,管理CCE集群并采集指标,插件安装会占用一定的集群资源。 集群纳管成功后,集群列表中不能马上看到集群信息。 因为ERS通过权限缓存机制查询集群列表,页面纳管成功后,后台需要进行权限缓存处理,因此需要稍等几分钟才能看到集群信息。 集群列表页面看到的集群名称和纳管录入的集群名称不一致。 集群列表显示的是ERS自定义资源名称,会在纳管集群名称前添加前缀。在集群详情中可以查看纳管集群名称。如图2所示。 图2 纳管集群名称
  • 过滤规则 ICAgent会在目标主机上进行周期性探测,类似ps -e -o pid,comm,lstart,cmd | grep -v defunct命令的效果,查出目标主机的所有进程。然后将每一个进程分别与过滤规则(过滤规则详见表1)进行匹配。如果进程满足过滤规则,则进程会被过滤掉,不会被AOM发现;如果进程不满足过滤规则,则进程不会被过滤,会被AOM发现。 探测结果类似如下回显信息: PID COMMAND STARTED CMD 1 systemd Tue Oct 2 21:12:06 2018 /usr/lib/systemd/systemd --switched-root --system --deserialize 20 2 kthreadd Tue Oct 2 21:12:06 2018 [kthreadd] 3 ksoftirqd/0 Tue Oct 2 21:12:06 2018 (ksoftirqd/0) 1140 tuned Tue Oct 2 21:12:27 2018 /usr/bin/python -Es /usr/sbin/tuned -l -P 1144 sshd Tue Oct 2 21:12:27 2018 /usr/sbin/sshd -D 1148 agetty Tue Oct 2 21:12:27 2018 /sbin/agetty --keep-baud 115200 38400 9600 hvc0 vt220 1154 docker-containe Tue Oct 2 21:12:29 2018 docker-containerd -l unix:///var/run/docker/libcontainerd/docker-containerd.sock --shim docker-containerd-shim --start-timeout 2m --state-dir /var/run/docker/libcontainerd/containerd --runtime docker-runc --metrics-interval=0 表1 过滤规则 过滤规则 举例 如果进程的“COMMAND”列的值为“docker-containe”、“vi”、“vim”、“pause”、“sshd”、“ps”、“sleep”、“grep”、“tailf”、“tail”或“systemd-udevd”,且为非容器内的进程,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“1154”的进程,因为其“COMMAND”列的值为“docker-containe”,所以该进程不会被AOM发现。 如果进程的“CMD”列的值以“[”开头,且以“]”结尾,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“2”的进程,因为其“CMD”列的值为“[kthreadd]”,所以该进程不会被AOM发现。 如果进程的“CMD”列的值以“(”开头,且以“)”结尾,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“3”的进程,因为其“CMD”列的值为“(ksoftirqd/0)”,所以该进程不会被AOM发现。 如果进程的“CMD”列的值以“/sbin/”开头,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“1148”的进程,因为其“CMD”列的值以“/sbin/”开头,所以该进程不会被AOM发现。
  • 内置发现规则 AOM提供了Sys_Rule和Default_Rule两个内置的发现规则,内置的发现规则会在所有主机上执行,包括后续新增的主机。其中Sys_Rule优先级大于Default_Rule,即优先在主机上执行Sys_Rule,如果满足Sys_Rule,则不执行Default_Rule,如果不满足Sys_Rule,则执行Default_Rule。规则内容如下: Sys_Rule(不能停用) 使用Sys_Rule规则的场景下,组件名和应用名配对使用,必须同时设置组件名和应用名信息,取值优先级如下: 应用名称取值优先级: 取进程的启动命令中“Dapm_application”字段的值。 如果1为空,则取环境变量“JAVA_TOOL_OPTIONS”中“Dapm_application”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如果1为空,则取环境变量“JAVA_TOOL_OPTIONS”中“Dapm_tier”字段的值。 如果2为空,则取环境变量“PAAS_APP_NAME”的值。 如下示例所示,则组件名为atps-demo,应用名为atpd-test。 PAAS_MONITORING_GROUP=atpd-testPAAS_APP_NAME=atps-demoJAVA_TOOL_OPTIONS=-javaagent:/opt/oss/servicemgr/ICAgent/pinpoint/pinpoint-bootstrap.jar -Dapm_application=atpd-test -Dapm_tier=atps-demo Default_Rule(可停用) 如果进程的“COMMAND”列的值为“java”,则组件名依次按照优先级从命令行中的jar包名、命令行中主类名、命令行中第一个非-开头的关键字获取,应用名使用默认值unknownapplicationname。 如果进程的“COMMAND”列的值为“python”,则组件名取命令行中第一个py/pyc脚本名,应用名使用默认值unknownapplicationname。 如果进程的“COMMAND”列的值为“node”,则组件名取命令行中第一个js脚本名,应用名使用默认值unknownapplicationname。
  • 更多应用发现规则操作 应用发现规则添加完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 查看规则详情 在“名称”列单击规则的名称。 启、停规则 单击“操作”列的“启用”。 单击“操作”列的“停用”。停用后,AOM将不采集进程的指标数据。 删除规则 删除一个发现规则:在“操作”列选择“删除”。 删除一个或多个发现规则:选中一个或多个发现规则前的复选框,单击页面上方的“删除”。 说明: 内置发现规则不支持删除操作。 修改规则 在“操作”列选择“修改”。 说明: 内置发现规则不支持修改操作。