实践场景

某电商系统由前端模块、商品模块和订单模块三个微服务组成,并部署在CCE集群中,随着的业务量不断增长,运维所要纳管的网络设备、物理服务器、应用服务器等基础设施都相应的增加,传统信息技术基础设施库(Information Technology Infrastructure Library,简称ITIL)流程中面向基础设施资源的管理方式,易造成各运维服务之间数据割裂、信息不一致等问题。

应用部署在容器中要如何将这些基础设施与应用关联、如何管理基础设施的生命周期、如何查看是否还有空闲的资产等一系列问题让运维人员非常头疼。

解决方案

应用运维管理AOM提供CMDB模型,能够自定义应用分层模型:应用/子应用/组件/环境,管理复杂应用,并将应用与资源进行关联。例如,将凤凰电商系统作为一个应用,商品和订单模块分别作为两个组件,再在组件下创建相应的环境,环境下绑定对应的资源,即可通过应用快速找到依赖的资源。应用资源管理中还提供基础资源管理,查看资源使用情况,为上层的应用场景提供可靠的数据支撑。

配置CMDB

前提条件

已创建CCE集群,并部署应用及购买相关资源。

1、创建一个应用。

登录AOM 2.0控制台。

在菜单栏选择“应用资源管理”,进入“应用资源管理”界面。

在左侧导航栏中选择“应用管理”,单击右上角的“创建应用”。

在弹出的“创建应用”页面中,设置创建应用的相关参数。

设置完成后,单击“确认”。

2、为创建的“phoenixapp1”应用添加节点,包括组件和环境。

为应用添加节点有两种方式,请根据需要选择:

方式一:通过安装APM探针方式添加CMDB的组件和环境。如果您需要通过AOM的CMDB统一管理APM性能数据,建议采用该方式。

方式二:直接在CMDB上手工添加组件和环境。如果您暂时不使用APM,可采用该方式。

说明:示例的商城应用部署在CCE集群中,建议用户采用方式一添加节点。通过安装APM探针的方式为CMDB模型添加组件和环境,安装完成后,组件名称为工作负载的名称,环境名称则为安装探针时填写的环境名,并显示在“应用资源管理”页面左侧的应用树中,无需在“应用资源管理”界面手工添加。

登录CCE控制台,单击集群名称进入集群。

在左侧导航栏中选择“工作负载 ”,选择需要上报到AOM的工作负载类型。

单击工作负载名称,在“工作负载运维”页签中,单击右下角“编辑”,修改“性能管理配置”相关信息。

选择“APM 2.0探针”,设置“探针版本”为“latest-x86”,“APM环境”为“phoenixenv1”,从“APM业务”的下拉列表中选择1创建的“phoenixapp1”应用。

设置完成后,单击“保存”。

3、依次为创建的环境关联RDS、DCS和ELB相关资源。

在“ 应用管理”界面左侧树节点,选中待操作的环境“phoenixenv1”,在右侧区域单击资源页签,在下方列表区域单击“关联资源”。

从资源列表中选择合适的资源实例。

说明:资源列表仅展示与应用企业项目相同的资源。

设置完成后,单击“关联”。

在“ 首页”搜索创建的“phoenixapp1”应用,单击应用名可直接跳至应用树节点查看应用的组件、环境等信息。

应用资源管理

应用资源管理是基于DevOps理念打造的面向应用全生命周期的资源管理平台,是现代自动化运维的基石服务,统一集中管理华为云同时覆盖不同云厂商的一切资源对象与应用之间的关系。

CMDB作为AOM的应用资源管理中心,将所有资源对象与应用统一管理,为AOM监控中心、自动化运维子服务和LTS、APM等上层运维服务提供准确、及时、一致的资源配置数据,并通过开放配置数据接口,辅助第三方系统运维场景建设。

应用运维管理AOM 常见问题

应用运维管理AOM 常见问题

  • 如何处理界面“ICAgent状态”为“离线”的问题?

    ICAgent安装完成后,界面“ICAgent状态”为“离线”。

    问题分析

    原因:AK/SK配置不正确或30200、30201端口未连通。

    影响:ICAgent无法正常使用。

    解决办法

    以root用户登录安装ICAgent的服务器。

    执行以下命令,检查AK/SK配置是否正确。

    配置AK/SK后,重新安装ICAgent。如果仍未安装成功,请执行4。

    查询端口连通性。


  • Agent安装失败相关类

    Agent安装机和目标机器网络不通,报错提示“[warn] ssh connect failed, 1.2.1.2:22”如何解决?

    答:安装之前先在安装页面单击连接测试,选择网络能通的安装机。

    Agent安装成功后,后续的心跳和注册都失败,代理机网络不通,如何解决?

    答:在目标机器上执行“telnet 代理机ip”,检查代理机和目标机器间的网络连通性。


  • 安装文件包提示没有OBS权限怎么办?

    自动化运维需要访问凭证授权访问OBS,用来获取OBS中的文件包。请在“设置 > 访问凭证”页面检查是否已创建访问凭证,如果没有创建访问凭证,请参考访问凭证新建凭证;

    如果已创建访问凭证依然提示没有OBS权限,请参考如何对OBS进行访问权限控制,添加OBS访问权限。


  • 编排好的作业,能否在执行时再选择执行机,填入脚本参数等内容?

    在创建作业时,如需在每次执行作业时填入脚本参数,确认执行目标实例等,则需要配置全局参数,并在作业步骤中引用。

    操作步骤

    1、登录AOM 2.0控制台,在菜单栏单击“自动化运维”,进入“自动化运维”界面。

    2、在左侧导航栏中选择“作业管理”,单击右上角的“新建作业”。

    设置“添加全局参数”,创建参数类型为“字符串”的参数 param1, 创建参数类型为“主机列表”的参数param2,并保存。

    3、创建作业步骤,如创建脚本执行步骤时,可在“脚本参数”中通过 ${param1} 引用字符串参数,可在选择“目标实例”时选择“全局参数”,并通过下拉框选择 param2,保存作业步骤即可生效。

    4、作业创建完成后,可以在每次执行时填入 param1 的值,并选择执行目标实例,即确定 param2 的值。