云容器引擎 CCE-工作负载异常:实例驱逐异常(Evicted):排查项一:节点是否存在资源压力

时间:2023-12-04 12:02:07

排查项一:节点是否存在资源压力

当满足硬性或软性驱逐条件时,即存在资源压力时,kubelet会根据驱逐信号将节点设置为相应的节点状况,并为节点打上对应的污点。请通过以下步骤查看节点是否存在对应的污点。

$ kubectl describe node 192.168.0.37
Name:               192.168.0.37
...
Taints:             key1=value1:NoSchedule
...
表1 存在资源压力的节点状况及解决方案

节点状况

节点污点

驱逐信号

描述

解决方案

MemoryPressure

node.kubernetes.io/memory-pressure

memory.available

节点上的可用内存已满足驱逐条件。

您可以扩容节点规格,详情请参见如何变更CCE集群中的节点规格?

DiskPressure

node.kubernetes.io/disk-pressure

nodefs.available、nodefs.inodesFree、imagefs.available 或 imagefs.inodesFree

节点的根文件系统或镜像文件系统上的可用磁盘空间和 inode 已满足驱逐条件。

您可以扩容节点磁盘空间,详情请参见存储扩容

PIDPressure

node.kubernetes.io/pid-pressure

pid.available

节点上的可用进程标识符已低于驱逐条件。

您可以修改节点进程ID上限,详情请参见修改节点进程 ID数量上限kernel.pid_max

support.huaweicloud.com/cce_faq/cce_faq_00209.html