云容器引擎 CCE-资源利用率优化调度配置案例:如何减少节点资源碎片,提高集群资源利用率

时间:2024-01-17 11:31:11

如何减少节点资源碎片,提高集群资源利用率

集群中存在大作业(request资源量较大)和小作业(request资源量较少)混合提交并运行,希望小作业可以优先填满集群各节点的资源碎片,将空闲的节点资源优先预留给大作业运行,避免大作业由于节点资源不足长时间无法调度。

开启装箱策略(binpack),使用默认权重值10。插件详情与配置方法请参见装箱调度(Binpack)

配置建议如下:

  • 优先减少集群中的CPU资源碎片:建议提高binpack策略中的CPU权重为5,Memory权重保持为1。
  • 优先减少集群中的Memory资源碎片:建议提高binpack策略中的Memory权重为5,CPU权重保持为1。
  • 优先减少集群中的GPU资源碎片:建议自定义资源类型(GPU),并设置GPU资源权重为10,CPU权重保持为1,Memory权重保持为1。
support.huaweicloud.com/usermanual-cce/cce_10_0813.html