VM调度数据集与VMAgent仿真器发布!让强化学习走进云资源调度

    华为云与华东师范大学合作发布国内首个VM调度标准数据集Huawei-East-1,并开源VM调度仿真器VMAgent。相关成果已被人工智能领域最主要的学术会议之一——IJCAI接受,并将于2022723日至729日在奥地利维也纳召开的IJCAI会议上报告。

    随着云计算的飞速发展,云资源调度对于云服务提供商而言的重要性日益提高。云资源调度通常被建模为一个运筹学问题(组合优化问题),而传统运筹学方法一般具有较高计算时间复杂度,因而在实际应用时只适用于离线上界探索。云服务提供商一直依赖启发式方法(比如FirstFit、BestFit等),并结合专家规则进行实际云资源调度。虽然这样的解决方案可以即时处理请求,但是通常容易陷入局部最优。近些年,强化学习技术在解决组合优化与调度问题时展现出极大潜力,但是目前仍局限在简单场景中,不能有效处理实际场景中非平稳性、持续性等难点。

    为了帮助虚拟机调度问题的深入研究,本论文开源了国内首个VM调度标准数据集——Huawei-East-1。该数据集产生于实际工业场景,共计二十余万条虚拟机创删记录,包含了CPU、内存、创删时间等信息。本论文一并展示了对该数据集的统计分析结果,以及相应的基线结果,以供研究者更好地使用。

images_16559488420845

    同时,为了提升强化学习方法处理云资源调度问题能力和效率,本论文建立了一个华为云实际数据与场景驱动、强化学习友好的云资源调度仿真平台——VMAgent。

images_165538288367376

    

    VMAgent仿真环境由三个主要组件构成:模拟器、调度器与可视化器。模拟器基于华为云实际调度数据作为数据输入,并抽象出三种实际调度场景(衰减、恢复和扩展)。模拟器也是VMAgent仿真环境的核心。

images_165538289880476

   

    VMAgent进一步提供了灵活配置能力,使模拟器与实际云计算架构(即多非统一内存访问)和场景兼容。为了方便研究人员实例化调度程序与模拟器交互,VMAgent预先构建多种类型调度算法(如启发式方法、流行强化学习算法等)。可视化器作为模拟器和调度器的辅助组件,交互方便的可视化界面可以方便研究人员对调度过程进行深入分析,并充分比较不同调度算法的优劣。

images_165538290749978

    本论文旨在希望促进云资源优化与强化学习研究人员更好的探索强化学习在实际云资源调度问题中的潜力,以及探索更多实用强化学习方法。

论文链接:https://arxiv.org/abs/2112.04785

代码仓库:https://github.com/mail-ecnu/VMAgent

开源数据集:https://github.com/huaweicloud/VM-placement-dataset