云服务器内容精选

  • 环境介绍 CartPole,车杆游戏,游戏画面如图1所示。游戏中,黑色的方块是一个小车,小车在一维无阻力轨道上运动。小车上连接一根活动杆,杆会左右摇摆。为保证游戏持续进行,小车需要左右移动保持杆子竖直。当小车的移动位置超出游戏界面所示范围或者杆子倾斜角度大于15°,游戏结束。游戏全过程可以理解为AI智能体与环境之间的互动,可以将复杂的因素抽象成以下三个变量。 可采取的动作:左移、右移。 获得奖励规则:左移或右移小车之后游戏没有结束,reward值会+1。 目的:使用强化学习训练一个智能体,玩CartPole游戏,尽可能多获得奖励。 图1 CartPole游戏画面