# 创建自己的强化学习环境

我们之前写的强化学习算法都是使用Gym中提供的环境,但是当遇到实际的问题需要我们自己创建我们的强化学习环境, 动作空间,状态空间,奖励机制都需要自己设置。

在这一节中,我们将创建一个Steady Hand的简易版本的游戏,游戏的规则是: 从起始点到。

Inverse RL KeniWangluo Bolzaman Factor