安装¶
Spinning Up需要使用Python3,MuJoCo,OpenAI Gym和OpenMPI。
Spinning Up目前仅支持Linux和OSX。可能可以在Windows上安装,但尚未经过测试。(如果您尝试并成功了,请告诉我们您是如何做到的!)
安装Python¶
我们建议通过Anaconda来安装Python。Anaconda是一个包含Python和许多有用的Python包的库,它同时拥有一个名为conda的环境管理器,使包管理变得非常简单。
请参照Anaconda的 安装说明 。下载并安装Anaconda 3.x(撰写本文时为3.6)。然后创建一个conda env来管理Spinning Up中使用的包:
conda create -n spinningup python=3.6
要从刚刚创建的环境中使用Python,请使用以下命令激活环境:
source activate spinningup
You Should Know
如果你对Python环境和软件包管理不了解,这些东西很快就会让你感到困惑或不知所措,你可能会在这个过程中遇到一些障碍。(特别地,你应该会遇到类似这种问题,“我刚刚安装了这个东西,但是当我尝试使用它时系统提示没有找到它!”)你可能想要阅读一些关于包管理是什么的清晰解释,为什么它是一个好的想法,以及您通常必须执行哪些命令才能正确使用它。
FreeCodeCamp 有一个很好的解释值得一读。这也有一篇关于 Towards Data Science 的简短描述也很有帮助。最后,如果你是一个非常有耐心的人,你或许想要阅读(枯燥但非常有用的) Conda文档页面 。
安装MuJoCo和OpenAI Gym¶
首先,前往 mujoco-py 的GitHub页面。按照README中的安装说明进行操作,该说明描述了如何安装MuJoCo物理引擎和mujoco-py包(允许在Python中使用MuJoCo)。
You Should Know
要使用MuJoCo模拟器,您需要获得 MuJoCo license 。任何人都可以获得免费30天的许可证,全日制学生可以获得免费1年的许可证。
接下来,前往 Gym GitHub页面,然后按照README中的”Installing Everything”说明进行操作。
一定要 先安装MuJoCo和mujoco-py 再安装Gym,以确保能够正确设置Gym mujoco环境。
安装Spinning Up¶
git clone https://github.com/openai/spinningup.git
cd spinningup
pip install -e .
检查您的安装¶
要查看您是否已成功安装Spinning Up,请尝试在Walker2d-v2环境中运行PPO
python -m spinup.run ppo --hid [32,32] --env Walker2d-v2 --exp_name installtest
这大约会运行10分钟,与此同时您可以继续阅读文档。这不会完成对Agent的训练,但会运行足够长的时间以便在结果出现时看到 某些 学习进度。
完成训练后,可以观看已经训练好完成的策略的视频
python -m spinup.run test_policy data/installtest/installtest_s0
并且可以绘制结果
python -m spinup.run plot data/installtest/installtest_s0