ray的强大不仅在于他是分布式计算框架,更是因为有RLLib和tune的加持。tune的使用上一节我们已经讲了,这一节我们来看一下RLLib的使用。虽然后讲的rllib,但是真正训练的时候,还是tune使用的多,因为它调节超参数是很方便的,而rllib不具有自动调节超参数的能力。
在使用rllib之前,需要使用命令
pipinstallray[rllib]
安装
使用rllib训练强化学习智能体有两种方式:
1.直接使用命令行训练,在终端中输入如下命令,就会开始训练过程。
rllibtrain--run=A2C--env=CartPole-v0
这种方式适合内置的环境和算法,不需要考虑环境和算法是如何实现的,如果想要做更多修改和人性化的训练,那么需要使用第二种方式。
2.编写程序实现训练
这估计是大多数人会选择的方式,对于命令行的方式,在编写py文件的时候,就应该使用argparse来接受并解析命令,但是我觉着大多数中国人还是喜欢直接修改py源码的方式。
不同的agents是通过ray.rllib.agents导入的,这里面
(*