ray - 简单的 DQN 示例 - 在配置中指定什么以便打印出模型参数和结果？

Question

我想在运行 DQN 或 DDPG 模型后打印参数和结果。我在 jupyter notebook 中触发了模型，如下所示。

定义配置和对象并调用训练。如下：

但这并没有打印模型参数和结果。请澄清如何打印这些？

Ubuntu EC2 实例 Jupyter notebook DQN 上的购物车杆示例。还想使用我的自定义体验数据集为我的问题设置（在线电子商务数据）进行政策培训

config_dict = {"evaluation_num_episodes":4,"num_workers": 10, "sample_batch_size": 200, 
               "train_batch_size": 200, "output": "outputdir", "gamma": 0.99, 
               "horizon": None,  
               "input": "sampler", 
               "optimizer_class": "SyncReplayOptimizer", "optimizer": {"prioritized_replay":True}, 
               "input_evaluation": ["is", "wis"], "callbacks": {"on_train_result": on_train_result},
               "ignore_worker_failures":True}


trainer = dqn.DQNAgent(config=config, env="CartPole-v0")

for epi in range(2):
    result = trainer.train()
    print(pretty_print(result))
    if epi %1000 ==0:
        checkpoint = trainer.save()
        print("checkpoint saved at", checkpoint)

带有模型参数和结果 json 的文件夹

score 0 · Accepted Answer

结果可以在 ~/ray_results 目录中找到。配置将在 params.json 文件中，结果在 results.json 中。TensorBoard 事件文件也将被写入，您可以使用 tensorboard --logdir=~/ray_results 将结果可视化。

这里有更多信息：https ://ray.readthedocs.io/en/latest/rllib-training.html#getting-started

顺便说一句，对于离线批处理 RL，文档是这个页面：https ://ray.readthedocs.io/en/latest/rllib-offline.html

ray - 简单的 DQN 示例 - 在配置中指定什么以便打印出模型参数和结果？

1 回答 1

Related

Reference