0

我正在使用 Watson Studio 的 HPO 功能训练一个简单的 MLP。但是,在查看我的日志时,指标没有显示。运行非 HPO 训练运行时,指标日志记录有效,但在 HPO 中运行时日志不显示。

这是我定义 Tensorboard 回调的方式:

tb_directory = os.path.join(os.environ["JOB_STATE_DIR"], "logs", "tb", 
os.makedirs(tb_directory, exist_ok=True)
tensorboard = TensorBoard(log_dir=tb_directory)

history = model.fit(x_train, y_train,
                    batch_size=batch_size,
                    epochs=epochs,
                    validation_data=(x_test, y_test),
                    callbacks=[tensorboard])
4

1 回答 1

1

找到了答案。运行 HPO 时,每次训练运行的指标都必须放在其自己的子目录中,否则会被覆盖。所以我应该像这样设置我的 Tensorboard 日志目录:

tb_directory = os.path.join(os.environ["SUBID"],os.environ["JOB_STATE_DIR"], "logs", "tb", 
于 2018-07-13T16:16:49.970 回答