python - 如何获得 tf-agents 中所有动作的概率向量？

翻译自：https://stackoverflow.com/questions/69271763 2021-09-21T15:37:54.827

35 次

我正在研究多臂强盗问题，使用LinearUCBAgentandLinearThompsonSamplingAgent但它们都返回单个动作进行观察。我需要的是可用于排名的所有动作的概率。

0 回答 0