我目前正在阅读 Sudharsan Ravichandiran 的《Python 强化学习实践》,在我遇到的第一个示例中,遇到了以下 AttributeError:
AttributeError 'TimeLimit' object has no attribute 'P'
由以下行提出:
for next_sr in env.P[state][action]:
我找不到任何有关 env.P 的文档,但我在这里找到了一个用 python2 编写的类似示例:https://gym.openai.com/evaluations/eval_48sirBRSRAapMjotYzjb6w/ https://gym.openai.com/evaluations/eval_48sirBRSRAapMjotYzjb6w/
我想 env.P 是过时库的一部分(即使这本书是在 2018 年 6 月出版的,并且有罪的代码是 python3 中的),那么我该如何替换它呢?
首先尝试通过添加以下内容来解开环境
env = env.unwrapped
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)