REINFORCE

强化学习入门笔记

强化学习相关概念我们先回忆一下童年来看看超级玛丽这款游戏在这款游戏里面的我们需要控制超级玛丽进行左右行走跳攻击等动作来躲避或攻击小动物吃金币以及各种类型的增益道具最终获得的金币数量的多少以及通关代表我们玩游戏玩的好不好

深度学习 强化学习 动态规划 蒙特卡罗 REINFORCE
PG-REINFORCE tensorflow 2.0

REINFORCE 算法实现 REINFORCE算法是策略梯度算法最原始的实现算法 xff0c 这里采用tensorflow2 0进行实现 span class token keyword import span tensorflow sp

REINFORCE tensorflow

强化学习入门笔记