Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
强化学习圣经-GridWorld实现
import numpy as np import matplotlib pyplot as plt grid size 5 posA 0 1 primeA 4 1 posB 0 3 primeB 2 3 discount 0 9 acti
RL
book
有模型强化学习总结
有模型和无模型的区别 1 有了模型 我们可以干哪些事呢 第一 利用模型和基于模型的优化算法 我们可以得到回报高的数据 也就是好的数据 有了好的数据 我们就可以对策略网络进行稳定的训练了 第二 有了模型 我们可以充分地利用示例 demonst
RL
机器学习
算法
人工智能
强化学习
强化学习奖励和状态设计
奖励 1 稀疏奖励问题 2 奖励模式化问题 3 奖励不能太过于全局化 4 记住一些常用的奖励设置方式 5 逆向强化学习自动涉及回报函数 6 避免奖励异常问题 贪婪 来回踱步 胆怯 不敢走 主线奖励太小 鲁莽 惩罚不够 7 采用reward
RL
算法
强化学习
python
机器学习
微分动态规划的基本思想
吴恩达cs229第19课 微分动态规划这一部分 看了两遍才看明白 赶紧记下来 微分动态规划是基于LQR 线性二次型 的 后者能够比较简洁地计算最优策略 但要基于一个前提 就是 t 1 时刻的状态 是 t 时刻的状态和 t 时刻采取行为的线性
AI
RL
强化学习
增强学习
RL
Catalogue DQN Framework Application 1 1 Cartpole Introduction 1 2 Code 1 3 Result Reference DQN Framework The agent inte
RL
DQN
CartPole
gym
强化学习
Isaac-gym(1): 安装及官方demo内容
希望和正在或者想要学习使用ISAAC GYM的朋友一起有一个讨论群 尝试互帮互助 交流学习内容 目前刚开始尝试 不知道能不能建立起来 如果有意向请私戳 2023 02 PS 本人是在安装完anaconda3的情况下进行安装与配置的 1 环境
RL
Pytorch
Isaac
强化学习
人工智能