人工智能学习：倒立摆（CartPole）（9）

2023-05-16

倒立摆是强化学习的一个经典模拟对象，通过对倒立摆对象的持续的动作输入，使倒立摆保持在竖立的状态或者倒下。Python提供了一个模拟库（gym）来模拟倒立摆等一些典型的难度控制对象。

首先载入gym库

import gym

然后启用倒立摆对象

env = gym.make('CartPole-v1', render_mode='human')

render_mode表示渲染模式，即渲染时输出的模式，human表示正常的屏幕输出，然后设立一个循环进行持续不断的输入，显示倒立摆的反映，程序如下

env.reset()

for _ in range(50):
    env.render()

    action = env.action_space.sample()
    env.step(action)

env.close()

程序中，首先进行初始化（reset），然后开始不断绘制（render）以及进行动作输入（env.step），action为输入的动作，这里调用env.action_space.sample函数从动作空间随机选择一个动作作为输入。50步以后结束仿真。
运行的结果是出现一个倒立摆的窗口，模拟倒立摆的左右随机移动，因为没有专门的输入动作控制，最后倒立摆会失去控制倒下。显示窗口如下
在这里插入图片描述

在这个模拟对象的基础上可以进行强化学习的仿真测试。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

人工智能学习：倒立摆（CartPole）（9）的相关文章

Linux系统下which, whereis, locate的用法

Linux系统下可以通过which whereis locate等命令来查找文件程序的所在位置 1 which 通过which命令查找可执行文件命令的位置 xff0c 比如 which ls 查找ls命令所对应的执行文件位置 xff0c
Linux下的链接与ln(link)命令

最近安装了多个版本的python3 xff0c 涉及到了链接的问题链接有点像Windows下的快捷方式 xff0c 本身是一个文件 xff0c 指向另一个文件或应用程序 xff0c 也可以指向一个目录在访问这个链接的时候 xff0c 等
当前主流目标识别（Object Detection）算法

参考链接 xff1a https blog csdn net librahfacebook article details 103114747 https blog csdn net weixin 43196118 article deta
Ubuntu 18.04安装NVIDA显卡驱动

Ubuntu 18 04安装NVIDIA显卡驱动方法比较简单在Ubuntu系统安装之后 xff0c 通过运行程序按键 xff08 即Window按键 xff09 搜索运行Software amp Updates程序 xff0c 在Addi
Ubuntu 18.04安装CUDA 11.4.3和cuDNN 8.2.4

CUDA和cuDNN为NVIDIA支持GPU运算以及深度神经网络计算加速的算法库通常需要安装以支持利用GPU加速神经网络的训练和推理在已经安装NVIDIA显卡驱动的情况下 xff0c 可以通过nvidia smi查看显卡信息和适合的CU
Ubuntu 18.04下测试YOLO v4

在Ubuntu 18 04下测试了YOLO的方案选择安装的是CUDA 11 4和cuDNN 8 2 xff0c 在测试v3版本时遇到了编译的问题所以选择v4版本参考链接 xff1a https pjreddie com darknet
在Jetson Nano上安装NoMachine

最近需要对Jetson Nano进行操作 xff0c 在它的上面测试目标识别的程序习惯了用NoMachine远程进行操作 xff0c 所以先在Nano安装NoMachine Nano采用的是通过镜像刻录的Ubuntu 18 04系统参考
Linux系统开机自启动程序设置

用户可以在Linux系统配置自启动的程序 xff0c 可以通过多种方式来实现 1 rc local 系统启动阶段 xff0c 系统根据启动层级运行 etc rcN d目录下脚本 xff08 N为0 6之间的数字 xff0c 表示启动层级 x
【Android】App安装提示“该安装包未包含任何证书”问题处理

根据客户反馈 xff0c 安装App时会出现安装失败的问题 xff0c 如下图 xff1a 安装失败就算了 xff0c 还被怀疑我亲自动手打包的App不是正版 xff0c 这不能忍 xff0c 这个问题我一定要处理掉可后来发现我错了 xf
Ubuntu系统apt-get, pip国内源设置

Ubuntu系统默认设置apt get pip的源为国外服务器 xff0c 速度较慢 xff0c 以及有时有连接不上的情况可以设置成国内的源以提高下载速度和稳定性 1 apt get apt get的源设置通过 etc apt sourc
在Jetson Nano上十行代码实现目标检测（jetson_inference）

网上有一个10行代码搞定目标检测的视频教程参考网址 xff1a https www bilibili com video av91150116 经测非常实用 xff0c 通过10行代码实现目标检测 xff0c 在Jetson Nano上迅
问题解决：Error: Can’t initialize nvrm channel

在Jetson Nano安装好环境之后 xff0c 使用jupyter notebook调试python程序 xff0c 启动 jupyter notebook 之后 xff0c 在terminal出现连续的提示 Error Can t i
问题解决：/usr/lib/aarch64-linux-gnu/libgomp.so.1: cannot allocate memory in static TLS block

在测试jetson utils实现视频载入时出现如下的错误 usr lib aarch64 linux gnu libgomp so 1 cannot allocate memory in static TLS block 经查询是libg
在Jetson Nano安装测试YOLO v5目标识别示例

参考链接 https blog csdn net carrymingteng article details 120978053 https blog csdn net weixin 43947712 article details 115
问题解决：ImportError: The _imagingft C module is not installed

在测试YOLO v5时出现错误提示 xff1a ImportError The imagingft C module is not installed 经查是pillow库的问题解决方法重新安装pillow xff0c 先卸载已有的pi
Jetson Nano设置风扇自启动

Jetson Nano跑一些如目标识别等需要较大计算量的程序 xff0c 散热板会非常的热 xff0c 为避免主板过热 xff0c 通常在散热板上加装一个风扇增强散热风扇需要软件指令进行驱动 xff0c 驱动风扇的指令为 sudo sh
Ubuntu 18.04安装gazebo9

首先 xff0c 把gazebo的源添加到apt的source list中 sudo sh c echo deb http packages osrfoundation org gazebo ubuntu stable 96 lsb rel
问题解决：/usr/bin/ld: cannot find -lbz2

在项目编译过程中 xff0c 出现类似如下的错误 usr bin ld cannot find lbz2 经查询 xff0c 是找不到bz2的库文件 xff0c 用whereis命令查询 whereis libbz2 找不到对应的库文件 x
常用Git命令

通过git命令可以对项目代码库执行克隆拉取提交等操作常用的git命令有如下 git clone 克隆代码库 xff0c 把远程代码库克隆到本机当前目录 xff0c 如 git clone https github com PX4 PX
【Android】原来Toolbar还能这么用？Toolbar使用最全解析。网友：终于不用老是自定义标题栏啦

一个Toolbar的UI可以做成什么样 xff1f 做出什么效果 xff1f 这是我最近在研究的问题目录带导航图标的Toolbar带标题的Toolbar带小标题的Toolbar带Logo的Toolbar带进度条的Toolbar带菜单的T

随机推荐

Linux安装Beyond Compare

Beyond Compare是一款很好用的代码比对软件 xff0c 提供了在Windows xff0c Linux等平台的安装包在Linux下安装Beyond Compare的方法如下参考链接 xff1a https www scoot
Linux下压缩解压文件和目录的方法（zip, tar）

Linux下可以用zip命令方便的压缩文件或文件夹压缩文件 zip data zip data xls zip data zip data1 xls data2 xls 上述命令把一个文件或者多个文件压缩到一个zip文件压缩目录 zip
Jupyter Notebook安装

Jupyter Notebook是一个非常好用的交互式Python运行的软件安装方法如下在命令行输入 pip3 install jupyter 安装后根据提示 xff0c Jupyter相关软件安装在 local bin目录下 xff0
Ubuntu添加截屏快捷键的方法

在Ubuntu下面具有截屏的命令 xff08 gnome screenshot xff09 xff0c 可以通过简单的设置方便的添加截屏快捷键通过 Settings gt Devices gt Keyboard选项 xff0c 添加快捷键
Windows下修改Jupyter Notebook默认字体的方法（custom.css）

在Windows下Jupyter Notebook代码显示的默认字体为宋体 xff0c 视觉效果不是很好 xff0c 可以通过设置修改默认的显示字体通过用户目录 C User Administrator jupyter custom 下的
Jupyter Notebook添加代码自动补全功能的方法

Jupyter Notebook成为一款非常受欢迎的交互式Python运行环境的软件通过如下的方法可以添加代码自动补全的功能输入命令安装插件 pip3 install jupyter contrib nbextensions 然后运行
修改grub默认启动选项的方法

在Windows系统基础上 xff0c 再安装Linux xff0c 形成双系统这样在grub启动菜单中会包含Linux Windows等多个选项 xff0c 默认为第一个选项 xff0c 常规的Linux启动通过修改配置文件 etc
在云服务器上搭建Jupyter Notebook服务

Jupyter Notebook提供了远程登录的功能 xff0c 可以在云服务器上配置Jupyter Notebook xff0c 用户可以远程登录和运行Python代码这里使用的是腾讯云的Ubuntu服务器 xff0c 配置方法如下 1
常用Linux命令

记录一些常用的Linux命令 1 用户管理增加用户 useradd lt user name gt useradd g lt group name gt lt user name gt g选项指定新用户所属的用户组修改用户的组别 use
在云服务器上安装VNC远程桌面服务

云服务器操作系统通常不包含图形界面 xff0c 通过在服务器上安装VNC服务 xff0c 可以让用户以图形化界面远程登录到云服务器这里服务器使用的是Ubuntu Server 18 04系统 1 安装图形界面首先在服务器端安装图形化桌面
【Android】ADB无线连接Android设备

目录简介无线连接的条件adb连接设备方法一方法二修改端口号方法一方法二辅助工具android toolscrcpy gui 问题集合简介 Android Debug Bridge xff0c 简称adb xff0c 是一种功能多样的
人工智能学习：载入MNIST数据集（1）

MNIST数据集是人工智能学习入门的数据集 xff0c 包含了一系列的手写的数字图片载入MNIST数据集的方法很简单 xff0c Tensorflow集成了载入数据集的方法首先导入tensorflow模块和matplotlib pypl
人工智能学习：MNIST数据分类识别神经网络（2）

在MNIST数据集上构建一个神经网络 xff0c 进行训练 xff0c 以达到良好的识别效果 1 导入模块首先 xff0c 导入必要的模块 span class token keyword import span numpy span c
人工智能学习：NMIST数据分类识别-CNN网络（3）

这里采用CNN模型 xff08 卷积神经网络 xff09 来进行MNIST数据集的分类识别 1 导入模块首先 xff0c 导入需要的模块 span class token keyword import span numpy span cl
人工智能学习：CIFAR-10数据分类识别（4）

与MNIST类似 xff0c CIFAR 10同样是人工智能学习入门的数据集之一 xff0c 它包含飞机汽车小鸟等10个类别的图片 xff0c 一共60000张图片 xff0c 其中训练集占50000张 xff0c 测试集占10000张
人工智能学习：CIFAR-10数据分类识别-VGG网络（5）

这里尝试采用VGG网络对CIFAR 10数据集进行分类识别 1 导入需要的模块 span class token keyword import span numpy span class token keyword as span np s
人工智能学习：PASCAL VOC数据集读取（6）

PASCAL VOC是一个国际的计算机视觉挑战赛 xff0c 数据集包含了20个分类的3万多张图片挑战赛及其数据集基础上涌现不少知名的目标检测模型如R CNN xff0c YOLO xff0c SSD等可以通过下载和读取的方法载入PAS
人工智能学习：Microsoft COCO数据集读取（7）

Microsoft COCO xff08 Common Objects in Context xff09 是微软研发维护的一个大型的数据集包含了30多万张图片和91个目标分类可用于目标识别 xff08 Object Detection
人工智能学习：ResNet神经网络（8）

ResNet是一种非常有效的图像分类识别的模型 xff0c 可以参考如下的链接 https blog csdn net qq 45649076 article details 120494328 ResNet网络由残差 xff08 Resi
人工智能学习：倒立摆（CartPole）（9）

倒立摆是强化学习的一个经典模拟对象 xff0c 通过对倒立摆对象的持续的动作输入 xff0c 使倒立摆保持在竖立的状态或者倒下 Python提供了一个模拟库 xff08 gym xff09 来模拟倒立摆等一些典型的难度控制对象首先载入gy

人工智能学习：倒立摆（CartPole）（9）

人工智能学习：倒立摆（CartPole）（9） 的相关文章

随机推荐

热门标签

人工智能学习：倒立摆（CartPole）（9）的相关文章