mujoco强化学习模拟环境的安装（windows10）

2023-05-16

最近在学强化学习，学长推荐用mujoco来做仿真环境。原本我是想照着教程安装的。结果最近mujoco被DeepMind收购了，现在是开源的，许多安装步骤都不太一样了，所以我就写了这篇安装教程。

安装环境：
python 3.7
mujoco 2.1.0（截止到2022/7/10号，目前gym好像不能适配2.1.0更高的版本，所以我现在只推荐安装mujoco的2.1.0的版本）

安装python、Microsoft Visual Studio

这些是前置环境的安装，我这不做过多赘述了，其他安装mujoco的教程也有这部分的内容。

安装mujoco

首先我们进到mujoco的github–https://github.com/deepmind/mujoco/releases去下载2.1.0的版本。
在这里插入图片描述

选择mujoco210-windows-x86_64.zip文件下载。
下载完成后我们来到C:\Users\MEC目录下，这里的MEC指的是用户名，我电脑上是MEC，你根据自己电脑的用户名随机应变。
在这个C:\Users\MEC目录下新建.mujoco文件夹，前面有个点一定要加上。然后我们再将之前下载的mujoco210-windows-x86_64.zip文件解压了放在这里面。最后是下图这个样子。
在这里插入图片描述
然后是配置环境变量，如下图，选择Path变量，

在里面加入我们刚刚新建的文件夹的路径。

环境配置换成后就是python环境的安装了。

pip install mujoco-py
pip install gym

执行完上面的命令，mujoco的环境就配置好了！

mujoco环境的测试

通过下面的代码，可以测试环境有没有正确地被安装好。

import gym
env = gym.make("Hopper-v2")
for i_episode in range(50):
    observation = env.reset()
    print("episode ", i_episode)
    for t in range(1000):
        env.render()
        #print(observation)
        action = env.action_space.sample()
        observation, reward, done, info = env.step(action)
        if done:
            print("Episode finished after {} timesteps".format(t+1))
            break
env.close()

它的输出是这样的：
在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

mujoco强化学习模拟环境的安装（windows10）的相关文章

管道鸟cortex-M4（TM4C1294）

看到满屏的贪吃蛇 xff0c 我也来开源一个Ti开发板 xff08 TM4C1294 xff09 的游戏将简化版的管道鸟 xff0c 根据自己玩的经历 xff0c 在cortexm4开发板上重新撸了一边 xff0c 设计思路 xff1a
C#连接MYSQL数据库并进行查询

之前用MFC开发结果界面太难看被pass了要求用C 重新来开发 gt lt 不过终于摆脱VC6 0的蛋疼操作了Y 先来连接数据库 xff08 1 xff09 用c 连接MYSQL数据库需要用到mysql connector net xff
binascii.Error: Incorrect padding 报错解决

输入的base64编码字符串必须符合base64的padding规则当原数据长度不是3的整数倍时如果最后剩下两个输入数据 xff0c 在编码结果后加1个 61 xff1b 如果最后剩下一个输入数据 xff0c 编码结果后加2个 61 x
通过过滤器链了解spring security + oauth2实现单点登录的过程

一系统注意部署在同一机器 xff08 localhost xff09 上的三个应用 xff0c 为了防止存放在cookie中的JSESSIONID不被覆盖 xff0c 需要设置不同的path xff0c 可以在配置文件中指定不同的上下文
jetson tx2开箱上电

期待已久的jetson tx2终于到了 xff0c 来做一个开箱 jetson tx2是英伟达的第三代GPU嵌入式开发板前两代分别是jetson tk1和jetson tx1 jetson tk1 xff1a 绿色的版板子接口丰富 jet
Jetson tx2刷机过程中的坑

暑假各种事忙得差不多后 xff0c 终于有时间拿出早就申请到的tx2 xff0c 开始刷机教程 xff0c 这两天几乎踩边了所有的坑第一个坑 xff0c 虚拟机一般在安装VMware虚拟机时 xff0c 建议的安装空间20GB xff0
python词云实现

python的一个蛮酷炫的功能是可以轻松地实现词云 github上有关于这个项目的开源代码 xff1a https github com amueller word cloud 注意跑例程时要删除里面的wordcloud文件夹词云的功能有
docker中accessTokens拉取私有git仓库

背景当需要git clone拉取私有库时 xff0c 传统的做法为将本机的ssh配置到gitlab中但在docker中执行程序时需要拉取私有库 xff0c 此时无法为每个docker容器配置ssh 网上的一种方案为 xff0c 将配置好
Docker世界 -- 进阶篇(入门)

一 Docker Compose 1 1 Docker Compose 介绍 1 1 1 简介 xff1a 传统的 docker 服务 xff0c 我们一般通过编写 Dockerfile 文件 xff0c 通过 build 命令创建一个镜像
树莓派pico CMake工程直接添加 .c .h文件

假设工程名test1 xff0c 带main 的源代码文件 main c xff0c 要往工程里添加oled c oled h之类的源代码直接添加为可执行文件 xff1a 编辑工程根目录的 CmakeLists txt add execu
张量的通俗理解

1 关于张量的四种定义张量在不同的运用场景下有不同的定义 xff08 1 xff09 张量是多维数组 xff0c 这个定义常见于各种人工智能软件听起来还好理解 xff08 2 xff09 张量是某种几何对象 xff0c 不会随着坐标系
如何搭建node_exporter

如何搭建node exporter 1 观看条件 1 假设你已经看过上一篇文章如何搭建普罗米修斯 Prometheus 2 假设你已经会搭建普罗米修斯 xff08 promethus xff09 3 上面两个假设 xff0c 只要满足一个
python类中初始化形式：def __init__(self)和def __init__(self, 参数1，参数2，···，参数n)区别

前言这两种初始化形式 xff0c 就类似于C 43 43 类中的构造函数形式1 def init self span class token keyword class span span class token class name
Go语言操作grpc详细使用

Go语言操作grpc详细使用零参考链接一 protobuf的详细使用二 grpc与protobuf的go文件的生成1 安装两个插件2 写proto文件3 编译proto文件 xff0c 生成go文件三 grpc的详细使用1 一元RPC
Steghide使用教程及其密码爆破

Steghide使用教程及其密码爆破工具介绍 Steghide是一款开源的隐写术软件 xff0c 它可以让你在一张图片或者音频文件中隐藏你的秘密信息 xff0c 而且你不会注意到图片或音频文件发生了任何的改变而且 xff0c 你的秘密文
一道Gloang并发、锁的面试题，你会吗？

Gloang并发锁的面试题 1 题目描述2 问题分析2 1问题一2 2问题二2 3问题三2 4问题四2 5问题五 3 问题解决方法4 代码实现4 1 map前后加锁的方式4 2 sync map解决方式 1 题目描述源地址 xff1a
阿里云、腾讯云centos7安装mysql

阿里云腾讯云centos7安装mysql 1 下载2 解压与准备3 安装4 配置4 1配置数据库4 2查看默认密码4 3启动mysql4 4设置密码 5 开启远程登录5 1开放3306端口5 2开启远程登录6 参考链接 1 下载镜像网站
go语言gin、net/http的优雅关机

gin net http的优雅关机什么是优雅关机 xff1f 优雅关机的实现参考链接什么是优雅关机 xff1f http server运行过程中 xff0c 若进程被关闭 xff0c 那么正在处理的请求可能只被处理了一半就停止了 xff
C语言不详细记录

C记录 1 内存管理2 结构体内存对其规则3 字符串函数4 二维数组5 const 指针6 字符串7 图片记录8 函数指针 1 内存管理 C语言内存讲解详说内存分布和heap空间 2 结构体内存对其规则 C语言结构体对齐规则 C语言结构
【web压测】压测常用工具、压测指标到底是什么？

压测常用工具压测指标到底是什么 xff1f 一压测指标 I1 QPS xff0c 每秒查询2 TPS xff0c 每秒事务3 RT xff0c 响应时间二压测指标 II三压测工具1 ab2 go wrk 在window上压测一

随机推荐

C语言结构体字节对其规则简述

C语言结构体字节对其规则简述规则描述示例示例一示例二字节对齐规则 xff0c 一直不是很理解 xff0c 网上的答案也是参差不齐规则描述首先 xff0c 预处理指令 pragma pack n 可以改变默认对齐数进行字节对齐 n 取
【STM32学习】SysTick定时器（嘀嗒定时器）

SysTick定时器一参考资料二时钟源选择与定时时间计算1 时钟源选择2 定时时间计算三 SysTick Handler中断服务函数一参考资料嘀嗒定时器 xff1a 时钟源寄存器二时钟源选择与定时时间计算结合正点原子的
【STM32学习】GPIO口的八种工作模式

GPIO口的八种工作模式一参考资料二 GPIO八种模式1 输入模式2 输出模式三施密特触发器1 电路2 电路计算一参考资料 GPIO原理图详解强烈建议观看 xff1a GPIO为什么这样设计 xff1f 施密特触发器原理施
【STM32学习】WWDG窗口看门狗

STM32学习 WWDG窗口看门狗 x1f415 1 图展示WWDG原理2 复位中断条件3 溢出时间计算4 与独立看门狗 x1f415 的对比 1 图展示WWDG原理 2 复位中断条件产生复位的情况 xff1a 当递减计数器数值递减到
【STM32学习】时钟配置详解

STM32学习时钟配置详解看懂时钟图结合代码外部高速时钟修改看懂时钟图在刚开始学习32的时候 xff0c 并不会在意这些 xff0c 或者即使看了也看的不是很明白随着学习的深入 xff0c 我们发现看门狗定时器 ADC很多外设都
vnc远程访问ubuntu18.04桌面系统 vncserver开机自启动

文章目录一 windows端准备二 ubuntu端准备三远程连接桌面四配置vncserver开机自启动一 windows端准备下载TightVNC xff1a https www tightvnc com 二 ubuntu端准备
【STM32学习】定时器寄存器配置、功能工作过程详解

STM32学习定时器寄存器配置功能工作过程详解零参考一引言二功能以及寄存器说明1 最基本的定时功能 xff08 时基单元 xff09 1 1 框图1 2 工作流程1 3 寄存器介绍1 3 1 CR1寄存器1 3 2 CNT PS
【STM32学习】实时时钟 —— RTC

STM32学习实时时钟 RTC 零参考一工作原理1 RTC介绍2 工作过程二相关寄存器三代码说明1 rtc初始化2 关于中断3 中断配置代码 xff08 仅供参考 xff09 3 1 秒中断 43 普通闹钟功能3 2 待机模式唤
【JLink仿真器】盗版检测、连接故障、检测不到芯片问题

JLink仿真器盗版检测连接故障检测不到芯片问题一问题描述二解决方法1 降低驱动 xff08 解决非法问题以及连接故障 xff09 2 SWD引脚被锁 xff08 解决检测不到芯片 xff09 三说明一问题描述盗版检测
【STM32学习】直接存储器访问——DMA

STM32学习直接存储器访问 DMA 零参考一对DMA的理解二 DMA通道优先级三 DMA通道x传输数量寄存器 DMA CNDTRx 四 DMA缓冲区设计零参考一个严谨的STM32串口DMA发送 amp 接收 xff08 1 5
【STM32学习】模数转换器——ADC

STM32学习模数转换器 ADC 零参考一 ADC转换耗时二转换模式三对某些寄存器的理解1 ADC CR22 ADC SQRX 四库函数注意事项零参考 STM32固件库 xff08 标准外设库 xff09 入门学习第七章 A
【面试】嵌入式C语言题目整理

面试嵌入式C语言题目整理描述内存四区内存四区分为 xff1a 代码区静态区堆区栈区代码区就是用来存放代码的静态区用来存放全局变量静态变量常量 xff08 字符串常量 const修饰的全局变量 xff09 堆区中的内存是由
【总线】IIC学习笔记

总线 IIC学习笔记参考链接IIC总线介绍IIC总线时序1 空闲信号2 启动信号与停止信号3 数据的有效性4 应答信号5 七位地址传输 IIC读写过程 xff08 AT24C02举例 xff09 IIC读过程IIC写过程正点原子IIC驱
树莓派下载及安装PyCharm软件

运行 PyCharm 需要 Java 环境 xff0c 如果树莓派上还没有安装过 JRE xff0c 可以使用以下命令安装即可 xff1a sudo apt install default jre y PyCharm 有专业版和社区版专业
QT 建立透明背景图像QPixmap

列将下面背景透明图片1转变成图片2 图1 图2 span class hljs preprocessor include 34 mainwindow h 34 span span class hljs preprocessor includ
putty 登录出现Network error: connection time out 解决方案

今天用putty登录我的linux主机出现Networkerror connection time out 然后我从linux系统上登录 xff0c 当是没法联网 xff0c pingwww baidu com 则提示 xff1a pin
大端字节序与小端字节序的转换

逐步加深对字节操作的理解 xff0c 记录一下大端字节序与小端字节序的转换 xff0c 开发环境是vs2010 xff0c 项目类型是控制台输出程序 xff0c 下面是代码实现 xff1a span class token comment
c++面试常见问题总结

近来在面试的过程 xff0c 发现面试官在c 43 43 方面总是喜欢问及的一些相关问题总结 xff0c 当时没怎么答出来 xff0c 或者是答的不怎么全面 xff0c 故而查询相关资料总结下后面实际工作会进行实时更新信息 lt 一 gt
Prometheus（普罗米修斯）架构及原理

prometheus架构图 xff1a 如上 xff0c prometheus 采集数据的主要方式是 server 通过http请求去主动拉取数据要完成以上需求 xff0c 必须满足以下条件 xff1a server必须知道各种 ex
mujoco强化学习模拟环境的安装（windows10）

最近在学强化学习 xff0c 学长推荐用mujoco来做仿真环境原本我是想照着教程安装的结果最近mujoco被DeepMind收购了 xff0c 现在是开源的 xff0c 许多安装步骤都不太一样了 xff0c 所以我就写了这篇安装教程

热门标签