如何传递元组列表作为 OpenAI Gym 中的动作空间？

2024-01-08

从头开始创建 OpenAI Gym 环境时，必须定义一个动作空间。这是通过数据包“空间”中自己的“数据结构”来完成的。有几种不同类型的空间，如盒子、离散等。我有一个元组列表，我想用作操作空间。有没有办法做到这一点？

我本来可以使用spaces.Box(low=0, high=1, shape(4,12), dtype=np.int)，但这却增加了很多违法行为。我愿意接受使用 space.Box 等解决方案，然后禁止/删除非法行为，但最好只插入我预先制作的元组列表。

OpenAI Gym 有一个元组动作空间 https://github.com/openai/gym/blob/master/gym/spaces/tuple.py。用法示例：

from gym import spaces
action_space = spaces.Tuple((
        spaces.Discrete(9),
        spaces.Discrete(5)))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

openaigym

如何传递元组列表作为 OpenAI Gym 中的动作空间？的相关文章

Python中Decimal类型的澄清

每个人都知道或者至少每个程序员都应该知道 http docs oracle com cd E19957 01 806 3568 ncg goldberg html 即使用float类型可能会导致精度错误然而在某些情况下精确的解决方
Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
Python模块可以访问英语词典，包括单词的定义[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我正在寻找一个 python 模块它可以帮助我从英语词典中获取单词的定义当然有enchant 这可以帮助我检查该单词是否存在于英语中
python 模拟第三方模块

我正在尝试测试一些处理推文的类我使用 Sixohsix twitter 来处理 Twitter API 我有一个类充当 Twitter 类的外观我的想法是模拟实际的 Sixohsix 类通过随机生成新推文或从数据库检索它们来模拟推文的
在 Python distutils 中从 setup.py 查找脚本目录的正确方法？

我正在分发一个具有以下结构的包 mymodule mymodule init py mymodule code py scripts script1 py scripts script2 py The mymodule的子目录mymodul
Argparse nargs="+" 正在吃位置参数

这是我的解析器配置的一小部分 parser add argument infile help The file to be imported type argparse FileType r default sys stdin parser
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
为什么Python的curses中escape键有延迟？

In the Python curses module I have observed that there is a roughly 1 second delay between pressing the esc key and getc
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
Numpy 过滤器平滑零区域

我有一个 0 及更大整数的 2D numpy 数组其中值代表区域标签例如 array 9 9 9 0 0 0 0 1 1 1 9 9 9 9 0 7 1 1 1 1 9 9 9 9 0 2 2 1 1 1 9 9 9 8 0 2 2 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
首先对列表中最长的项目进行排序

我正在使用 lambda 来修改排序的行为 sorted list key lambda item item lower len item 对包含元素的列表进行排序A1 A2 A3 A B1 B2 B3 B 结果是A A1 A2 A3 B
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
列表值的意外更改

这是我的课 class variable object def init self name name alias parents values table name of the variable self name 这是有问题的函数 f
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

无法在 Google 应用模拟器中添加 google 帐户

我正在尝试实现我的第一个 Android C2DM 应用程序我在添加谷歌帐户时遇到困难我的机器位于代理后面但我添加了一个包含代理端口用户名密码详细信息的 APN 我可以使用浏览器进入谷歌帐户页面我已经尝试过http和https
Java 序列化：readObject() 与 readResolve()

这本书有效的Java和其他来源提供了关于如何以及何时使用的很好的解释readObject 使用可序列化 Java 类时的方法这readResolve 另一方面方法仍然有点神秘基本上我发现的所有文件要么只提到两者之一要么只单独提到两者
如何在react.js中使用setProps

我想打电话setProps从外部myComponent能够动态更改数据myComponent 我希望在更改组件的道具后它将重新渲染自身我正在尝试以下操作 var myComponent React createClass render
AWS Elastic mapreduce 似乎没有正确地将流媒体转换为 jar

我有一个映射器和减速器当我在管道版本中运行它们时它们可以正常工作 cat data csv mapper py sort k1 1 reducer py 我使用了弹性mapreducer向导加载了输入输出引导程序等引导程序成功
Pyspark - 使用collect_list时保留空值

根据接受的答案 in pysparkcollect set或collect list与groupby https stackoverflow com questions 37580782 pyspark collect set or col
安装valgrind，启动时出现致命错误

我正在安装 Valgrind 但遇到一些问题我的平台信息 Linux xx ThinkPad X61 3 2 0 39 generic pae 62 Ubuntu SMP Wed Feb 27 22 25 11 UTC 2013 i686
两个 kubernetes 集群之间的 mTLS

我正在尝试在两个 kubernetes 集群中的两个应用程序之间获取 mTLS 而无需使用 Istio 的方式通过其入口网关我想知道以下内容是否可行对于 Istio Likerd Consul 假设我们有一个 k8s 集群 A 和一个
React Router browserHistory 适用于本地，不适用于生产

每当我在本地使用 browserHistory 时我都没有问题但是当我在发货之前测试它时我会得到一个带有错误的空白页面因此当我用 hashHistory 替换 browserHistory 时一切正常但我丢失了漂亮的网址未捕
Thymeleaf - 如何有条件地将选中的属性添加到输入

如你所知 input组件有一个属性 checked是否将复选框标记为默认启用
Activity 从下到上滑动，但后台 Activity 不应移动

我正在尝试将一项活动从底部滑动到顶部这是我能够做到的但是当从底部滑动到顶部时我的后台活动也滑动到底部我想将后台活动保持在与原来相同的位置以便新活动在打开时看起来像是后台活动的覆盖这是我的slide in up xml
在 R 中将点图保存为 pdf [重复]

这个问题在这里已经有答案了当在函数内执行此命令时我无法将点图保存为 pdf 正常调用时效果很好 df lt data frame a runif 10 b runif 10 c runif 10 x 1 10 pdf test pdf
AIDL Client 未绑定到远程服务

我正在尝试使用远程服务运行简单的乘法我有 AIDL 服务器文件声明和定义方法在AIDL中我在服务器的包名称下复制了与服务器相同的AIDL文件我已经给出了服务器服务的意图过滤器的操作我的 AIDL 客户端代码仍然没有连接到该服务 A
本地函数和 SOLID 原则 C#

我知道从 C 7 0 开始我们可以创建局部函数但这与实现良好设计模型的 SOLID 原则有何关系我的意思是这不会打破单一职责原则在另一个函数中添加一个函数吗我们可以委托这个简单的任务在另一个方法或另一个新类中进行计算吗对于允许我
如何将侦听器从 Fragment 传递到 DialogFragment

我有我Fragment这就是如何DialogFragment The DialogFragment创建并显示TimePickerDialog dialog 我希望调用 Fragment 来实现imePickerDialog OnTimeSe
如何在 C# 中以编程方式执行方法重载解析？

当 C 编译器解释方法调用时它必须使用静态参数类型来确定实际调用的是哪个重载我希望能够以编程方式完成此操作如果我有一个方法的名称 astring 声明它的类型一个实例System Type 以及参数类型列表我希望能够调用标准库函
使用 Github 推送提交时出错： fatal: 无法读取用户名

自从几次以来我在我的项目中使用 Github 当我想要推送提交时我遇到了问题首先我创建了一个存储库然后我克隆了叉子使用命令行git clone https github com 并且在进行修改后我已成功承诺 git commi
强制所有区域使用相同的布局

我有以下项目结构视图共享布局区域 Area1 Views ControllerName Index 区域 AreaN Views ControllerName Index 有什么办法强制所有区域都使用 Layout as a 基地布
Git 服务器挂钩：获取正在推送的文件的内容？

我正在尝试在我的团队中强制执行一些编码规则为此我编写了许多客户端挂钩这些挂钩可以正常工作但现在我希望当开发人员将其修改推送到中央存储库时运行相同的检查但它们不起作用这是我想做的我想逐行遍历推送的文件检查是否违反编码约定如果
Chrome 版本 61 中扩展中的 ES6 模块

这与以下问题不是同一个问题Google Chrome 扩展开发中的 ES6 模块意外标记 https stackoverflow com questions 36796191因为这已经过时并且已经得到解答谷歌发布了一份新闻稿声称 Ch
如何传递元组列表作为 OpenAI Gym 中的动作空间？

从头开始创建 OpenAI Gym 环境时必须定义一个动作空间这是通过数据包空间中自己的数据结构来完成的有几种不同类型的空间如盒子离散等我有一个元组列表我想用作操作空间有没有办法做到这一点我本来可以使用spaces

如何传递元组列表作为 OpenAI Gym 中的动作空间？

如何传递元组列表作为 OpenAI Gym 中的动作空间？ 的相关文章

随机推荐

热门标签

如何传递元组列表作为 OpenAI Gym 中的动作空间？的相关文章