如何传递元组列表作为 OpenAI Gym 中的动作空间?

2024-01-08

从头开始创建 OpenAI Gym 环境时,必须定义一个动作空间。这是通过数据包“空间”中自己的“数据结构”来完成的。有几种不同类型的空间,如盒子、离散等。我有一个元组列表,我想用作操作空间。有没有办法做到这一点?

我本来可以使用spaces.Box(low=0, high=1, shape(4,12), dtype=np.int),但这却增加了很多违法行为。我愿意接受使用 space.Box 等解决方案,然后禁止/删除非法行为,但最好只插入我预先制作的元组列表。


OpenAI Gym 有一个元组动作空间 https://github.com/openai/gym/blob/master/gym/spaces/tuple.py。用法示例:

from gym import spaces
action_space = spaces.Tuple((
        spaces.Discrete(9),
        spaces.Discrete(5)))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何传递元组列表作为 OpenAI Gym 中的动作空间? 的相关文章

随机推荐

  • 无法在 Google 应用模拟器中添加 google 帐户

    我正在尝试实现我的第一个 Android C2DM 应用程序 我在添加谷歌帐户时遇到困难 我的机器位于代理后面 但我添加了一个包含代理 端口 用户名 密码详细信息的 APN 我可以使用浏览器进入谷歌帐户页面 我已经尝试过http和https
  • Java 序列化:readObject() 与 readResolve()

    这本书有效的Java和其他来源提供了关于如何以及何时使用的很好的解释readObject 使用可序列化 Java 类时的方法 这readResolve 另一方面 方法仍然有点神秘 基本上我发现的所有文件要么只提到两者之一 要么只单独提到两者
  • 如何在react.js中使用setProps

    我想打电话setProps从外部myComponent能够动态更改数据myComponent 我希望在更改组件的道具后 它将重新渲染自身 我正在尝试以下操作 var myComponent React createClass render
  • AWS Elastic mapreduce 似乎没有正确地将流媒体转换为 jar

    我有一个映射器和减速器 当我在管道版本中运行它们时 它们可以正常工作 cat data csv mapper py sort k1 1 reducer py 我使用了弹性mapreducer向导 加载了输入 输出 引导程序等 引导程序成功
  • Pyspark - 使用collect_list时保留空值

    根据接受的答案 in pysparkcollect set或collect list与groupby https stackoverflow com questions 37580782 pyspark collect set or col
  • 安装valgrind,启动时出现致命错误

    我正在安装 Valgrind 但遇到一些问题 我的平台信息 Linux xx ThinkPad X61 3 2 0 39 generic pae 62 Ubuntu SMP Wed Feb 27 22 25 11 UTC 2013 i686
  • 两个 kubernetes 集群之间的 mTLS

    我正在尝试在两个 kubernetes 集群中的两个应用程序之间获取 mTLS 而无需使用 Istio 的方式 通过其入口网关 我想知道以下内容是否可行 对于 Istio Likerd Consul 假设我们有一个 k8s 集群 A 和一个
  • React Router browserHistory 适用于本地,不适用于生产

    每当我在本地使用 browserHistory 时 我都没有问题 但是当我在发货之前测试它时 我会得到一个带有错误的空白页面 因此 当我用 hashHistory 替换 browserHistory 时 一切正常 但我丢失了漂亮的网址 未捕
  • Thymeleaf - 如何有条件地将选中的属性添加到输入

    如你所知 input组件有一个属性 checked是否将复选框标记为默认启用
  • Activity 从下到上滑动,但后台 Activity 不应移动

    我正在尝试将一项活动从底部滑动到顶部 这是我能够做到的 但是 当从底部滑动到顶部时 我的后台活动也滑动到底部 我想将后台活动保持在与原来相同的位置 以便新活动在打开时看起来像是后台活动的覆盖 这是我的slide in up xml
  • 在 R 中将点图保存为 pdf [重复]

    这个问题在这里已经有答案了 当在函数内执行此命令时 我无法将点图保存为 pdf 正常调用时效果很好 df lt data frame a runif 10 b runif 10 c runif 10 x 1 10 pdf test pdf
  • AIDL Client 未绑定到远程服务

    我正在尝试使用远程服务运行简单的乘法 我有 AIDL 服务器文件声明和定义方法 在AIDL中 我在服务器的包名称下复制了与服务器相同的AIDL文件 我已经给出了服务器服务的意图过滤器的操作 我的 AIDL 客户端代码仍然没有连接到该服务 A
  • 本地函数和 SOLID 原则 C#

    我知道从 C 7 0 开始我们可以创建局部函数 但这与实现良好设计模型的 SOLID 原则有何关系 我的意思是 这不会打破单一职责原则 在另一个函数中添加一个函数吗 我们可以委托这个简单的任务在另一个方法或另一个新类中进行计算吗 对于允许我
  • 如何将侦听器从 Fragment 传递到 DialogFragment

    我有我Fragment这就是如何DialogFragment The DialogFragment创建并显示TimePickerDialog dialog 我希望调用 Fragment 来实现imePickerDialog OnTimeSe
  • 如何在 C# 中以编程方式执行方法重载解析?

    当 C 编译器解释方法调用时 它必须使用 静态 参数类型来确定实际调用的是哪个重载 我希望能够以编程方式完成此操作 如果我有一个方法的名称 astring 声明它的类型 一个实例System Type 以及参数类型列表我希望能够调用标准库函
  • 使用 Github 推送提交时出错: fatal: 无法读取用户名

    自从几次以来 我在我的项目中使用 Github 当我想要推送提交时我遇到了问题 首先 我创建了一个存储库 然后我克隆了叉子 使用命令行git clone https github com 并且 在进行修改后 我已成功承诺 git commi
  • 强制所有区域使用相同的布局

    我有以下项目结构 视图 共享 布局 区域 Area1 Views ControllerName Index 区域 AreaN Views ControllerName Index 有什么办法强制所有区域都使用 Layout as a 基地布
  • Git 服务器挂钩:获取正在推送的文件的内容?

    我正在尝试在我的团队中强制执行一些编码规则 为此 我编写了许多客户端挂钩 这些挂钩可以正常工作 但现在我希望当开发人员将其修改推送到中央存储库时运行相同的检查 但它们不起作用 这是我想做的 我想逐行遍历推送的文件 检查是否违反编码约定 如果
  • Chrome 版本 61 中扩展中的 ES6 模块

    这与以下问题不是同一个问题Google Chrome 扩展开发中的 ES6 模块 意外标记 https stackoverflow com questions 36796191因为这已经过时并且已经得到解答 谷歌发布了一份新闻稿 声称 Ch
  • 如何传递元组列表作为 OpenAI Gym 中的动作空间?

    从头开始创建 OpenAI Gym 环境时 必须定义一个动作空间 这是通过数据包 空间 中自己的 数据结构 来完成的 有几种不同类型的空间 如盒子 离散等 我有一个元组列表 我想用作操作空间 有没有办法做到这一点 我本来可以使用spaces