Learning to Navigate in Cities Without a Map 理解

2023-10-27

问题定义
在真实世界中进行无定位辅助，类似于人直觉长距离导航。输入为当前的视觉输入和目标地点。输出就是接下来应该怎么走，才能到达目的地。PS：Navigation相比于planning来说更加粗糙，就是不需要具体到某个地点，而是一个大概的方向确定。
问题解决
使用DRL，定义状态：当前视觉输入；定义动作：五个离散动作，快慢向前，这个应该是由Google Map采集地图的摄像头确定的；奖励：最开始的是由当前agent的位置到目标距离的最短路径决定，成比例的，应该是距离越远，给的reward越小；另外走的步数会给予更高的奖励（我觉得走的步数越多，给予的奖励应该是更多加个负号，比较DRL的目标是最大化reward，步数越多可不是好事情，比如一直围绕某个建筑物，步数非常多，这不是我们希望看到的优化结果）输入的目标定义，这个定义的方法有很多，比如给GPS位置，给定目的地周围的视觉形态，这篇论文是使用周围五个最近的landmark确定的，landmark是确定的，任何一个地点周围五个landmark也是确定的，所以使用这种方法，是对目的地进行了一种编码表示，数据压缩吧。这个逼我给满分~
policy：P(a|s,g) 给定当前输入的图片和目的地的状态表示，接下来的动作；
value function：E(s,g) 在该状态下，已知目的地，它的期待奖励，这个东西是为了指导policy那块的network更快收敛的。
训练心得
Deepmind的paper就是看上去很高大上，然后更多是提出问题，给出benchmark，自己复现吧。当然，考虑到需要的计算量和实用性，更多小伙伴应该就是看看它训练的时候网络和技巧，定义DRL怎么做的，很少会去复现这些东西。
迁移能力：
使用子网络，来实现迁移学习。

加速收敛：
使用子任务提供更多约束
训练网络使用IMPALA和A3C都可以。

Ref：
https://deepmind.com/blog/learning-to-navigate-cities-without-a-map/
https://papers.nips.cc/paper/7509-learning-to-navigate-in-cities-without-a-map.pdf

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

working

DRL

Navigation

Learning to Navigate in Cities Without a Map 理解的相关文章

在 Visual Studio 中调试/导航 JS 代码

有没有办法启用f12 or 查找所有参考文献 across JavaScript文件在视觉工作室我在用着要求JS在我的 SPA 中注册 js 文件我在用着骨干JS以及有什么技巧可以像使用 C net 代码一样在 Visual Stud
solr 中的距离分面 - 如何生成在给定距离范围内搜索的链接

在 Solr 中生成距离范围或桶的分面相当简单 http wiki apache org solr SpatialSearch How to facet by distance http wiki apache org solr Spa
如何在 Jetpack Compose 中将图像从一个可组合函数传递到另一个可组合函数？

我正在开发一个带有文本和图像的应用程序在一个可组合项活动上图像与文本一起显得很小如缩略图这个想法是当用户触摸单击图像时导航组件会将用户带到另一个可组合项活动中该图像的全屏版本这有可能吗如果是怎么办提前致谢您
导航到目的地时仅创建一个片段实例（android）

我正在使用导航组件导航时如果片段已经存在于后台堆栈中我不想创建新的片段实例并弹出前面已经存在的片段 findNavController navigate RequestTransferFragmentDirections actio
有没有办法为 NavigationLink 添加额外的功能？斯威夫特用户界面

我想向 NavigationLink 添加一个额外的功能示例代码是这样的 struct ContentView View func yes print yes var body some View NavigationView Navig
CSS Jquery 垂直导航菜单与水平子菜单

我想创建一个像这样的导航菜单 main item1 main item2 sub item1 sub item2 sub item3 main item3 main item4 我现在看到的是这样的 main item1 main item
Bootstrap 3 导航栏 - 无法正确折叠

导航栏曾经正常工作但我做了一些更改它不再工作当我将窗口缩小时会显示切换方块但是当我单击它时什么也没有发生 Note 导航栏在全屏下工作正常它只是在小窗口中当我单击切换按钮时下拉菜单不会出现想知道是否有人知道如何解决它这
单页网站上复杂的活动状态导航

HTML div class logo ribbon a href top a div
Android Studio：导航 xml 编辑和设计视图出现问题

我们一直在项目中使用导航组件但偶然发现了一个似乎是我们的项目和 JetBrains Android 插件特有的问题我无法确定它开始发生的确切时间点但我在 AS 3 2 发布后注意到了它该项目构建得很好但是在编辑导航 XML 时自
React Native 导航显示白屏

使用反应本机导航进行编译时出现白屏请问为什么会这样我似乎没有收到任何错误代码什么也没有我只看到一个白屏为什么会这样呢我的代码看起来像这样表明到目前为止我似乎没有任何错误 Here is what the Error seems
CSS / HTML 导航和徽标位于同一行

我不知道如何将它们放在同一条线上 http codepen io anon pen dovZdQ http codepen io anon pen dovZdQ div class navigation bar div img src lo
为什么 WebBrowser Document Completed() 会触发两次？

嗯我正在使用一个简单的网络浏览器控件来浏览页面因此我需要在执行此操作时更改表单的文本我在用着 private void webBrowser1 DocumentCompleted object sender WebBrowserDoc
Android 中的导航抽屉和 Activity

我正在尝试中给出的导航抽屉幻灯片菜单本教程 http www androidhive info 2013 11 android sliding menu using navigation drawer 上面的链接和我的链接的区别在于我
如何对很多很多页面进行页面导航？对数页面导航

显示许多页面的页面导航的最佳方式是什么最初这是作为操作提示发布的我的答案包含在问题中我现在将我的答案分成下面的答案部分更具体假设您要向用户显示一组记录这些记录分为固定大小的页面例如 Google 搜索的结果如果只有几个
如何使用 FLUTTER go_router 弹出上下文？

如何使用 flutter go router 返回上一个屏幕如何弹出上下文目前我只是将一个新屏幕添加到堆栈中无论我想返回还是前进 onTap gt context go secondPage 我用过 context pop 但它会抛
Jetpack Compose：嵌套导航，在嵌套路径中使用底部栏导航

我的应用程序具有以下结构并且由于路线 B 有自己的底部导航栏因此有自己的 NavHost 我如何从屏幕 C 从选项卡栏打开导航到路线 A Nested Route onboarding route startDestination s
如何从另一个 JSF 页面按下某个按钮返回到同一个 JSF 页面

我有两个 JSF 页面假设 A 和 B 从这两个页面 A 和 B 我可以导航到页面 C 现在页面 C 中有一个按钮确定按钮单击它应该导航回 A 或 B 具体取决于从哪里 A 或 B 调用页面 C 任何帮助将不胜感激利用视图参数的解决
Flutter中的pushReplacementNamed和popAndPushNamed有什么区别？

The NavigatorState班级在Flutter navigator dart有 2 种具有类似行为的方法有什么区别pushReplacementNamed and popAndPushNamed在颤振中 pushReplacem
无法找到与 from-view-id '/pages/index.xhtml' 匹配的导航案例

我在 JSF 页面之间导航时遇到问题我的大部分导航都是在您单击命令按钮时发生的命令按钮的操作返回一个字符串我的登录页面是我的欢迎页面它位于我的 web xml 中
从 ADF Faces JSF 1.2 中的托管 bean 构造函数导航

是否可以从托管 bean 的构造函数导航到另一个页面视图如果发生任何异常我希望进行此重定向我尝试了很多方法 Try 1 getFacesContext responseComplete getFacesContext getAppl

随机推荐

AXI Uartlite IP AXI驱动代码

说明 AXI Uartlite IP AXI驱动代码根据博客 Xilinx AXI Uartlite IP核的使用有问题联系微信 Crazzy M 效果简单展示 module uart parameter UART REG NUM 2
CAP 可能是CAP理论的最好解释

一篇非常精彩的解释CAP理论的文章翻译水平有限不准确之处请参考原文还请见谅 Chapter 1 Remembrance Inc Your new venture Last night when your spouse apprecia
centos7 监控文件内容变化打印

tail命令可以输出文件末尾的内容至于输出多少看你指定多少最少是10行使用一下命令可以伴随文件内容的增长实时的查看文件内容的变化 tail f file name
Springboot + MySQL+ JPA Ⅰ 项目新建

最近在学习JPA的在此跟大家分享一下持续更新中开发工具IDEA 一 new project 选择 Spring Initializr Next 二自定义项目名我这边时smjdemo 三选择需要依赖的包 Lombok 本人喜欢用
使用代理服务获取网页源代码测试

import requests url 输入测试访问网址 headers User Agent Mozilla 5 0 Windows NT 10 0 Win64 x64 AppleWebKit 537 36 KHTML like Geck
一键开启mysql的审计功能（无需安装插件）

本文所使用数据库为mysql8 0 5 x版本的mysql上没试过一下步骤调用审计功能无需下载任何插件两行命令就能搞定一首先查看审计配置情况 show global variables like log timestamps sho
Spring Boot 笔记 - 注解(四)-- @SpringBootApplication

Many Spring Boot developers like their apps to use auto configuration component scan and be able to define extra configu
二、Java代码实现冒泡排序

冒泡排序描述关键相邻的两个元素进行比较依次比较数组中相邻两个元素大小若 a j gt a j 1 则交换两个元素两两都比较一遍就是一轮冒泡结果是一轮冒泡后最大的元素排到了最后重复以上的步骤直到整个数组有序就行了冒泡的优化
字典序算法详解

一字典序字典序就是按照字典中出现的先后顺序进行排序 1 单个字符在计算机中 25个字母以及数字字符字典排序如下 0 lt 1 lt 2 lt lt 9 lt a lt b lt lt z 比如在 python 中 0 lt 9 l
R语言初学者必备的10个实用函数

R语言初学者必备的10个实用函数 R语言是一种流行的数据分析和统计建模工具它提供了丰富的函数和库来处理和分析数据对于初学者来说掌握一些常用的实用函数将使他们更加高效地使用R语言进行数据处理和可视化本文将介绍10个初学者必备的实用函数
CPU上下文切换

文章目录 CPU上下文切换什么是CPU上下文进程上下文切换特权模式切换进程上下文切换与系统调用的区别什么时候会切换进程上下文线程上下文切换中断上下文切换监控上下文切换 vmstat pidstat 减少上下文切换 CPU上下
生命在于学习——网站Getshell的方法

PS 本篇文章仅用于学习笔记记录不可用于其他用途一通用getshell方法 1 任意文件上传 1 注意编程语言 asp aspx php jsp 2 上传成功但是访问直接下载文件以文本展示原因文件没有被解析 3 上传成功蚁剑
Burp Suite软件常用模块

目录 1 Proxy 代理模块 2 Repeater模块请求重放 3 Intruder模块入侵自动化攻击 Intruder的4种攻击模式 1 Sniper模式狙击手模式 2 Battering ram模式攻城锤模式
解决HC05蓝牙模块主从配对失败及AT模式设置方案

解决HC05蓝牙模块主从配对失败及AT模式设置方案原创文章转载请注明本文为电脑端配置关于连线关于串口调试工具关于AT指令与蓝牙模块配对关于测试验证原创文章转载请注明本文为电脑端配置最近在做一个开源的Vorpal Hex
HBase拆分策略

转载自 http blog javachen com 2014 01 16 hbase region split policy html Region 概念 Region是表获取和分布的基本元素由每个列族的一个Store组成对象层级图如
图像相关算法整理

图像相关算法整理 1 HE算法灰度直方图均衡算法原理将原始图像的灰度直方图从比较集中地某个灰度区间变成全部灰度范围内的均匀分布步骤 1 遍历每一帧图像中的所有像素记录每个灰度值出现的像素个数 2 统计每个灰度值占总像素的百分比即
C语言占位符格式占位符

常用占位符 d i 代表整数 f 浮点数 s 字符串 c char p 指针 fL 长log e 科学计数法 g 小数或科学计数法 C语言中的格式占位符 a A 读入一个浮点值仅C99有效 c 读入一个字符 d 读入十进制整数 i 读入十
Dev-C++使用教程，将你编写第一个C语言代码，实现输出Hello world

安装好Dev C 软件方法步骤 1 打开安装好的Dev C 软件初始界面如下 2 然后选择左上角文件依次选择新建 gt 源代码或者使用快捷键ctrl n 新建一个项目就可以编写代码了 3 这里以输出Hello world 为例
java基础

java命名规范驼峰命名见名知意 1 项目名全部小写 2 包名全部小写以域名开头 3 类名首字母大写如果类名由多个单词组成每个单词的首字母都要大写如 public class MyFirstClass 4 变量名方法名首字母小
Learning to Navigate in Cities Without a Map 理解

问题定义在真实世界中进行无定位辅助类似于人直觉长距离导航输入为当前的视觉输入和目标地点输出就是接下来应该怎么走才能到达目的地 PS Navigation相比于planning来说更加粗糙就是不需要具体到某个地点而是一个大概的方

Learning to Navigate in Cities Without a Map 理解

Learning to Navigate in Cities Without a Map 理解 的相关文章

随机推荐

热门标签

Learning to Navigate in Cities Without a Map 理解的相关文章