识别图片地点_地点识别

2023-05-16

识别图片地点

Imagine this scenario: you catch-up with a friend who’s returned from a trip to India. You’ve traveled extensively through India and recommended your friend to holiday there. When you meet, your friend tells you about having seen a monkey wearing a red hat in front of a temple. You remember seeing that very same monkey several years ago! You whip out your phone to find the photo as proof. This is how the next few minutes of conversation might sound: “I know it’s here somewhere! No, no. It was before we visited the waterfall. Hmm. It was after the beach, I’m pretty sure…” Frustrating, right?

想象一下这种情况:您遇到了一个从印度之旅中回来的朋友。 您已经遍历印度,并推荐您的朋友去印度度假。 见面时,您的朋友告诉您有关看到一只猴子在庙宇前面戴红色帽子的故事。 您还记得几年前见过同一只猴子! 您拨出手机以查找照片作为证据。 接下来的几分钟可能是这样的:“我知道它在这里! 不,不。 那是在我们参观瀑布之前。 嗯 是在海滩之后,我敢肯定……”令人沮丧,对吧?

Holidays usually last a week or two and involve taking continuous holiday snaps. Finding a single image on your phone taken some time ago can be tricky. This can be frustrating, but not impossible. We intuitively replay a sequence of mental images that provide information about our location at any one point in time.

假期通常持续一两个星期,并且需要连续进行假期。 在手机上查找某段时间前拍摄的单个图像可能很棘手。 这可能令人沮丧,但并非不可能。 我们直观地重播一系列心理图像,这些图像可提供有关我们在任何时间点的位置的信息。

地点识别 (Place Recognition)

This recognition and recall of previously seen information is what makes up the problem of place recognition. Finding the holiday snap of that one monkey wearing a red hat on your phone involves the same mental navigation. As you thumb through images, your mind goes back in time and mentally replays the duration of your holiday, localizing when and where you saw the monkey.

对先前看到的信息的这种识别和回忆是构成位置识别问题的原因。 找到那只猴子在手机上戴红色帽子的假日快照涉及相同的心理导航。 当您翻阅图像时,您的思维会回到过去,并在心理上重播假期的时间,从而确定您何时何地看到了猴子。

Here’s another way of explaining it. When you give someone directions to a location, it’s common to say something like: ‘Go straight ahead until you see the famous burger place, take a left and then you’ll see a pharmacy right in front of you. Take a right there….’. All this information is useless if they are unable to match what they see to what you described.

这是另一种解释方式。 当您向某人指示某个地点的路线时,通常会说类似这样的话:“直走,直到看到著名的汉堡店,向左走,然后您会在眼前看到一家药房。 在那儿右转…。'。 如果他们无法将看到的内容与您描述的内容相匹配,则所有这些信息都将毫无用处。

更大范围 (At Larger Scales)

Now, imagine if your mobile phone never stopped capturing images, day and night. It would be virtually impossible to navigate through all the content to find one image of a monkey wearing a red hat from a sequence of holiday snaps taken months or years ago. This is precisely the problem autonomous vehicles have to solve. In place of photos on a mobile phone, these robots must make sense of a continuous stream of video sequences (equivalent to millions of images) captured while in motion throughout their operational lifetime.

现在,想象一下您的手机是否昼夜不停地捕获图像。 从几个月或几年前拍摄的一系列假日快照中,几乎不可能浏览所有内容来找到一个戴着红色帽子的猴子的图像。 这正是自动驾驶汽车必须解决的问题。 这些机器人必须替代移动电话上的照片,才能感觉到在其整个使用寿命中运动时所捕获的连续视频序列流(相当于数百万个图像)。

For robots, successful localization over large scale observations happens through the process of, you guessed it, scalable place recognition.

对于机器人来说,您可以猜到它是可扩展的位置识别的过程,因此可以成功进行大规模观测的本地化。

机器人像人类一样解决问题 (Robots Problem-Solve Like Humans)

As humans, we carry a representation of the world in our heads all the time. It’s a similar situation for autonomous vehicles. In order to make effective decisions ‘on the go’, self-driving cars must make sense of a never-ending sequence of images as quickly as possible.

作为人类,我们所向披靡的表现在我们头上所有的时间 。 无人驾驶汽车也有类似情况。 为了在旅途中做出有效的决定,自动驾驶汽车必须尽可能快地理解无休止的图像序列。

Humans and robots also share an ability to access outside help in the form of GPS navigation/localization tools. GPS, however, is not accurate enough for all tasks in all scenarios — underwater, underground, on Mars! This is problematic when it comes to the reliability of autonomous cars and their ability to make accurate, real-time decisions. Fortunately, if robots, including automated vehicles, have seen something before, this information should help self-localization.

人类和机器人还具有以GPS导航/定位工具的形式访问外部帮助的能力。 但是,GPS在所有情况下(水下,地下,火星上)的所有任务都不够准确! 当涉及到自动驾驶汽车的可靠性及其做出准确,实时决策的能力时,这是有问题的。 幸运的是,如果机器人(包括自动驾驶汽车)以前见过某物,则此信息应有助于自我定位。

Think back to a time when you were lost in a new city. After randomly walking around, you suddenly see a building you noticed earlier, maybe because of its color or size. Thanks to the place recognition algorithm running in your head, you work out where the building is situated in relation to your hotel, allowing you a safe return. We don’t consider a single image or scene to recognize where we are. We make sense of things by playing back a sequence of connected images (and memories) to navigate back to your hotel.

回想一下你在一个新城市迷路的时候。 随机走动后,您可能会突然看到先前注意到的建筑物,可能是因为其颜色或大小。 得益于大脑中运行的位置识别算法,您可以算出建筑物相对于酒店的位置,从而安全返回。 我们不会考虑单个图像或场景来识别我们的位置。 我们通过播放一系列相连的图像(和记忆)来导航回您的酒店,从而使事情变得有意义。

As part of the Australian Centre for Robot Vision, we’ve applied this same ‘human’ strategy to robots. We use scalable place recognition to match what a robot is actively seeing to millions of previously observed images. Individual images may not be informative enough for localisation. However, gathering bits and pieces of evidence from each image and using that to reason over sequences has shown great promise for localisation, even when the appearance of images changes due to weather, time of day, etc.

作为澳大利亚机器人视觉中心的一部分,我们已将相同的“人类”策略应用于机器人。 我们使用可缩放的位置识别来将机器人正在主动看到的内容与数百万个先前观察到的图像进行匹配。 单个图像可能不足以提供本地化信息。 但是,即使当图像的外观由于天气,一天中的时间等发生变化时,从每幅图像中收集点点证据并用于对序列进行推理也显示出了很好的定位潜力。

机器学习可以拯救吗? (Machine learning to the rescue?)

While machine learning is used to solve most problems in the field of robotics, our focus on sequential reasoning takes a slightly old-fashioned route. The good news, as shown in our work at 2019 ICCV, is that sequential reasoning outperforms bespoke deep learning-based approaches to solving the problem of scalable place recognition for robots. This surprised us as well!

虽然机器学习被用来解决机器人领域的大多数问题,但我们对顺序推理的关注却有些过时。 正如我们在2019 ICCV上的工作所示,好消息是顺序推理胜过定制基于深度学习的方法来解决机器人可扩展位置识别的问题。 这也让我们感到惊讶!

A big limitation of current deep learning methods is their inability to generalize to unseen scenarios. By contrast, we have shown our method works ‘out of the box’ for a wide range of different environments trialed. Additionally, because there are no learned components in sequential reasoning, our methods is not limited by scope and can be informed by millions of images as soon as they are seen.

当前深度学习方法的一大局限性在于它们无法推广到看不见的场景。 相比之下,我们已经展示了我们的方法可以在各种不同的环境中“开箱即用”地工作。 此外,由于在顺序推理中没有学习到的组成部分,因此我们的方法不受范围的限制,一旦被看到,便可以被数百万张图像告知。

未来之路:后续步骤和挑战 (The Road Ahead: Next Steps and Challenges)

Autonomous cars will soon become a reality on our roads. To navigate safely, these future robots will need to see and understand countless thousand images each time they drive on a road.

自动驾驶汽车将很快在我们的道路上成为现实。 为了安全导航,这些未来的机器人每次在道路上行驶时,都需要查看和理解无数的图像。

There are still challenges to overcome. For example, as humans, we have little problem working out where we are, even in changing conditions. In dark or stormy conditions, we can still look out the window of our car during a stormy dark night and still be able to localise where we are. Robots, however, still find it hard to interpret images when the appearance of a location changes due to external/environmental factors (light, weather, obstructions etc).

仍然需要克服的挑战。 例如,作为人类,即使在不断变化的环境中 ,我们几乎也不会遇到问题。 在黑暗或暴风雨的条件下,我们仍然可以在暴风雨的漆黑夜里看着车窗外,仍然可以定位我们所在的位置。 但是,当位置的外观由于外部/环境因素(光线,天气,障碍物等)而发生变化时,机器人仍然难以理解图像。

A more immediate problem to overcome is storage. All the images seen by an autonomous vehicle need to be stored in memory to enable sequential reasoning about them.

需要解决的一个更直接的问题是存储 。 无人驾驶汽车看到的所有图像都需要存储在内存中,以便能够对其进行顺序推理。

The current challenge for us is to come up with a ‘life-long place recognition’ method that will continue to operate under every conceivable circumstance — no matter the weather or time of day — and across large scales. We want to combine what we know presently about our location to make predictions about where we will be in the next instant in time. Using this information, we can then limit the set of images that we need to reason over. The reasoning behind it goes something like this. If I know I am somewhere in the Adelaide CBD, it’s highly unlikely (actually, impossible in the absence of teleportation) that, in the next moment, I’ll find myself somewhere in Perth. Therefore, let’s only look at images close to my current location and mark everything else as ‘not likely’.

当前我们面临的挑战是提出一种“ 终生位置识别 ”方法,该方法将在各种可能的情况下(无论天气或一天中的时间如何)在大范围内继续运行。 我们想结合我们目前对位置的了解,对下一个瞬间的位置做出预测 。 然后,使用此信息,我们可以限制需要推理的图像集。 其背后的原因是这样的。 如果我知道自己在阿德莱德中央商务区的某个地方,那么极不可能(实际上,在没有远距离交通的情况下是不可能的),在下一刻,我会发现自己在珀斯的某个地方。 因此,让我们仅查看靠近我当前位置的图像,并将其他所有内容标记为“不太可能”。

We are hopeful that by combining sequential analysis with memory management, we will be able to achieve a method that enables an autonomous vehicle to localise itself over arbitrarily large image collections.

我们希望,通过将顺序分析与内存管理相结合,我们将能够实现一种方法,使自动驾驶汽车能够将自己定位在任意大的图像集合上。

Imagine this future scenario: autonomous cars that can work together to capture a real-time snapshot of what the world looks like at any given moment and how it changes from day to day. Such large-scale place recognition methods could enable precise localization for each self-driving car by looking at the world through the combined eyes of all cars.

想象一下这种未来情况:自动驾驶汽车可以协同工作,以实时捕获世界在任何给定时刻的样子以及其每天如何变化的快照。 这样的大规模位置识别方法可以通过用所有汽车的组合眼睛观察世界来实现每辆自动驾驶汽车的精确定位。

Exciting times, indeed!

确实令人兴奋的时代!

翻译自: https://towardsdatascience.com/how-do-robots-find-themselves-in-an-ever-changing-world-19eda1956c56

识别图片地点

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

识别图片地点_地点识别 的相关文章

  • OpenCV4.7.0、FFmpeg5.1 Nvidia GPU视频硬解码

    1 环境 操作系统 xff1a Ubuntu18 04 GPU xff1a Nvidia GeForce RTX 2080TI 2 安装2080TI驱动 请参考文章 158条消息 NVIDIA GPU 驱动程序安装 洪流之源的博客 CSDN
  • MQ-2烟雾传感器的使用

    一 MQ 2烟雾传感器简介 MQ 2 烟雾传感器采用在清洁空气中电导率较低的二氧化锡 SnO2 xff0c 属于表面离子式N型半导体 当MQ 2烟雾传感器在200到300摄氏度环境时 xff0c 二氧化锡吸附空气中的氧 xff0c 形成氧的
  • HC-SR04超声波测距模块介绍

    超声波简介 超声波是由机械振动产生的 可在不同介质中以不同的速度传播 具有定向性好 能量集中 传输过程中衰减较小 反射能力较强等优点 超声波传感器可广泛应用于非接触式检测方法 它不受光线 被测物颜色等影响 对恶劣的工作环境具有一定的适应能力
  • 液晶12864显示图片

    液晶12864简介 12864是128 64点阵液晶模块的点阵数简称 基本参数 1 低电源电压 xff08 VDD 43 3 0 xff5e 43 5 5V xff09 2 显示分辨率 128 64 点 3 内置汉字字库 xff0c 提供8
  • 液晶12864显示字符

    液晶12864简介 12864是128 64点阵液晶模块的点阵数简称 基本参数 1 低电源电压 xff08 VDD 43 3 0 xff5e 43 5 5V xff09 2 显示分辨率 128 64点 3 内置汉字字库 xff0c 提供81
  • Bash:command:未找到命令

    前言 在Linux系统中 xff0c 经常会遇到这样的问题 xff1a bash xff1a command xff1a 未找到命令 这个真的很烧脑 xff0c 遇到的次数多 xff0c 在网上也查了好多 xff0c 答案五花八门 xff0
  • S32K148----SDK笔记----CAN收发

    文章目录 前言建立工程ProcessorExpert配置发送CAN报文CAN接收中断工程代码微信公众号 前言 S32K148自带3路CAN 官方的SDK给了can pal的例程 本文更基础一点 直接用flexcan组件相关的函数 CANFD
  • TC397开发板KIT_A2G_TC397_5V_TFT简介

    开发板简介 照片资料调试资源供电扩展CAN 用的开发板是KIT A2G TC397 5V TFT 其实更推荐KIT A2G TC397 3V3 TFT 售价 1 670 59 照片 正面 背面 5V的板子和3 3V的板子主要是下面几个器件不
  • AURIX TC397 Flash编程

    目录 Flash编程基础知识Flash Programming微信公众号 Flash编程基础知识 参考 Flash Programming 1 for KIT AURIX TC397 TFT 本例展示了如何烧写PFLASH Program
  • 周立功USBCAN-II的Python调用

    目录 USBCAN II环境配置CAN收发运行zcanpro微信公众号 USBCAN II USBCAN II 或者叫USBCAN2是周立功 致远电子 比较经典的USB接口的CAN卡 有两路标准CAN 最高支持到1M波特率 单用USB就可以
  • 拒绝丧偶式育儿,正确「养育男孩」

    前言 如何养育男孩 xff1f 当写下这几个字的时候 xff0c 我已在心里默念了好几遍 xff0c 不知道该如何回答 在2年前的某个凌晨2点18分 xff0c 第一声婴儿地啼哭 xff0c 护士告诉我 是个男孩 开始 xff0c 我就买了
  • Pandoc 多Markdown转单PDF

    文章目录 Pandoc 简介Pandoc 安装pandoc latex template字体安装Powershell 脚本Ubuntu PandocMarkdown 合并 Pandoc 简介 Pandoc 免费的文档转换器 支持常见的各种文
  • SocketCAN 命名空间 VCAN VXCAN CANGW 举例

    文章目录 NAMESPACESocketCAN最新 can utils 安装VCAN 举例VXCAN 举例CANGW 举例参考 NAMESPACE namespaces 命名空间 将全局系统资源包装在抽象中 使命名空间中的进程看起来拥有自己
  • slcan 协议 脚本 测试

    文章目录 slcan 协议kernel slcancan utils slcanptycan utils slcandcan utils slcan attachpython slcan slcan 协议 slcan 基于文本 ASCII
  • Notepad++直接编译运行Java

    安装Notepad 43 43 和JDK xff08 略 xff09 xff1b Notepad 43 43 的菜单栏 xff1a 插件 gt Plugin Manager gt Show Plugin Manager xff0c Avai
  • 几款自带编码器的直流电机

    不少小伙伴做两轮自平衡车或者机器人或者各种比赛时 xff0c 经常需要用到直流电机带编码器 xff0c 有的自己可以做外置的编码器 xff0c 但是否有自带编码器或码盘的直流电机 xff1f 答案是肯定的 xff0c 这里就推荐几款带编码器
  • 四大编辑器 -- Sublime, Atom, VS Code和Notepad++

    主要介绍3个跨平台的 Sublime Atom VS Code 一个Windows的 Notepad 43 43 Sublime Text 官网 https www sublimetext com Sublime Text is a sop
  • AD绘制四层板

    原理图导入PCB后 默认是双层板 可以Design gt Layer Stack Manager 点击Top Layer 然后点击Add Plane 负片层 电脑上在此层走线表示把铜挖空 这里把一整层都当作GND 非GND的过孔打到这一层
  • 群晖(Synology)配置 NAS + 软路由

    文章目录 背景结论软路由配置 背景 老板上周兴致勃勃的找到我 说Macbook存储不够用了 帮他找个存东西的 不是移动硬盘 我也很懵逼 我搞活动捡便宜充的百度网盘超级会员 觉得自己很是尾巴翘上天的土豪了 但想到老板的身价 又不太清楚macb
  • 各种类型的Writable

    各种类型的Writable xff08 Text ByteWritable NullWritable ObjectWritable GenericWritable ArrayWritable MapWritable SortedMapWri

随机推荐

  • C++ strtok的用法

    size 61 large align 61 center strtok的用法 align size 函数原型 xff1a char strtok char s char delim 函数功能 xff1a 把字符串s按照字符串delim进行
  • 读《遇见未知的自己》笔记

    为什么我不快乐 xff1f 为什么我不能拥有自己想要的生活 xff1f 此刻屏幕前的你 是否想过 xff0c 自己为什么会出现这种情况呢 xff1f 张德芬在 遇见未知的自己 一书给出了解释 xff1a 我们人类所有受苦的根源就是来自不清楚
  • PX4飞控问题汇总

    接触PX4飞控代码一年多了 xff0c 代码都是模块化 开发起来比APM的方便 xff0c 使用过程中也出现过各种怪异问题 xff0c 用的硬件是V5 nano 和V5 43 xff0c 测试的代码版本是1 9和1 10 今天总结一下遇到过
  • Sumo 搭建交叉路口交通流仿真平台

    Sumo安装 注意事项 xff1a 需要工具的使用需要环境变量的设置 需要包含文件Sumo安装路径下的bin和tools Sumo配置文件 Sumo中项目的配置文件的组成如下所示 节点文件 图 1 节点及边的拓扑图 Node的属性主要有id
  • OpenWRT 各种烧录方式及量产(三)

    界面烧录 不更新uboot 电脑连接WIFI xff08 或者通过网线连接电脑与路由器 xff09 通过浏览器访问路由器管理界面 xff0c 进行升级 注意不要断电 xff01 xff01 xff01 xff08 断电只能通过tftp方式恢
  • 华为手机root

    首先手机已解锁 xff42 xff4c 此方法针对 华为手机 可使用 xff0c 其他手机没有测试 xff0c 但应该也可以 官方的twrp没有对mate xff19 进行配适 xff0c 可以使用奇兔 twrp 提取码 ax6d 如果你没
  • 阿里云ubuntu 16.04 Server配置方案 2 远程控制桌面

    通过远程控制 xff0c 更好的管理服务器 1 XRDP远程控制 为了更好的远程管理 xff0c linux一般情况都用VNC进行远程连接 xff0c 如 TightVNC X11VNC ReadVNC等 Xrdp 是开放原始码的远端桌面通
  • 自顶向下(top down)简介

    无论是在实际生活中还是在学术问题上 xff0c 复杂的问题比比皆是 xff0c 当我们对此类问题毫无头绪的时候 xff0c 自顶向下 xff08 top down xff09 为我们提供了一种可靠的解决方法 自顶向下法将复杂的大问题分解为相
  • SecureCRT图形界面(通过设置调用Xmanager - Passive程序)

    首先 xff0c 在服务器进行设置 如果服务器是图形化界面启动的 xff0c xhost 43 命令可以不用执行 root 64 test xhost 43 xhost unable to open display 34 34 设置disp
  • 一种GPS辅助的多方位相机的VIO——Slam论文阅读

    34 A GPS aided Omnidirectional Visual Inertial State Estimator in Ubiquitous Environments 34 论文阅读 这里写目录标题 34 A GPS aided
  • docker & LXC

    目录 一 LXC1 了解Docker的前生LXC2 LXC与docker的关系3 与传统虚拟化对比4 LXC部署4 1 安装LXC软件包和依赖包4 2 启动服务4 3 创建虚拟机 5 LXC常用命令 二 doker1 什么是docker2
  • curl命令总结

    curl no cache d Users Administrator Desktop curl 7 73 0 3 win64 mingw bin gt curl Iv http abc gkmang cn 8081 index php l
  • 使用FastJSON 对Map/JSON/String 进行互转

    前言 Fastjson是一个Java语言编写的高性能功能完善的JSON库 xff0c 由阿里巴巴公司团队开发的 1 主要特性 高性能 fastjson采用独创的算法 xff0c 将parse的速度提升到极致 xff0c 超过所有json库
  • ai面向分析_2020年面向企业的顶级人工智能平台

    ai面向分析 In the long term artificial intelligence and automation are going to be taking over so much of what gives humans
  • 回答问题人工智能源码_回答21个最受欢迎的人工智能问题

    回答问题人工智能源码 Artificial intelligence sets the stage for a new era of solutions to be made with computers It allows us to s
  • 人工智能药物设计_用AI革新药物安全

    人工智能药物设计 介绍 Introduction Advances in the life sciences have brought about a transformative impact on healthcare with lif
  • 数据集分为训练验证测试_将数据集分为训练集,验证集和测试集

    数据集分为训练验证测试 测试我们的模型 Testing Our Model Supervised machine learning algorithms are amazing tools capable of making predict
  • 深度学习 场景识别_使用深度学习进行自然场景识别

    深度学习 场景识别 Recognizing the environment in one glance is one of the human brain s most accomplished deeds While the tremen
  • 使用Pytorch的LSTM文本分类

    Photo by Christopher Gower on Unsplash Christopher Gower在 Unsplash上的 照片 介绍 Intro Welcome to this tutorial This t
  • 识别图片地点_地点识别

    识别图片地点 Imagine this scenario you catch up with a friend who s returned from a trip to India You ve traveled extensively