机器视觉最火应用领域

2023-11-19


1、图像和视频识别

人工神经网络领域最重要的进展之一出自 ImageNet。ImageNet收集了 1400 万标签图像并于2009年发布。

ImageNet挑战赛要求参赛者设计一个能够跟人类一样对照片进行分类的算法,但一直没有出现获胜者。直到2012年,一个使用深度学习算法的参赛队伍取得了显著优于以往尝试的结果。

今天,人们与计算机视觉产生交互的最常见的几种方式包括图像自动标记和拍照面部识别等,都是基于ImageNet获胜的技术。这些应用有助进行网上购物可视化搜索、自动标注社交媒体照片等特定任务。

除了图像识别外,这项新科技也推动了照片编辑技术的发展。图像分割算法是计算机视觉的组成部分,可以帮助机器将一张图片分成不同的部分,例如识别背景和前景中的人物。用户可迅速编辑照片,达到专业修图的效果。

视觉识别能力目前也应用于视频。计算机视觉算法可以查看摄像机的视频流,并且标记重要部分,这样人们就无需反复回看长达数小时的视频。

了解视频中人物的情绪是一项研究人员正在开展的工作,不过有些机构已经率先采用了这类技术。例如坐落在中国东部浙江省的杭州第十一中学,正在尝试用摄像头追踪学生的课堂行为,这些摄像头被称为“慧眼”。

2、让机器人拥有正常视力

机器人在 20世纪 60年代开始投入制造业使用,这些装置可以提升重物,执行重复性任务,并且可以一次进行数小时的精确测量,从而轻松地胜过人类。

斯德哥尔摩 KTH 皇家理工学院的机器人学教授 Danica Kragic 说:“这一领域始终关注的是建造出那些可以完成人类无法完成任务的机器人。”

Kragic表示,因为人类有40% 的大脑致力于处理视觉信息,如果要创造能够模仿并参与我们世界的机器,了解它们在多大程度上需要视觉信息是非常重要的。“我们人类在做任何事情时都会自然而然地使用视觉反馈,” Kargic说。

能够处理视觉信息的机器可以在工厂中完成更复杂的工作,甚至进入了我们的家庭。某些技能(例如,拾取会因压力而改变形状的柔软物品)对机器人来说仍然是遥不可及的。

这是因为人类在观察时,获得的不仅仅是视觉信息;我们还会获得有关物体物理属性的线索,以及与之交互所需要的物理知识。机器需要能够收集这类信息,才能像人类一样毫不费力地穿行在物理世界中。

“在五官感觉当中,视觉是最重要的,因为它赋予了人类理解这个复杂世界的能力。”贾佳亚说,“同样地,计算机视觉就是为了让计算机能够像人类一样观察环境并能跟环境互动。”

赋予机器人能够更好地了解世界的传感器是该技术的下一个迭代,它可能让机器人完成在今天尚无法实现的任务。

3、自动驾驶汽车

自动驾驶汽车是 AI 开发领域中获得资金最充裕、最受关注的领域之一,全面了解世界对于自动驾驶汽车(AV) 也是至关重要的。

除了摄像头,大多数无人驾驶汽车使用激光雷达、雷达、GPS 和感知算法进行导航。 

“我们使用的许多算法都来自计算机视觉,但现在它不仅仅是关于摄像头数据,”多伦多大学副教授兼优步多伦多高级技术集团负责人 Raquel Urtasun 介绍说。“我们想给汽车装上的,不仅仅是我们的眼睛。”

像优步这样的公司希望到 2020 年前能实现自动驾驶汽车上路和载客。

这些汽车只会在预先选定的路线上行驶,或需要有人坐在驾驶员座位上,以便在出现任何问题时能够手动接管。

这项技术最终的目标是实现真正自主,使得乘坐者除了注意路况外,还可以做其他活动。

Urtasun 表示,为了实现这一目标,需要在硬件和软件两方面都取得进步。

在硬件方面,激光雷达可能花费数万美元,这使得大规模部署成本太高;在软件方面,工程师需要找到一种方法来使 AI 具备归纳、区分不同物体的能力。

如果一个人类驾驶员在道路上看到一些出乎意料的东西(比如一条坠落的电源线),他们会知道应该绕过电线。而如果一辆自动驾驶汽车遇到训练中没有经历过的事情,它可能无法安全地做出反应。

Urtasun 表示,虽然自动驾驶汽车现在尚未迎来发展的黄金期,但她对自己在改进传感器和训练算法上的努力能够有效应用仍然充满希望。

Urtasun进一步介绍,幸运的是,“这项技术能够解决许多其他问题。”改进的激光雷达可以使地图测绘和土地调查更加准确,甚至配备传感器的非自动驾驶汽车也可以帮助改善交通状况。

4、无人机

汽车不是研究人员唯一希望能够自动驾驶的东西:无人驾驶飞机也正在接受自动飞行的训练。无人机研究与自动驾驶汽车研究面临着同样的难题。

高质量的训练数据既困难又昂贵,不同的飞行方式意味着无人机需要接受不同的新场景训练,而且法规使得在某些领域难以进行测试。即使是曾经受过训练,飞行过程仍然会非常困难。

“任何尝试过控制无人机的人都知道这不是件容易的事情,”比利时研究型大学天主教鲁汶大学的教授 Tinne Tuytelaars 说道。

不过,与自动驾驶汽车不同,无人机犯错的成本更低。“如果一架无人机坠毁,”Tuytelaars 耸了耸肩,“也不是件什么大不了的事。”

无人机已经可以投入到诸如协助救灾和管道检查等的应用。有朝一日它们将会可以进行送货并提供载客服务。

像亚马逊和波音这样的公司已经在测试无人机,未来它们可能会像现在的邮递员那样投递包裹。

在某些情况下,多架无人机可能出现在同一个空域内,并且可以比人类飞行员更好地实现彼此间飞行的协调。使它们自动飞行意味着可以降低成本,将技术带到全世界更多人和公司的手中。

5、机器人医生

除了交通工具,计算机视觉给医疗领域带来的变化是最显著的。AI 算法已经可以比放射科医生更好地从医学影像中识别出病症,例如骨折和肺炎。

“大数据的爆发,尤其在医疗领域的爆发,意味着我们能获得更多的数据来进行研究。”西班牙奥维耶多大学计算机学系助理教授 BeatrizRemeseiro表示,“我们正在利用数据去解决比以往更复杂的难题。”

去年,谷歌宣布开发出新的图像识别算法,可用于检测糖尿病视网膜病变的迹象,这种病变如果不及时治疗会导致失明。

这种算法能媲美人类专家,可以在患者视网膜的照片中发现小动脉瘤,这种动脉瘤是病变的早期迹象。

2017年,腾讯也发布了一款用于医学领域的AI产品——腾讯觅影,能够通过扫描上消化道内镜图片筛查食管癌,对早期食管癌的识别准确率高达 90%。

目前,腾讯觅影已经应用于中国100多家医院,未来也将辅助诊断糖尿病视网膜病变、肺结节、宫颈癌及乳腺癌等。

其他运用 AI 技术的工具也被用来更早地发现中风,为患者提供更好的生存机会。美国食品和药物管理局最近宣布将简化流程,以便帮助 AI  产品更快地获得批准。

当然,这些工具并不会很快就替代医生,它们起到更多是顾问的作用,而非取代从业医师。

计算机视觉可以提高工作效率,并使医生短缺地区的人们能得到更多医疗服务。这些创新技术也正在被用来最大限度地减少对人体的侵入性危害。

例如,CT 扫描比 X 射线能获取更多信息,但会使患者暴露在更大的辐射中。AI 则可以对X光片进行分析后,给医生提供相当于CT扫描的信息。

“医学影像是通过计算机视觉可以提供更多信息从而真正产生影响的领域,”康奈尔大学计算机科学系教授、谷歌研究所研究科学家 Ramin Zabih 表示。

“医学史已经证明,如果医师可以获得更多的数据,这可能意味着能更好地帮助到患者。”

6、边缘设备和航天器

所有这些领域都令人印象深刻,计算机视觉的未来会更加光明。即将开始影响该行业的最大变化之一,就是边缘设备——在两个网络的边界控制数据流转的硬件。

大多数 AI 处理需要在大型远程云服务器上完成,因为运行这些算法的计算密集程度很高。另一方面,人们制造了边缘设备,从而具有足够的处理能力能在本地完成工作。

随着像 Nvidia和Facebook这样的公司开始制造专门用于运行 AI的芯片,边缘设备正在变得越来越普遍。

这将可以实现更快、更安全的数据处理,并且能让用户通过自己的数据进行更多 AI 自定义训练,增加个人结果的定制程度。

“它将推动更多的创新,”总部位于加利福尼亚的 Movidius 公司前首席执行官 Remi El-Ouazzane表示,该公司为计算机视觉设计专用的低功耗处理器芯片。

目前 Remi El-Ouazzane也担任英特尔 AI 产品集团首席运营官,这是另一家生产半导体芯片和微处理器的加州科技公司。

El-Ouazzane 表示,从智能家居设备和监控摄像头到自动驾驶汽车,数十亿台设备都可以运用 AI 技术并在边缘设备上工作。

这还将创造能够找到失踪人员的技术(例如,通过扫描人群图像),或者可以在孩子睡觉前没有刷牙的时候能够提醒父母。

“问题不是‘能不能实现’,而是‘什么时候实现’。”他说。

在边缘设备的微世界之外,天文学家们也对计算机视觉特别感兴趣,他们从无尽太空中收集到大量数据集并进行研究。

Kaggle 是一个用于预测建模和分析竞赛的在线平台,在Kaggle上就有一个比赛利用深度学习和计算机视觉技术让研究人员能够通过观察天文图像发现更多关于支配我们宇宙的暗物质的相关信息。

此外,还有一个致力于通过 AI 促进探索太空的研究孵化器。前沿开发实验室 (FDL) 是美国航空航天局 (NASA) 与英特尔 AI、谷歌云、洛克希德和 IBM 等公司共同建立的合伙机构。

FDL将天文学家和计算机科学家带到了加利福尼亚州硅谷共同工作8周,解决诸如了解太阳耀斑、绘制月球地图和寻找小行星等问题。

根据 FDL 创始人之一 James Parr 的说法,如果没有计算机视觉,计划就无法成功。

事实上,位于美国加州帕萨迪纳的NASA 喷气推进实验室 (JPL) 对于摄像技术的发明起到了至关重要的作用,该技术影响了如今的大部分计算机视觉软件。

“计算机视觉与太空计划之间存在共生关系,” Parr 说。“但这个议题在太空行业的讨论度还不足够。”

太空探索将同样受到影响,因为AI 对于前往火星以及更远的地方至关重要。

太空旅行者和地球指挥中心之间的通信滞后意味着系统必须要能够做出自主决定,而这些决策很多都是由视觉数据来推动的。

“随着我们不断向外探索,我们需要机器人和自治系统为宇航员做好准备并提供协助、建造结构、定位并提取资源,” Parr 说。“这是发现和探索过程中激动人心的时刻。”

探索计算机视觉将如何改变地球上的生活,同样令人激动。随着 AI 扩展到更多领域并发展出新功能,它可能会遇到新的技术难题。但是,当我们回顾 AI 的历史时,给计算机提供视觉的能力可能是最重要的一项进步。拥有视力的机器将带领我们走向更光明的未来。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器视觉最火应用领域 的相关文章

  • Obsidian入门

    这里讲一下Obsidian 一款支持markdown语法的笔记软件 软件上手没有难度 会基本的markdown语法可以直接使用 但是Obsidian第三方库插件社区提供了近千种插件以及各种各样的主题 可以帮助用户更好的使用它 相信很多人都跟
  • Python 导出保存 MongoDB上数据到Excel(.xls和.csv)文件

    Python 中使用MongoDB存储数据 若需要导出数据到文件 可以使用pandas或xlwings导出到Excel xls和 csv 文件 本文主要介绍Python 中导出保存MongoDB上数据到Excel xls和 csv 文件的方
  • CVPR17(backbone) - ResNeXt : 引入网络设计中的新维度cardinality

    文章目录 原文地址 论文阅读方法 初识 相知 回顾 代码 论文全称 Aggregated Residual Transformations for Deep Neural Network 原文地址 原文地址 论文阅读方法 三遍论文法 初识
  • 《一个操作系统的实现》读书笔记-- 第一章--最小的“操作系统”

    一 最简单的 操作系统 最最简单的 操作系统 就是一个最最简单的引导扇区 Boot Sector 虽然它不具有任何功能 但是它却能够直接在裸机上运行 不依赖其他软件 一个引导扇区是512个字节 并且以0xAA55为结束标识的扇区 下面就是那
  • EIoU和Focal-EIoU Loss

    1 论文 论文题目 Focal and Efficient IOU Loss for Accurate Bounding Box Regression 2 引言 CIoU Loss虽然考虑了边界框回归的重叠面积 中心点距离 高宽比 但是其公

随机推荐

  • 第一章:宇宙第一IDE--Visual Studio

    数据结构 是指一种计算机存储 组织数据的方式 IDE Integrated Development Environment 的缩写 表示 集成开发环境 它是一种用于提供程序开发环境的应用程序 一般包括代码编辑器 编译器 调试工具和图形化用户
  • Java调用exe程序

    String exePath D Xftp6 Xftp exe BufferedReader br null BufferedReader brError String line null try String cmd D Xftp6 Xf
  • MATLAB函数句柄

    1 何为函数句柄 函数句柄也是MATLAB中的一种常见的数据类型 它的地位类似于其它计算机语言里的函数对象 Javascript Python 函数指针 C 或者函数引用 Perl 它的作用是将一个函数封装成一个变量 使其能够像其它变量一样
  • 【NLP】自然语言处理技术在自动生成足球比赛战报上的应用

    1 背景介绍 自动生成新闻看似是一个很成熟的技术 很多年前就有各种应用 但是深入了解后我们可以发现机器自动生成的文章一般都是复述一些数字和简单的趋势变化 所以自动生成新闻的技术广泛应用在金融 体育领域 原因就是这类报道需要基于一定的事实 而
  • 模型调参之网格搜索与随机搜索

    模型调参之网格搜索与随机搜索 网格搜索法 GridSearchCV GridSearchCV GridSearchCV可以拆分成GridSearch和CV两部分 即网格搜素和交叉验证 GridSearch系统地遍历多种参数组合 通过交叉验证
  • 一文讲透彻!RobotFramwork测试框架教程(全能)

    Robot Framwork在业界早已名声大振 有很多刚学自动化测试的伙伴问我 有没有不需要编程就可以玩自动化的方法 有吗 有的 Robot Framwork 我们今天就一篇文章 把它讲得明明白白 一 Robot Framwork简述 Ro
  • 宅男福利!程序员周末看片神器,关键还开源

    本文源自自公众号开源最前线 ID OpenSourceTop 猿妹整理 别人眼中的程序员一定是这样的 每天有接不完的需求 写不完的代码 改不完的Bug 但大多数程序员偶尔也是有周末的 你是否有出现这种情况 连续加了好几天的班 好不容易迎来一
  • Python查询MySQL数据库并输出相应信息

    场景描述 将fork的编号与ip信息存储在了MySQL中 数据库为forklift 数据表名为fork info 存储格式为id num ip 那么如何用python去查询这些信息呢 分析 根据提供的MySQL表结构 想从名为fork in
  • 【千律】C++基础:打开并下载网页 -- ShellExecuteEx 和 URLDownloadToFile 函数

    include
  • Elasticsearch 7 系列(3) —— 核心概念

    目录 集群 cluster 节点 node 索引 index 类型 type 要学好Elasticsearch 就得先对Elasticsearch中的概念有所了解 接下来我们就重点说说Elasticsearch中的集群 节点 索引 类型 文
  • 多个if语句并列_使用if-then 语句

    最基本的结构化命令就是if then语句 if then语句有如下格式 if command then commands fi 简单的例子 cat test1 sh bin bash testing the if statementif p
  • 开发工具链-DevOps_阿里云云效

    简介 阿里云效官网 DevOps Development和Operations的组合词 是一组过程 方法与系统的统称 用于促进开发 应用程序 软件工程 技术运营和质量保障 QA 部门之间的沟通 协作与整合 百度百科 快速开始 1 云效首页
  • 给导航网站新增了一些免费影视网站,欢迎体验

    使用时建议使用火狐浏览器 并安装广告屏蔽插件 这样就没有广告 视频内的广告千万不要相信 其余安心食用 地理导航 地理上网从这里开始
  • VS Code Remote Development

    配置VSCode Remote Development 1 Ubuntu 上启用 SSH 1 打开终端 并且安装openssh server软件包 sudo apt update sudo apt install openssh serve
  • 图像处理岗位面试题搜罗汇总

    传统图像处理部分 图像处理基础知识 彩色图像 灰度图像 二值图像和索引图像区别 彩色图像 RGB图像 灰度图像 0 255像素值 二值图像 0和1 用于掩膜图像 索引图像 在灰度图像中 自定义调色板 自定义输出256种颜色值 常用的图像空间
  • java 泛型 作用与定义

    1 泛型方法的定义和使用 public static void main String args throws ClassNotFoundException String str get 哈士奇 world System out print
  • Mac显示放大镜

    设置快捷键 系统默认是不开启热键的 如果需要设置 操作如下 设置 system preferences gt accessibility 在左侧找到room 进入配置窗口 按如上配置后 按住option键 然后两指向上就可以放大 两指向下就
  • 这座城市引领大模型浪潮!80余个AI大模型,一半集结在这里!

    刚刚结束的2023全球数字经济大会上 人工智能高峰论坛掀起了一股热潮 大型模型的发展和应用成为了会议的亮点 而作为这次盛会的主办方之一 北京市已经成为了这场人工智能革命的领先力量 作为人工智能产业的引领者 北京不负众望 国内已有80余个大型
  • Redis系列(七)Redis主从、哨兵、cluster集群方案解析

    文章目录 Redis主从 主从数据同步 同步 建立连接 完整重同步 全量同步 触发条件 部分重同步 增量同步 复制偏移量 offset 复制积压缓冲区 replication backlog buffer 部分重同步执行过程 命令传播 指令
  • 机器视觉最火应用领域

    1 图像和视频识别 人工神经网络领域最重要的进展之一出自 ImageNet ImageNet收集了 1400 万标签图像并于2009年发布 ImageNet挑战赛要求参赛者设计一个能够跟人类一样对照片进行分类的算法 但一直没有出现获胜者 直