杂谈光场相机的不足、优势、应用和展望(中)

2023-05-16

来源丨光场视觉

文章的上篇,主要是简单回顾了光场相机的起源历史、 极大地推动了它发展的Lytro公司的发展轨迹, 并简要分析了这个相机在To C端市场表现疲软的三大技术性原因。

也正如前文指出的那样,光场相机因为它独特的成像特性,在某些To B端领域得到了落地应用,成为在某些特定场景中具有性能优势的一个技术解决方案。这里的“强”和前面的“弱”,实则为光场相机同一技术特性的阴阳两极。作为“阵列”型传感器中的一种,它在空间分辨率和角度分辨率中的折衷主义设计,决定了它性能“两头不靠”, 却又“多面能手”。

光场相机的定义虽然范畴很小,但是“芥子纳须弥”。这个概念上十分简洁的设备,即一块主透镜、一个微透镜阵列和一个感光芯片就构成了的光场相机,与很多其他技术相结合,诞生了诸多设备变种,被应用在不同场景需求中。可以认为它很简单,简单到从事计算机视觉的研究工作者,可以不用过多地去理会成像过程中的光学内涵和物理过程,仅凭借着傍轴近似条件下的几何光学,就可以开展应用性研究;但是也可以认为它很复杂,从几何光学到波动光学,从相干照明到部分相干照明, 即使是光学专业科班出身的科研工作者,对它的成像过程和性质,也难以建立一个完备的数学描述。

对于作者而言,这个文章的标题从一开始,就是超纲和过于庞大的。但是为了尽量给读者一个清晰的面貌,特别是非专业领域的读者一个简明的介绍, 我将斗胆畅言,继续抛砖引玉,阐述下光场相机在某些特定领域的优势所在,以及这几年涌现出的基于光场相机的新型应用技术。

02

优势篇

光场相机的优点,一言以蔽之,它快速、它灵活、它多变。光场相机最多的应用场景,目前主要集中在3D成像领域,特别是深度估计、3D光强场的逆向重构两大方面。3D成像领域,有很多其他技术方案,多目视觉、激光点阵扫描、TOF飞行时间法、全息术、相位恢复、结构光…… 光场相机与这些方案对比,成像速度和信息解算速度快,同时保留了被探测物体的灰度值信息(波长、强度), 同时也记载了多视角信息(空间频率)。光场相机由于灵活的特点,也可以和这些方案中的一些技术进行组合, 衍生“混血儿”。它的独特之处,在于以下几个方面:

1.密集的多视角

由于光场相机中,视角数目,等于单个微透镜下的像素数目,而这一数字,目前达到了三位数的数量级,因此相较于传统多目相机阵列(抛开图1中斯坦福的极端烧钱案例,一般的多目系统相机都是个位数),光场相机在视角的密集程度(即视角分辨率)上,具有明显的优势。

4e48727853a37810ee6a8771d5614b7c.png 

图1相机阵列和光场相机的结构对比(by Kurt Akeley,Light-Field Imaging Approaches Commercial Viability, 2015)

密集的视角,既为重聚焦、基于EPI的深度估计提供了技术上的可行性,成为这些后续技术的一个前期铺垫环节, 而且它本身,就有着独特的应用价值。

比如,在手机玻璃盖板的工业检测上,为了检测手机屏幕上的质量瑕疵,一种传统的解决方法,就是工人利用肉眼、一天八小时对着强光并反复从各个角度检查瑕疵。这种To C产品的检测需要尽可能地降低漏检率,提高成品率,参见毁掉三星手机诺大声名的其实只是百万块手机电池中的一块。瑕疵由于对光线的反射或者折射特性变得十分隐蔽,只有在特定视角下,才可以显现。如果利用传统二维相机进行扫描,视角移动设备复杂,也不具备时效性;利用人工肉眼检测,对工人的健康不人道。丰富的视角属性,为光场相机探测这些瑕疵赋予了快捷、准确的属性。

4c76f5a3463f6035322a1779bdbeb573.png

图2:检验玻璃盖板缺陷流水线上的工人(央视纪录片“科学的力量” Episode 5)

2.结构的紧凑性

对比图1中,两种光场技术的系统尺寸大小,光场相机的结构紧凑性,不言而明。光场相机结构的紧凑性,带来两点收益:光场相机适合在空间光学观察窗口受限条件下对目标进行观测;光场相机容易与其他附加光路结合,构成另外一种应用方式。

366d3f88c636506a5602eee80d15b745.png

图3:光场相机应用于燃气轮机的内涵道激光粒子图像测速(小梅本人画的)

光学窗口受限的典型情况,就比如旋转机械中流场的观测,为了尽量降低光学窗口对机匣中气体流动的影响,以及降低结构强度,光学窗口一般数目都很少,大小有限。

后者的一个典型案例,就是光场相机在生物显微方向的应用,通过附加光路,不用太复杂的设备,即可完成成像系统的改造。

3.快速的宽视场体成像

这一特点,在光场相机的显微成像中被反复提起。由于光场相机仅需要单次拍摄,就可以记录光场信息,因此方便快速地完成对被观测物体的3D图像采集。在生物显微领域,光场相机的应用极大地降低了标本的活性时间要求。其他很多传统的3D成像技术,要求活体标本保持位置和姿态固定(想象下病人去扫描CT核磁共振的时候,一动不动,那带壳的长寿动物犹不能及),而光场相机速度快的优势,使得它甚至可以被用来检测运动状态下的被检测活体[1],比如游动的细菌、运动中的老鼠,这种场景在传统医学成像领域基本上是不可能出现的。

586cec6f5fbf0d71d3339ac429183ca7.png

图4:基于光场相机的三维成像显微镜 (Prevedel, Simultaneous whole-animal 3D imaging of neuronal activity using light-field microscopy. 2014.)

4.“一鱼多吃”,光场信息的多种解读

光场相机由于是记录了光线的方向和坐标等四维信息,因此基于对光场的不同解读方式,可以形成对光场图像的不同利用方法。典型的解读方法有:

a.重聚焦,形成了一系列focal stack图片。这种解读,可以了解为被观测物体,在一个定焦透镜不同轴向位置处的图像变化。focal stack目前主要的应用,是被利用在深度估计上,也可以应用它进行对被观测物体的相位恢复。利用不同轴向位置处的图像锐度,可以判定被观测物的空间位置。和其他利用focal stack的技术相比,比如机械式的移动被观测物, 或者最新大火的液体快速变焦透镜(华为P50预告),光场相机获得focal stack是通过一次拍摄,后续处理得到的,更具备时效性,所拍即所得 (当然空间分辨率上,其他focal stack技术更好,时间换空间)。

1d8d70e3a21ee7dee7363e3b9dad2f8c.png

图5:光场相机利用重聚焦形成的focal stack (Takahashi,  From focal stack to tensor light-field display. 2018.)

b. 多视角图像,形成了密集分布的不同视角下的图片。 在此情形下,光场相机即可以退化为传统的多目视觉,因此主要用途依旧是深度估计,用来观测物体的形貌。但是由于光场相机的视角密度很高,因此一个更合理的利用方式,是利用多视角图像的EPI(epipolar plane image), 探测特定目标区域的EPI的斜率变化,从而得到深度信息。

914b73a8dfb406525b656d29bd0af0ce.png 

图6:光场相机多视角图像形成的EPI信息(Teixeira, Epipolar based light field key-location detector. 2017

c. 点扩散函数的利用。光场相机的点扩散函数PSF,会随着点光源在轴向的位置而发生改变。在空间域看,随着点光源离焦程度的加深,更多的微透镜被照亮,点光源仿佛散作满天星。在频率域看,不同空间频率分量上的频谱分布发生了改变。这种PSF随着空间位置发生变化的属性,与点扩散函数工程领域的方法,有着异曲同工之妙。在点扩散函数工程领域,PSF被人为调制,使得物点在不同空间位置上的像图案呈现不同规律,比如涡旋光束导致图案会根据沿光轴位置,旋转不同角度[2]。光场相机的PSF也呈现出不同特征、但思路相仿的特点,通过探测、校准PSF, 利用反卷积技术,可以利用图像重构物方三维空间中的光强分布。这一方法,在光场的显微三维成像领域中,受到了广泛的应用。

1345fb66dbaab25fcecc8d5bb7564586.png

 图7:光场显微中的PSF和反卷积应用(Broxton, Wave optics theory and 3-D deconvolution for the light field microscope. 2013)

d. 波前传感与相位探测。光场相机的前身,有另外一个名字,哈特曼-夏克传感器,这一仪器,主要被用于探测光波的波前和相位分布。这一传感器的工作原理的简要介绍,可以参见如下的中文链接。但凡波前探测的领域,都可以见到这一相机的应用场景,比如自适应光学中,探测大气湍流造成的波前畸变,消除像差从而提高天文观测的成像质量,光学仪器的瑕疵检测,激光光束的波前探测.于军于民,基于光场相机的波前探测也是一个小的研究热点。

 c840f98e20f29a1ad26b862d25891d1d.png

 图8:光场相机被应用于波前探测(Chen, Ni, et al. 3D imaging based on depth measurement technologies. Sensors 18.11 (2018): 3711.)

上面,可以看到利用了上述优点,拓展光场相机应用领域的案例。在外观检测、被加工零件的形貌误差等方面,光场相机都有着独特的优势。

尽管光场相机的空间分辨率较低,但是这一问题,有望随着感光芯片的技术进步而解决。机器阅读并去理解图像,对空间分辨率的需求不一定需要很高,达到人审美需求的那种程度。

总的来说,光场相机具备结构简单的属性,使得它可以快速成像、并对光场数据进行快速解算。同时,由于对光场信息的存在不同解读方法,光场相机可以拓展到很多不同应用领域, 形成一个复杂和庞大的成像应用系列技术,这也就是为什么尽管光场相机已经在To C端偃旗息鼓,但仍然有新的火花,在知识森林中被点燃。

你以为这是故事的全部?No, No, No! 下篇将继续介绍,大家如何脑洞大开,利用光场相机,继续去干一些神奇而又好玩的事情。尽管有些方向,仍然停留在学界层面,但是对想要创业“恰饭”的朋友们,这不是件好事?

“芥子纳须弥”, 光场成像的复杂性,远超过小梅的知识范畴,所以本文不免谬误。请各位看官,继续点赞、评论、指点、交流,谢谢!

参考文献(图片说明中有,这里仅仅列出两个):

[1] Bimber, Oliver, and David C. Schedl. "Light-Field Microscopy: A Review." Journal of Neurology 4.1 (2019): 1-6.

[2] Berlich, René, Andreas Bräuer, and Sjoerd Stallinga. "Single shot three-dimensional imaging using an engineered point spread function." Optics express 24.6 (2016): 5946-5960.

本文仅做学术分享,如有侵权,请联系删文。

点击进入—>3D视觉工坊技术交流群

8990cc1a372b2ea9be9284ac253ef327.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

杂谈光场相机的不足、优势、应用和展望(中) 的相关文章

  • KCU105 XDMA 测试

    rdf0307 kcu105 trd03 2017 3 kcu105 axis dataplane hardware vivado scripts ug920 kcu105 pcie streaming data plane trd pdf
  • Ubuntu 配置 boa 服务器

    原文 xff1a http www linuxidc com Linux 2011 08 39780p3 htm Ubuntu上编译使用boa服务器的教程文章 xff0c 已经有很多了 xff0c 博客上也有很多人写了 xff0c 我就不赘
  • 阿里云docker方式搭建CAS服务端-最新版

    现在网上查到的CAS服务端搭建方式都比较老 xff0c 坑也很多 docker镜像直接使用官方的 xff0c 便于今后无缝升级 cas现时点最新版本为6 3 1 创建工作目录 mkdir home cas 以下操作都在该目录下执行 2 生成
  • 0、清华大学开源软件镜像站linux系统镜像下载地址

    https mirrors tuna tsinghua edu cn
  • 使用SSH公钥(id_dsa.pub)实现免密码登录

    使用SSH公钥 id dsa pub 实现免密码登录 博客分类 xff1a linux shell ssh 免密码 公钥 首先 xff0c 在本地机器上产生公钥 xff1a Java代码 root 64 localhost ssh ssh
  • 6.1、startx命令怎么不能进入图形界面

    命令行界面输入startx命令怎么不能进入图形界面 复制链接 发表于 2010 1 29 12 55 来自 51CTO网页 只看他 楼主 我在虚拟机 xff08 vmware xff09 上新安装的red hat linux 9 0在命令行
  • 7.1、mysql mha 主从自动切换 高可用

    是这个博主写的 xff0c 但是找不到地址了 写了他的另一个MHA地址 感谢原创的贡献 mysql mha 主从自动切换 高可用 mha xff08 Master High Availability xff09 目前在MySQL多服务器 x
  • 7.3、mysql主主循环备份数据库

    绿色部分是我根据需要自己写的 mysql 主主互备 双机热备的概念简单说一下 xff0c 就是要保持两个数据库的状态自动同步 对任何一个数据库的操作都自动应用到另外一个数据库 xff0c 始终保持两个数据库数据一致 这样做的好处多 1 可以
  • 7.4、Slave_SQL_Running: No mysql同步故障解决方法

    Slave SQL Running No mysql同步故障解决方法 2010 02 21 16 31 30 标签 xff1a mysql 数据库 同步 双机 休闲 原创作品 xff0c 允许转载 xff0c 转载时请务必以超链接形式标明文
  • 7.5、mysql破解密码

    找不到原创了 xff0c 百度了一下 xff0c 这个比较像 感谢原创的贡献 vi etc my cnf 在配置文件中加入 s kip grant tables mysqld safe skip grant tables amp 最佳答案
  • Scrum实践系列之三--敏捷教练的修炼之路

    敏捷教练与项目经理 在被奉为 项目管理圣经 的PMBOK中 xff0c 对项目经理在各阶段的职责有着清晰的界定 xff0c 比如项目经理制定规则 安排进度 监控执行中的各项风险并实时汇报状态 xff0c 等等 然而在敏捷的世界里 xff0c
  • 知识图谱_概述:课程PPT+个人理解

    2019 05 08 一 概念 xff08 是什么 xff09 1 知识 xff1a 有不同的解释 xff0c 可以是 不变的真理 经验 背景 解释 交工的信息 xff08 1 xff09 分类 陈述性知识 gt 描述客观事物的性状和关系等
  • chatgpt

    transformer GitHub Topics GitHub
  • Apollo:source cyber/setup.bash的作用

    source cyber setup bash 是在使用Apollo开发过程中 xff0c 用于加载Apollo软件的配置以及环境变量的脚本 Apollo是一款自动驾驶开发平台 xff0c cyber是其中的一个核心模块 xff0c 提供了
  • 什么样的人当不好程序员?

    什么样的人当不好程序员 xff1f 2016 01 21 程序员之家 来源 xff1a 36Kr 译文 xff1a http 36kr com p 5042433 html 原文 xff1a https goo gl jLfUFq 软件蚕食
  • java基础语法(顺便回顾cpp语法并比较与java的异同)

    变量 标识符 关键字与数据类型 1 标识符命名风格约定 xff1a 不能以数字开头 xff0c 也不能有 等符号 可以有 和 但不用作开头 方法名 变量名首单词小写 xff0c 其余单词首字母大写 如anyVariableName 类名 接
  • 刷leetcode,锻炼编程能力(c++)

    力扣20 xff0c 有效的括号 xff0c 栈 span class token macro property span class token directive keyword include span span class toke
  • 华为笔试题库之困难--难度

    题记 xff1a 若立志投身算法研究 xff0c 可精研理论算法 xff1a 动态规划 递归 深度搜索等 xff1b 若以解决问题为目的 xff0c 主要为了工作内容 xff0c 当尝试快而简单的方法 xff0c 这该是学习的本意 1 素数
  • C++ - opencv应用实例之矩形框检测

    C opencv应用实例之矩形框检测 现阶段下 目标检测在实际应用场景中的表现颇为重要 工业质检 移动机器人视觉伺服 作业 交通监控 安防领域等均需要通过目标检测来实现对目标的定位 测量或者统计 辅助控制等 目前目标检测主要分为两个方向的发
  • cpp-5 : Depends: gcc-5-base (= 5.3.1-14ubuntu2) but 5.4.0-6ubuntu1~16.04.11 is to be installed

    在5 4 0 6ubuntu1 16 04 11 cpp 5 amd64 Xenial 16 04 Ubuntu上下载对应的版本 xff0c 国 内源的版本都是5 4 0 6ubuntu1 16 04 12 xff0c 最后一位是12 xf

随机推荐

  • Questasim SystemC 指令sccom

    QuestaSim sccom 10 6c 1 compiler 2017 09 Sep 15 2017 Usage sccom options CPP compiler options lt CPP files gt General Op
  • MacOS 安装curl和wget

    目录 1 什么是curl和wget1 1 curl1 2 wget1 3 curl和wget的区别 2 安装curl2 1 利用wget安装curl2 2 直接下载curl源码编译安装 推荐 3 安装wget3 1 利用Homebrew安装
  • linux tty core 源码分析__tty_read,__tty_write,__tty_poll,

    转载 xff1a http blog csdn net sirzjp article details 6134489 前面分析了open操作 xff0c 现在分析读操作tty read tty read直接调用线路规程中的读操作从tty g
  • D触发器二分频电路

    D触发器二分频电路 有时真的要感慨一下自己电路学的够烂的 xff0c 啥都不会 xff0c 做示波器要学习分频电路 xff0c 学呗 将D触发器的Q非端接到数据输入端D即可实现二分频 xff0c 说白了就是CLK时钟信号的一个周期Q端电平反
  • 自动驾驶系列(十)编写电动车ROS节点(刹车)

    一 硬件控制协议 对于不同的设备 xff0c 底层的通讯方式都不一致 xff0c 因此需要根据具体硬件具体分析 本系统 采用了1个CAN盒子控制转向 xff0c 1路DA控制油门 xff0c 另外一路DA控制刹车 1 xff0c 转向协议
  • 【Mapreduce】利用单表关联在父子关系中求解爷孙关系

    首先是有如下数据 xff0c 设定左边是右边的儿子 xff0c 右边是左边的父母 Tom Lucy Tom Jack Jone Lucy Jone Jack Lucy Mary Lucy Ben Jack Alice Jack Jesse
  • 【C++】Split

    如果要将类似 aa ss ff 的字符串按空格分割成一个个字符 xff0c Java C PHP或者python等其它语言写多的人 xff0c 就会认为split一个理应存在的方法 xff0c 实际上C 43 43 中并没有这个方法 xff
  • TX2模组镜像备份与刷机

    1 环境搭建 1 1 下载驱动包和根文件系统 进入https developer nvidia com embedded linux tegra r3251下载两个文件 xff0c L4T Driver Package BSP 和Sampl
  • STM32——Keil5的编译警告和错误订正

    这是第一次写博客 xff0c 这里都是我在修改stm32代码遇到的一些警告和错误的改正 xff0c 其中有很多解决方法都是在网上找的 xff0c 也有一些还没解决的 xff0c 望指点 513 D HARDWARE 1U src Uart
  • stm32堆栈的认知

    flash和SRAM的区别 flash可以像硬盘一样存数据 xff0c 也可以直接像RAM运行 xff0c 一般在里面放bootload xff0c 程序执行代码 1 stm32中的堆栈 单片机是一种集成电路芯片 xff0c 集成cpu r
  • Liunx使用apt安装本地deb软件包

    平常都是用 dpkg i 来安装本地deb软件包 但是 dpkg 不会自动安装依赖包 xff0c 因此安装很容易出现依赖相关的错误 之后需要通过运行 sudo apt get install f 来安装依赖 可以直接通过 apt apt g
  • NeRFLiX,NeRF新高度!

    作者丨小张Tt 来源丨计算机视觉工坊 论文题目 xff1a NeRFLiX High Quality Neural View Synthesis by Learning a Degradation Driven Inter viewpoin
  • 研究生,真的“太多”了?

    来源丨软科 2023年毕业季已经临近 xff0c 据人力资源和社会保障部的数据显示 xff0c 今年我国高校毕业生人数将达到1158万 xff0c 继去年之后 xff0c 国内高校毕业生数量再次破千万 在毕业生人数创新高的同时 xff0c
  • 迟来的2023秋招总结

    作者丨藤和艾莉欧 64 知乎 来源丨https zhuanlan zhihu com p 622571550 编辑丨3D视觉工坊 点击进入 gt 3D视觉工坊学习交流群 首先 现在是2023年四月中旬 xff0c 毕业的事情暂时告一段落 x
  • 6位数字密码滚动破解

    gt File Name password c gt Author sea gt Mail 623535724 64 qq com gt Created Time 2017年07月20日 星期四 16时00分14秒 include lt s
  • 最新|事件相机SLAM综述

    Arxiv链接 https arxiv org abs 2304 09793 Github 链接 https github com kun150kun ESLAM survey 视觉SLAM vSLAM 是指移动机器人通过相机感知外部世界并
  • 还在为投稿发愁吗?ICCVIT 2023,一个计算机、视觉与智能技术国际会议

    ChatGPT热潮带来的行业革新大行其道 xff0c 相关区块链 信息安全 视觉 机器学习 产业必将带来诸多变革 本文为大家梳理了近期可投的4则EI检索的国际会议 xff0c 均可推荐发表SCI xff0c 还有超多IEEE Fellow主
  • ikd树:激光雷达SLAM中高效的点云数据结构

    点击上方 3D视觉工坊 选择 星标 干货第一时间送达 作者丨小飞飞 来源丨计算机视觉工坊 作者机构 HKU 项目主页 https github com hku mars ikd Tree git k d树是一种常用的多维数据结构 它可以用于
  • 招聘|三维点云算法总监

  • 杂谈光场相机的不足、优势、应用和展望(中)

    来源丨光场视觉 文章的上篇 xff0c 主要是简单回顾了光场相机的起源历史 极大地推动了它发展的Lytro公司的发展轨迹 xff0c 并简要分析了这个相机在To C端市场表现疲软的三大技术性原因 也正如前文指出的那样 xff0c 光场相机因