一种新型神经网络正在帮助物理学家应对数据分析的艰巨挑战

2023-11-13

71c2ce3ebe0baa325d377a38813a3a2c.png

来源:ScienceAI
本文约3000字,建议阅读5分钟
现在,在计算端,计算机科学往往处于领先地位。

3f26e0390daa44d1f18e2222fa60da23.png

假设你有一本一千页的书,但每一页只有一行文字。你使用扫描仪提取书中包含的信息,这个特定的扫描仪系统地扫描每一页,一次扫描一平方英寸,要花很长时间才能读完整本书,而且大部分时间会浪费在扫描空白处。

这就是许多实验物理学家的生活。在粒子实验中,探测器捕获并分析大量数据,即使其中只有一小部分包含有用信息。「在一张鸟儿在天空中飞翔的照片中,每个像素都可能有意义,」SLAC 国家加速器实验室的物理学家 Kazuhiro Terao 解释道。但在物理学家看到的图像中,通常只有一小部分真正重要。在这种情况下,仔细研究每个细节会消耗不必要的时间和计算资源。

但这种情况正在开始改变。借助一种称为稀疏卷积神经网络 (Sparse Convolutional Neural Network,SCNN) 的机器学习工具,研究人员可以专注于数据的相关部分并筛选出其余部分。研究人员使用这些网络极大地加快了他们进行实时数据分析的能力。他们计划在至少三大洲的即将进行或现有的实验中使用 SCNN。这一转变标志着物理学界的历史性变化。

「在物理学中,我们习惯于开发自己的算法和计算方法,」哈佛大学物理学家 Carlos Argüelles-Delgado 说。「我们一直走在发展的最前沿,但现在,在计算端,计算机科学往往处于领先地位。」

稀疏字符

SCNN 的工作始于 2012 年,当时在华威大学(University of Warwick)工作的 Benjamin Graham 想要构建一个可以识别中文手写体的神经网络。

当时处理这类图像相关任务的首要工具是卷积神经网络(CNN)。对于中文手写任务,书写者会在数字平板电脑上描写一个字符,生成一张例如 10,000 像素的图像。然后,CNN 将在整个图像上移动一个称为内核的 3×3 网格,使内核分别以每个像素为中心。对于内核的每个位置,网络都会执行复杂的数学计算,称为卷积,以寻找区别特征。

CNN 旨在用于信息密集的图像,例如照片。但是包含汉字的图像大多是空的;研究人员将具有此属性的数据称为稀疏数据。这是自然界中任何事物的共同特征。

Graham 说:「举个例子说明世界是多么稀疏」,如果埃菲尔铁塔被包裹在尽可能小的矩形中,那么该矩形将由「99.98% 的空气和仅 0.02% 的铁」组成。

04293b8817f38ce55bf052e3951c25b1.png

南极冰立方中微子观测站。

Graham 尝试调整 CNN 方法,以便将内核仅放置在图像的 3×3 部分上,这些部分至少包含一个具有非零值(并且不仅仅是空白)的像素。就这样,他成功地制作了一个能够高效识别手写中文的系统。它以仅 2.61% 的错误率识别单个字符赢得了 2013 年的比赛。(人类平均得分为 4.81%。)接下来他将注意力转向了一个更大的问题:三维物体识别。

475a2b0dc1acd4e5053b2aea3c1401c2.png

论文地址:https://arxiv.org/abs/1711.10275

873aebd0894985655ae8582d317f9d38.png

论文地址:https://arxiv.org/abs/1706.01307

到 2017 年,Graham 转到 Facebook AI Research 并进一步完善了他的技术并发布了第一个 SCNN 的详细信息,该 SCNN 仅将内核集中在具有非零值的像素上(而不是将内核放在任何 3×3 像素上)至少有一个「非零」像素的部分)。Terao 为粒子物理世界带来的正是这种普遍的想法。

地下拍摄

Terao 在费米国家加速器实验室参与了探索中微子性质的实验,中微子是已知最难以捉摸的基本粒子之一。它们也是宇宙中质量最丰富的粒子(尽管不多),但它们很少出现在探测器内。因此,中微子实验的大部分数据都很少,Terao 一直在寻找更好的数据分析方法。他在 SCNNs 中找到了一个。

2019 年,他将 SCNN 应用于模拟深层地下中微子实验 (DUNE) 的预期数据,该实验将于 2026 年上线,届时将成为世界上最大的中微子物理实验。该项目将从芝加哥郊外的费米实验室发射中微子, 穿过 800 英里的地球到达南达科他州的一个地下实验室。在此过程中,粒子将在三种已知类型的中微子之间「振荡」,这些振荡可能会揭示中微子的详细特性。

与普通方法相比,SCNN 分析模拟数据的速度更快,并且需要的计算能力大大降低。这些有希望的结果意味着 SCNN 很可能会在实际的实验运行中使用。

SCNN 比普通方法更快地分析模拟数据,并且这样做需要的计算能力要少得多。有希望的结果意味着 SCNN 可能会在实际的实验运行中使用。

与此同时,在 2021 年,Terao 帮助将 SCNN 添加到费米实验室另一个名为 MicroBooNE 的中微子实验中。在这里,科学家们研究了中微子与氩原子核之间碰撞的后果。通过检查这些相互作用产生的轨迹,研究人员可以推断出有关原始中微子的细节。为此,他们需要一种算法,该算法可以在探测器的三维表示中查看像素(或者从技术上讲,它们的三维对应物称为体素),然后确定哪些像素与哪些粒子轨迹相关联。

由于数据非常稀疏——大型检测器(大约 170 吨液态氩)中的少量细线——SCNN 几乎是这项任务的完美选择。Terao 说,使用标准的 CNN,由于要完成所有计算,图像必须分成 50 块。「使用稀疏的 CNN,我们可以一次分析整个图像——而且速度更快。」

及时触发

从事 MicroBooNE 工作的研究人员之一是一名名叫 Felix Yu 的本科生实习生。SCNN 的强大功能和效率给他留下了深刻的印象,作为哈佛大学研究实验室的研究生,他带着这些工具来到了下一个工作场所,该实验室正式隶属于南极冰立方中微子天文台。

天文台的主要目标之一是拦截宇宙中最具活力的中微子并追踪它们的来源,其中大部分位于我们银河系之外。该探测器由埋在南极冰层中的 5,160 个光学传感器组成,在任何给定时间只有一小部分会亮起。阵列的其余部分仍然是黑暗的,并没有提供特别的信息。更糟糕的是,探测器记录的许多「事件」都是误报,对中微子搜寻没有用。只有所谓的触发级事件才能进行进一步分析,并且需要立即决定哪些事件值得指定,哪些事件将被永久忽略。

标准 CNN 对于这项任务来说太慢了,因此 IceCube 的科学家们长期以来一直依赖一种名为 LineFit 的算法来告诉他们潜在有用的检测结果。但 Yu 说,该算法并不可靠,「这意味着我们可能会错过一些有趣的事件。」 同样,它是一个非常适合 SCNN 的稀疏数据环境。

f80f6ae8678fe42c45b4f172f7ef6559.png

论文地址:https://arxiv.org/abs/2303.08812

Yu 与他的博士生导师 Argüelles-Delgado 以及威斯康星大学麦迪逊分校的研究生 Jeff Lazar 一起量化了这一优势,在最近的一篇论文中表明,这些网络的速度将比典型的 CNN 快 20 倍左右。Lazar 说:「这足以运行检测器发出的每个事件,」每秒大约 3,000 个。「这使我们能够更好地决定丢弃什么和保留什么。」

a74f2fc6ec0254172265858f8b265a64.png

IceCube 有数千个传感器深埋在南极冰层中,例如左边的那个(由研究人员和工程师签名)。在任何时候,这些传感器中只有少数能为中微子猎手提供有用的数据,因此研究人员需要一种工具来帮助他们分离出不需要的数据。

作者还在使用官方 IceCube 数据的模拟中成功采用了 SCNN,下一步是在南极计算系统的副本上测试他们的系统。如果一切顺利,Argüelles-Delgado 认为他们应该在明年将他们的系统安装在南极天文台。但这项技术可能会得到更广泛的应用。「我们认为 [SCNN 可以使] 所有中微子望远镜受益,而不仅仅是 IceCube,」Argüelles-Delgado 说。

超越中微子

麻省理工学院的物理学家 Philip Harris 希望 SCNN 能够帮助最大的粒子对撞机:CERN 的大型强子对撞机 (LHC)。Harris 从麻省理工学院的同事计算机科学家宋涵那里听说了这种神经网络。「Song 是使算法快速高效的专家,」Harris 说——非常适合大型强子对撞机,那里每秒发生 4000 万次碰撞。

几年前,当他们交谈时,Song 告诉 Harris 他正在与实验室成员一起进行的一个自动驾驶汽车项目。Song 的团队使用 SCNN 分析车辆前方空间的 3D 激光地图,其中大部分是空的,以查看前方是否有任何障碍物。

Harris 和他的同事在大型强子对撞机上面临着类似的挑战。当两个质子在机器内部碰撞时,碰撞会产生一个由粒子组成的膨胀球体。当其中一个粒子撞击收集器时,会发生二次粒子雨。「如果你能绘制出这场流星雨的全部范围,」Harris 说,「你就能确定产生它的粒子的能量,」这可能是一个特别感兴趣的物体——类似于希格斯玻色子,物理学家 2012 年发现的暗物质粒子,物理学家仍在寻找。

「我们试图解决的问题归结为连接点,」Harris 说,就像自动驾驶汽车可能连接激光地图上的点以检测障碍物一样。

Harris 说,SCNN 将使大型强子对撞机的数据分析速度至少提高 50 倍。「我们的最终目标是让 [SCNN] 进入检测器」——这项任务至少需要一年的文书工作和社区的额外支持。但他和他的同事们充满希望。

总而言之,SCNNs——一个最初在计算机科学领域构想的想法——很快将在中微子物理学 (DUNE)、中微子天文学 (IceCube) 和高能物理学 (LHC) 中进行的最大实验中发挥作用。

Graham 说,当他得知 SCNN 已经进入粒子物理学领域时,他感到非常惊喜,尽管他并不完全感到震惊。「从抽象意义上说,」他说,「一个粒子在空间中运动,有点像笔尖在纸上运动。」

参考内容:

https://www.quantamagazine.org/sparse-neural-networks-point-physicists-to-useful-data-20230608/

编辑:文婧

fdff75241fc890d11273c3ed40c144f5.png

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一种新型神经网络正在帮助物理学家应对数据分析的艰巨挑战 的相关文章

随机推荐

  • 高频面试题:服务器CPU占用过高怎么办?搞定只需简单7步

    一 前言 在Java开发岗位的面试中 时不时会出现一些运维类的题目 其实这也反映了后端面试的一种趋势 现在企业对后端开发的要求越来越全面 不仅要求我们会写代码 还要我们能够进行部署和运维 今天九哥就结合一个真实的项目案例 来给大家讲解一道关
  • C语言中局部变量和全局变量在内存中的存放位置

    C语言中局部变量和全局变量变量的存储类别 static extern auto register 1 局部变量和全局变量 在讨论函数的形参变量时曾经提到 形参变量只在被调用期间才分配内存单元 调用结束立即释放 这一点表明形参变量只有在函数内
  • 信号是如何传输的

    一 信号 信息 人对现实世界事物存在方式或运动状态的某种认识 数据 用于描述事物的某些属性的具体量值 信号 信息传递的媒介 一 信号的分类 1 模拟信号 模拟信号是信号参数 幅度 频率等 大小连续变化的电磁波 可以以不同的频率在媒体上传输
  • springboot + vue 前端时间字符串,后台LocalDateTime 参数接收方法

    前端格式以 2020 05 09 10 55 22 这样的格式传值 后台实体类LocalDateTime 添加注解 即可接收到值 DateTimeFormat pattern yyyy MM dd HH mm ss JsonFormat p
  • day4:最长回文子串

    文章目录 问题描述 思路 实现代码 问题描述 给定一个字符串 s 找到 s 中最长的回文子串 你可以假设 s 的最大长度为 1000 示例 1 输入 babad 输出 bab 注意 aba 也是一个有效答案 示例 2 输入 cbbd 输出
  • [医疗相关任务]

    药物研发 GLAM
  • 【Linux】IO多路复用--poll函数基本处理流程

    poll 函数在服务端流程图 当我们的已连接套接字时间就绪 也就是connfd已连接套接字读事件就绪时候 那么我们就要读取接受缓冲区的数据 但是我们不能保证我们一次读取就能够读完 所以我们需要循环读取 那么就需要在应用层设置一个该connf
  • c:Bubble Sort

    file SortAlgorithm h brief 业务操作方法 VSCODE c11 author geovindu Geovin Du date 2023 09 19 ifndef SORTALGORITHM H define SOR
  • Opencv dft & idft

    Load an image cv Mat inputImage cv imread argv argc 1 0 Go float cv Mat fImage inputImage convertTo fImage CV 32F FFT st
  • HTML的无序列表、有序列表、自定义列表

    HTML的无序列表 1 无序列表是一个项目的列表 此列项目使用粗体圆点 典型的小黑圆圈 进行标记 无序列表始于 ul 无序列表 ul type disc li HTML li li CSS li li li ul ul
  • 函数的传递方式&不定长参数&参数解包

    文章目录 1 函数简介 2 函数的参数 2 1 形参和实参 2 2 函数的传递方式 2 2 1 位置传参 2 2 2 关键字传参 2 3 函数的实参类型 2 4 不定长参数 2 5 参数的解包 1 函数简介 函数也是一个对象 函数用来保存一
  • C++ 模板特例化

    文章目录 介绍 函数模板特例化 类模板特例化 介绍 模板作为C 泛型编程的基础十分重要 其使得一份代码能用于处理多种数据类型 而有些时候 我们会希望对一些特定的数据类型执行不同的代码 这时就需要使用模板特例化 template specia
  • Echarts 渐变色

    series i line itemStyle normal color Color Function default 自适应 图形的颜色 默认从全局调色盘 option color 获取颜色 颜色可以使用 RGB 表示 比如 rgb 12
  • Java技术栈,从入门到放弃,废了废了

    Java技术路线 应用框架 后端 Spring家族 Spring IoC AOP Spring MVC Spring Boot 自动配置 开箱即用 整合Web 整合数据库 事务问题 整合权限 Shiro Spring Security 整合
  • 开放集识别

    0 摘要 1 到目前为止 在计算机视觉中 几乎所有基于机器学习的识别算法的实验评估都采用了封闭集识别的形式 即在训练时已知所有测试类 对于视觉应用来说 一个更现实的场景是开放集识别 在训练时存在不完整的世界知识 在测试时未知的类可以提交给算
  • Vscode 打开文件注释中文乱码解决如下

    安装插件 ext install gbktoutf8 搜索encoding
  • 【LINUX计算机大白平凡学习linux之路】

    计算机大白平凡学习 之路 千里之行 始于足上 只有基础扎实 思路清析 写脚本才没有问题 多看一些牛人大咖写的脚本 看人家的思路与结构 会收益良多 一起努力学习吧 Linux是Torvalds先生所开发出来的 基于GPL的版权宣告之下 可以在
  • 神经网络优化(初始化权重)

    使隐藏层饱和了 跟之前我们说的输出层饱和问题相似 对于输出层 我们用改进的cost函数 比如cross entropy 但是对于隐藏层 我们无法通过cost函数来改进 更好的方法来初始化权重 因为传统的初始化权重问题是用标准正态分布 均值为
  • CentOS7.6 MySql 5.7.34安装部署

    一 卸载Mysql 查看系统是否安装默认的mysql rpm qa grep i mysql 如有 进行卸操作 rpm e nodeps 确认是否卸载完成 whereis mysql cd find name mysql cat etc p
  • 一种新型神经网络正在帮助物理学家应对数据分析的艰巨挑战

    来源 ScienceAI 本文约3000字 建议阅读5分钟 现在 在计算端 计算机科学往往处于领先地位 假设你有一本一千页的书 但每一页只有一行文字 你使用扫描仪提取书中包含的信息 这个特定的扫描仪系统地扫描每一页 一次扫描一平方英寸 要花