论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod

2023-10-27

2018 Geophysical Journal International

1 Intro

1.1 Motivation

  • 地震检测和定位是地震学的基础。
    • 地震目录的质量主要取决于到达时间测量的数量和准确性。
    • 地震到达时间测量或相位选择通常由网络分析员执行,他们根据专家判断和多年经验选择相位。
    • 随着地震仪部署速度的不断加快; 网络分析员分析的速度跟上数据流增加的速度得越来越困难。
  •  地震的相位选择尤其受到 S 波的挑战,因为它们不是最先到达的波,而是从 P 尾波的散射波中出现的。
    • S 波到达时间特别有用
      • 它们可用于减少仅基于 P 波的地震位置的深度-震源权衡
      •  S 波结构对于强地面运动预测很重要。 

1.2 related works

  • 很多研究致力于自动地选择地震的相位
    • 基于振幅、标准差、能量
      • 短期平均-长期平均模型是一个广泛使用的模型(STA/LTA short-term average/long-term average)(Allen 1978)
        • 他记录短期窗口和长期窗口之间能量的比例
        • 比例大于一个阈值的话,就表明P或者S波的到达
        • ——>这种方法虽然有效,导师易受噪声的干扰,同时对到达时间的准确度不高(尤其是对剪切波 shear wave的到达时间的准确度)
      • Baer & Kradolfer (1987) 使用包络(envelope)作为特征函数改进了 STA/LTA 方法。

      • Sleeman & Van Eck (1999) 对噪声和地震信号应用联合自回归 (AR) 建模,并使用 Akaike 信息准则来确定地震信号的开始。

    • 统计模型
      • 基于高阶统计(包括峰度 kurtosis和偏度 skewness)的方法来识别从高斯性到非高斯性的转变,这与地震事件的发生相吻合,即使存在噪声

    • 浅层神经网络
      • Gentili & Michelini (2006) 根据四个手动定义的特征对传统的浅层神经网络进行了测试,以选择 P 和 S 阶段:

        • 方差

        • 偏度的绝对值

        • 峰度

        • 基于滑动窗口预测的偏度和峰度的组合。

      • 大多数相位选择算法都关注 P 波, Ross & Ben-Zion (2014) 利用极化分析(polarization)来区分 P 波和 S 波,主要是为了改进 S 波到达时间的测量。

    • ——>尽管做出了上述大量努力,但自动相位选择算法的准确性仍落后于经验丰富的分析师。

      • 这是由于地震波形由于多种效应而高度复杂,包括震源机制(source mechanism)、应力降(stress drop)、散射(scattering)、场地效应(site-effects)、相位转换(phase conversion)和来自多种噪声源的干扰。

      • 传统的自动相位选择算法使用手动定义的特征,需要仔细的数据处理,如带通过滤和设置激活阈值。

1.3 Paper‘s idea

    • 这篇论文提出了一种用于地震相位拾取的深度神经网络算法 PhaseNet。

      • 深度神经网络不使用手动定义的特征,而是从标记数据中学习特征

      • 模型根据经验丰富的分析师挑选的P波 和 S波 到达时间进行训练。

      • 未经过滤的三分量地震波形是 PhaseNet 的输入(垂直、南北、东西分量)

      • PhaseNet 经过训练可输出三种概率分布:P 波、S 波和噪声。

        • P 波和 S 波概率分布中的峰值被设计为对应于预测的 P 和 S 到达时间。

      • PhaseNet 为 P波和 S波的 选择提供了高准确率和召回率,并且与传统的 STA/LTA 方法相比取得了显着的改进。 

         2 数据

2.1 数据介绍

  • 地震档案包括大量手动拾取的 P 波和 S 波到达时间,它们代表了非常丰富的有标记数据训练集,非常适合深度学习(图 1)。
  • 论文使用北加州地震数据中心地震目录 (NCEDC 2014) 收集的数字地震波形数据。
    • 使用具有 P 和 S 到达时间的三分量数据。
      • ——>779 514 条记录。
      • 基于站点分层抽样,将数据集分为训练、验证和测试数据集,分别有 623 054、77 866 和 78 592 个样本。
        • 训练集和验证集用于训练、微调参数和模型选择。
        • 测试集仅用于评估PhaseNet的最终性能和结果。
    • 该数据集具有多样性的波形特征。 它包括北加州地震台网中不同类型的仪器,涵盖了广泛的信噪比 (SNR) 范围。
      • 各仪器在数据集中所占比例如图2所示
      • 信噪比分布如图3所示
        • 信噪比由P波到达后5s和前5s的标准差之比计算得出
      • ——>数据集的复杂性使得自动相位选择具有挑战性,
      • ——>数据集的复杂性同时提供了更全面的性能评估。

2.2 数据预处理

  • 随机选择一个包含 P波 和 S波 到达时间的 30 秒时间窗口作为 PhaseNet 的输入。
    • 窗口P波和S波内到达的位置是变化的,以确保算法不只是学习窗口方案。
    • 所有数据均以 100 Hz 采样,这是原始数据集中最常见的采样率,因此 30 秒输入波形的每个分量都有 3001 个数据点。
    • 通过去除其均值并将其除以标准偏差来对每个分量波形进行归一化。
  • 数据集中分析师手动选择的P波S波到达的时间可能不是真正的 P/S 到达时间,可能具有一定的不确定性。
    • 出于这个原因,论文认为手动选择的P波S波到达的时间满足一个高斯分布。
      • 分析师选择的到达时间概率最高,而附近的数据点概率逐渐降低。
      • 高斯分布的标准偏差设置为 0.1 秒。
      • ——>以概率表示手动选择的P波S波到达的时间
        • ——>减少数据集中挑选错误的影响
        • ——>增加了 P波S波到达时间的拾取中相对于噪声的信息量,并有助于加速收敛
          • 噪声表示所有不是P波和S波的点
          • Prob(noise) = 1 Prob(P) Prob(S)
    • 使用高斯分布掩码转换后,我们可以从 PhaseNet 预测的概率分布的峰值中提取到达时间。 

3 模型

  • PhaseNet的架构是修改 U-Net得到的
    • U-net 是一种用于生物医学图像处理的深度神经网络方法,旨在定位图像中的属性。
    • 映射到这篇论文的setting中,就是将时间序列的属性定位为三类:P波、S 波 和噪声。
  • 输入是已知地震的三分量地震图。 输出是 P 波、S 波和噪声的概率分布。
    • 输入和输出序列包含3001 个数据点(30 秒长,以 100 Hz 采样)。
  • 输入的地震数据经过四个下采样阶段和四个上采样阶段。
    • 在每个阶段内,应用一维卷积和整流线性单元 (ReLU) 激活函数。
    • 下采样过程旨在从原始地震数据中提取有用信息并将其缩小到更少量的神经元
      • ——>最后一层中的每个神经元感受野很广
    • 上采样过程将此信息扩展并转换为每个时间点的 P 波、S 波和噪声的概率分布。
    • kernel size为7。
    • 下采样的stride为4
    • 最后一层接一个softmax以进行概率的生成
      • 1,2,3分别代表噪声、P波和S波 
      • x论文没说,我觉得应该是t,也就是时刻(个人觉得是每一时刻的三个分量做softmax,结果是一个3*3001的矩阵)

  • 损失函数是预测分布q(x)和实际分布p(x)的交叉熵 

4 实验

4.1 metric

  • 如果预测的和实际的,相差间隔在0.1秒以内,那么就认为是true positive
  • F1 分数是精确率和召回率之间的平衡标准。
    • 例如,如果我们为 positive picks 设置一个非常高的阈值,只有最好的 picks 被报告为 positive,这只占总 true picks 的一小部分,这样我们可以获得非常高的精度但非常低的召回率。
    • 非常低的阈值的相反情况将导致低精度但高召回率。
    • 对于这两种情况,F1 分数都会很低
      • ——>使用F1可以更准确地评估算法的性能

4.2 比较结果

PhaseNet取得了显着的改进,特别是对于 S波。 因为 S 波从 P 尾波的散射波中出现,所以选择 S 到达对于自动方法来说更具挑战性。 

4.3 自动和人工标记的 P 和 S到达时间的时间残差分布

 

  •  图 6 显示了自动和人工标记的 P 和 S到达时间的时间残差分布。
  • P picks 的残差分布比 S picks 窄得多,这与 P 波到达预计更清晰因此更容易挑选的事实一致。
  • 与 AR 选择器的结果相比,PhaseNet 的 P 和 S 选择的残差分布明显更窄并且没有明显的偏差。

 4.4 在不同仪器类型上的性能

  • 图 7 显示了 PhaseNet 在不同仪器类型上的性能。
  • 训练集还是所有类型的仪器采集的数据,而测试数据集是根据每种仪器类型划分的。
  • 在不改变任何参数或阈值的情况下,PhaseNet 的性能在不同的仪器上都很稳健。 尽管短周期和宽带、高增益和低增益、加速度计和地震计之间存在波形差异,但 PhaseNet 学习了检测 P 和 S 相位所需的共同特征并选择了正确的到达时间。 

4.5 不同 SNR(信噪比)的 PhaseNet 的性能变化

 

  •  图 8 显示了具有不同 SNR(信噪比)的 PhaseNet 的性能变化。
  • 根据 log10(SNR) 的值将测试集分为 10 个不同的类别。 为每个类别计算精度、召回率和 F1 分数。
  • 三个评估指标都随着信噪比的提高而增加。
    • 当 log10(SNR) 的值超过 0.5 时,P 的 F1 分数超过 0.9,S 的 F1 分数超过 0.8。
    • 即使对于低 SNR 数据,PhaseNet 的精度也很高,而召回率变得相对较小。
    • ——>这反映了这样一个事实,即对于噪声数据,地震信号可能会被噪声淹没,变得更难检测。

4.6 可视化结果(好的-不好的-数据标注可能有误的)

 

 

 

  • 图 9 显示了来自测试数据集的良好示例。
  • 对于不同的波形特征和 P-S 时间间隔,PhaseNet 成功地拾取了 P 和 S 到达。 预测分布的峰值与分析师标记的 P 和 S 精选准确对齐。

 

图 10 显示了一些明显失败的案例。 P 和 S 初至更难区分,波形比图 9 中的波形更嘈杂和复杂。

 

图 11 显示了一些有趣的情况,其中分析人员选择的 P 或 S 到达时间可能不正确。 神经网络的预测显得更加合理和一致。 由于在地震相位选择中存在主观因素,分析人员可能会使用不同的标准来选择到达。 同一分析师的选择在不同时间也可能有所不同。

4.7 分析PhaseNet学到的特征

  • 为了分析 PhaseNet 学习到的表示,我们训练了另一个没有skip-connection的模型,它强制所有信息通过最深层,并将 PCA(主成分分析)应用于最深层的神经权重。
  • 神经网络将来自高维原始波形的知识浓缩为最深层的几个参数,这意味着这些低维神经权重应该包含确定 P 与 S 到达所需的信息。
  • 这里输入具有 P 波、S 波或仅噪声的地震数据,并在最深层记录相应的矢量。 PCA 可视化显示这些压缩向量分组到 P pick、S pick 和噪声的不同区域。
  • 结果表明神经网络已经学会从原始数据中提取特征以区分 P pick、S pick 和噪声,并将它们捕获到最深层的压缩神经权重中。

 4.8 连续数据的地震监测

  • PhaseNet 预测时间序列中每个数据点的 P 和 S波 的概率分布,因此它可以应用于地震检测的连续数据。
  • 论文通过叠加八个不同事件的波形创建了连续的地震数据。 移动这些事件以使相邻事件之间的到达时间间隔等于 6 秒。
  • 用STA/LTA 和 PhaseNet 方法进行比较。
    • STA/LTA 方法的短滑动窗口和长滑动窗口分别设置为 0.2 和 2 s。
    • PhaseNet不需要滑动窗口,而是将整个60s波形作为P pick、S pick和noise三个概率序列的输入和输出。
  • 图 13 中的输出序列表明,PhaseNet 产生与 STA/LTA 方法相似的尖峰,后者通常用于地震检测; 然而,PhaseNet 也可以区分 P 和 S 到达。
    • 此信息还可用于减少错误检测,因为与 STA/LTA 报告的未区分的尖峰相比,同时具有 P 和 S 选择的事件更有可能是真正的地震。 

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod 的相关文章

  • spring提前加载,懒加载,bean的作用域和注入注解讲解

    前言 sping知识随笔笔记 spring提前加载 懒加载 bean的作用域和注入注解讲解 spring提前加载 懒加载 bean的作用域和注入注解讲解 前言 1 depends on 2 bean的作用域 3 lazy init 懒加载
  • Spring Boot事务配置管理

    Spring Boot事务配置管理 场景 我们在开发企业应用时 由于数据操作在顺序执行的过程中 线上可能有各种无法预知的问题 任何一步操作都有可能发生异常 异常则会导致后续的操作无法完成 此时由于业务逻辑并未正确的完 成 所以在之前操作过数
  • HJ32 密码截取

    题目 HJ32 密码截取 题解 暴力截取所有子串 利用双指针判断子串是否为回文串 获取最大长度回文串 public int interceptPassword String password int maxLength 100 for in
  • vue 单页面(SPA) ,IOS端页面跳转后调用微信jssdk 时报错: "invalid signature"的解决方案

    背景 1 JS接口安全域名 OK 2 Android手机 微信开发者工具 测试分享都没问题 问题 在IOS手机微信端 从A页面 http a com A 跳转到B页面 http a com B 后 B页面进行分享时就会报签名 invalid

随机推荐

  • div让两个按钮并排显示在一行中

    做微信小程序 查了一些方法 对于我来说都不适用 有各种各样的问题 下面的这个试了 可以 wxml语法
  • java android小程序_java和android一些小程序

    Java 和 android 的一些小程序 1 给定字符串 String str a b c g b h l b h r v 剔除重 复的 并统计出之后其个数 public class zhaoshu1 构造遍历字符串及将重复出现的字符置空
  • 基于YOLOv5&opencv的交通道路三角锥检测系统(部署教程&源码)

    1 研究背景与意义 随着城市化进程的加快和交通流量的不断增加 交通安全问题成为了一个日益突出的社会问题 其中 交通道路上的三角锥是一种常见的交通安全设施 用于标记道路施工 交通事故现场 道路封闭等情况 然而 由于道路规模庞大 人力资源有限
  • GCN初步尝试

    任务如下 读取cora数据集 有2708个节点 每个节点有1433个特征 每个节点属于7类中的一类 节点之间存在边 注 cora的节点标号不是从0开始计数 故需要进行处理 附上一份简约代码 建立一个两层的GCN 这里的edges是经过节点重
  • GitBucket 搭建属于自己的GitHub。

    GitBucket是一个开源的代码管理仓库 就像GitHub一样 什么意思了 说白了我们可以下载GitBucket 然后放到自己服务器的Tomca容器上 就可以把代码往上面提交 GitHub你提交的代码都是可以被其它人看到的 除非你付费 但
  • 西数ZN540如何修改sector size

    写在前面 因需要在ZN540上挂载F2FS 故需要两块盘 一块传统SSD一块ZNS SSD 对于ZN540 信息如下 由于其扇区大小为4KiB 而自己服务器上没有逻辑扇区为4KiB的盘 例如三星883 所以当用883做传统盘的时候 格式化m
  • 基因富集分析 GSEA for time-course

    基因富集分析 Gene Set Enrichment Analysis GSEA 是一种针对全基因组表达谱芯片数据的分析方法 将基因与预定义的基因集进行比较 即综合现有的对基因的定位 性质 功能 生物学意义等信息基础 构建一个分子标签数据库
  • html怎么把视频设置为背景,如何将视频设置为网页背景

    第一步 准备工作 工欲善其事必先利其器 我们首先需要准备一个视频 第二步 html中引入视频 这里我们需要用到了video 标签 然后在source里面写视频的路径 autoplay用来使其自动播放 muted用来使其静音 loop为循环播
  • 数学建模:9 多元线性回归分析

    向前 后逐步回归筛选自变量 检验自变量之间是否多重共线性 计算VIF 内生性 核心变量与解释变量 虚拟变量 个数 分类数 1 否则有多重共线性 stata软件 回归模型假设检验 回归系数假设检验与解释 自变量对因变量的影响程度 标准化回归系
  • 如何检验数据正态分布_数据不符合正态分布,如何统计描述

    10万 文章推荐的科研神器 秒杀 谷歌翻译 不够用 再送两个 2020 04 09 介 绍 我们一般会在文献的统计方法部分看到这样的描述 对于数值变量 首先进行正态性检验 如果各组均满足正态性 采用均数 标准差 进行统计描述 采用t检验进行
  • php类中的私有化构造函数,在类中将构造函数私有化有什么用?

    通过提供私有构造函数 可以防止在此类之外的任何地方创建类实例 提供这种构造函数有几种用例 答 您的类实例是在static方法中创建的 static然后将该方法声明为public class MyClass private MyClass p
  • JAVA产生五位随机验证码

    用Java写出一个程序产生5位验证码 且前四位是字母不限大小写最后一位是数字 解法一 import java util Random public class YanZhengMa public static void main Strin
  • 【华为面试题】栈

    思路 首先 遍历输入的压缩字符串 三种情况 1 遇到字符 将其入栈 2 遇到字符 计算重复次数 将栈中的字符组合成一个字符串 重复拼接后再入栈 3 遇到字母字符 判断下一个字符是否是数字 若是数字 则将当前字母重复拼接后入栈 若不是数字 则
  • mysql的安装与使用

    1 mysql下载与安装 下载解压 下载地址 https dev mysql com downloads mysql 5 7 html downloads 下载到指定位置 如D mysql 5 7 23 winx64 把解压的文件夹bin目
  • 计算机系统课程 笔记总结 CSAPP第二章 信息的表示和处理(2.3-2.4)

    GitHub计算机系统CSAPP课程资源 计算机系统课程 笔记总结 CSAPP第二章 信息的表示和处理 2 1 2 2 计算机系统课程 笔记总结 CSAPP第二章 信息的表示和处理 2 3 2 4 计算机系统课程 笔记总结 CSAPP第三章
  • opencv android 服务包,Unity中使用C++ OpenCV并且打包为Android apk

    我们需要在Unity中使用WebCamTexture获取图像 传送到OpenCV中做处理 然后返回到Unity中作显示 Unity通过调用动态链接库so与OpenCV进行通信 最终程序会打包成APK并且在Android上运行 系统环境 Vi
  • 华为OD机试 Python 【座位调整】

    描述 由于疫情原因 学生之间的座位要保持一定距离 每个学生的左右都要至少有一个空座 给定一个代表座位情况的数组desk 其中1代表有学生坐在那个位置 0代表该位置为空 问你在保持疫情安全距离的前提下 我们还能安排多少学生 输入 一个整数数组
  • cuda运行时库配置问题

    总是遇到一堆问题 这次遇到的问题和这个类似 http cudazone nvidia cn forum forum php mod viewthread tid 483 先看了一些文章 明白了是因为VC在编译和链接过程用的默认库被新库取代
  • vue动态加载页面组件

    问题说明 在开发时遇到一个问题 在同一个页面 局部页面要根据下拉框的选项来动态加载不同的页面 参考 1 Vue 下拉框代码
  • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod

    2018 Geophysical Journal International 1 Intro 1 1 Motivation 地震检测和定位是地震学的基础 地震目录的质量主要取决于到达时间测量的数量和准确性 地震到达时间测量或相位选择通常由网