论文笔记：PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod

2023-10-27

2018 Geophysical Journal International

1 Intro

1.1 Motivation

地震检测和定位是地震学的基础。
- 地震目录的质量主要取决于到达时间测量的数量和准确性。
- 地震到达时间测量或相位选择通常由网络分析员执行，他们根据专家判断和多年经验选择相位。
- 随着地震仪部署速度的不断加快；网络分析员分析的速度跟上数据流增加的速度得越来越困难。
地震的相位选择尤其受到 S 波的挑战，因为它们不是最先到达的波，而是从 P 尾波的散射波中出现的。
- S 波到达时间特别有用
  - 它们可用于减少仅基于 P 波的地震位置的深度-震源权衡
  - S 波结构对于强地面运动预测很重要。

1.2 related works

很多研究致力于自动地选择地震的相位
- 基于振幅、标准差、能量
  - 短期平均-长期平均模型是一个广泛使用的模型（STA/LTA short-term average/long-term average）(Allen 1978)
    - 他记录短期窗口和长期窗口之间能量的比例
    - 比例大于一个阈值的话，就表明P或者S波的到达
    - ——>这种方法虽然有效，导师易受噪声的干扰，同时对到达时间的准确度不高（尤其是对剪切波 shear wave的到达时间的准确度）
  - Baer & Kradolfer (1987) 使用包络（envelope）作为特征函数改进了 STA/LTA 方法。
  - Sleeman & Van Eck (1999) 对噪声和地震信号应用联合自回归 (AR) 建模，并使用 Akaike 信息准则来确定地震信号的开始。
- 统计模型
  - 基于高阶统计（包括峰度 kurtosis和偏度 skewness）的方法来识别从高斯性到非高斯性的转变，这与地震事件的发生相吻合，即使存在噪声
- 浅层神经网络
  - Gentili & Michelini (2006) 根据四个手动定义的特征对传统的浅层神经网络进行了测试，以选择 P 和 S 阶段：
    - 方差
    - 偏度的绝对值
    - 峰度
    - 基于滑动窗口预测的偏度和峰度的组合。
  - 大多数相位选择算法都关注 P 波， Ross & Ben-Zion (2014) 利用极化分析（polarization）来区分 P 波和 S 波，主要是为了改进 S 波到达时间的测量。
- ——>尽管做出了上述大量努力，但自动相位选择算法的准确性仍落后于经验丰富的分析师。
  - 这是由于地震波形由于多种效应而高度复杂，包括震源机制(source mechanism)、应力降（stress drop）、散射（scattering）、场地效应（site-effects）、相位转换（phase conversion）和来自多种噪声源的干扰。
  - 传统的自动相位选择算法使用手动定义的特征，需要仔细的数据处理，如带通过滤和设置激活阈值。

1.3 Paper‘s idea

- 这篇论文提出了一种用于地震相位拾取的深度神经网络算法 PhaseNet。
  - 深度神经网络不使用手动定义的特征，而是从标记数据中学习特征
  - 模型根据经验丰富的分析师挑选的P波和 S波到达时间进行训练。
  - 未经过滤的三分量地震波形是 PhaseNet 的输入（垂直、南北、东西分量）
  - PhaseNet 经过训练可输出三种概率分布：P 波、S 波和噪声。
    - P 波和 S 波概率分布中的峰值被设计为对应于预测的 P 和 S 到达时间。
  - PhaseNet 为 P波和 S波的选择提供了高准确率和召回率，并且与传统的 STA/LTA 方法相比取得了显着的改进。

2 数据

2.1 数据介绍

地震档案包括大量手动拾取的 P 波和 S 波到达时间，它们代表了非常丰富的有标记数据训练集，非常适合深度学习（图 1）。
论文使用北加州地震数据中心地震目录 (NCEDC 2014) 收集的数字地震波形数据。
- 使用具有 P 和 S 到达时间的三分量数据。
  - ——>779 514 条记录。
  - 基于站点分层抽样，将数据集分为训练、验证和测试数据集，分别有 623 054、77 866 和 78 592 个样本。
    - 训练集和验证集用于训练、微调参数和模型选择。
    - 测试集仅用于评估PhaseNet的最终性能和结果。
- 该数据集具有多样性的波形特征。它包括北加州地震台网中不同类型的仪器，涵盖了广泛的信噪比 (SNR) 范围。
  - 各仪器在数据集中所占比例如图2所示
  - 信噪比分布如图3所示
    - 信噪比由P波到达后5s和前5s的标准差之比计算得出
  - ——>数据集的复杂性使得自动相位选择具有挑战性，
  - ——>数据集的复杂性同时提供了更全面的性能评估。

2.2 数据预处理

随机选择一个包含 P波和 S波到达时间的 30 秒时间窗口作为 PhaseNet 的输入。
- 窗口P波和S波内到达的位置是变化的，以确保算法不只是学习窗口方案。
- 所有数据均以 100 Hz 采样，这是原始数据集中最常见的采样率，因此 30 秒输入波形的每个分量都有 3001 个数据点。
- 通过去除其均值并将其除以标准偏差来对每个分量波形进行归一化。
数据集中分析师手动选择的P波S波到达的时间可能不是真正的 P/S 到达时间，可能具有一定的不确定性。
- 出于这个原因，论文认为手动选择的P波S波到达的时间满足一个高斯分布。
  - 分析师选择的到达时间概率最高，而附近的数据点概率逐渐降低。
  - 高斯分布的标准偏差设置为 0.1 秒。
  - ——>以概率表示手动选择的P波S波到达的时间
    - ——>减少数据集中挑选错误的影响
    - ——>增加了 P波S波到达时间的拾取中相对于噪声的信息量，并有助于加速收敛
      - 噪声表示所有不是P波和S波的点
      - Prob(noise) = 1 − Prob(P) − Prob(S)
- 使用高斯分布掩码转换后，我们可以从 PhaseNet 预测的概率分布的峰值中提取到达时间。

3 模型

PhaseNet的架构是修改 U-Net得到的
- U-net 是一种用于生物医学图像处理的深度神经网络方法，旨在定位图像中的属性。
- 映射到这篇论文的setting中，就是将时间序列的属性定位为三类：P波、S 波和噪声。
输入是已知地震的三分量地震图。输出是 P 波、S 波和噪声的概率分布。
- 输入和输出序列包含3001 个数据点（30 秒长，以 100 Hz 采样）。
输入的地震数据经过四个下采样阶段和四个上采样阶段。
- 在每个阶段内，应用一维卷积和整流线性单元 (ReLU) 激活函数。
- 下采样过程旨在从原始地震数据中提取有用信息并将其缩小到更少量的神经元
  - ——>最后一层中的每个神经元感受野很广
- 上采样过程将此信息扩展并转换为每个时间点的 P 波、S 波和噪声的概率分布。
- kernel size为7。
- 下采样的stride为4
- 最后一层接一个softmax以进行概率的生成
  - 1，2，3分别代表噪声、P波和S波
  - x论文没说，我觉得应该是t，也就是时刻（个人觉得是每一时刻的三个分量做softmax，结果是一个3*3001的矩阵）

损失函数是预测分布q(x)和实际分布p(x)的交叉熵

4 实验

4.1 metric

如果预测的和实际的，相差间隔在0.1秒以内，那么就认为是true positive
F1 分数是精确率和召回率之间的平衡标准。
- 例如，如果我们为 positive picks 设置一个非常高的阈值，只有最好的 picks 被报告为 positive，这只占总 true picks 的一小部分，这样我们可以获得非常高的精度但非常低的召回率。
- 非常低的阈值的相反情况将导致低精度但高召回率。
- 对于这两种情况，F1 分数都会很低
  - ——>使用F1可以更准确地评估算法的性能

4.2 比较结果

PhaseNet取得了显着的改进，特别是对于 S波。因为 S 波从 P 尾波的散射波中出现，所以选择 S 到达对于自动方法来说更具挑战性。

4.3 自动和人工标记的 P 和 S到达时间的时间残差分布

图 6 显示了自动和人工标记的 P 和 S到达时间的时间残差分布。
P picks 的残差分布比 S picks 窄得多，这与 P 波到达预计更清晰因此更容易挑选的事实一致。
与 AR 选择器的结果相比，PhaseNet 的 P 和 S 选择的残差分布明显更窄并且没有明显的偏差。

4.4 在不同仪器类型上的性能

图 7 显示了 PhaseNet 在不同仪器类型上的性能。
训练集还是所有类型的仪器采集的数据，而测试数据集是根据每种仪器类型划分的。
在不改变任何参数或阈值的情况下，PhaseNet 的性能在不同的仪器上都很稳健。尽管短周期和宽带、高增益和低增益、加速度计和地震计之间存在波形差异，但 PhaseNet 学习了检测 P 和 S 相位所需的共同特征并选择了正确的到达时间。

4.5 不同 SNR（信噪比）的 PhaseNet 的性能变化

图 8 显示了具有不同 SNR（信噪比）的 PhaseNet 的性能变化。
根据 log10(SNR) 的值将测试集分为 10 个不同的类别。为每个类别计算精度、召回率和 F1 分数。
三个评估指标都随着信噪比的提高而增加。
- 当 log10(SNR) 的值超过 0.5 时，P 的 F1 分数超过 0.9，S 的 F1 分数超过 0.8。
- 即使对于低 SNR 数据，PhaseNet 的精度也很高，而召回率变得相对较小。
- ——>这反映了这样一个事实，即对于噪声数据，地震信号可能会被噪声淹没，变得更难检测。

4.6 可视化结果（好的-不好的-数据标注可能有误的）

图 9 显示了来自测试数据集的良好示例。
对于不同的波形特征和 P-S 时间间隔，PhaseNet 成功地拾取了 P 和 S 到达。预测分布的峰值与分析师标记的 P 和 S 精选准确对齐。

图 10 显示了一些明显失败的案例。 P 和 S 初至更难区分，波形比图 9 中的波形更嘈杂和复杂。

图 11 显示了一些有趣的情况，其中分析人员选择的 P 或 S 到达时间可能不正确。神经网络的预测显得更加合理和一致。由于在地震相位选择中存在主观因素，分析人员可能会使用不同的标准来选择到达。同一分析师的选择在不同时间也可能有所不同。

4.7 分析PhaseNet学到的特征

为了分析 PhaseNet 学习到的表示，我们训练了另一个没有skip-connection的模型，它强制所有信息通过最深层，并将 PCA（主成分分析）应用于最深层的神经权重。
神经网络将来自高维原始波形的知识浓缩为最深层的几个参数，这意味着这些低维神经权重应该包含确定 P 与 S 到达所需的信息。
这里输入具有 P 波、S 波或仅噪声的地震数据，并在最深层记录相应的矢量。 PCA 可视化显示这些压缩向量分组到 P pick、S pick 和噪声的不同区域。
结果表明神经网络已经学会从原始数据中提取特征以区分 P pick、S pick 和噪声，并将它们捕获到最深层的压缩神经权重中。

4.8 连续数据的地震监测

PhaseNet 预测时间序列中每个数据点的 P 和 S波的概率分布，因此它可以应用于地震检测的连续数据。
论文通过叠加八个不同事件的波形创建了连续的地震数据。移动这些事件以使相邻事件之间的到达时间间隔等于 6 秒。
用STA/LTA 和 PhaseNet 方法进行比较。
- STA/LTA 方法的短滑动窗口和长滑动窗口分别设置为 0.2 和 2 s。
- PhaseNet不需要滑动窗口，而是将整个60s波形作为P pick、S pick和noise三个概率序列的输入和输出。
图 13 中的输出序列表明，PhaseNet 产生与 STA/LTA 方法相似的尖峰，后者通常用于地震检测；然而，PhaseNet 也可以区分 P 和 S 到达。
- 此信息还可用于减少错误检测，因为与 STA/LTA 报告的未区分的尖峰相比，同时具有 P 和 S 选择的事件更有可能是真正的地震。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

论文笔记

论文阅读

深度学习

神经网络

论文笔记：PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod 的相关文章

spring提前加载，懒加载，bean的作用域和注入注解讲解

前言 sping知识随笔笔记 spring提前加载懒加载 bean的作用域和注入注解讲解 spring提前加载懒加载 bean的作用域和注入注解讲解前言 1 depends on 2 bean的作用域 3 lazy init 懒加载
Spring Boot事务配置管理

Spring Boot事务配置管理场景我们在开发企业应用时由于数据操作在顺序执行的过程中线上可能有各种无法预知的问题任何一步操作都有可能发生异常异常则会导致后续的操作无法完成此时由于业务逻辑并未正确的完成所以在之前操作过数
HJ32 密码截取

题目 HJ32 密码截取题解暴力截取所有子串利用双指针判断子串是否为回文串获取最大长度回文串 public int interceptPassword String password int maxLength 100 for in
vue 单页面(SPA) ，IOS端页面跳转后调用微信jssdk 时报错： "invalid signature"的解决方案

背景 1 JS接口安全域名 OK 2 Android手机微信开发者工具测试分享都没问题问题在IOS手机微信端从A页面 http a com A 跳转到B页面 http a com B 后 B页面进行分享时就会报签名 invalid

随机推荐

div让两个按钮并排显示在一行中

做微信小程序查了一些方法对于我来说都不适用有各种各样的问题下面的这个试了可以 wxml语法
java android小程序_java和android一些小程序

Java 和 android 的一些小程序 1 给定字符串 String str a b c g b h l b h r v 剔除重复的并统计出之后其个数 public class zhaoshu1 构造遍历字符串及将重复出现的字符置空
基于YOLOv5＆opencv的交通道路三角锥检测系统（部署教程＆源码）

1 研究背景与意义随着城市化进程的加快和交通流量的不断增加交通安全问题成为了一个日益突出的社会问题其中交通道路上的三角锥是一种常见的交通安全设施用于标记道路施工交通事故现场道路封闭等情况然而由于道路规模庞大人力资源有限
GCN初步尝试

任务如下读取cora数据集有2708个节点每个节点有1433个特征每个节点属于7类中的一类节点之间存在边注 cora的节点标号不是从0开始计数故需要进行处理附上一份简约代码建立一个两层的GCN 这里的edges是经过节点重
GitBucket 搭建属于自己的GitHub。

GitBucket是一个开源的代码管理仓库就像GitHub一样什么意思了说白了我们可以下载GitBucket 然后放到自己服务器的Tomca容器上就可以把代码往上面提交 GitHub你提交的代码都是可以被其它人看到的除非你付费但
西数ZN540如何修改sector size

写在前面因需要在ZN540上挂载F2FS 故需要两块盘一块传统SSD一块ZNS SSD 对于ZN540 信息如下由于其扇区大小为4KiB 而自己服务器上没有逻辑扇区为4KiB的盘例如三星883 所以当用883做传统盘的时候格式化m
基因富集分析 GSEA for time-course

基因富集分析 Gene Set Enrichment Analysis GSEA 是一种针对全基因组表达谱芯片数据的分析方法将基因与预定义的基因集进行比较即综合现有的对基因的定位性质功能生物学意义等信息基础构建一个分子标签数据库
html怎么把视频设置为背景,如何将视频设置为网页背景

第一步准备工作工欲善其事必先利其器我们首先需要准备一个视频第二步 html中引入视频这里我们需要用到了video 标签然后在source里面写视频的路径 autoplay用来使其自动播放 muted用来使其静音 loop为循环播
数学建模：9 多元线性回归分析

向前后逐步回归筛选自变量检验自变量之间是否多重共线性计算VIF 内生性核心变量与解释变量虚拟变量个数分类数 1 否则有多重共线性 stata软件回归模型假设检验回归系数假设检验与解释自变量对因变量的影响程度标准化回归系
如何检验数据正态分布_数据不符合正态分布，如何统计描述

10万文章推荐的科研神器秒杀谷歌翻译不够用再送两个 2020 04 09 介绍我们一般会在文献的统计方法部分看到这样的描述对于数值变量首先进行正态性检验如果各组均满足正态性采用均数标准差进行统计描述采用t检验进行
php类中的私有化构造函数,在类中将构造函数私有化有什么用？

通过提供私有构造函数可以防止在此类之外的任何地方创建类实例提供这种构造函数有几种用例答您的类实例是在static方法中创建的 static然后将该方法声明为public class MyClass private MyClass p
JAVA产生五位随机验证码

用Java写出一个程序产生5位验证码且前四位是字母不限大小写最后一位是数字解法一 import java util Random public class YanZhengMa public static void main Strin
【华为面试题】栈

思路首先遍历输入的压缩字符串三种情况 1 遇到字符将其入栈 2 遇到字符计算重复次数将栈中的字符组合成一个字符串重复拼接后再入栈 3 遇到字母字符判断下一个字符是否是数字若是数字则将当前字母重复拼接后入栈若不是数字则
mysql的安装与使用

1 mysql下载与安装下载解压下载地址 https dev mysql com downloads mysql 5 7 html downloads 下载到指定位置如D mysql 5 7 23 winx64 把解压的文件夹bin目
计算机系统课程笔记总结 CSAPP第二章信息的表示和处理（2.3-2.4）

GitHub计算机系统CSAPP课程资源计算机系统课程笔记总结 CSAPP第二章信息的表示和处理 2 1 2 2 计算机系统课程笔记总结 CSAPP第二章信息的表示和处理 2 3 2 4 计算机系统课程笔记总结 CSAPP第三章
opencv android 服务包,Unity中使用C++ OpenCV并且打包为Android apk

我们需要在Unity中使用WebCamTexture获取图像传送到OpenCV中做处理然后返回到Unity中作显示 Unity通过调用动态链接库so与OpenCV进行通信最终程序会打包成APK并且在Android上运行系统环境 Vi
华为OD机试 Python 【座位调整】

描述由于疫情原因学生之间的座位要保持一定距离每个学生的左右都要至少有一个空座给定一个代表座位情况的数组desk 其中1代表有学生坐在那个位置 0代表该位置为空问你在保持疫情安全距离的前提下我们还能安排多少学生输入一个整数数组
cuda运行时库配置问题

总是遇到一堆问题这次遇到的问题和这个类似 http cudazone nvidia cn forum forum php mod viewthread tid 483 先看了一些文章明白了是因为VC在编译和链接过程用的默认库被新库取代
vue动态加载页面组件

问题说明在开发时遇到一个问题在同一个页面局部页面要根据下拉框的选项来动态加载不同的页面参考 1 Vue 下拉框代码
论文笔记：PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod

2018 Geophysical Journal International 1 Intro 1 1 Motivation 地震检测和定位是地震学的基础地震目录的质量主要取决于到达时间测量的数量和准确性地震到达时间测量或相位选择通常由网