兼顾速度和精度的深度神经网络震相拾取

于子叶; 储日升; 盛敏汉; 马海超

doi:10.11939/jass.20190154

兼顾速度和精度的深度神经网络震相拾取

于子叶^1,2,3,
储日升^1,2, ,,
盛敏汉^1,2,
马海超^1,2,3

1.
中国武汉 430077 中国科学院测量与地球物理研究所
2.
中国武汉 430077 大地测量与地球动力学国家重点实验室
3.
中国北京 100049 中国科学院大学

基金项目: 国家自然科学基金（41661164035）资助

详细信息

通讯作者:
储日升: e-mail：chur@asch.whigg.ac.cn

中图分类号: P315.63
计量
- 文章访问数: 955
- HTML全文浏览量: 422
- PDF下载量: 71
出版历程
- 收稿日期: 2019-10-10
- 修回日期: 2020-01-02
- 网络出版日期: 2020-08-16
- 发布日期: 2020-07-20

A new deep neural network for phase picking with balanced speed and accuracy

Yu Ziye^1,2,3,
Chu Risheng^1,2, ,,
Sheng Minhan^1,2,
Ma Haichao^1,2,3

1.
Institute of Geodesy and Geophysics，Chinese Academy of Sciences，Wuhan 430077，China
2.
State Key Laboratory of Geodesy and Earth’s Dynamics，Wuhan 430077，China
3.
University of Chinese Academy of Sciences，Beijing 100049，China

摘要

摘要: 深度神经网络虽然在震相拾取中取得了良好效果，但作为高复杂度的机器学习模型，深度神经网络在取得较高精度的同时需要付出较高的计算代价，而且试验研究表明震相拾取中并不需要过高的模型复杂度。为此，本文根据地震波形的特点设计了四种具有不同复杂度的深度神经网络改进模型，可以综合具体的精度和速度需求从中选取合适的模型。在此基础上，将改进模型与现有四种到时拾取的深度学习网络模型进行了对比，结果表明本文中的网络模型在到时拾取上具有较高的速度和精度。同时，本文的深度神经网络通过使用多种深度学习模型压缩手段可将震相拾取模型的大小压缩到2.0 MB以内，从而使得模型可以在低功耗设备上完成高速震相拾取的同时尽可能地减少精度损失。
- 震相拾取 /
- 深度神经网络 /
- 编码解码结构 /
- 卷积神经网络 /
- 循环神经网络 /
- 模型压缩
Abstract: The deep neural network （DNN） has achieved good results in phase picking. As a high complexity machine learning model, DNN suffers from high computational cost to achieve high accuracy. The experimental results show that there is no need to build a high complexity model for phase picking. So, we designed four network models with different complexity to improve speed and accuracy of phase picking based on characteristics of seismic waveforms, which offers a choice of accuracy and/or speed of the phase picking. And then we compared our results with those obtained from four existing DNN models, and verified the relative high speed and accuracy. More importantly, the DNN models can be compressed to within 2.0 MB after a variety of model compression methods, which allows the structure to perform high-speed phase picking with relatively high accuracy on low-power-consumption devices.
- onset picking /
- deep neural work /
- encoder-decoder model /
- CNN （convolutional neural network） /
- RNN （recurrent neural network） /
- model compression

HTML全文

引言

国内外关于局部场地地震效应的研究始于20世纪初（胡聿贤等，1980；Trifunac，2016）。Wood （1908）在讨论1906年发生于美国旧金山M_S7.8大地震的震害特征时，指出局部场地条件对震害有显著的影响，在这次地震中，位于软弱场地上的震害明显重于其它场地；Yamanaka和Yamada （2003）针对1923年日本关东M_S8.1地震的震害研究发现，软土场地上木房屋的震害明显有别于刚性房屋；Seed等（1988）关于1985年墨西哥M_S7.8地震的震害研究表明场地地震效应显著，墨西哥城下伏较厚的软弱沉积层是引起地震动显著放大的原因；Chávez-García和Bard （1994）对1985年墨西哥M_S7.8地震作了进一步分析研究，大量的实验和理论结果表明，墨西哥城的严重震害是由盆地内深厚软弱的沉积层导致地震动显著放大引起。再如1960年的智利M_S8.9地震（Doyel et al，1963）和1990年伊朗M_S7.3大地震（Ishihara et al，1992）等都表现出了场地效应对地震动的影响。国内关于场地效应的研究始于20世纪70年代的云南通海地震。通海地震发生后，胡聿贤等对震区震害异常进行了宏观调查和统计，随后经过数年的地震震害、强震动记录和理论与实验分析研究了局部场地地震动效应（通海地震影响场调查组，1977），其关于场地效应的相关研究成果在我国抗震规范的制定中得到了体现。1975年辽宁海城M_S7.3地震中，海城县和大石桥市的一般砖屋结构的震害远高于营口市和盘锦市，定性分析认为这一震害异常是由海城县和大石桥地区较厚的覆盖土层引起的（中国科学院工程力学研究所，1979）。此外，在河北唐山M_S7.8地震（高振寰，胡碧茹，1987）和台湾集集M_S7.6地震（Wang et al，2002）中均存在局部场地影响地震作用的现象。

基于地脉动的场地特征研究起始于20世纪30年代，随着基于同一测点地脉动水平垂直谱比法（H/V谱比法），即Nakamura方法的提出（Nakamura，1989），地脉动法在场地特征估计中得到了更广泛的应用（Yamazaki，Ansary，1997；Poovarodom et al，2017；Verdugo，2019；Benkaci et al，2021；Thornley et al，2021；Ramadan et al，2021）。温瑞智等（2013）为了进一步说明场地地形对四川省宝兴县防震减灾局强震台的影响，对台站附近进行了背景噪声测试，利用H/V谱比法计算了场地背景噪声的卓越周期和水平向放大系数，揭示了场地卓越频率随地势自山脚向山坡上的增高而逐渐增大，且放大系数也随之增大。单振东等（2014）采用H/V谱比法测试了思经乡希望小学附近场地及典型民居的特征频率，结合震后现场灾害考察，分析了场地特征与建筑物震害间的相关性，总结出思经乡异常区产生的原因为思经乡场地特征频率与现有民用两层建筑特征频率相近。

鉴于鲁甸龙头山集镇老行政机关办公区、老街区及骡马口村区在鲁甸M_S6.5地震中所受震害明显重于老中学区（图1），除有房屋建筑结构本身的因素外，局部场地条件可能亦是主要影响因素。为此，本文拟对龙头山集镇老行政机关办公区、老街区及骡马口村区三个观测实验区进行地脉动观测，以期通过地脉动傅里叶幅值谱比了解各场地特征，即场地卓越频率和场地放大系数，确定各场地的地震动放大效应，并通过比较房屋建筑的动力特性，揭示房屋建筑震害加重机理。

图 1 老行政机关办公区（a）、老街区（b）和骡马口村区（c）的建筑震害

Figure 1. Earthquake damage of buildings in the old administrative-office zone （a）， old blocks （b） and Luomakou village （c）

下载: 全尺寸图片幻灯片

1. 龙头山集镇地脉动测试

1.1 地脉动观测

老行政机关办公区、老街区和骡马口村区等三个观测实验区的分布位置如图2所示，各观测实验区地脉动观测点布局如图3所示，在每个观测实验区内将测点尽可能布设在震害较重的建筑场地或附近场地上。同时亦在龙头山集镇的两处基岩露头位置各布置一参考观测点，以作为传递函数法谱比参考点，其中老行政机关办公区、老街区观测实验区参考观测点均为基岩测点1 （图3a，3b），骡马口村区观测实验区参考观测点为基岩测点2 （图3c）。现场测试所采用的仪器为ETNA2加速度仪，观测时间为晚上11点后的5个小时，以尽量避免外界干扰。

图 2 龙头山集镇3个观测实验区的分布

Figure 2. Layout of three observation experiment areas in Longtoushan town

下载: 全尺寸图片幻灯片

图 3 老行政机关办公区（a）、老街区（b）和骡马口村区（c）测点布设示意图

括号中数据为依据参考点谱比层得到的EW向和NS向场地放大系数

Figure 3. Schematic layout of measuring points in the old administrative-office zone （a）， old blocks （b） and Luomakou village （c）

The data in parentheses are the amplification coefficients of the EW and NS directions obtained based on the spectral ratio of the reference point

下载: 全尺寸图片幻灯片

1.2 脉动数据处理

首先依据各测点记录起止时间确定出每个测试排列的有效记录时间，并据此从参考点连续记录中截取出与各测点相同的有效记录时间段内的记录数据。通过专用数据处理软件对每一测试排列中各测点记录及对应时段参考点记录进行处理（魏来，2018），处理内容如下：① 基线校正。由于温度、仪器布置不水平等导致实际记录存在一定的零位漂移，为此将通过趋势拟合得到每一测点及对应参考点记录的基线函数，并从每一测点及对应参考点实际记录中减去相应的基线函数值，实现每一测点及对应参考点记录的基线校正；② 数字滤波。为了减少噪音干扰，对经过基线校正的记录进行滤波处理，频带范围为0.1—25 Hz；③ 从滤波处理后的数据中连续截取40—43段数据，每个数据段包含8 192个采样点（时长40.96 s）；④ 对截取的40—43段数据进行累加求和再平均，得到每一测点和对应参考点的平均记录，新的数据采样点为8 192个；⑤ 针对每一测点及对应参考点平均记录进行傅里叶变换，继而求其傅里叶振幅谱；⑥ 按照每一测试排列，对各测点及对应参考点平均记录的傅里叶振幅谱采用滑动平均法进行平滑。

1.3 测点谱比曲线特征

经脉动观测数据处理即可得到每一测试排列各测点及对应参考点三分量平滑傅里叶振幅谱，继而计算出各测点H/V谱比及各测点水平向傅里叶振幅谱与参考点水平向傅里叶振幅谱的谱比，即参考点谱比法谱比。参考点H/V谱比曲线如图4所示，从图4可知，基岩场点H/V谱比曲线呈一条幅值变化较小的曲线，无明显峰值，表现为基岩场地H/V谱比曲线特征，即单点H/V谱比曲线多为单峰值，而参考点谱比法谱比曲线多为双峰值。老行政机关办公区、老街区及骡马口村区典型观测点单点H/V谱比曲线与参考点谱比法谱比曲线如图5所示。

图 4 参考点H/V谱比曲线

Figure 4. H/V spectral ratio curves of reference points

下载: 全尺寸图片幻灯片

图 5 老行政机关办公区（a）、老街区（b）和骡马口村区（c）测点及参考点谱比曲线

图a，b参考点为基岩测点1，图c参考点为基岩测点2

Figure 5. Spectral ratio curves of measuring points reference points in old administrative-office zone （a），old blocks （b） and Luomakou village （c）

Reference points in Fig.（a） and Fig.（b） are base bedrock measuring point 1，while is 2 for Fig.（c）

下载: 全尺寸图片幻灯片

2. 场地特征与震害影响分析

经脉动测试数据处理分析得到了三个观测实验区各测点的地脉动谱比，其中包括参考点谱比法谱比及H/V谱比，据此可确定出三个观测实验区各测点对应场地的卓越频率和场地放大系数，结果列于表1，并在图3中标注了场地放大系数。

表 1 老行政机关办公区、老街区和骡马口村区各测点谱比计算结果

Table 1. Statistics of the spectral ratio of the measured points in old administrative-office zone， old blocks and Luomakou village

测点号	参考点谱比法卓越频率/Hz		参考点谱比法场地放大系数		H/V谱比法卓越频率/Hz
测点号	EW	NS	EW	NS	EW	NS
X₁	8.08	7.86	2.79	2.93	4.01	3.88
X₂	4.15	4.35	2.09	2.67	4.00	3.91
X₃	4.01	3.10	2.01	1.80	3.98	3.12
X₄	4.12	4.66	2.53	2.43	3.91	4.57
X₅	3.96	5.98	1.96	1.69	3.76	3.64
X₆	4.64	4.66	1.39	1.47	4.76	3.96
X₇	3.91	4.10	4.63	3.63	3.86	3.32
X₈	3.71	3.81	2.82	3.08	3.47	3.50
X₉	5.70	6.75	4.42	3.33	5.69	6.64
X₁₀	5.64	6.23	4.20	4.00	3.96	4.48
X₁₁	3.49	6.75	5.96	4.92	3.34	5.64

下载: 导出CSV

| 显示表格

由表1和图3可以看出，老行政机关办公区各测点的参考点谱比法中南北方向上的场地放大系数多数与东西方向上的场地放大系数存在差异，且场地放大系数均大于1，表明老行政机关办公区的场地具有显著的场地放大效应，参考点谱比法卓越频率两方向有一定的差异，主要介于3—8 Hz频带范围内。各测点H/V谱比法卓越频率主要介于2—6 Hz频带范围内，基本与参考点谱比法优势频带相吻合。

老行政机关办公区多数房屋为2—3层砖混结构，其基频约为4—6 Hz （王广军，樊水荣，1989年；中华人民共和国建设部，1990），位于脉动测试分析得到的场地卓越频带范围内，因此，地震动作用下砖混结构地震反应的共振效应会加重其破坏程度。龙头山集镇老行政机关办公区位于洪积扇西缘侵蚀陡坡上方，多属残坡积堆积地貌，主要以台阶地形为主，这样的地貌特征使其对地震动具有显著的放大作用，这一点已被前述谱比分析所证实，老行政机关办公区场地的显著地震动放大作用导致了该区砖混结构建筑的严重破坏。

综上所述，老行政机关办公区房屋建筑所受的严重震害是由其场地显著的地震动放大效应及共振效应的共同作用引起的。

老街区各测点参考点谱比法南北方向上的场地放大系数与东西方向上的较接近，且场地放大系数均大于1 （表2）。此外，场地东西向与南北向的卓越频率存在一定的差异，主要位于3—8 Hz频带范围内。表明老街区场地具有明显的场地放大效应，且场地放大效应具有一定的方向性。位于幼儿园建筑附近的测点S₃，S₄，S₅，S₉，S₁₀的场地放大系数为1—2，相对于其它测点（大于3）偏低，说明老街区内场地效应存在一定的差异，幼儿园附近场地的地震动放大效应比其它场地的小，这一特征可能是幼儿园附近房屋建筑的震害较周围房屋震害轻的原因。各测点H/V谱比法卓越频率与参考点谱比法的卓越频率差异较明显，主要介于3—6 Hz频带范围内，较参考点谱比法优势频带窄。

表 2 老街区各测点谱比计算结果

Table 2. statistics of the spectral ratio of measured points in old blocks

测点号	参考点谱比法卓越频率/Hz		参考点谱比法场地放大系数		H/V谱比法卓越频率/Hz
测点号	EW	NS	EW	NS	EW	NS
S₁	3.62	3.76	3.51	3.33	3.59	3.42
S₂	5.35	4.35	4.22	4.31	4.08	3.88
S₃	4.74	4.66	1.27	1.07	4.81	4.57
S₄	4.66	7.64	1.65	1.66	2.34	4.93
S₅	5.30	3.93	1.88	1.85	5.35	5.05
S₆	4.27	3.98	3.18	3.95	4.74	3.47
S₇	4.30	4.03	3.22	3.81	4.66	3.86
S₈	8.55	3.39	2.71	3.64	5.18	3.86
S₉	6.62	4.47	1.29	1.27	3.17	4.57
S₁₀	6.98	5.54	1.68	1.28	4.03	3.08

下载: 导出CSV

| 显示表格

老街区地震震害显现出一定的分区特征，这可能与近地表覆盖土层结构有关。科考期间进行的工程地质钻探结果显示，尽管两个钻孔（DZK4和DZK5）之间的距离不足30 m，均位于洪积扇中部，亦同属于中硬场地土，建筑场地类别为Ⅱ类，但松散覆盖层厚度明显不同，其中位于幼儿园场地上的DZK4钻孔揭露的松散覆盖层厚度为30.1 m，而位于老旧房屋处的DZK5钻孔揭露的松散覆盖层厚度仅为20.1 m，这使得地震动的放大效应不同，从而导致了地震震害的差异。

老街区砖混结构建筑多数为两层，其基频约为6 Hz （王广军，樊水荣，1989；中华人民共和国建设部，1990），位于测试区场地卓越频带范围内，因此，地震动作用下砖混结构地震反应的共振效应会加重其破坏。此外，老街区位于洪积扇东缘侵蚀陡坡上，多属残积和坡洪积堆积地貌，主要以坡地地形为主，复杂的场地条件使得场地动力特性表现出一定的差异。地脉动测试结果表明，幼儿园附近场地的地震动放大效应比其它场地小，因而幼儿园及其附近房屋建筑破坏程度较周边的轻，而幼儿园周边场地的显著地震动放大作用导致了砖混结构与土木结构的严重破坏甚至倒塌，证实了前文关于幼儿园建筑震害较周边房屋建筑轻的原因的推断。

土木结构多数为一层，其基频约为8 —10 Hz （王广军，樊水荣，1989；中华人民共和国建设部，1990），与场地脉动测试卓越频率范围不吻合，未能与结构地震反应产生共振效应，但显著的地震动放大效应导致了土木结构的严重破坏甚至倒塌。

综上所述，老街区场地效应存在一定的差异是导致震害差异的主要原因，幼儿园及其附近房屋建筑破坏程度较周边的轻；幼儿园周边场地的砖混建筑震害较重是由其场地的地震动放大效应及结构地震反应的共振效应共同作用引起的，土木建筑的破坏主要是由场地地震动放大效应引起的。

骡马口村区各测点参考点谱比法南北方向上的场地放大系数与东西方向上的场地放大系数差异明显，且谱比峰值均大于5 （表3），表明骡马口村区测试场地具有显著的场地地震动放大效应，且具有一定的方向性；参考点谱比法卓越频率两方向具有一定的差异，主要介于5—8 Hz频带范围内。各测点H/V谱比卓越频率亦主要介于5—8 Hz频带范围内，与参考点谱比法优势频带相吻合。

表 3 骡马口村区各测点谱比计算结果

Table 3. Luomakou village measured spectral ratio statistics

测点号	参考点谱比法卓越频率/Hz		参考点谱比法场地放大系数		H/V谱比法卓越频率/Hz
测点号	EW	NS	EW	NS	EW	NS
L₁	5.47	7.50	5.19	3.53	5.57	7.49
L₂	5.53	5.36	5.81	6.25	5.44	5.04
L₃	5.24	5.01	7.79	9.19	5.13	4.80
L₄	5.47	5.30	5.95	6.25	5.45	5.04

下载: 导出CSV

| 显示表格

由鲁甸县龙头山集镇震害调查可知，骡马口村区多数房屋建筑为一层土木与砖木结构，其基频约为8—10 Hz （王广军，樊水荣，1989；中华人民共和国建设部，1990），与场地脉动测试卓越频率范围不吻合，未有结构地震反应的共振效应，但显著的地震动放大效应可导致土木与砖木结构的严重破坏甚至倒塌。

由此可知，骡马口村区土木与砖木结构房屋（不包含木框架结构）地震震害较为严重，除其抗震性能较差外，也与显著的场地地震动放大效应有关。

3. 讨论与结论

基于鲁甸龙头山集镇老行政机关办公区、老街区及骡马口村区三个震害严重区域的地脉动测试记录的频谱分析，并结合各区内建筑结构特点、局部场地效应及震害进行综合分析，结果表明：

1）老行政机关办公区场地具有显著的场地放大效应，且场地放大效应具有方向上的差异；参考点谱比法卓越频率东西与南北方向有一定的差异，主要介于3—8 Hz频带范围内；各测点H/V谱比法卓越频率主要位于2—6 Hz频带范围内，基本与参考点谱比法优势频带相吻合。老行政机关办公区房屋建筑震害较重是由其场地显著的放大效应及场地和结构体系的共振效应共同作用引起的。

2）老街区场地具有明显的场地放大效应，且具有一定的方向性差异；老街区场地放大效应的差异性导致了震害的分区性；参考点谱比法场地两方向卓越频率存在一定的差异，主要介于3—8 Hz频带范围内；各测点H/V谱比法卓越频率与参考点谱比法的卓越频率差异较明显，主要介于3—6 Hz频带范围内，较参考点谱比法优势频带窄。老街区内砖混建筑震害较重是由其场地的放大效应及场地和结构体系的共振效应共同作用引起的，土木建筑主要是由场地放大效应引起的。

3）骡马口村区测试场地具有显著的场地放大效应，且具有一定的方向性差异；参考点谱比法卓越频率两方向具有一定的差异，主要介于5—8 Hz频带范围内。各测点H/V谱比卓越频率亦主要介于5—8 Hz频带范围内，与参考点谱比法优势频带相吻合。骡马口村区测试场地上的房屋震害较重是由其场地显著的放大效应引起的。

图 1 卷积神经网络和循环神经网络用于震相拾取的关系示意

Figure 1. The relationship between CNN and RNN used for phase picking

下载: 全尺寸图片幻灯片

图 2 用于震相拾取的纯卷积结构设计

Figure 2. Pure CNN structure designed for phase picking

下载: 全尺寸图片幻灯片

图 3 用于到时提取的WaveNet网络结构

Figure 3. WaveNet structure used for phase picking

下载: 全尺寸图片幻灯片

图 4 训练数据

Figure 4. Training data

下载: 全尺寸图片幻灯片

图 5 多个模型对于P波（a）和S波（b）拾取的受试者工作特征曲线（ROC）

RE为使用深度可分离卷积代替传统卷积结构，FP16为网络计算中使用16位浮点

Figure 5. ROC curves of picking P phase （a） and S phase （b） based on eight DNN models

RE stands for separable CNN optimized network，FP16 stands for 16bit floating for computing

下载: 全尺寸图片幻灯片

图 6 基于P波（a）和S波（b）的神经网络模型预测误差统计图

RE为使用深度可分离卷积代替传统卷积结构，FP16为网络计算中使用16位浮点。箱型图矩形边界为上下四分位数，绿色线条为中位数，三角形为均值，黑色短线为数值边界。矩形上下四分位数越接近，且均值越接近0，效果越好

Figure 6. The error staticstics of different DNN models on P phase （a） and S phase （b）

RE stands for separable CNN optimized network，FP16 stands for 16bit floating for computing. The box rectangle is the upper and lower quartiles，the green line is the median，the triangle symbol is the mean value，and the black short line is the boundary. The closer the upper and lower quartiles of the rectangle are and the closer the mean is to zero，the better

下载: 全尺寸图片幻灯片

图 7 不同噪声对于模型预测的影响

RE为使用深度可分离卷积代替传统卷积结构，FP16为网络计算中使用16位浮点（a）近震波形分析；（b）远震P波拾取失败分析

Figure 7. Effect of different noises on model prediction

RE stands for separable CNN optimized network，FP16 stands for 16bit floating for computing（a） Analysis of near-shock waveforms；（b） Analysis of failures on tele-seismics

下载: 全尺寸图片幻灯片

图 8 八个测试模型在不同噪声情况下的ROC曲线

ROC曲线下方面积越大效果越好。RE代表深度可分离卷积优化的网络，FP16代表16位浮点精度计算结果（a） P波拾取的ROC曲线；（b） S波拾取的ROC曲线

Figure 8. ROC curves of eight DNN models with different signal to noise ratio （SNR）

The bigger area under ROC，the better. RE stands for separable CNN optimized network，FP16 stands for 16bit floating for computing （a） ROC curve of picking P phase；（b） ROC curve of picking S phase

下载: 全尺寸图片幻灯片

表 1 七层卷积神经网络

Table 1 Seven-layer CNN

层号	基础网络	核心	特征数量	扩张率	激活函数	正则化
1	卷积	3	32	1	LeakyReLU	BN
2	卷积	3	64	1	LeakyReLU	BN
3	卷积	3	128	1	LeakyReLU	BN
4	卷积	3	128	1	LeakyReLU	BN
5	卷积	3	128	2	LeakyReLU	BN
6	卷积	3	128	4	LeakyReLU	BN
7	卷积	3	128	8	LeakyReLU	BN
8	全连接		3		无	无

下载: 导出CSV

表 2 三层卷积神经网络

Table 2 Three-layer CNN

层号	基础网络	卷积核心	特征数量	激活函数	正则化
1	卷积	5	32	LeakyReLU	BN
2	卷积	5	64	LeakyReLU	BN
3	卷积	5	128	LeakyReLU	BN
4	全连接		3	无	无

下载: 导出CSV

表 3 编码解码模型（U-Net）

Table 3 The encoder-decoder model （U-Net）

层号	基础网络	核心	特征数量	降采样率	激活函数	正则化
1	卷积×2＋池化	3	32	2	LeakyReLU	BN
2	卷积×2＋池化	3	64	2	LeakyReLU	BN
3	卷积×2＋池化	3	128	2	LeakyReLU	BN
4	卷积×2＋池化	3	256	2	LeakyReLU	BN
5	转置卷积＋卷积×2	3	256，128	0.5	LeakyReLU	BN
5	转置卷积＋卷积×2	3	128，64	0.5	LeakyReLU	BN
6	转置卷积＋卷积×2	3	64，32	0.5	LeakyReLU	BN
8	全连接		3		无	无

下载: 导出CSV

表 4 双向循环神经网络用于到时拾取

Table 4 Bidirectional RNN used for phase picking

层号	基础网络	核心	特征数量	激活函数	正则化
1	卷积	3	32	LeakyReLU	BN
2	卷积	3	64	LeakyReLU	BN
3	卷积	3	128	LeakyReLU	BN
4	GRU （双向）	−	128	tanh	无
5	GRU （双向）	−	128	tanh	无
8	全连接		3	无	无

下载: 导出CSV

表 5 CPU和GPU上的网络性能统计

Table 5 Performance statistics on CPU and GPU

网络名称	可训练参数个数	CPU环境15个样本推断时长/s	GPU环境15个样本推断时长/s
3层CNN	52 195	0.12	0.008 8
7层CNN	229 283	0.51	0.025
编码解码结构	1 748 771	0.67	0.030
CNN＋RNN	476 195	1.2	1.0
WaveNet	2 715 651	4.5	0.17
7层CNN （RE）	78 758	0.19	0.021
7层CNN （RE，FP16）	78758	16	0.020
WaveNet （RE）	770692	2.4	0.17
注：RE代表深度可分离卷积优化，FP16代表16位浮点计算。

下载: 导出CSV

参考文献(27)

于子叶,储日升,盛敏汉. 2018. 深度神经网络拾取地震P和S波到时[J]. 地球物理学报,<bold>61</bold>(12):4873–4886. doi: 10.6038/cjg2018L0725

Yu Z Y,Chu R S,Sheng M H. 2018. Pick onset time of P and S phase by deep neural network[J]. <italic>Chinese Journal of Geophysics</italic>,<bold>61</bold>(12):4873–4886 (in Chinese). doi: 10.6038/cjg2018L0725（inChinese）

赵明,陈石,房立华,Yuen D A. 2019. 基于U形卷积神经网络的震相识别与到时拾取方法研究[J]. 地球物理学报,<bold>62</bold>(8):3034–3042. doi: 10.6038/cjg2019M0495

Zhao M,Chen S,Fang L H,Yuen D A. 2019. Earthquake phase arrival auto-picking based on U-shaped convolutional neural network[J]. <italic>Chinese Journal of Geophysics</italic>,<bold>62</bold>(8):3034–3042 (in Chinese). doi: 10.6038/cjg2019M0495

Cho K, van Merriënboer B, Gulcehre C, Bahdanau D, Bougares F, Schwenk H, Bengio Y. 2014. Learning phrase representations using RNN encoder-decoder for statistical machine translation[Z]. arXiv preprint. arXiv: 1406.1078.

Courbariaux M, Bengio Y, David J P. 2014. Training deep neural networks with low precision multiplications[Z]. arXiv preprint. arXiv: 1412.7024.

García L,Álvarez I,Benítez C,Titos M,Titos M,Bueno Á,Mota S,De La Torre Á,Segura J C,Alguacil G,Díaz-Moreno A,Prudencio J,García-Yeguas A,Ibáñez J M,Zuccarello L,Cocina O,Patanè D. 2016. Advances on the automatic estimation of the P-wave onset time[J]. <italic>Ann Geophys</italic>,<bold>59</bold>(4):S0434.

He K M, Zhang X Y, Ren S Q, Sun J. 2016. Deep residual learning for image recognition[C]//Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA: IEEE: 770–778.

Hinton G, Vinyals O, Dean J. 2015. Distilling the knowledge in a neural network[Z]. arXiv preprint. arXiv: 1503.02531.

Hochreiter S,Schmidhuber J. 1997. Long short-term memory[J]. <italic>Neural Comput</italic>,<bold>9</bold>(8):1735–1780. doi: 10.1162/neco.1997.9.8.1735

Howard A G, Zhu M L, Chen B, Kalenichenko D, Wang W J, Weyand T, Andreetto M, Adam H. 2017. Mobilenets: Efficient convolutional neural networks for mobile vision applications[Z]. arXiv preprint. arXiv: 1704.04861.

Hu L L,Zheng X D,Duan Y T,Yan X F,Hu Y,Zhang X L. 2019. First-arrival picking with a U-net convolutional network[J]. <italic>Geophysics</italic>,<bold>84</bold>(6):1–58. doi: 10.1190/geo2019-1029-tiogeo.1

Ioffe S, Szegedy C. 2015. Batch normalization: Accelerating deep network training by reducing internal covariate shift[Z]. arXiv preprint. arXiv: 1502.03167.

LeCun Y,Bottou L,Bengio Y,Haffner P. 1998. Gradient-based learning applied to document recognition[J]. <italic>Proc IEEE</italic>,<bold>86</bold>(11):2278–2324. doi: 10.1109/5.726791

Maass W. 1997. Networks of spiking neurons:The third generation of neural network models[J]. <italic>Neu Networks</italic>,<bold>10</bold>(9):1659–1671. doi: 10.1016/S0893-6080(97)00011-7

Ronneberger O, Fischer P, Brox T. 2015. U-Net: Convolutional networks for biomedical image segmentation[C]//International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich, Germany: Springer: 234–241.

Ross Z E,Meier M A,Hauksson E. 2018. P wave arrival picking and first‐motion polarity determination with deep learning[J]. <italic>J Geophys Res</italic>:<italic>Solid Earth</italic>,<bold>123</bold>(6):5120–5129. doi: 10.1029/2017JB015251

Rumelhart D E,Hinton G E,Williams R J. 1986. Learning representations by back-propagating errors[J]. <italic>Nature</italic>,<bold>323</bold>(6088):533–536. doi: 10.1038/323533a0

Sandler M, Howard A, Zhu M L, Zhmoginov A, Chen L C. 2018. MobileNetV2: Inverted residuals and linear bottlenecks[C]//Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, UT, USA: IEEE: 4510–4520.

Schuster M,Paliwal K K. 1997. Bidirectional recurrent neural networks[J]. <italic>IEEE Trans Signal Process</italic>,<bold>45</bold>(11):2673–2681. doi: 10.1109/78.650093

van der Baan M,Jutten C. 2000. Neural networks in geophysical applications[J]. <italic>Geophysics</italic>,<bold>65</bold>(4):1032–1047. doi: 10.1190/1.1444797

van den Oord A, Dieleman S, Zen H G, Simonyan K, Vinyals O, Graves A, Kalchbrenner N, Senior A, Kavukcuoglu K. 2016. WaveNet: A generative model for raw audio[Z]. arXiv preprint. arXiv: 1609.03499.

Zeiler M D, Krishnan D, Taylor G W, Fergus R. 2010. Deconvolutional networks[C]//2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA: IEEE: 2528–2535.

Zhang K P,Zhang Z P,Li Z F,Qiao Y. 2016. Joint face detection and alignment using multitask cascaded convolutional networks[J]. <italic>IEEE Signal Process Lett</italic>,<bold>23</bold>(10):1499–1503. doi: 10.1109/LSP.2016.2603342

Zhao Y,Takano K. 1999. An artificial neural network approach for broadband seismic phase picking[J]. <italic>Bull Seismol Soc Am</italic>,<bold>89</bold>(3):670–680.

Zhou Y J,Yue H,Kong Q K,Zhou S Y. 2019. Hybrid event detection and phase‐picking algorithm using convolutional and recurrent neural networks[J]. <italic>Seismol Res Lett</italic>,<bold>90</bold>(3):1079–1087. doi: 10.1785/0220180319

Zhu W Q,Beroza G C. 2018. PhaseNet:A deep-neural-network-based seismic arrival-time picking method[J]. <italic>Geophys J Int</italic>,<bold>216</bold>(1):261–273.

施引文献

资源附件(0)

图(8) / 表(5)

计量

文章访问数: 955
HTML全文浏览量: 422
PDF下载量: 71
被引次数: 0

引言
1. 龙头山集镇地脉动测试
1.1 地脉动观测
1.2 脉动数据处理
1.3 测点谱比曲线特征
2. 场地特征与震害影响分析
3. 讨论与结论

兼顾速度和精度的深度神经网络震相拾取

通讯作者: 储日升: e-mail：chur@asch.whigg.ac.cn

计量

出版历程

A new deep neural network for phase picking with balanced speed and accuracy