考虑震源不确定性的近断层高山峡谷场地地震动变异性分析

孟思博, 魏石涛, 刘中宪, 李文轩, 刘英

孟思博,魏石涛,刘中宪,李文轩,刘英. 2024. 考虑震源不确定性的近断层高山峡谷场地地震动变异性分析. 地震学报,46(6):1034−1050. DOI: 10.11939/jass.20230029
引用本文: 孟思博,魏石涛,刘中宪,李文轩,刘英. 2024. 考虑震源不确定性的近断层高山峡谷场地地震动变异性分析. 地震学报,46(6):1034−1050. DOI: 10.11939/jass.20230029
Meng S B,Wei S T,Liu Z X,Li W X,Liu Y. 2024. Ground motion variability of a mountain-canyon site near a strike-slip fault considering uncertainty of source. Acta Seismologica Sinica46(6):1034−1050. DOI: 10.11939/jass.20230029
Citation: Meng S B,Wei S T,Liu Z X,Li W X,Liu Y. 2024. Ground motion variability of a mountain-canyon site near a strike-slip fault considering uncertainty of source. Acta Seismologica Sinica46(6):1034−1050. DOI: 10.11939/jass.20230029

考虑震源不确定性的近断层高山峡谷场地地震动变异性分析

基金项目: 国家自然科学基金(U2139208,52208497,52278516)和天津市自然科学基金(22JCQNJC00030)联合资助
详细信息
    作者简介:

    孟思博,博士,副教授,主要从事地震工程与桥梁工程方面研究,e-mail:sibomeng@yeah.net

    通讯作者:

    刘中宪,博士,教授,主要从事地震工程与工程波动方面研究,e-mail:zhongxian1212@163.com

  • 中图分类号: TP183, P315.9

Ground motion variability of a mountain-canyon site near a strike-slip fault considering uncertainty of source

  • 摘要:

    由于震源不确定性客观存在且对近地表地震动特性产生显著影响,尝试将乘子降维法应用至考虑震源不确定性的近断层复杂场地地震动变异性求解,将不确定性分析问题转换为有限次确定性分析,获得与蒙特卡洛模拟一致的地震动参数统计矩,其中单次确定性分析采用边界元法模拟断层破裂—传播路径—场地放大的整个物理过程。基于乘子降维法,以近走滑断层高山峡谷场地为例,分析了在近断层效应、场地效应和震源不确定性三者耦合作用下的场地地震动峰值加速度(PGA)、峰值速度(PGV)的空间分布变异性,以及关键地表点谱加速度(SA)的统计值。结果表明:乘子降维法适用于含震源参数不确定性的近断层复杂场地随机地震动求解;高山峡谷地形对地震波的散射效应叠加近断层效应后可引起断层上盘PGA和PGV均值的显著增大,可放大至两倍以上;震源不确定性经由场地传播,导致地表地震动变异性,PGA变异性强于PGV;考虑一倍均方差时,震源不确定性对结构反应的影响可达30%以上,大跨度工程结构还应考虑近断层地震动变异性的空间分布差异。

    Abstract:

    A large number of railways and highways in the western part of China are located in near-fault mountain-canyon sites. The bridges and tunnels account for a large proportion due to the complex topography, and many important projects are faced with severe seismic risk. The ground motions in the near-fault mountain-canyon sites are very complex. On the one hand, velocity pulses and large vertical amplitudes are typical characteristics of the ground motions in near-fault regions; on the other hand, the topography of mountains and canyons leads to amplification and non-uniformity effects on ground motions. For example, the 1992 Hualien earthquake records show that the peak ground acceleration on the sidewalls of the Feitsui canyon in Taiwan is 2.69 times than that of the canyon bottom. In the 2008 Wenchuan earthquake, the peak ground acceleration in the east-west direction at the top of Xishan Mountain in Zigong is 1.77 times than that at the foot of the mountain. Theoretical and numerical analyses reveal that the physical essence of the amplification and non-uniformity effect is the scattering and local focusing of seismic waves by the topography of mountain-canyon sites.

    In addition, the current technologies of geophysical prospecting make it difficult to finely determine the physical parameters of faults, interface slip characteristics, etc. It means that the fault rupture process has uncertainty. Based on the previous studies, the uncertainty of source existed objectively and had a significant impact on the characteristics of near-surface ground motions. In this study, it is an issue of quantifying uncertainty in ground motion parameters at near-fault mountain-canyon sites. Monte Carlo simulations and logic trees are commonly used to quantify the uncertainty in this problem. The main purpose is to construct different seismic scenarios, focusing on comparing the standard deviation of the spatial distribution of ground motions in the actual regional site with the standard deviation in the ground motion prediction model. It is worth pointing out that the Monte Carlo simulation has low efficiency to carry out the multidimensional uncertainty analysis. Besides, the simulation of ground motions in near-fault mountain-canyon sites needs to take into account near-fault and topography effects. Meanwhile, the uncertainty of the seismic source will cause random scattering of the seismic waves in mountain-canyon sites, which will lead to the variability of the ground motion parameters at various surface locations. However, the existing studies have not explored the propagation mechanism in depth.

    In this paper, the multiplicative dimensional reduction method (M-DRM) is applied to solve the ground motion variability of complex sites near-fault considering the uncertainty of the source. The uncertainty analysis problem is converted into a finite deterministic analysis to obtain statistical moments of ground motion parameters consistent with Monte Carlo simulation. The deterministic analysis uses the boundary element method to simulate the entire physical process. Based on this method, the mountain-canyon site near a strike-slip fault was discussed as an example. The spatial distribution variability of the peak acceleration (PGA) and peak velocity (PGV) under the coupling of near-fault effect, site effect and source epistemic uncertainty was analyzed, as well as statistical values of spectral acceleration (SA) at some surface points.

    The results indicated that the M-DRM is applied to the ground motion variability problem of near-fault mountain-canyon sites caused by seismic source uncertainty, which has higher computational efficiency compared with the conventional Monte Carlo simulation. This method can be used for the stochastic ground motion simulation of the complex sites based on the phylsical model and considering the uncertainty of seismic source. When there is a mountain-canyon topography in the near-fault region, the coupling of the near-fault effect and the local site effect causes a significant amplification of the mean values of the PGAs at the sites, which shows significant spatial variations, especially in the canyon. It can be up to 2.69 times that of the result without the local topography. The mean values of the variability of the PGVs at the different surface points are smaller than those of the PGAs. The structural periods corresponding to the maximum values of the surface ground motion acceleration response spectrum are basically the same under the conditions with and without mountain-canyon topography. The seismic source uncertainty is propagated through the site, which is finally manifested in the spatial distribution variability of PGAs and PGVs. Due to the different energy distributions of ground motion acceleration and velocity, there are differences in the variability of PGAs and PGVs. PGAs have larger coefficients of variation. The variability of PGAs and PGVs is different from that of a single parameter under different rupture scenarios when both the asperity intensity and the rupture velocity uncertainty are taken into account. However, the results of the acceleration response spectrum are more complicated. The variability of the structural response at different locations may be lower or higher than the superposition of single-parameter uncertainty variability, and it is affected by the location of the asperity.

  • 随着科技的迅速发展和全球氛围的不断升温,非天然地震活动的监测与识别成为维护国家安全与生态平衡的关键一环。地下核爆的有效监测可以帮助国际社会更好地履行《全面禁止核试验条约》等国际公约,从而维护全球核安全。识别非天然地震技术对监测地下核爆和区域性非天然地震事件、国家军事响应能力和国家安全保障尤为重要(Chiang et al,2018Gaebler et al,2019Wang et al,2022)。一方面,天然地震目录中往往混杂着大量非天然地震,不利于构造地震的研究;另一方面,地震事件数量随震级的降低呈指数级增长,淹没在小震级地震事件中的特殊地震事件将更加难以检测和识别。因此,对小震级地震事件进行研究将成为推动监测与识别非天然地震技术发展的重要方向。

    非天然地震事件涵盖了工业爆破、矿震塌陷、核爆炸、滑坡等等。在早期对地震事件类型的识别研究中,主要聚焦于区分天然地震和核爆炸,国内外的研究学者已将发震位置、P波初动方向、mb/MS、震相幅值比等特征作为识别核爆的判据(Pomeroy et al,1982Taylor et al,1989边银菊,2005Selby et al,2005Chiang et al,2014)。随着研究逐渐深入,地震事件类型识别的量化特征被不断发掘与验证。例如:王婷婷和边银菊(2011)提出P波初动振幅与S波峰值振幅之比、P波峰值振幅与S波峰值振幅之比可作为首都圈小震级天然地震和爆破事件的判定依据;靳玉贞等(20152019)研究发现优势频率可用于区分山西地区的非天然地震事件;杨千里等(2020)根据地震与爆炸在时频谱中的差异性,引入谱图二阶矩,作为新的识别判据;Voyles等(2020)和Koper等(2021)均指出ML-MC是区分爆炸和天然地震的有用度量;Sanina等(2021)将P波和Lg波振幅谱对数比频率曲线的斜率作为新判据,以区分短时群爆炸和地震;Zhang等(2021)对比了P/S幅值比、持续时间、谱图二阶矩、拐角频率等32个特征对地震、爆炸和矿震的分类性能。

    大量研究人员使用人工智能方法或与其它方法联合进行非天然地震事件的分类。陈润航等(2018)采用卷积神经网络与梅尔频率倒谱系数对首都圈及其周边地区的天然地震和人工爆破事件进行分类识别,正确识别率达97.1%。Tibi等(2019)对犹他州地区的地震事件采用振幅比和机器学习方法进行对比研究,振幅比联合多元二次判别函数的准确率为80%—90%,训练卷积神经网络模型的准确率为90%—100%,并指出最佳方案是结合振幅比和机器学习方法各自的长处。Jia等(2022)参考卷积神经网络结构VGGnet、ResNet和Inception设计了三种地震事件分类器,利用三通道地震全波形时间序列数据和频谱数据对设计的分类器进行了测试和比较,地震、爆破和矿山坍塌的快速分类可以在事件发生后约1分钟内完成。Ren等(2022)使用AlexNet卷积神经网络模型对宁夏及周边地区地震事件波形记录进行识别研究,对天然地震的识别准确率可达100%,而对爆炸和塌陷的准确率只有大约85%。Kong等(2022)提出了将深度学习和物理特征相结合的地震事件识别方法,对天然地震和爆破事件进行有效区分,该组合方法具有更强的泛化能力。Yue等(2023)构建了一个包含7层卷积神经网络的模型,通过分析地震波形图像和时频谱信息,对自然地震、爆破和塌陷地震事件进行分类,实验表明识别方面表现出色,平均准确率达96.13%。Barama等(2023)使用P波地震记录和卷积神经网络训练得到了一个地震源分类器,对天然地震的P波、地下核爆炸的P波以及噪声进行识别验证,准确率超过95%。隗永刚等(2019)提出了基于深度学习残差网络模型的爆破识别方法,对河北三河采石场的爆破和周边地震事件进行识别研究,结果表明该模型识别率达97.3%且效果稳定。任涛等(2019)采用Bagging机器学习算法对震中距在80—200 km的地震事件进行识别,准确率达85%以上。Wang等(2022)利用5种人工智能方法构建了中国中东部地区地震、爆炸和矿震的两分类与三分类模型,其中,地震/矿震分类器和地震/爆炸分类器的平均准确率分别为97.4%—98.4%和96.5%—97.6%。Mousavi等(2016)利用人工神经网络模型和逻辑回归模型,将震源深度小于250 m的事件从震源深度为10002000 m的事件中区分出来,准确率为88%—90.7%。Shang等(2017)使用主成分分析(principal components analysis,缩写为PCA)和人工神经网络(artificial neural network,缩写为ANN)对微震事件与采石场爆炸的判别进行了研究,PCA的准确率达到了89%,结果表明PCA-ANN分类器在微震事件分类中最为可靠且具有潜力。Lindenbaum等(2020)通过训练神经网络和树分类器来估计可疑事件的性质,将此方法应用于在以色列和约旦收集的1609个事件中,取得了良好的效果。Tan等(2021)将线性判别函数(linear discriminant function,缩写为LDF)和ANN方法应用于土耳其埃迪尔内地区及其附近的地震事件,将地震和采石场爆炸区分开,LDF和ANN的准确率分别为95%和99%。范晓易等(2020)利用小波变换从山东地区的天然地震、爆破和塌陷事件中提取出香农熵特征,采用支持向量机方法(a library of support vector machine,缩写为LIBSVM)进行分类识别,分析了影响分类效果的因素。蔡杏辉等(2021)结合特征组合和支持向量机对福建地区的天然地震和人工爆破事件进行事件类型判别,识别准确率达到了94.5%。梁皓等(2023)使用支持向量机方法对中国东北地区的天然地震、爆破和塌陷事件进行了分类识别,结果显示,该方法在三分类识别中取得了99.2%的准确率,证明了支持向量机在少样本量地震事件分类中的潜在应用前景。这些研究表明人工智能方法在地震事件类型识别方面表现优异,值得作进一步的研究。

    本文主要聚焦于华北地区M3以下的天然地震、人工爆炸和矿震塌陷三种不同类型的地震事件,对地震波形、频率及能量进行分析,提取并量化时域、频域和能量特征,建立相应的特征训练集和测试集,结合三种不同的机器学习方法对三类事件进行分类,并对分类效果进行评估分析,对比不同分类器的性能。

    从北京遥测数字地震台网和国家测震台网数据备份中心获取了华北地区事件目录和相应的地震波形记录,筛选出了2008年8月至2016年12月期间的741次天然地震、608次人工爆炸和586次矿震塌陷,总计1935个事件,研究范围为(108.4°—124.1°E,34.1°—43.7°N)。在对三类事件的波形、发震时间和地点逐一进行观察后,进一步核实了事件目录的准确性。为确保每类事件的样本数量平衡,按照时间和地理位置的均匀分布进行了筛选,最终确定每类事件545个,共1635个地震事件作为样本数据。在本研究中,我们采用了留出法将数据集划分为训练集和测试集两部分,训练集用于构建模型,测试集用于评估性能。具体地,将每类事件分别划分为训练数据和测试数据,其中训练数据占总样本的75%,用于构建与验证分类模型,而测试数据占25%,则用于评估分类模型的性能。训练数据的范围为(109.3°—123.5°E,34.1°—43.7°N)(图1a),覆盖了华北地区的主要地理范围,有助于确保模型在训练阶段能够涵盖地区的多样性和复杂性。测试数据的范围为(110.8°—124.1°E,34.9°—42.7°N)(图1b)。从分布图中可以看出,天然地震呈现出分散和随机分布的特点,相比之下,人工爆炸呈现相对聚集的状态,矿震塌陷则最为集中。

    图  1  华北地区训练数据(a)和测试数据(b)的地震事件分布图
    Figure  1.  Distribution map of train (a) and test (b) data of seismic events in North China

    图2为2008年到2016年间华北地区天然地震、人工爆炸和矿震塌陷数量的年度分布图,从中可以更直观地观察到地震事件数量的年度变化趋势。由于数据从2008年8月开始统计,所以2008年的地震事件数量相较于其它年份更少。天然地震数量的整体分布呈现随机性,反映了构造地震在不同年份的多样性和复杂性;人工爆炸的数量在2010年达到峰值,2013年后数量骤减,可能与首都圈城市、公路工程等处于建设高峰期有关;矿震塌陷的数量在2013年出现明显增加,而后逐年下降。工业和信息化部(2011,2016)发布的《民用爆炸物品行业发展规划》倡导可持续发展,因此政策的调整可能对2014至2016年间非天然地震的发生产生了影响。通过分析这些地震事件数量的年度变化趋势,能够更好地理解人类活动对地震事件的影响。

    图  2  2008—2016年华北地区地震事件年度分布
    Figure  2.  Annual distribution of seismic events of North China area during 2008−2016

    三类事件的震级均为M3.0以下,主要集中在M1.5—2.5的范围内。其中,天然地震的震级主要分布在M1.5—2.0之间,而人工爆炸和矿震塌陷的震级主要分布在M1.5—2.5。地震事件的训练数据和测试数据样本震级分布统计直方图如图3所示,训练数据和测试数据的震级分布之间的差异微小,两者保持了高度的一致性。

    图  3  训练数据(a)和测试数据(b)地震事件震级分布统计
    Figure  3.  Magnitude distribution statistics of train (a) and test data (b) seismic events

    本研究涉及的地震类型主要分为三类:天然地震、人工爆炸和矿震塌陷。天然地震通常是由地壳或板块运动、断裂、岩石变形引起的地质构造活动,释放的能量较大且持续时间较长,震源释放能量的过程中会产生特定的震荡模式,主要以弹性波的形式传播。天然地震的震源机制主要涉及剪切位错源,剪切位错是地球内部岩石断裂的一种形式,是地震能量释放的主要机制之一。地震波具有复杂成分和较慢的衰减速度,所记录到的波形数据通常较为连续和平滑。人工爆炸主要指由工业活动引起的爆破事件,这类地震事件的震源通常是人为引起的,主要涉及爆破引起的岩石膨胀破裂,高能量的爆炸物在短时间内释放能量,爆炸产生的气体和热能会导致周围岩石的瞬时膨胀,发生剧烈的破碎和变形。一般发生在近地表,传播介质较为疏松,相比天然地震,人工爆炸产生的地震波具有更简单的波形特征和更快的衰减速度。矿震塌陷主要指由采矿活动引起的震动和地下空间塌陷所导致的地震事件,在采矿过程中,岩石内部的应力状态改变,可能发生断裂和破碎,同时地下矿体的岩石受到破坏和移除,导致地下空洞的形成。当地下空洞无法支撑地表或地下结构时,就会发生地下空间的塌陷,产生地震波。其震源深度较浅,由于矿山地质条件的复杂性和采矿活动的影响,传播路径相对不稳定,会受到地形地貌的影响,从而导致地震波在传播过程中可能失真或衰减(赵永等,1995Zhang et al,2021)。研究首先对原始地震数据进行了预处理,其中包括振幅归一化、去趋势、去均值和带通滤波(0.5—20 Hz),之后进行短时傅里叶变换,最终筛选出震中距300 km以内的地震波形。绘制三类地震事件的波形记录和时频图,通过波形和时频图可以更详细地观察地震事件在时域和频域上的特征。从中挑选了较具代表性的三次事件的单台记录(图4),更直观地对时频域上的差异进行比较。

    图  4  天然地震(a)、人工爆炸(b)、矿震塌陷(c)的波形记录和时频图
    Figure  4.  Waveform records and time-frequency spectrograms of natural earthquake (a),artificial explosion (b) and mining collapse (c),respectively

    天然地震的波形(图4a)频带较宽,0—20 Hz均有能量分布,主要集中在3—12 Hz,S波振幅和能量明显大于P波;人工爆炸的波形(图4b)中P波十分尖锐,持续时间较短,衰减迅速,从时频图中可以看出能量为瞬间释放,集中在5—15 Hz,符合爆炸源的瞬时特性,S波能量与幅值低于P波,频率低于10 Hz;矿震塌陷的波形(图4c)衰减缓慢,持续时间较长,以低频成分(1—6 Hz)为主。

    根据上述对天然地震、人工爆炸、矿震塌陷三类地震事件的波形记录和时频图的综合分析,对三类事件的垂直分量地震记录进行特征提取。考虑在地学领域的物理意义和应用背景,编写了相应的计算函数,准确提取出每类特征的具体数值,并对多个台站的计算结果进行平均。从这些原始地震数据中共提取了62个特征,分为时间、P/S幅值比、频率、过零率、峰值振幅、峰值地面加速度、能量、信号、角度、其它比值10个类别,具体描述列于表1

    表  1  所提取的特征表
    Table  1.  Table of extracted features
    特征 物理意义 数量
    时间 地震波形从起始点到达波峰所需的时间;从波峰到达结束点所需的时间;从起始点到结束点所经历的总时间;地震波形超过设定阈值的持续时间;地震波形在超过设定阈值后到达波峰所需的时间;地震波形在超过设定阈值后从波峰到结束点所需的时间;地震波形在超过设定阈值前波形的上升、下降时间;两个相邻的波峰或波谷之间的时间间隔,即两个相邻波峰或波谷之间的周期长度(Kim et al,2 021薛思敏等,2 022)。 9
    P/S幅值比 P波与S波峰值振幅之比(Yıldırım et al,2 011);对P波、S波进行傅里叶变换,滤波波段为1—20 Hz时振幅之比(Wang et al,2 021)。 21
    频率 地震信号中波形每秒振动的次数,为周期的倒数(Levshin et al,1995);中心频率,地震信号在频率域中的中心位置;主频率,地震信号中振幅最大的频率;平均频率,地震信号频谱的加权平均频率;地震波形在上升或下降阶段的平均频率;波形上升、下降时,地震信号在超过设定阈值的情况下的平均频率;地震信号复倒频谱的实部(魏富胜,黎明,
    2 003
    )。
    9
    过零率 地震波形从正向值变为负向值,或从负向值变为正向值的次数;地震信号在超过设定阈值的情况下的过零率;峰值振幅前、后的过零率;地震信号在超过设定阈值的情况下的最大振幅前、后的过零率(Dargahi-Noubary,1998)。 6
    峰值振幅 地震波形中振幅达到的最大值(Horasan et al,2009Badawy et al,2019)。 1
    峰值地面加速度 地震信号中垂直地面方向的最大加速度值(Goforth et al,2006)。 1
    能量 地震信号总能量;峰值振幅前吸收能量、峰值振幅后衰减能量(刘莎等,2012)。 3
    信号 地震信号强度;信号均方根(Laasri et al,2015Saad et al,2019)。 2
    其它比值 地震波形的上升时间、下降时间与峰值振幅之比(the ratio of rise time to amplitude,缩写为RA;the ratio of decay time to amplitude,缩写为DA);阈值之上的上升、下降时间和振幅的比值;RA,DA与地震波形的平均频率之比(ratio of RA to average frequency,缩写为RA/AF;ratio of DA to average frequency,缩写为DA/AF)(吴顺川等,2020)。 6
    角度 地震波形的上升、下降角度,为RA,DA的反正切函数(Ma et al,2015);地震信号在超过设定阈值的情况下的上升、下降角度。 4
    下载: 导出CSV 
    | 显示表格

    特征提取过程不仅关注地震学领域的专业知识,还引入了岩石力学领域的一些常用分类特征,例如RA,RA/AF,DA和DA/AF等。这种综合的特征选择和提取方法,使得我们能够更全面、准确地揭示不同类型地震事件的独特性质,为后续分析和搭建分类模型奠定了基础。

    图5展示了所提取的62个特征中部分特征的分布情况。图5a5b为阈值之上的平均下降频率和P/S振幅比(滤波波段为9.5—10.5 Hz)的特征分布图,三类事件中这两个特征集中在不同数值分布范围。在图5a中可以观察到,天然地震的均值最大,而矿震塌陷的均值最小;图5b中,天然地震的均值最小,人工爆炸的均值最大;图5c为1—20 Hz频带的P/S振幅比数值分布图,5 Hz以后人工爆炸的P/S振幅比趋于最大,天然地震的振幅比趋于最小。

    图  5  特征分布图
    (a) 阈值之上的平均下降频率特征分布;(b) 滤波波段为9.5—10.5 Hz的P/S振幅比特征分布;(c) 1—20 Hz频带的P/S振幅比特征分布
    Figure  5.  Distribution of features
    (a) Distributions of features of the decay average frequency above the threshold;(b) The P/S amplitude ratio distribution at 9.5—10.5 Hz filter band;(c) The P/S amplitude ratio distribution at the frequency band from 1 to 20 Hz

    K-近邻算法(K-Nearest Neighbor,缩写为KNN)是一种基本分类和回归方法,本研究只涉及到KNN的分类问题。在KNN的分类过程中,首先,给定一个训练数据集,该数据集包含已知类别的实例。对于新的输入实例,算法会在训练数据集中找到与该实例最邻近的K个实例,通常通过计算距离来确定邻近性;其次,KNN算法将统计这K个邻近实例中各个类别出现的频率;最后,将输入实例分类到其中出现频率最高的类别,成为该实例的预测分类。这种基于邻近性的分类方法,能够在不依赖先验概率分布的情况下,通过对数据集的直接学习进行预测,具有较好的适用性和灵活性。在实际应用中,KNN算法曾用于火山构造地震的分类与识别微震事件和爆破事件的分类问题(Peng et al,2021Pérez et al,2022),为解决各种分类问题提供了简单而有效的方法。

    自适应提升算法(Adaptive Boosting,缩写为AdaBoost)是一种集成学习技术,其核心思想在于通过组合多个相对较弱的学习器,构建一个性能强大的分类器。该算法由Freund和Schapire (1997)提出,它的自适应性表现在训练过程中,前一个基本分类器错误分类的样本会得到加强,即赋予更高的权重,而被正确分类的样本则降低权重。这使得那些在之前分类阶段表现不佳的样本能够更受关注,从而提高整体模型的准确性。

    AdaBoost的训练过程可以简要概括为以下步骤:首先假设有N个样本,每个样本最初都被赋予相同的权值,通常为1/N。在具体训练过程中,若某个样本点被弱分类器正确分类,其权值将减小;相反,若被错误分类,其权值将增加,使用权值更新后的样本集训练下一个弱分类器,此过程将迭代进行。弱分类器训练完成后,根据其分类错误率对各个弱分类器的权重进行调整。错误率低的弱分类器在最终分类器中占据较大的权重,从而增强其在整体模型中的影响。AdaBoost算法在实践中常用于分类问题,特别是对于决策树等弱分类器的集成,在地学领域曾用于强震和微震分类(Peng et al,2021吴涛等,2022),其优点在于能够有效处理复杂数据集,提高模型泛化能力。

    轻量级梯度提升机算法(Light Gradient Boosting Machine,缩写为LGBM)是一种高效的梯度提升机(Gradient Boosting Machine,缩写为GBM)算法,专为应对大规模数据和高效训练而设计。原理基于梯度提升技术,通过迭代的方式逐步提高模型的预测能力。它采用基于树的模型作为弱学习器,其中树的构建过程采用一种称为“Leaf-wise”(叶子结点分裂)的高效特征分裂策略。相较于传统的“Level-wise”(层级分裂),这种策略在每次分裂时选择对当前样本集贡献最大的特征和阈值,从而减少树的深度,提高训练速度。LGBM以其高效的性能、低内存消耗、出色的准确率,为解决实际分类问题提供了强有力的支持。

    将上述第1.1节和1.2节中训练数据的62个特征采用第2章节中提到的KNN,AdaBoost,LGBM三种分类算法进行分类模型训练。模型训练中用0表示天然地震、1表示人工爆炸、2表示矿震塌陷,0−1代表天然地震-人工爆炸分类模型、0−2代表天然地震-矿震塌陷分类模型、1−2代表人工爆炸—矿震塌陷分类模型、0−1−2代表天然地震—人工爆炸—矿震塌陷分类模型。对0−1,0−2,1−2,0−1−2使用KNN,AdaBoost,LGBM分别进行100次训练实验,每次实验从训练数据中随机抽取75%用于训练,剩下的25%用于测试该分类模型准确率,不同分类模型的准确率如图6所示,同时对每个分类模型准确率的平均值、最大值、最小值进行计算,计算结果列于表2

    图  6  采用KNN (a),AdaBoost (b),LGBM (c)对分类模型训练100次的准确率
    Figure  6.  The accuracy of classification models trained 100 times using KNN (a), AdaBoost (b), and LGBM (c),respectively
    表  2  不同分类模型准确率平均值、最大值、最小值
    Table  2.  Average,maximum and minimum accuracy of different classification model
    分类模型0−1准确率0−2准确率1−2准确率0−1−2准确率
    平均值最大值最小值平均值最大值最小值平均值最大值最小值平均值最大值最小值
    KNN89.66%91.22%87.80%98.84%99.61%98.05%94.73%95.90%93.07%89.19%90.68%87.30%
    AdaBoost96.99%97.95%94.63%99.28%99.80%98.24%98.12%99.51%97.07%95.17%96.35%93.94%
    LGBM97.03%98.05%95.90%99.10%99.71%98.34%97.95%98.73%96.98%97.01%97.98%96.16%
    下载: 导出CSV 
    | 显示表格

    图6中可以明显观察到,相对于KNN算法,AdaBoost和LGBM在各种分类模型中展现出更为卓越的性能,尤其在0−1和0−1−2方面表现更为显著。在不同的分类算法中,LGBM的整体表现最为出色,其准确率保持在95%以上,展现了较高的稳定性。在不同分类任务中,0−2分类效果最为突出,1−2次之。

    表2包含了使用不同分类算法(KNN,AdaBoost,LGBM),分别对0−1,0−2,1−2,0−1−2训练100次的结果。在0−1分类中,LGBM表现最佳;0−2分类中,三种不同的分类算法准确率均值都达到98.05%以上;1−2分类中,AdaBoost和LGBM的分类效果表现更为出色;0−1−2分类中,LGBM同样呈现最佳表现。值得注意的是,LGBM模型在所有分类任务上都表现出色,不仅准确率较高,呈现出较强的鲁棒性。

    在完成分类模型的训练后,接下来聚焦于测试数据以对这些模型进行全面的评估。使用每个模型对测试数据的事件类型进行识别,得到了各模型在不同分类任务上的表现结果,基于识别结果生成了混淆矩阵(图7)。从图中可以看出,每个分类任务都完成得较为出色,特别是0−2分类使用三种不同的分类算法时,均表现最佳。

    图  7  分类模型对测试数据的识别结果混淆矩阵
    Figure  7.  Confusion matrix of identification results of test data by classification model (a)—(d) KNN;(e)—(h) AdaBoost;(i)—(l) LGBM

    基于混淆矩阵,我们计算了模型性能评估指标,包括准确率、精度、召回率和F1分数(表3)。通过表3可以观察到,在0−1分类中,AdaBoost的表现最佳,准确率可达96.69%;在0−2分类中,三类算法表现都很好,评价指标均达99.26%以上,其中KNN和AdaBoost比LGBM略高一点,所有的矿震塌陷都被正确分类,因此精确率达100.00%;1−2和0−1−2分类中,LGBM的分类效果最好。总得来说,以上每个分类模型的表现都很好,准确率、精度、召回率、F1分数均达到了89.71%及以上。值得指出的是,Wang等(2022)对1−2的分类准确率在90.00%左右,本研究中将准确率提升至94.49%以上,取得了明显的改进。

    表  3  不同分类模型对不同分类任务的评价指标
    Table  3.  Evaluation metrics of different classification models for different classification task
    分类模型评价指标0−10−21−20−1−2
    KNN准确率90.81%99.63%94.49%91.75%
    精度91.73%100.00%94.81%93.15%
    召回率89.71%99.26%94.12%93.03%
    F1分数90.71%99.63%94.47%93.03%
    AdaBoost准确率96.69%99.63%98.16%95.10%
    精度94.41%100.00%98.52%96.11%
    召回率99.26%99.26%97.79%98.99%
    F1分数96.75%99.63%98.15%97.52%
    LGBM准确率96.32%99.26%98.53%97.30%
    精度93.75%99.26%98.53%97.31%
    召回率99.26%99.26%98.53%97.30%
    F1分数96.44%99.26%98.53%97.30%
    下载: 导出CSV 
    | 显示表格

    最后绘制了采用三种不同分类算法(KNN,AdaBoost,LGBM)识别测试集的受试者工作特征曲线(receiver operating characteristic curve,缩写为ROC曲线)。ROC曲线是一种用于评估分类模型性能的重要工具,其中横轴表示假正例率,纵轴表示真正例率。ROC曲线的斜率越陡,说明模型在提高真正例率的同时,更少地将负例误分类为正例,因此曲线下面积(area under curve,缩写为AUC)越大,模型性能越优秀。图8a展示了在不同的二分类任务(0−1,0−2,1−2)中三种分类算法的ROC曲线,可以看出KNN算法对0−1和1−2的识别仍待优化。由于ROC曲线是为二分类问题所设计,所以图8b呈现了0−1−2分类中每个类别0,1,2的ROC曲线,进一步展示了模型的综合性能,其中KNN对0和1、AdaBoost对1的识别还有改进空间,其它模型表现都十分出色。

    图  8  不同分类模型的ROC曲线
    (a) 测试集0−1,0−2,1−2;(b) 测试集0−1−2
    Figure  8.  ROC curves of different classification models
    (a) 0−1,0−2,1−2 classification models;(b) 0−1−2 classification model

    本文将华北地区M3.0以下天然地震、人工爆炸、矿震塌陷的地震事件划分为75%的训练数据和25%的测试数据,根据地震波形记录和时频谱提取了10类62个特征,采用KNN,AdaBoost,LGBM分类算法对不同分类任务(0−1,0−2,1−2,0−1−2)进行训练,构建相应的分类模型并对参数进行优化,将训练完成的分类模型对测试数据进行识别,得到相应的混淆矩阵和评价指标,得出以下结论:

    1) 结合三类事件的时频特征,量化提取了时间、P/S幅值比、频率、过零率、峰值振幅、峰值地面加速度、能量、信号、角度和其它比值10类62个特征,作为不同分类模型训练、测试并进行识别的基础。

    2) 通过训练和测试结果,发现0−1,0−2,1−2,0−1−2均取得了较好的分类效果,准确率在90.81%以上。特别是在0−2分类中,三种算法均取得最佳表现,1−2的分类准确率次之。此外,虽然0−1和0−1−2的分类效果也较好,但仍存在一些优化的空间。

    3) LGBM整体表现最为优秀,其准确率保持在96.32%以上,并且具有较高的稳定性。KNN仍有很大改进空间,可能由于其对数据较为敏感,从而在处理不同数据时性能相对于AdaBoost和LGBM较弱。AdaBoost的综合性能介于LGBM和KNN之间。

    4) 混淆矩阵和评价指标均表明上述构建的分类模型对测试数据分类效果良好,ROC曲线的分析进一步印证了分类模型在不同任务中的卓越性能,不同算法的ROC曲线特点揭示了在各自任务中的适用性,为模型的实际应用提供了有力支持。

    本研究仅针对华北地区的地震事件进行了探究,可以将所提出的分类方法在其它地区进行地震事件分类,验证和扩展在其它地区的应用。所提取的62个特征在本研究中效果良好,可以将更多的地震特征引入到分类中。在以后的研究中,将更多地关注多种分类算法的联合使用,以提高综合识别能力。

  • 图  9   近断层场地PGV空间分布变异性

    (a) 考虑凹凸体强度不确定性;(b) 考虑破裂速度不确定性;(c) 同时考虑凹凸体强度和破裂速度不确定性

    Figure  9.   Spatial distribution variability of PGVs in the near-fault site

    (a) Considering asperity intensity uncertainty ;(b) Considering rupture velocity uncertainty;(c) Considering asperity intensity and rupture velocity uncertainty

    图  1   近走滑断层高山峡谷场地计算模型示意图

    Figure  1.   Calculation model of mountain-canyon site near a strike-slip fault

    图  2   不同断层角度下本文方法与Kara和Trifunac (2014)方法所得地表位移结果对比

    (a) 倾角为π/24;(b) 倾角为π/4;(c) 倾角为π/2

    Figure  2.   Comparison of surface displacement results obtained by the proposed method and the method in reference Kara and Trifunac (2014) under different fault angles

    (a) Dip angle of π/24;(b) Dip angle of π/4;(c) Dip angle of π/2

    图  3   用于验证的计算模型

    (a) 场地计算模型,图中ABCDEF为地表参考点;(b) 断层模型

    Figure  3.   Calculation model for verification

    (a) Calulation model of sites,and ABCDE and F are the surface reference point;(b) Fault model

    图  4   不同入射频率波下高山峡谷场地位移幅值均值(a)及其均方差(b)

    Figure  4.   Mean values of displacement amplitude of mountain-canyon site (a) and mean square deviation of displacement amplitude of mountain-canyon site (b) under different incident frequency waves

    图  5   考虑凹凸体位置不确定性的破裂情景

    Figure  5.   Rupture scenarios considering uncertainty of asperity positions

    图  6   考虑凹凸体强度不确定性时近断层场地PGA空间分布变异性

    (a) 破裂情景1;(b) 破裂情景2;(c) 破裂情景3

    Figure  6.   Spatial distribution variability of PGAs in the near-fault site considering asperity intensity uncertainty

    (a) Rupture scenario 1;(b) Rupture scenario 2; (c) Rupture scenario 3

    图  7   考虑破裂速度不确定性时近断层场地PGA空间分布变异性

    (a) 破裂情景1;(b) 破裂情景2;(c) 破裂情景3

    Figure  7.   Spatial distribution variability of PGAs in the near-fault site considering rupture velocity uncertainty

    (a) Rupture scenario 1;(b) Rupture scenario 2; (c) Rupture scenario 3

    图  8   考虑凹凸体强度和破裂速度不确定性时近断层场地PGA空间分布变异性

    (a) 破裂情景1;(b) 破裂情景2;(c) 破裂情景3

    Figure  8.   Spatial distribution variability of PGAs in the near-fault site considering asperity intensity and rupture velocity uncertainty

    (a) Rupture scenario 1;(b) Rupture scenario 2;(c) Rupture scenario 3

    图  10   考虑凹凸体强度不确定性时近断层场地SA空间分布变异性

    (a) A点;(b) B点;(c) C点;(d) D点;(e) E点;(f) F点。μ1μ2分别代表有、无高山峡谷地形时观测点SA均值,σ为存在高山峡谷地形时观测点SA均方差,阻尼比取为0.05,下同

    Figure  10.   Spatial distribution variability of SAs in the near fault site considering asperity intensity uncertainty

    (a) Point A;(b) Point B;(c) Point C ;(d) Point D;(e) Point E;(f) Point F. μ1 and μ2 represent mean SAs at observed points with and without the mountain-canyon site, σ represents the root mean squares of SAs at observed points with the mountain-canyon site,and the damping ratio is 0.05,the same below

    图  12   同时考虑凹凸体强度和破裂速度不确定性时近断层场地SA空间分布变异性

    (a) A点;(b) B点;(c) C点;(d) D点;(e) E点;(f) F

    Figure  12.   Spatial distribution variability of SAs in the near-fault site considering asperity intensity and rupture velocity uncertainty

    (a) Point A;(b) Point B; (c) Point C ;(d) Point D;(e) Point E;(f) Point F

    表  1   边界元法数值稳定性验证 (η=0.25)

    Table  1   Numerical stability verification of boundary element method (η=0.25)

    x/a 边界元法参数 解析解
    N=600,
    L=561
    N=1 000,
    L=801
    N=1 400,
    L=1 041
    −2.0 0.070 3 0.070 7 0.070 4 0.070 4
    −1.5 0.091 3 0.090 9 0.090 8 0.090 8
    −1.0 0.518 9 0.519 9 0.522 6 0.522 6
    −0.5 0.495 0 0.516 7 0.551 2 0.551 2
    0.5 0.744 8 0.749 8 0.754 7 0.754 7
    1.0 0.494 2 0.547 7 0.551 2 0.551 2
    1.5 0.097 8 0.099 2 0.100 3 0.100 3
    2.0 0.083 3 0.084 0 0.084 6 0.084 6
    下载: 导出CSV
  • 巴振宁,吴孟桃,梁建文,喻志颖. 2020. 高山—峡谷复合地形对入射平面P-SV波的散射[J]. 应用数学和力学,41(7):695–712.

    Ba Z N,Wu M T,Liang J W,Yu Z Y. 2020. Scattering and diffraction by the hill-canyon composite topography for incident plane P- and SV-waves[J]. Applied Mathematics and Mechanics,41(7):695–712 (in Chinese).

    陈畅,吴军,黄炬斌,代劲松. 2019. 新建川藏铁路雅安至林芝段出渣综合利用及处置对策研究[C]//川藏铁路工程建造技术研讨会论文集. 北京:中国铁建股份有限公司:25−28.

    Chen C,Wu J,Huang J B,Dai J S. 2019. Study on comprehensive utilization and disposal countermeasures of slag from Ya'an to Linzhi section of newly constructed Sichuan−Tibet railway[C]//Proceedings of Sichuan-Tibet Railway Engineering Construction Technology Seminar. Beijing:China Railway Construction Corporation:25−28 (in Chinese).

    陈笑宇,王东升,付建宇,国巍. 2021. 近断层地震动脉冲特性研究综述[J]. 工程力学,38(8):1–14.

    Chen X Y,Wang D S,Fu J Y,Guo W. 2021. State-of-the-art review on pulse characteristics of near-fault ground motions[J]. Engineering Mechanics,38(8):1–14 (in Chinese).

    雷涛,李碧雄,曹鹏杰,顺远坤. 2010. 汶川地震近断层附近桥梁震害浅析[J]. 重庆交通大学学报(自然科学版),29(3):358–362.

    Lei T,Li B X,Cao P J,Shun Y K. 2010. Analysis on damage of near-faultage bridges in Wenchuan earthquake[J]. Journal of Chongqing Jiaotong University (Natural Science),29(3):358–362 (in Chinese).

    李宁,刁泽民,李忠献. 2022. 考虑震源和场地特征的近断层地区竖向地震动合成研究[J]. 工程力学,39(6):181–190.

    Li N,Diao Z M,Li Z X. 2022. Study on synthesis method of vertical ground motions for near-fault regions considering the characteristics of source and site condition[J]. Engineering Mechanics,39(6):181–190 (in Chinese).

    李郑梁,李建春,刘波,聂萌萌. 2021. 浅切割的高山峡谷复杂地形的地震动放大效应研究[J]. 工程地质学报,29(1):137–150.

    Li Z L,Li J C,Liu B,Nie M M. 2021. Seismic motion amplification effect of shallow-cutting hill-canyon composite topography[J]. Journal of Engineering Geology,29(1):137–150 (in Chinese).

    罗全波,陈学良,高孟潭,李宗超,李铁飞. 2019. 近断层速度脉冲地震动的三维有限差分模拟[J]. 地震工程学报,41(6):1630–1636.

    Luo Q B,Chen X L,Gao M T,Li Z C,Li T F. 2019. Three-dimensional finite-difference simulation of near-fault velocity pulse-like ground motions[J]. China Earthquake Engineering Journal,41(6):1630–1636 (in Chinese).

    王海云,谢礼立. 2010. 自贡市西山公园地形对地震动的影响[J]. 地球物理学报,53(7):1631–1638.

    Wang H Y,Xie L L. 2010. Effects of topography on ground motion in the Xishan park,Zigong city[J]. Chinese Journal of Geophysics,53(7):1631–1638 (in Chinese).

    王伟,刘必灯,刘欣,杨明亮,周正华. 2015. 基于汶川MS8.0地震强震动记录的山体地形效应分析[J]. 地震学报,37(3):452–462.

    Wang W,Liu B D,Liu X,Yang M L,Zhou Z H. 2015. Analysis on the hill topography effect based on the strong ground motion records of Wenchuan MS8.0 earthquake[J]. Acta Seismologica Sinica,37(3):452–462 (in Chinese).

    袁飞云,王剑波. 2018. 雅康高速长下坡高桥隧比路段交通安全设施优化设计研究[J]. 交通科技,(5):114–117.

    Yuan F Y,Wang J B. 2018. Research on optimum design of traffic safety facilities for Ya’an-Kangding expressway at long downhill and high ratio of bridge tunnel section[J]. Transportation Science and Technology,(5):114–117 (in Chinese).

    张冬锋. 2019. 随机有限断层法参数不确定性分析及其在近场地震动模拟中的工程应用研究[D]. 北京:中国地震局地球物理研究所:26−29.

    Zhang D F. 2019. Parameter Uncertainty Analysis of Stochastic Finite-Fault Method and Its Application in Near-Field Ground Motion Simulation[D]. Beijing:Institute of Geophysics,China Earthquake Administration:26−29 (in Chinese).

    Ameri G,Gallovic F,Pacor F,Emolo A. 2009. Uncertainties in strong ground-motion prediction with finite-fault synthetic seismograms:An application to the 1984 M5.7 Gubbio,Central Italy,Earthquake[J]. Bull Seismol Soc Am,99(2A):647–663. doi: 10.1785/0120080240

    Bjerrum L W,Sørensen M B,Ottemöller L,Atakan K. 2013. Ground motion simulations for İzmir,Turkey:Parameter uncertainty[J]. J Seismol,17(4):1223–1252. doi: 10.1007/s10950-013-9389-9

    Cao Z L,Tao X X,Tao Z R,Tang A P. 2019. Kinematic source modeling for the synthesis of broadband ground motion using the f-κ approach[J]. Bull Seismol Soc Am,109(5):1738–1757.

    Fortuño C,de la Llera J C,González G,González J,Aguirre P. 2021. Rupture parameter sensitivity of low frequency ground motion response spectra using synthetic scenarios in North Chile[J]. Bull Earthq Eng,19(12):4833–4864. doi: 10.1007/s10518-021-01113-0

    Hartzell S,Frankel A,Liu P C,Zeng Y H,Rahman S. 2011. Model and parametric uncertainty in source-based kinematic models of earthquake ground motion[J]. Bull Seismol Soc Am,101(5):2431–2452. doi: 10.1785/0120110028

    Haskell N A. 1964. Total energy and energy spectral density of elastic wave radiation from propagating faults[J]. Bull Seismol Soc Am,54(6A):1811–1841. doi: 10.1785/BSSA05406A1811

    Huang H C,Chiu H C. 1995. The effect of canyon topography on strong ground motion at Feitsui damsite:Quantitative results[J]. Earthq Engin Struct Dyn,24(7):977–990. doi: 10.1002/eqe.4290240705

    Iwaki A,Morikawa N,Maeda T,Fujiwara H. 2017. Spatial distribution of ground-motion variability in broadband ground-motion simulations[J]. Bull Seismol Soc Am,107(6):2963–2979. doi: 10.1785/0120170150

    Kara H F,Trifunac M D. 2014. Two-dimensional earthquake vibrations in sedimentary basins:SH waves[J]. Soil Dyn Earthq Eng,63:69–82. doi: 10.1016/j.soildyn.2014.03.010

    Liu Z X,Liu Y,Huang L,Li Y R,Zhao R B. 2021. Indirect boundary element method solution to the seismic ground motion of near-fault sedimentary valley[J]. Eng Anal Bound Elem,132:289–308.

    Liu Z X,Zhou T,Meng S B,Jin L G. 2022. 2-D FM-IBEM simulation of broadband ground motions on near-fault mountain-valley coupling site[J]. Eng Anal Bound Elem,145:224–241. doi: 10.1016/j.enganabound.2022.09.020

    Sánchez-Sesma F J,Campillo M. 1991. Diffraction of P,SV,and Rayleigh waves by topographic features:A boundary integral formulation[J]. Bull Seismol Soc Am,81(6):2234–2253.

    Yamada M,Senna S,Fujiwara H. 2011. Statistical analysis of ground motions estimated on the basis of a recipe for strong-motion prediction:Approach to quantitative evaluation of average and standard deviation of ground motion distribution[J]. Pure Appl Geophys,168(1/2):141–153.

    Zhang J,Bi K M,Zheng S X,Jia H Y,Zhang D Y. 2018. Seismic system reliability analysis of bridges using the multiplicative dimensional reduction method[J]. Struct Infrastruct E,14(11):1455–1469. doi: 10.1080/15732479.2018.1450428

    Zhang X F,Pandey M D. 2013. Structural reliability analysis based on the concepts of entropy,fractional moment and dimensional reduction method[J]. Struct Saf,43:28–40. doi: 10.1016/j.strusafe.2013.03.001

  • 期刊类型引用(4)

    1. 李军,马念杰,王卫军,任建举,连小勇,马振凯. 蝶形破坏理论及其应用研究进展. 中国矿业大学学报. 2023(02): 209-228 . 百度学术
    2. 师皓宇,黄辅琼,张超,杨长益,马龙,田益博. 微小应力对断裂带深部岩体应变能释放的触发过程模拟. 地震地磁观测与研究. 2021(S1): 11-13 . 百度学术
    3. 师皓宇,马念杰,石建军,李楠,谈国文. 采场围岩能量演化及释放模拟研究. 煤炭科学技术. 2020(03): 106-111 . 百度学术
    4. 师皓宇,黄辅琼,马念杰,王永建,马骥,邹光华,彭瑞. 基于岩体塑性位错理论的龙门山区域构造系统演化过程. 地质学报. 2020(12): 3581-3589 . 百度学术

    其他类型引用(5)

图(11)  /  表(1)
计量
  • 文章访问数:  294
  • HTML全文浏览量:  30
  • PDF下载量:  147
  • 被引次数: 9
出版历程
  • 收稿日期:  2023-03-27
  • 修回日期:  2023-08-21
  • 录用日期:  2023-08-22
  • 网络出版日期:  2023-10-26
  • 刊出日期:  2024-11-19

目录

/

返回文章
返回