地震学报  2010, Vol. 32 Issue (3): 270-276
天然地震与人工爆破的波形小波特征研究
黄汉明1 , 边银菊2, 卢世军1, 蒋正锋1, 李锐1    
1. 广西师范大学计算机科学与信息工程学院, 桂林, 541004;
2. 中国地震局地球物理研究所, 100081
摘要:研究了如何从天然地震和人工爆破事件的波形记录中提取出有效、适用的波形特征, 以用于对爆破事件的识别.首先对波形记录进行了4层小波包变换;然后对变换得到的最后一层小波包系数提取3种波形特征:能量比特征、香农熵特征及对数能量熵特征;最后利用 v-SVC支持向量分类机对这3种特征的分类能力进行了外推检验.通过选用不同地区、不同台站、不同震级的天然地震与人工爆破的波形记录, 力求提取的特征量能尽可能地反映天然地震与人工爆破波形的本质区别, 尽量弱化震中距、震级等因素对识别效果的影响.结果表明, 上述3种特征中以香农熵特征的识别效果最好, 能反映天然地震与人工爆破的本质区别, 可作为识别天然地震与人工爆破的一个有效判据.
关键词爆破识别    小波包    能量比    香农熵    支持向量机    
A wavelet feature research on seismic waveforms of earthquakes and explosions
Huang Hanming1 , Bian Yinju2, Lu Shijun1, Jiang Zhengfeng1, Li Rui1    
1. College of Computer Science and Information Engineering, Guangxi Normal University, Guilin, 541004;
2. Institute of Geophysics, China Earthquake Administration, 100081
Abstract: Research on how to extract seismic wave features from earthquakes and explosions and how to discriminate explosions from earthquakes based on these features. Firstly, the transform of 4-layer wavelet packet is performed on the wave records. Secondly, the last layer coefficients of wavelet packet from the transform are employed to extract 3 types of wave features: energy ratio, Shannon entropy and logarithmic energy entropy. Thirdly, these features are supplied to a classifier of v-SVC support vector machines for verifying the capabilities of these features. In order to weaken undesirable effect of event epicenter-distance and magnitude on the recognition, we tried to extract more essential features of the wave records gathered from different regions, different observatories and various events almost covering whole magnitude ranges. The results show that, among the above three features, the feature of Shannon entropy is the best candidate for discriminating explosions from earthquakes. This may be an effective criterion in explosion recognition.
Key words: explosion recognition    wavelet packet    energy ratio    Shannon entropy    v-SVC    
引言

天然地震与人工爆破的震源性质是不同的. 天然地震大多发生于地下几公里至几十公里的地壳深处,其震源是非对称剪切源(曾融生等,2000); 而人工爆破(包括化学爆破、 地下核爆炸等)多位于地表附近,其爆破源为对称膨胀源. 地震观测台网记录到的事件信号中包含了很多人工地震,如矿山爆破等. 这些事件的记录,如果不能及时剔除,会混淆我们的地震目录,影响地震学的研究工作.

在天然地震与人工爆破事件的分类识别中,如何提取出有效的识别特征是识别的关键. 自上世纪50年代开始,国内外在这两类事件的识别方面进行了广泛和深入的研究,并提出了多种识别判据,主要有: P波初动、 震源深度、 体波震级mb与面波震级MS之比、 P波初动振幅与P波最大振幅比、 勒夫波和瑞利波振幅比、 P波与S波谱振幅比、 P波与勒夫波谱振幅比、 倒谱、 小波变换、 瞬态谱等(刘希强等,2003边银菊,2002杨选辉等,2005和雪松等,2006; TjØstheim,1978). 但是由于地震信号本身的复杂性,有些识别判据的识别效果或适用性仍有不足,某些判据仅仅适用于一些特定的地区和台站记录. 本文试图从波形记录中提取出有效、 适用的波形特征,以用于对上述两类事件的识别.

1 小波包分析方法基本原理 1.1 小波包分析

小波包分析是小波变换中的一种. 小波包对信号的低频近似部分及高频细节部分进行逐层分解,可以把信号按频带分得更细,这样就可以了解到信号中包含的更多细节信息. 小波包由一簇正交紧支小波构成,可以用如下函数簇描述(高志,余啸海,2007):

定义小波包(wavelet packet,WP): 若子空间Unj是函数un(t)的闭包空间,U2nj是函数u2n(t)的闭包空间,并令un(t)满足下面的双尺度方程:

式中,h(k),g(k)为正交镜像滤波器组,满足g(k)=(-1)kh(1-k). 当n=0时,式(1)直接给出

式中,(t)和φ(t)分别为多分辨分析中的尺度函数与小波基函数. 我们称由式(2)构造的序列{un(t)},n∈Z+为由u0(t)=(t)确定的正交小波包.

对实际地震信号(2001-10-12T11:28:49.3,38.46°N、 113.06°E,M2.3,h=33.0 km)进行小波包4层分解后得到16个子频带信号的波形如图 1所示. 这16个子频带信号的频带分布是从第1个WPT系数到第16个WPT系数顺序增加的. 对地震和爆破信号,只选择各台站BHE分量,采样率为50 Hz. 样本波形分解为16个子频段后,很多样本的前7个子频段对应的特征向量有值,后面的几乎全为零. 从地震、 爆破两类样品的各子频段的频谱图上获得的平均能量和卓越频率分别做柱状分布图,地震和爆破有些差异,但难以根据任何一个子频段的特性来较可信地区分出地震与爆破. 故需要根据一定的算法综合利用这些单个来看并不明显的子频段特征. 为此本文研究了香农熵等3个综合性特征.

图 1 天然地震信号的4层小波包分解 Fig. 1 4-layer wavelet packets decomposition of a seismic signal
1.2 本文所选取的波形特征

本文对各天然地震与人工爆破记录进行4层小波包分解后,对第4层的小波包系数分别提取出3种波形特征(均为16维向量): 小波系数的能量比(Ewt)、 小波系数的香农熵(Eshannon)和小波系数的对数能量熵(Elg),研究了各特征的分类能力.

若S为原始信号,对它进行n层小波包分解后,得到第n层的小波包系数总共为N个. Si为信号S分解后的第i个小波的系数,其长度为J,小波系数的结点序号为j,则从第i个小波的系数中提取出的能量比(Ewt)、 香农熵(Eshannon)和对数能量熵(Elg)特征分别按式(3)、(4)和(5)定义.

2 数据集的选取和特征提取 2.1 数据集的选取

为了能最大限度地提取适用于不同地区、 不同台站记录的波形特征,用于天然地震与人工爆破事件的识别,同时力求特征尽可能地反映两类事件的本质区别,尽量弱化震中距、 震级等因素对识别效果的影响. 本文在数据集的选取上有意识地选择了不同地区、 不同台站、 不同震级的天然地震与人工爆破事件的波形记录(对不同台站的同一次地震或人工爆破事件的记录当作不同的样本对待). 另外只选择了各台站的BHE分量且有较长时间有效记录(振幅明显且记录中未显示出仪器有零点漂移)的波形数据来进行实验.

实验中所用的天然地震记录样本来自于从中国地震台网中心地震数据管理与服务系统(http://www.csndmc.ac.cn/newweb/)与国家地震数据共享中心(http://data.earthquake.cn/data)中下载的SEED文件中提取出来的1 336条地震波形记录文件集合,其中包括: ① 2001—2007年以(39.44°N,112.42°E)、(26.07°N,101.81°E)、(25.16°N,113.68°E)、(40.80°N,116.96°E)和(31.30°N,101.81°E)为中心,±1°区域范围内震级在1.3—4.0之间的地震波形记录330条; ② 2001—2003年发生于我国及周边地区震级在5.3—7.9之间的303条地震波形记录; ③ 2008年5月四川汶川地震的余震记录703条.

人工爆破记录样本集中总共有236条波形记录文件. 其中包括: ① 1987—1988年记录到我国新疆及周边地区的人工爆破波形记录31条; ② 2007年宁夏爆破和延庆爆破的波形记录205条.

实验中从上面所述的天然地震和人工爆破数据集中,各随机选择100条记录总计200条记录用于实验(其中测试集和训练集均各有100条记录: 其中的50条为天然地震记录,另50条为人工爆破记录). 按如上方式选择中国及周边区域中几个典型区域的地震和爆破数字波形记录,目的是想突出震源特性在波形特征中的表现,试图为对中国及周边区域中的地震与爆破识别提供较好的基于震源特性的识别特征.

2.2 特征提取

不同事件或不同台站记录的整个地震波形的记录长度会有差异,有时有效记录长度差别很大. 而特征提取时应针对同样长度的波形记录,本文采用某一长度的矩形窗对长度不一的原波形记录进行截取. 采用不同的窗长度进行截取时,对所提取出来的波形特征的识别效果是有影响的. 对于本研究所选用的波形记录,尤其是爆破记录,由于对应的震级很小,没有考虑从P波、 S波的角度截取波段. 为了简化波段截取且试图可应用于任何震源、 震级的波形,本文选择了以波形幅值绝对值最大的采样点为中心、 窗长度为500—3 000,按500为增量,共6种长度的窗长度,以及整个波形记录信号进行实验比较. 实验结果显示,这7种长度的波形记录中,窗长度为2 000点时,识别效果是可以接受的,且是最好的. 所以,本文的特征提取是对以波形最大绝对幅值采样点为中心的窗长度为2 000的波段进行的.

本文中利用下述方法来提取各样本的波形特征:

1 )将各训练集(或测试集)样本用db7小波基函数进行4层小波包分解.

2)对第4层的16个小波包系数分别利用公式(3)、 公式(4)和公式(5)提取各自的相应波形特征,并将它们分别组合成一个16维的特征向量.

3 )利用标准差标准化方法对特征向量集进行标准化,得到训练集(或测试集)的特征向量矩阵,以此作为支持向量机分类器的输入参数,利用下面(2.3节)所述的参数所构造的分类器来检验各波形特征的分类能力.

2.3 分类器参数选择

为了研究经过小波变换后提取出来的波形特征在识别两类事件中的分类能力,本文利用Matlab对此进行了实验验证,分类器选择了v-支持向量分类机(v-support vector classifier,v-SVC)(郭丽娟等,2008王睿,2007). 具体参数设置如下:

1)v-SVC中的v=0.5.

2 )核函数采用Sigmoid核: K(xi,xj)=tanh[γ(xi·xj)+c],其中,xi,xj 分别为第i和j个样品向量. 所谓样品向量,在此即为前一小节(2.2节)中所述的波形特征向量.

3)Sigmoid核中的γ=1/100,c=0.

2.4 支持向量机分类器的训练

将标准化后的训练集的特征向量利用文献(郭丽娟等,2008王睿,2007)中的支持向量机算法进行训练后,得到分类器. 分类器模式的相关参数包括: 两类训练集中支持向量的数目和具体记录个数、 各支持向量的对应权值、 支持向量机算法中的阈值等. 表 1为用训练得到的分类器对训练集本身进行识别的结果.

表 1 v-SVC对训练集本身的分类效果 Table 1 Classification result of training sets by v-SVC
3 分类能力检验结果

将各测试集样本用2.2节同样的方法进行特征提取,用训练得到的支持向量分类机进行地震事件的分类,以检验各波形特征的分类能力. 实验结果如表 2图 2所示.

图 2所对应的v-SVC的决策函数(分类器)为

式中,xi为训练集经支持向量机训练后确定的支持向量(i=1,…,51),yi等于1(当第i个支持向量是天然地震记录时)或-1(当第i个支持向量是人工爆破记录时),a*i为第i个支持向量对应的权值,x为待识别的测试集记录,-0.3558为支持向量机训练后确定的阈值.

图 2 香农熵特征识别效果 Fig. 2 Recognition result based on Shannon entropy features

表 2 v-SVC对测试集的分类效果 Table 2 Classification results of testing sets by v-SVC
4 讨论与结论

1)国内外利用其它判据进行地震与爆破的识别研究中,准确率较高的可达到90%以上. 在本研究的3种波形特征中,香农熵特征的分类能力达到了97%,用随机选择的测试集进行检验的识别效能也达到了96%的准确率,识别效果较好. 这表明了香农熵特征能反映天然地震与人工爆破的本质区别,可以作为识别天然地震与人工爆破的一个有效判据; 而能量比特征差一些,还需进一步研究; 对数能量熵特征则很差,可淘汰.

2 )相关文献中一般是对某一地区、 在一定震级范围内的地震与爆破进行识别,本文在较大的地区、 较大的台站距离范围及较大的震级范围内研究了地震与爆破的识别,这是我们为得到一个较普遍适用的识别判据进行的初步尝试,实验结果显示应该是可行的. 此外,为得到一个较普适的判据,由于事件的震级范围跨度较大,为避免震级相差较大带来的影响,在提取特征前对波形数据还做了幅值归一化处理.

当然,本文得到的香农熵特征的识别效能及普遍适用性还须在实践中经大量事件的验证.

3)天然地震与人工爆破本质的差异是震源性质,其次是传播路径的差异. 本文选择中国及周边区域中的几个典型区域、 较大的台站距离范围及较大的震级范围研究地震与爆破的识别,目的是想突出震源性质在波形特征中的表现,对中国及周边区域中的地震与爆破识别提供较好的识别特征. 本文得到的香农熵特征的识别率为96%,表明结果较好. 但并未达到100%的识别,今后应进一步考虑地震波传播路径差异的影响和波形记录中出现的多种震相种类及其先后次序的影响,那么识别率应该会更高,结论会更可靠.

参考文献
[1] 边银菊. 2002. 遗传BP网络在地震和爆破识别中的应用[J]. 地震学报, 24(5): 516-524.(1)
[2] 高志, 余啸海(编著). 2007. Matlab小波分析与应用[M]. 北京:国防工业出版社: 1-150.(1)
[3] 郭丽娟, 孙世宇, 段修生. 2008. 支持向量机及核函数研究[J]. 科学技术与工程, 8(2): 487-490.(2)
[4] 和雪松, 李世愚, 沈萍, 冯全雄. 2006. 用小波包识别地震和矿震[J]. 中国地震, 22(4): 425-434.(1)
[5] 刘希强, 沈萍, 张玲, 李永红. 2003. 用小波变换能量线性度方法识别天然地震与爆破或塌方[J]. 西北地震学报, 25(3): 204-209.(1)
[6] 王睿. 2007. 关于支持向量机参数选择方法分析[J]. 重庆师范大学学报(自然科学版), 24(2): 36-42.(2)
[7] 杨选辉, 沈萍, 刘希强, 郑治真. 2005. 地震与核爆识别的小波包分量比方法[J]. 地球物理学报, 48(1): 148-156.(1)
[8] 曾融生, 陈运泰. 2000. 探测地球内部的“雷达”:地震波(续)[J]. 城市防震减灾, (6): 12-14.(1)
[9] TjØstheim D. 1978. Improved seismic discrimination using pattern recognition [J]. Phys Earth Planet Inter, 16(2): 85-108.(1)