Earthquake loss prediction based on random forest algorithm
-
摘要:
针对现有的基于实际震害评估的大多研究仅限于某特定区域和某种结构类型,且所采用的数据样本量也十分有限,本文基于随机森林模型,采用2011年3月11日东日本MW9.0地震的37万8 037条建筑物实际震害数据,利用美国应用技术协会发布的地震震害等级划分标准(ATC-13)预测了建筑物地震破坏所引起的损失,对建筑物损失的影响因素进行了特征重要性分析。结果显示:通过合成少数类过采样技术(SMOTE)解决数据不均衡和贝叶斯优化超参数之后,得到了基于随机森林的预测模型测试集的准确率为68.8%,轻微破坏、中等破坏、严重破坏、倒塌等四种破坏等级的召回率分别为65.0%,53.6%,74.8%,81.8%;考虑生命安全性能将模型转换为二分类之后,模型准确率进一步提高至87.5%,极大地改善了现有研究应用于建筑损失预测中数据样本量受限、数据不均衡等导致的最严重破坏等级精度低等问题。对随机森林模型特征重要性的研究表明:震中距、峰值加速度和vS30是最影响模型输出的特征。
Abstract:Rapid assessment of building damage and its severity after an earthquake is crucial for emergency response and recovery. Accurate earthquake damage assessment is crucial for pre-earthquake disaster prevention and mitigation, post-earthquake disaster relief, and rapid reconstruction. Most existing studies based on actual earthquake damage assessment are limited to a specific region and a particular structure type, and the number of data samples used is also limited, resulting in subpar generalization performance for the model. Many factors affect the loss of buildings due to earthquakes. Traditional methods cannot fully consider the complex mapping relationship between the influencing factors. Therefore, finding a method to quickly and accurately assess building damage is essential. Machine learning provides a data-driven artificial intelligence method that can handle complex nonlinear relationships between input and output parameters by learning the underlying laws of big data. This paper proposes an earthquake damage prediction model based on combination of Bayesian optimization algorithm, synthetic minority over-sampling technique (SMOTE), and random forest algorithm. The core of the Bayesian optimization algorithm takes prior knowledge into account. It can continuously update and iterate until the optimal parameter combination is fitted, solving the problem of slow efficiency of traditional parameter adjustment. The core of the SMOTE method is to generate data samples of a few categories, solving the problem of uneven distribution of data samples. Based on the random forest model, this paper uses 378 037 actual building damage data from the March 11, 2011, MW9.0 Tohoku-Oki, Japan earthquake, comprehensively considers multidimensional building information such as ground shaking information, site information, and structural characteristics, and uses the earthquake damage classification issued by the American Applied Technical Council (ATC-13). This model can predict the damage caused by earthquake damage to buildings and analyze the feature importance of factors affecting building damage. The results show that after using SMOTE method to solve data imbalance and the Bayesian approach to optimize hyper-parameters, the accuracy on the test set of the random forest-based prediction model is 68.8%, and the recall rates for minor damage, moderate damage, severe damage and collapse are 65.0%, 53.6%, 74.8%, and 81.8%, respectively; the accuracy of the model is further increased to 87.5% by considering the life safety performance to convert the model to dichotomous classification, which significantly improves the existing research problems in building loss prediction, such as limited data, lack of regional generalization, lack of diversity in building attributes, imprecise classification of damage levels and low accuracy of the most severe damage state. The study of the importance of random forest features showed that the epicenter distance, PGA and vS30 have the most significant influences on the model output.The earthquake damage assessment model established by this study can achieve rapid and relatively accurate prediction of building damage caused by earthquakes, which is beneficial for pre-earthquake planning and timely rescue after the earthquake.
-
Keywords:
- building loss data /
- random forest /
- earthquake loss prediction /
- feature importance
-
引言
我国大陆发生的M>6.5地震一般会在地表产生数千米至数十千米的地表破裂带(铁瑞等,2016),并会对沿线的房屋建筑、建设工程等产生直接破坏,这种地震灾害主要是由于活动断层突发的快速错动而形成的强烈地面运动和地表破裂变形引起,同时还会在地貌上形成线性陡坎、断错水系、扭动冲沟和地表裂隙等地震遗迹,这些永久保留下来的、类型丰富的断错地貌记录着断层活动的重要信息,如地震期次、活动类型及位移量等,结合年代学和震级经验公式,可进一步讨论地震震级、计算大地震复发间隔等(邓起东,闻学泽,2008),这对于掌握震后灾害情况、预测未来地震复发模式、评估地震危险性和提高城市防震减灾能力等具有重要意义。因此震后快速获取地震地表破裂带的数字高程模型(digital elevation model,缩写为DEM)和地貌数据(正射影像),提取发震断层的定量参数,是分析地震灾情、评估地震断层危害性等工作的重要依据。
影像数据一般通过传统的卫星遥感平台和航空平台(李云等,2011)来获取,但这样获取的影像数据只能从中提取水平方向的形变参数,不能获得垂直方向的形变参数(Zhou et al,2015)。随着机载激光雷达(light detection and ranging,缩写为LiDAR)技术的出现,获取地震形变参数有了新的技术手段。Oskin等(2012)利用LiDAR技术首次获得了El Mayor-Cucapah 地震地表破裂在垂直方向的形变参数。这种遥感技术不仅能够主动实现大范围的影像数据采集,而且可以剔除植被覆盖的影响,因此适用于断错地貌的精细化和定量化研究中(刘静等,2013;Lin et al,2013),但由于该方法成本高、数据处理流程复杂,广泛应用受限。近年来在计算机视觉理论及特征匹配算法的发展中,出现了一种新型数字摄影测量技术SfM (Snavely et al,2008;Harwin,Lucieer,2012;James,Robson,2012;Fonstad et al,2013)。该技术通过自动解算相机的位置和姿态可以快速地获取高精度的三维地形地貌数据,具有作业成本低、获取效率高和操作方式便捷等特点,已被广泛用于获取DEM数据(Klinger et al,2011),同时还被应用于多个地震研究领域,如滑坡监测(Lucieer et al,2014)、古地震分析(Ren et al,2015;高伟等,2017)、微构造地貌解译(Johnson et al,2014;孙稳等,2019)和活动构造(Bemis et al,2014;Angster et al,2016;毕海芸等,2017;艾明等,2018)。前人利用遥感影像获取地震应急灾情信息的大量研究主要集中在灾区建筑物、道路和滑坡方面(李金香等,2019;荆帅军等,2019),鲜有基于无人机摄影测量技术提取地震地表破裂带的定量参数研究。
为此,本文针对大震后如何快速获取地表破裂带的影像数据以及如何生成高精度、高分辨率的DEM数据这一实际问题,拟利用大疆无人机采集的影像数据,以集成SfM算法的PhotoScan软件为平台,通过对比不同质量密集点云生成DEM数据的优缺点来确定软件处理的最优参数配置,然后以中卫天景山活动断裂带上1709年中卫南M7½地震的主体地表破裂带为例,提取其上地震断层的定量参数,并结合前人研究结果讨论所获取参数的可靠性及该方法的可行性,以期揭示无人机摄影测量技术在地震应急方面的应用前景。
1. 影像数据的获取与处理
1.1 影像数据的获取
本次使用的无人机为精灵Phantom 4 Pro V2.0,该无人机搭载了大疆制造的FC6310S型号的相机,配备了1英寸2 000万像素的影像传感器和8.8 mm焦距的广角镜头,确保获取到分辨率高、色彩还原度好及物体成像变形小的影像数据;其质量(含电池和桨)为1 375 g,质量轻、体积小使得在地震应急中便于搬运、装卸及携带;最大飞行海拔高度为6 000 m,最大可承受风速为10 m/s,工作环境温度为0℃—40℃,再加上FlightAutonomy安全系统,该无人机能够满足高原、山地上的正常作业;集成了全球定位系统(Global Positioning System,缩写为GPS)和全球卫星导航系统(Global Navigation Satellite System,缩写为GLONASS)卫星定位双模块,GPS定位正常时水平误差为±1.5 m,垂直误差为±0.5 m,在震后的恶劣环境下,无需满足对控制点精度(魏占玉等,2015)的要求,便可以快速获取地表破裂带高精度、高分辨率的影像数据。
无人机摄影图像的质量与环境条件、无人机的航迹、高度、重叠度等有关(陆博迪等,2011)。此次采集的地表破裂带地处山地,选择晴朗弱风天气的中午时分进行航拍,以保证地貌上的光线最佳,无人机飞行的稳定性好。由于山地地形起伏较大且地面如电线杆等障碍物较多,利用自动飞行软件设置飞行高度为120 m、航向和旁向的重叠度均为80%,这样既能保障飞行的安全性,又能确保影像的分辨率。受限于电池的电量,无人机一次飞行的覆盖区域不超过500 m×500 m,耗时一般在15 min左右,研究区域可分三四个架次完成,相邻架次采集的覆盖区域必须有一定的重叠,这样便于后期的影像拼接。
1.2 影像数据的处理
本文选取中卫市西天景山断裂带某段的41张影像照片作为试验数据,其覆盖面积为1.28×105 m2,无人机的平均飞行高度为146 m。利用集成SfM算法的PhotoScan软件,在8 G内存、英特尔酷睿i7双核处理器的图形工作站处理数据,经过对齐照片、生成密集点云、生成网格、建立DEM和获取正射影像等五个步骤完成拼接,其中前三个步骤的参数设置直接决定了所生成的DEM和正射影像的分辨率,详见表1。各步骤分述如下:
表 1 对齐照片、生成密集点云和生成网格的参数设置Table 1. Parameter setting for aligning photo,generating dense point clouds,and generating grids对齐照片 生成密集点云 生成网格 精度 成对预选 质量 深度过滤 表面类型 源数据 面数 高 参考 超高,高,中 进取 高度场 密集点云 中 1) 对齐照片。当精度设置为“高”时,直接处理的是原始影像。由于影像是具有测量坐标的照片,故成对预选为“参考”模式。
2) 生成密集点云。这一步是获取点高程的关键,点云密度越大,生成的DEM分辨率越高,软件处理所需时间越长。本研究通过设置“超高”、“高”和“中”三种点云密度,在保持其它参数不变的情况下对比生成的DEM在水平位置和高程上的差异,以挑选出最优的参数配置。超高质量表示处理原始影像,高质量处理的影像尺寸为超高质量的四分之一,中等质量处理的影像尺寸则为超高质量的十六分之一;深度过滤是为了挑选出影像对焦不好的异常点,以滤掉地表植被覆盖产生的异常点,这里选择适用于航空摄影数据处理的“进取”过滤模式。
3) 生成网格。处理航空摄影测量数据时,选择“高度场”表面类型模式,其对内存的要求更低;数据源选择上一步的密集点云,这样处理结果会更好,但也意味着处理时间长。最终生成网格的最大面数是基于上一步生成的密集点云中点的数量计算出来,“中”的比率为十五分之一最为合适,因为面值太小生成的网格过于粗糙,而面值太大即超过1千万会影响模型的可视化。
基于上述各步骤设定的参数,获取了相应的DEM和正射影像,将分辨率和各类参数进行对比,结果列于表2。可以看出:密集点云的质量仅对DEM的点云密度和分辨率产生影响,而对正射影像的分辨率并无影响;如果不考虑处理时长,密集点云的质量显然越高越好,但为了震后快速获取DEM的同时又能保证厘米级的分辨率,处理时长不应太长。从超高质量到高质量密集点云生成的DEM,虽然其分辨率降低了50%,但获取时间缩短了80%,故从处理时间和分辨率方面综合考虑高质量密集点云为最佳选择。
表 2 不同质量密集点云生成的DEM和正射影像的分辨率及其它相关参数Table 2. Resolution of DEM and orthophoto map generated by dense point clouds of different masses and the other parameters密集点云
的质量处理时间/h DEM 正射影像分辨率
/(cm·pix−1)点云密度/(点·m−2) 分辨率/(cm·pix−1) 超高 15 876 3.38 3.38 高 3 219 6.76 3.38 中 0.6 55 13.50 3.38 1.3 不同质量密集点云生成的DEM水平位置和高程的差异对比
在缺少地面控制点的情况下,首先通过图像特征匹配与跟踪解算出相机的空间位置,然后进一步计算出三维密集点的相对坐标,该坐标为图像的空间坐标系并非现实世界的空间坐标系,故解算出的相机位置决定了密集点云的坐标系。1.2节中步骤一“对齐照片”用于解算相机位置,因此三种质量的密集点云均是基于相同的相机位置而生成,其相机位置的水平(xy)误差和高程(z)误差均相同(表3),但密集点的差异使得生成DEM时进行插值计算所得的坐标位置和高程略有不同,由表4可见三种质量密集点云生成的DEM中点的投影坐标和高程范围的差异均小于0.100 m。
表 3 相机位置误差估计值Table 3. The error estimates of camera locationsx误差/m y误差/m xy误差/m z误差/m 0.540 0.338 0.637 3.127 表 4 DEM中点的投影坐标和高程范围Table 4. The projected coordinates and elevation ranges of midpoint in DEM不同质量密集点云 x/m y/m 最低高程/m 最高高程/m 高程差/m 超高 495639.212 4142958.128 1281.045 1338.719 57.674 超高与高的差异 0.000 0.007 0.057 0.079 0.022 高 495639.212 4142958.135 1281.102 1338.798 57.696 高与中等的差异 0.089 0.041 0.008 0.046 0.038 中等 495639.123 4142958.176 1281.094 1338.752 57.658 综合以上数据分析,在利用PhotoScan软件处理时,基于不同质量密集点云生成的DEM具有差异性。虽然超高质量密集点云可以处理原始影像,能够将软件引起的误差降至最低,但在实际工作中耗时太长无法满足地震应急的需求;中等质量密集点云虽然处理影像的时间短,但获取的DEM分辨率无法达到厘米级;高质量较超高质量密集点云的处理时间大大缩短,且获取的DEM分辨率能够达到厘米级,水平位置和高程与另外两者的差值均小于0.100 m,是快速获取高精度、高分辨率DEM和正射影像的最优参数配置。
2. 1709年中卫南M7½地震地表破裂带定量参数的提取
以1709年宁夏中卫市南发生的M7½ 地震为例来提取地表破裂带的定量参数。中卫地震产生的整个地表破裂带长约60 km,其主体地表破裂带为位于天景山活动断裂带的中段粉石沟—双井子一带(图1),该破裂带长约30 km (周俊喜,刘百箎,1987;张维歧等,1988)。前人对天景山活动断裂带地震事件的研究结果表明该断裂带上唯一的历史大地震即为1709年中卫南M7½地震(汪一鹏等,1990;闵伟等,2001),因此近千年以来形成的小冲沟位错仅为1709年地震造成,这为本研究提供了合适的场点。
在1709年中卫南地震主体地表破裂带上的形变遗迹有地震陡坎及水系错动,特别是青蛇崖西至红谷梁一带(图1)发育最好。因此在红谷梁西的洪积扇面上,进行无人机摄影测量获取影像数据,之后利用PhotoScan软件,基于高质量密集点云生成DEM和正射影像,按照1.2节的方法进行参数设置,最终生成分辨率为6.33 cm/pix的DEM,其点云密度为249 点/ m2,有效重叠约7.6次,影像覆盖度在9张以上的面积占区域覆盖总面积的75% (图2a),正射影像分辨率为3.16 cm/pix (图2b),通过厘米级、高分辨率的DEM和正射影像可以清晰地显示冲沟和陡坎地貌,在此基础上能够准确地解译地震地表破裂并提取相关参数。
2.1 垂直位错量
从获取的高精度DEM和正射影像上来看,在山前的洪积扇上,有一条明显的东西向延伸线,其展布不受地形影响并伴随一系列冲沟的左旋扭动,汪一鹏等(1990)证实该线性地貌是跨过1709年地震地表破裂带的一条断层陡坎。在该陡坎附近保存完好、未被植被破坏的同一时期沉积扇面上,提取垂直于断层方向的地形剖面数据,以确定该次地震的垂直断错量,剖面位置见图3a。结合地形剖面的高度和坡度,不仅能够快速地分离断层的上、下盘,而且地形剖面的坡度能够反映断层陡坎的坡降是否连续。由图3b和图3c可见l1剖面的坡度曲线仅有一个拐点,而l2剖面的坡度曲线有两个拐点,这说明l1剖面仅仅经历和记录了1709年地震的信息,而l2剖面除记录最新一次地震事件外,可能还记录了之前的地震或滑坡等事件(孙稳等,2019),但是相距仅15 m的两剖面所经历的事件不应有较大差别,那么多出来的拐点应该是剖面中的异常点,实际上为后期人为和植被对地形的破坏。经对比可知l1剖面上原始地形保留得较好,所以将其上所测量的垂直断距作为地震的垂直位错量更合理。于是,将l1剖面图上已划分出的上、下盘地形线进行最小二乘法拟合,分别用拟合公式(图3b,c)计算两点的高程之差h1和h2,然后利用断层陡坎高度=(h1+h2)/2、断距测量误差=(h1-h2)/2确定垂直位错量为(0.704±0.293)m。
图 3 由地形剖面确定的垂直断错量图(b)和(c)中,黑色虚线为上、下盘拟合线,蓝色虚线是根据坡度绘制的上、下盘分界线(a) 地形剖面位置;(b) 由l1剖面确定的垂直断错量;(c) 由 l2剖面确定的垂直断错量Figure 3. The vertical displacement of the fault extracted from the terrain profilesIn Figs. (b) and (c),the black dashed lines are the fitting lines for the hanging wall and footwall,and the blue vertical lines are the boundary lines between hanging wall and footwall determined by slope. (a) The position of the terrain profiles l1 and l2;(b) The vertical displacement of the fault from the l1;(c) The vertical displacement of the fault from the l22.2 水平位移量
水系对于断层新活动反应十分灵敏,而且沿断层分布也最为广泛,因此在实际测量时以冲沟为标志。结合在高精度DEM基础上生成的坡度图和1 m等高线图,确定断层的位置和走向,然后以沟心线为参照测量该断层的水平走滑位移。大地震发生后,通过确定宏观震中的最大水平位移量,可以结合其它相关参数进一步求取大地震的平均重复间隔。
在高精度DEM的基础上,生成坡度图和1 m等高线图(图4a,4b),确定断裂带的位置和走向之后,测量两条相距30 m的冲沟的水平位移,结果为10.4 m和5.1 m。虽然两条冲沟的长度基本相当,但东侧冲沟上游逐渐变小、消失、未切到基岩,西侧冲沟的深度和宽度较大、沟头已下切入石炭系基岩,所以西侧冲沟的形成年代显然要早,且位移量为东侧冲沟的两倍,故推测其可能经历了包括1709年地震在内的两次地震事件。从横向对比来看,海原断裂带1920年M8.6地震震中水平位移普遍处于6—8 m之间,而1709年震中位移多介于4.0—4.5 m之间,其最大水平位移不会超过1920年地震,所以10.4 m的位移可能为两次错动的叠加,而东侧5.1 m的位移才是1709年地震的水平位移量。
图 4 基于坡度图和等高线图确定的水平位移量及野外实测水平位移值(a) 坡度图;(b) 坡度图与1 m间隔等高线的叠置图;(c) 水平位错量;(d) 野外实测水平位移Figure 4. The horizontal displacement of the fault extracted from the superposition of slope map and 1 m interval contour map as well as that measured in the field(a) The slope map;(b) Overlapping of slope map and 1 m interval contour map;(c) The horizontal displacement of the fault;(d) The horizontal displacement measured in the field2.3 地表破裂带定量参数的探讨与无人机摄影测量技术的应用前景
张维歧等(2015)认为1709年大地震的宏观震中在主体地表破裂段的阴洞沟至红谷梁之间(图1),断错地貌上的垂直断距在0.6—0.8 m之间,水平位移在3.4—5.6 m之间,最大水平位移为5.6 m,位于红谷梁西,平均水平位移为4.05 m。本文基于无人机摄影测量技术提取红谷梁西的垂直位错为(0.704±0.293) m,水平位移为5.1 m,均与前人研究结果相吻合,同时与东侧冲沟野外实测水平位移值亦相同(图4d),因此该数据真实可靠,可以代表1709年地震的同震位移。
该方法利用无人机摄影测量技术快速获取高精度、高分辨率的DEM数据和正射影像,能够精细地判识亚米级断错地貌,准确地定位规律性冲沟扭动,清晰地再现地震断层陡坎;在大地震发生后的恶劣环境下,当人员无法到达宏观震中时,利用无人机第一时间获取发震断层的影像数据,不仅可为震后获取灾害情况提供有价值的图件和数据,更是为今后的科研保留一份珍贵的资料,且兼具安全性、及时性、重要性和科学性。利用无人机提取的定量参数,结合年代学确定的断裂在对应地质时期以来的平均滑动速率,通过提取大量的位移值确定地震的最大位移和平均位移,再根据地质方法(华莱士方法)确定的计算公式可以估算大地震的平均重复间隔;结合进一步的槽探结果可以讨论地震事件的震级,这些均展现出该方法获取的地震地表破裂带定量参数在未来地震危险性评估及地震地质等方面的研究中具有良好的应用前景。
3. 讨论与结论
本文简述了使用无人机摄影测量技术获取大地震后地表破裂带影像数据的流程,详细介绍了在集成SfM算法的PhotoScan软件平台上影像数据处理时各步骤的参数设置,深入讨论了不同质量密集点云生成的DEM数据所需处理时间、分辨率、水平位置和高程的差异,最终确定了快速获取高精度、高分辨率DEM和正射影像的最优参数配置。之后以1709年中卫南M7½大地震的主体地表破裂带为例,提取其上地震断层的垂直位错量和水平位移量,为大地震发生后基于无人机摄影测量技术快速提取发震断层的定量参数提供了可行、高效和科学的技术方法,并探讨了获取的定量参数在进一步研究和应用中的广阔前景。本文研究结果如下:
1) 无人机摄影测量技术获取影像数据具有成本低、安全性高、操作简易且获取速度快的特点。利用PhotoScan软件进行数据处理时,高质量密集点云能够生成厘米级分辨率的DEM,处理时间不需太长,水平位置和高程与另外两种质量密集点云生成的DEM差异均小于0.100 m,能够满足地震应急中快速获取地震地表破裂带影像数据及处理的需求。
2) 利用无人机摄影测量技术获取1709年中卫南M7½地震地表破裂带的影像数据,基于SfM算法生成DEM和正射影像,所提取地震断层的垂直位错量为(0.704±0.293) m、水平位移量为5.1 m,与张维歧等(2015)的研究结果相吻合,因此该数值能够代表1709年地震的同震位移,证实了该方法的可靠性和科学性。
使用无人机摄影测量技术在震后快速获取地震地表破裂带的影像数据、提取地震断层的定量参数,是将该技术用于活动构造定量化、精细化研究的延伸。利用生成的DEM能够提取地形剖面和坡度信息,在地震应急中获取传统遥感影像难以直接获得的破裂带垂直位移信息,显示出该技术巨大的应用潜力,但目前还存在一定的局限性,一些重要的因素如天气、飞行高度、测量面积、续航时间和地面控制点等,在大地震后恶劣的环境条件下,还会对影像的获取和精度的提高产生较大影响,尚需要进一步研究。未来工作可从飞行高度和地面控制点方面入手,探讨以适宜的飞行高度来获取高分辨率的影像数据以及选取适量的地面控制点来提取高精度的DEM,使无人机摄影测量技术在地震应急中发挥出更大的作用。
两位审稿专家提出了宝贵的修改意见和建议,作者在此表示衷心的感谢!
-
图 3 随机森林四个超参数的学习曲线图
(a) 决策树个数;(b) 决策树最大深度;(c) 叶子节点最少样本数;(d) 节点划分最小样本数
Figure 3. Learning curves of four hyper-parameters for random forest model
(a) Number of estimators;(b) Maximum depth of estimators;(c) Minimum number of samples required to be at a leaf node;(d) Minimum number of samples required to split an internal node
表 1 依据ATC-13划分的四种破坏等级数据统计
Table 1 Statistics on four types of damage levels data according to ATC-13
建筑物破坏等级 损失率 记录数量 轻微破坏(0类) 5%<Dr≤10% 136 334 中等破坏(1类) 10%<Dr≤30% 178 594 严重破坏(2类) 30%<Dr≤60% 33 079 倒塌(3类) 60%<Dr≤100% 30 029 总数量 378 037 表 2 建筑物数据集的机器学习模型输入特征
Table 2 Input features of machine learning model for building datasets
类别 影响因素 影响因素的特征描述 计算方法或数据来源 地震
信息PGA 地震动峰值加速度 Zhao等(2 016a,b)公式 震中距 地震震中至建筑物地面距离 Robusto (1 957)计算
两点经纬度距离公式建筑物
信息层数 建筑物层数 数据库 地区编号 47个都道府县 建筑物建造年代 ① 1 867—1910;② 1 911—1 924;③ 1 925—1 987;④ 1 988—2 011 外墙材料类型 ① 混凝土;② 蒸压轻质混凝土;③ 砌块;④ 砂浆;⑤ 抹灰;
⑥ 镶石砖;⑦ 金属板;⑧ 玻璃板;⑨ 石板;⑩ 金属陶瓷;
⑪ 土藏造;⑫ 木制壁板;⑬ 木板建筑物结构类型 ① 木结构;② 混合结构(木和砂浆);③ 土藏造;④ 砌块;
⑤ 砌体结构;⑥ 钢结构;⑦ 混凝土结构;⑧ 其它柱子材料类型 ① 混凝土柱;② 防火涂层钢结构;③ 钢结构;④ 木框架;
⑤ 双料组合;⑥ 其它屋顶材料类型 ① 混凝土;② 金属板;③ 石板;④ 瓷砖瓦;⑤ 合成树脂;
⑥ 木板;⑦ 茅草建筑物使用用途 ① 住宅;② 其它 场地信息 vS30 地表以下30 m土层的加权平均剪切波速 USGS (2 007) 表 3 混淆矩阵
Table 3 Confusion matrix
混淆矩阵 预测值 正类 负类 真实值 正类 真阳性 假阴性 负类 假阳性 真阴性 表 4 随机森林模型超参数优化方法对比
Table 4 Comparison of hyper-parameter optimization methods for random forest models
超参数优化方法 决策树棵数 决策树最大深度 叶子节点最少样本数 节点划分最小样本数 模型准确率 贝叶斯优化 654 48 1 2 68.8% 学习曲线方法 550 20 2 8 65.9% 表 5 基于实地调查数据的震害预测研究结果比较
Table 5 Comparison of seismic damage prediction research results based on field survey data
来源 模型类型 分类
类型研究数据 最严重破坏
状态准确率模型
准确率Harirchian等(2 021b) 极端随机树 三分类 2 016年厄瓜多尔地震,172座受损钢筋混凝土建筑物 55.0% 70.2% 三分类 2 010年海地地震,145座受损钢筋混凝土建筑物 41.2% 58.5% 四分类 2 017年韩国浦项市地震,74座受损建筑物 50.0% 60.0% Harirchian等(2 020c) 支持向量机 三分类 2 016年厄瓜多尔地震,171座受损钢筋混凝土建筑物 54.0% 60.0% 三分类 2 010年海地地震,142座受损钢筋混凝土建筑物 54.0% 68.0% 四分类 2 015年尼泊尔地震,138座受损钢筋混凝土建筑物 33.0% 67.0% 四分类 2 017年韩国浦项市地震,67座受损建筑物 2 0.0% 48.0% Harirchian等(2 020a) 多层感知器 五分类 1 999年土耳其迪兹杰地震,484座受损建筑物 71.4% 52.0% Harirchian等(2 020b) 支持向量机 五分类 1 999年土耳其迪兹杰地震,484座受损建筑物 54.5% 52.0% Mangalathu和Burton (2 019) 长短期记忆网络 三分类 2 014年美国纳帕南部地震, 3423 座受损建筑物63.0% 86.0% Mangalathu等(2 020) 随机森林 三分类 2 014年美国纳帕南部地震, 2276 座受损建筑物13.0% 66.0% Roeslin等( 2020) 随机森林 二分类 2 017年墨西哥普埃布拉地震,237座受损建筑物 78.0% 67.0% Stojadinović等(2 022) 随机森林 五分类 2 010年塞尔维亚克拉列沃地震,1 979座受损建筑物 30.0% 85.0% Ghimire等(2 022) 随机森林 三分类 2 015年尼泊尔地震,76.2万座受损建筑物 70.0% 64.0% 本文 随机森林 四分类 2 011年东日本大地震,37.8万座受损建筑物 81.8% 68.8% 二分类 88.0% 87.5% -
鲍跃全,李惠. 2019. 人工智能时代的土木工程[J]. 土木工程学报,52(5):1–11. Bao Y Q,Li H. 2019. Artificial intelligence for civil engineering[J]. China Civil Engineering Journal,52(5):1–11 (in Chinese).
孙柏涛,胡少卿. 2005. 基于已有震害矩阵模拟的群体震害预测方法研究[J]. 地震工程与工程振动,25(6):102–108. Sun B T,Hu S Q. 2005. A method for earthquake damage prediction of building group based on existing earthquake damage matrix[J]. Earthquake Engineering and Engineering Vibration,25(6):102–108 (in Chinese).
王健峰. 2012. 基于改进网格搜索法SVM参数优化的说话人识别研究[D]. 哈尔滨:哈尔滨工程大学:25−26. Wang J F. 2012. Study on Speaker Recognition Based on Improved Grid Search Parameters Optimization Algorithm of SVM[D]. Harbin:Harbin Engineering University:25−26 (in Chinese).
王自法,Park S,Lee S,崔凯. 2014. 提高地震灾害损失估计精度的几点研究[J]. 地震工程与工程振动,34(4):110–114. Wang Z F,Park S,Lee S,Cui K. 2014. Quantification improvement of earthquake loss estimation[J]. Earthquake Engineering and Engineering Dynamics,34(4):110–114 (in Chinese).
隗永刚,蒋长胜. 2021. 人工智能技术在地震减灾应用中的研究进展[J]. 地球物理学进展,36(2):516–524. doi: 10.6038/pg2021EE0164 Wei Y G,Jiang C S. 2021. Research progress of artificial intelligence technology in the application of earthquake disaster reduction[J]. Progress in Geophysics,36(2):516–524 (in Chinese).
杨旭,李永华,盖增喜. 2021. 机器学习在地震学中的应用进展[J]. 地球与行星物理论评,52(1):76–88. Yang X,Li Y H,Gai Z X. 2021. Machine learning and its application in seismology[J]. Reviews of Geophysics and Planetary Physics,52(1):76–88 (in Chinese).
杨毅,卢诚波,徐根海. 2017. 面向不平衡数据集的一种精化Borderline-SMOTE方法[J]. 复旦学报(自然科学版),56(5):537–544. Yang Y,Lu C B,Xu G H. 2017. A refined borderline-SMOTE method for imbalanced data set[J]. Journal of Fudan University (Natural Science),56(5):537–544 (in Chinese).
于红梅,许建东,张素灵,潘波. 2006. 基于集集地震的建筑物易损性统计分析[J]. 防灾科技学院学报,8(4):17–20. doi: 10.3969/j.issn.1673-8047.2006.04.004 Yu H M,Xu J D,Zhang S L,Pan B. 2006. The statistical analysis of building vulnerability research on Jiji earthquake[J]. Journal of Institute of Disaster Prevention,8(4):17–20 (in Chinese).
张风华,谢礼立,范立础. 2004. 城市建构筑物地震损失预测研究[J]. 地震工程与工程振动,24(3):12–20. doi: 10.3969/j.issn.1000-1301.2004.03.002 Zhang F H,Xie L L,Fan L C. 2004. A study on disaster loss prediction caused by damaged structures under earthquake[J]. Earthquake Engineering and Engineering Vibration,24(3):12–20 (in Chinese).
张桂欣,孙柏涛. 2018. 基于模糊层次分析的建筑物单体震害预测方法研究[J]. 工程力学,35(12):185–193. Zhang G X,Sun B T. 2018. Seismic damage prediction for a single building based on a fuzzy analytical hierarchy approach[J]. Engineering Mechanics,35(12):185–193 (in Chinese).
张浩. 2018. 自动化特征工程与参数调整算法研究[D]. 成都:电子科技大学:26. Zhang H. 2018. Research of Automatic Feature Engineering and Parameter Adjustment Algorithm[D]. Chengdu:University of Electronic Science and Technology of China:26 (in Chinese).
张天翼,丁立新. 2021. 一种基于SMOTE的不平衡数据集重采样方法[J]. 计算机应用与软件,38(9):273–279. Zhang T Y,Ding L X. 2021. A new resampling method based on SMOTE for imbalanced data set[J]. Computer Applications and Software,38(9):273–279 (in Chinese).
赵登科,王自法,刘渊,仝文博. 2021. 基于新西兰实际震害资料的地震损失不确定性分析[J]. 地震工程与工程振动,41(2):84–95. Zhao D K,Wang Z F,Liu Y,Tong W B. 2021. Earthquake loss uncertainty based on detailed loss data in New Zealand[J]. Earthquake Engineering and Engineering Dynamics,41(2):84–95 (in Chinese).
Applied Technology Council. 1985. Earthquake Damage Evaluation Data for California[M]. Redwood City:Applied Technology Council:167−219.
Bergstra J,Bengio Y. 2012. Random search for hyper-parameter optimization[J]. J Machine Learn Res,13:281–305.
Breiman L. 2001. Random forests[J]. Mach Learn,45(1):5–32. doi: 10.1023/A:1010933404324
Calvi G M,Pinho R,Magenes G,Bommer J J,Restrepo-Vélez L F,Crowley H. 2006. Development of seismic vulnerability assessment methodologies over the past 30 years[J]. ISET J Earthq Technol,43(3):75–104.
Chawla N V,Bowyer K W,Hall L O,Kegelmeyer W P. 2002. SMOTE:Synthetic minority over-sampling technique[J]. J Artif Intell Res,16:321–357. doi: 10.1613/jair.953
Ghimire S,Guéguen P,Giffard-Roisin S,Schorlemmer D. 2022. Testing machine learning models for seismic damage prediction at a regional scale using building-damage dataset compiled after the 2015 Gorkha Nepal earthquake[J]. Earthq Spectra,38(4):2970–2993. doi: 10.1177/87552930221106495
Harirchian E,Lahmer T,Rasulzade S. 2020a. Earthquake hazard safety assessment of existing buildings using optimized multi-layer perceptron neural network[J]. Energies,13(8):2060. doi: 10.3390/en13082060
Harirchian E,Lahmer T,Kumari V,Jadhav K. 2020b. Application of support vector machine modeling for the rapid seismic hazard safety evaluation of existing buildings[J]. Energies,13(13):3340. doi: 10.3390/en13133340
Harirchian E,Kumari V,Jadhav K,Raj Das R,Rasulzade S,Lahmer T. 2020c. A machine learning framework for assessing seismic hazard safety of reinforced concrete buildings[J]. Appl Sci,10(20):7153. doi: 10.3390/app10207153
Harirchian E,Hosseini S E A,Jadhav K,Kumari V,Rasulzade S,Işık E,Wasif M,Lahmer T. 2021a. A review on application of soft computing techniques for the rapid visual safety evaluation and damage classification of existing buildings[J]. J Build Eng,43:102536. doi: 10.1016/j.jobe.2021.102536
Harirchian E,Kumari V,Jadhav K,Rasulzade S,Lahmer T,Raj Das R. 2021b. A synthesized study based on machine learning approaches for rapid classifying earthquake damage grades to RC buildings[J]. Appl Sci,11(16):7540. doi: 10.3390/app11167540
Hwang S H,Mangalathu S,Shin J,Jeon J S. 2021. Machine learning-based approaches for seismic demand and collapse of ductile reinforced concrete building frames[J]. J Build Eng,34:101905. doi: 10.1016/j.jobe.2020.101905
Lerman P M. 1980. Fitting segmented regression models by grid search[J]. J R Stat Soc Series C Appl Stat,29(1):77–84.
Mangalathu S,Burton H V. 2019. Deep learning-based classification of earthquake-impacted buildings using textual damage descriptions[J]. Int J Disast Risk Reduct,36:101111. doi: 10.1016/j.ijdrr.2019.101111
Mangalathu S,Sun H,Nweke C C,Yi Z X,Burton H V. 2020. Classifying earthquake damage to buildings using machine learning[J]. Earthq Spectra,36(1):183–208. doi: 10.1177/8755293019878137
Mansourdehghan S,Dolatshahi K M,Asjodi A H. 2022. Data-driven damage assessment of reinforced concrete shear walls using visual features of damage[J]. J Build Eng,53:104509. doi: 10.1016/j.jobe.2022.104509
McCormack T C,Rad F N. 1997. An earthquake loss estimation methodology for buildings based on ATC-13 and ATC-21[J]. Earthq Spectra,13(4):605–621. doi: 10.1193/1.1585971
Miyakoshi J,Hayashi Y,Tamura K,Fukuwa N. 1997. Damage ratio functions of buildings using damage data of the 1995 Hyogo-Ken Nanbu earthquake[C]//Proceedings of the 7th International Conference on Structural Safety and Reliability. Kyoto:International Association for Structural Safety and Reliability:349−354.
Pedregosa F,Varoquaux G,Gramfort A,Michel V,Thirion B,Grisel O,Blondel M,Prettenhofer P,Weiss R,Dubourg V,Vanderplas J,Passos A,Cournapeau D,Brucher M,Perrot M,Duchesnay E. 2011. Scikit-learn:Machine learning in Python[J]. J Mach Learn Res,12:2825–2830.
Robusto C C. 1957. The Cosine-Haversine formula[J]. Am Math Mon,64(1):38–40.
Roeslin S,Ma Q,Juárez-Garcia H,Gómez-Bernal A,Wicker J,Wotherspoon L. 2020. A machine learning damage prediction model for the 2017 Puebla-Morelos,Mexico,earthquake[J]. Earthq Spectra,36(S2):314–339.
Shahriari B,Swersky K,Wang Z Y,Adams R P,De Freitas N. 2016. Taking the human out of the loop:A review of Bayesian optimization[J]. Proc IEEE,104(1):148–175. doi: 10.1109/JPROC.2015.2494218
Singhal A,Kiremidjian A S. 1996. Method for probabilistic evaluation of seismic structural damage[J]. J Structural Eng,122(12):1459–1467. doi: 10.1061/(ASCE)0733-9445(1996)122:12(1459)
Snoek J,Larochelle H,Adams R P. 2012. Practical Bayesian optimization of machine learning algorithms[C]//Proceedings of the 25th International Conference on Neural Information Processing Systems. Lake Tahoe:Curran Associates Inc.:2951−2959.
Stojadinović Z,Kovačević M,Marinković D,Stojadinović B. 2022. Rapid earthquake loss assessment based on machine learning and representative sampling[J]. Earthq Spectra,38(1):152–177. doi: 10.1177/87552930211042393
Suryanita R,Maizir H,Yuniarto E,Zulfakar M,Jingga H. 2017. Damage level prediction of reinforced concrete building based on earthquake time history using artificial neural network[C]//The 6th International Conference of Euro Asia Civil Engineering Forum. Seoul:Euro Asia Civil Engineering Forum, 138 :02024.
Tesfamariam S,Liu Z. 2010. Earthquake induced damage classification for reinforced concrete buildings[J]. Struct Saf,32(2):154–164. doi: 10.1016/j.strusafe.2009.10.002
USGS. 2007. vS30 models and data[DB/OL]. [2022-08-01]. https://earthquake.usgs.gov/data/vs30/.
Wald D J,Allen T I. 2007. Topographic slope as a proxy for seismic site conditions and amplification[J]. Bull Seismol Soc Am,97(5):1379–1395. doi: 10.1785/0120060267
Whitman R V,Reed J W,Hong S T. 1973. Earthquake damage probability matrices[C]//Proceedings of the Fifth World Conference on Earthquake Engineering. Rome:Palazzo dei Congressi (EUR):2531−2540.
Yuan X Z,Chen G D,Jiao P,Li L J,Han J,Zhang H B. 2022. A neural network-based multivariate seismic classifier for simultaneous post-earthquake fragility estimation and damage classification[J]. Eng Struct,255:113918. doi: 10.1016/j.engstruct.2022.113918
Zhao J X,Liang X,Jiang F,Xing H,Zhu M,Hou R B,Zhang Y B,Lan X W,Rhoades D A,Irikura K,Fukushima Y,Somerville P G. 2016a. Ground-motion prediction equations for subduction interface earthquakes in Japan using site class and simple geometric attenuation functions[J]. Bull Seismol Soc Am,106(4):1518–1534. doi: 10.1785/0120150034
Zhao J X,Zhou S L,Zhou J,Zhao C,Zhang H,Zhang Y B,Gao P J,Lan X W,Rhoades D,Fukushima Y,Somerville P G,Irikura K. 2016b. Ground‐motion prediction equations for shallow crustal and upper-mantle earthquakes in Japan using site class and simple geometric attenuation functions[J]. Bull Seismol Soc Am,106(4):1552–1569. doi: 10.1785/0120150063
-
期刊类型引用(11)
1. 廖程,梁明剑,周文英,吴微微,刘书淮. 基于无人机SfM及LaDiCaoz的地震地表破裂定量参数提取——以炉霍扎交村一带地震典型地表破裂为例. 大地测量与地球动力学. 2024(02): 183-188 . 百度学术
2. 朱英浩,孟金龙,杨平科. 基于GIS和无人机航摄测量技术的城市数字地形测量方法. 粉煤灰综合利用. 2023(06): 134-140 . 百度学术
3. 刘超,杜鹏,雷启云,武治群,吕俊强,余思汗. 基于无人机航测的天景山断裂孟家湾地貌精细解译及活动构造定量参数提取. 地震研究. 2022(01): 100-108 . 百度学术
4. 刘超,王银,余思汗,雷启云,杨顺. 新型便携式行业级无人机精灵4RTK定位精度分析. 震灾防御技术. 2022(01): 114-123 . 百度学术
5. 李忠武,陈桂华. 基于无人机倾斜航空摄影三维点云测量同震倾滑变形研究——以2021年玛多M_S7.4地震地表破裂为例. 震灾防御技术. 2022(01): 46-55 . 百度学术
6. 吴永春. 铁路桥梁巡检中无人机摄影测量技术的应用研究. 科学咨询(科技·管理). 2022(08): 96-98 . 百度学术
7. 刘超,武治群,王银,余思汗,杨顺. 基于网络RTK技术分析新型无人机获取DEM的差异性. 科技和产业. 2022(09): 395-400 . 百度学术
8. 殷翔,刘炜,姚生海,盖海龙. 基于无人机测量的微地貌提取——以昆中断裂(巴隆-温泉段)为例. 震灾防御技术. 2022(04): 701-709 . 百度学术
9. 李东臣,任俊杰,张志文,刘亮. 基于高分辨率无人机影像的地震地表破裂半自动提取方法——以2021年M_S7.4青海玛多地震为例. 地震地质. 2022(06): 1484-1502 . 百度学术
10. 吴永春. 铁路桥梁巡检中无人机摄影测量技术的应用研究. 科学咨询. 2022(15): 96-98 . 百度学术
11. 张志文,任俊杰,章小龙. 高精度无人机航测在2021年玛多7.4级地震地表破裂精细研究中的应用. 震灾防御技术. 2021(03): 437-447 . 百度学术
其他类型引用(1)