基金项目:中国地震局地震研究所基本科研业务费专项资助项目和中国地震局地壳应力研究所基本科研业务费专项资助项目(306337-12);湖北省地震局基础科研基金项目(2022HBJJ012)联合资助。
作者简介:张萍(1993-),女,工程师,主要从事地震监测与应急工作。E-mail:zping@whu.edu.cn
通信作者:李垠(1979-),女,高级工程师,主要从事地震应急与灾情评估方面的工作。E-mail:yubai1979@qq.com
1.中国地震局地震研究所 地震大地测量重点实验室,武汉 430071;2.湖北省地震局,武汉 430071
1.430071, China;2.Hubei Earthquake Agency , Wuhan 430071, China
U-Net;Remote sensing image;Building spatialization;Earthquake disaster;Rapid assessment
DOI: 10.13512/j.hndz.2024.04.04
破坏性地震在极短的时间内就会造成大量的人员伤亡和经济损失[1]。地震灾害发生后,快速评估灾区受灾情况、掌握灾情分布,对于地震应急救援、指挥决策、灾后重建具有重要意义。地震灾害快速评估是震后评估灾害规模的技术支撑,依赖于地震应急基础数据的完备性和可靠性。房屋是重要的承灾体,房屋数据的准确性是影响评估结果准确性的因素之一[2]。
传统的房屋数据获取方法主要依靠房屋普查及统计数据,工作量大、耗时耗力,这些数据以行政区为统计单元,无法反映行政区内部的空间分布细节。房屋数据空间化是将房屋统计数据分配到行政单元内部一定尺度的规则格网上,使数据具有更高的空间分辨率[3],有效弥补地震灾害损失评估出现的偏差。建筑物会随时间而变化,而遥感技术可快速获取区域影像,从遥感影像中提取建筑物对房屋数据进行更新,对于提高地震灾害损失评估的准确性具有重要意义[4]。
近年来学者对房屋数据空间化方法做了大量研究。文献[5]~[7]分别利用公里格网实地抽样调查数据、房屋普查数据、高分辨率遥感影像数据,构建了较高精度的房屋空间分布数据,实现了房屋数据空间化。
随着人工智能的发展,基于卷积神经网络(Convolutional Neural Networks, CNN)的方法已成为遥感影像建筑物提取的主流方法[8]。这类方法具有强大的特征表达和学习能力,能充分利用图像信息。在CNN基础上发展了一系列网络模型,如AlexNet、VGGNet、ResNet等,缺点是参数多、计算复杂度高。全卷积神经网络(Fully Convolutional Networks,FCN)模型[9]则是利用卷积层替换全连接层,实现像素级分割,有效提高分割效率、降低计算复杂度。FCN有很多变种,U-Net[10]就是其中之一。U-Net是一个包含特征编码和解码两部分的对称结构网络,编码部分捕捉图像的高级语义特征,解码部分结合语义特征恢复图像的位置信息,两部分之间采用跳跃连接结构,该结构可以实现高级语义信息和低级细节信息的融合,弥补下采样造成的空间信息损失。U-Net网络改造性强、训练速度快,使用极少的训练数据即可训练一个高性能的网络模型,在图像分割领域有着广泛应用。后来的学者对U-Net进行了很多改进,Zhou等[11]将跳跃连接用嵌套密集跳跃连接代替,提出了UNet++模型。吕少云等[12]引入多尺度空洞空间金字 塔 池 化 模 块 ASPP (Atrous Spatial Pyramid Pooling),提出了残差空洞空间金字塔网络(Res_ASPP_UNet++)模型,有效提高了建筑物提取精度。
本文以湖北省秭归县为研究区域,基于高分辨率遥感影像,利用全卷积神经网络U-Net模型提取房屋信息,利用GIS技术将提取到的房屋矢量数据网格化,获得研究区房屋面积公里格网空间分布数据,提高基础数据的精度,所得结果能更好地满足地震灾害快速评估对高质量数据的需求,为地震灾害评估等工作提供更准确的数据支撑。
秭归县位于湖北省西部,长江西陵峡两岸,三峡大坝库首,地处我国地势第二级阶梯向第三级阶梯的过渡阶段。秭归县地势西南高、东北低,平均海拔千米以上,属长江三峡山地地貌。长江由西向东将县境分为南、北两部分,江北北高南低,江南南高北低。县境内山脉为大巴山、巫山余脉,多为南北走向,形成广大起伏的山岗丘陵和河谷地带。秭归县东段为黄陵背斜,西段为秭归向斜,县境内有仙女山断裂、九畹溪断裂等区域性大断裂,从地质地貌、形变观测资料及小震活动方面分析,两断裂现今仍有弱活动。
本文技术路线如图1所示,包括基于U-Net网络的建筑物识别与基于GIS的房屋面积数据空间化两个步骤。基于U-Net网络的建筑物识别包括建立房屋样本数据库、深度学习训练、房屋矢量数据提取三个步骤。
U-Net网络结构如图2所示,呈U型对称结构。左侧为编码器,用于提取图像的深层语义特征、减少空间维度。右侧为解码器,用于恢复图像的细节和空间维度。编码器和解码器之间通过跳跃连接,更好地保留低层特征,还原图像精度。
图1 技术路线Fig.1 Technology roadmap
编码器也称下采样部分,包含4组相同的编码块,每组编码块包含两个3×3卷积层和一个2×2下采样层,通过重复的卷积和池化操作充分提取图像的深层特征。每组编码块的过程包括:先对图像进行两次卷积,用于提取图像特征,再对图像进行最大池化操作,用于减小特征图的空间维度。每组编码块使特征图尺度缩小一半,特征通道数量加倍。
解码器也称上采样部分,包含4组相同的解码块,每组解码块包含两个3×3卷积层和一个2×2反卷积层。每组解码块的过程包括:先对图像进行一次反卷积,并与编码器的对应层的下采样特征图进行拼接,减少编码块中下采样带来的细节信息损失,再对图像进行两次卷积。每组解码块使特征图尺度扩大一倍,特征通道数量减半。
经过编-解码器后得到一个64维特征图,通过1×1卷积将多维特征向量映射为二分类的特征图,最后利用softmax分类器进行分类。
图2 U-Net网络结构Fig.2 U-Net architecture
本文在秭归县遥感影像上选择部分区域作为样本区域,包含各种类型的、具有代表性的建筑物以及容易与建筑物混淆的地物。本文借助ArcGIS软件平台来制作标签数据,以建筑物屋顶为目标,通过目视解译勾画样本区域影像上的建筑物边界矢量,同时利用建筑物阴影、排列、屋顶颜色等信息,以及其他辅助数据,来辅助判别建筑物目标。标签标注完成之后,将样本影像数据与对应的标签数据裁剪成512×512像素的图像块,并对其进行数据增强操作,最终生成本文的房屋样本数据库。本文房屋样本数据库包含14260张512×512像素的样本(图像和标签),图3为部分样本。
图3 秭归县部分房屋样本(图像和标签) Fig.3 Some building samples from Zigui County(images and labels)
将本文的房屋样本数据库分为训练集和验证集,在深度学习框架下,对U-Net网络模型进行训练,得到在验证集上精度最高的模型。利用该模型对秭归县遥感影像上的房屋进行提取,若将整个影像直接送入网络模型会因影像尺寸较大出现内存不足的问题,因此先对影像进行切分操作,将影像切分成统一大小的小尺寸影像,对小尺寸影像块分别提取房屋,将提取结果拼接起来得到整个影像的房屋矢量结果。对模型错误识别或漏识别的房屋,通过人工目视判读进行编辑和修改,对漏提取的房屋勾画轮廓添加房屋要素,并删除错误识别为房屋的地物,得到秭归县房屋矢量数据。
传统的房屋数据统计的多是各级行政区划内的房屋信息,而当地震发生时,灾区范围与行政区划范围并不一定是一致的,以行政区划内的房屋分布作为地震灾区的房屋数据来源,会导致地震灾害快速评估的结果受到影响,与实际损失存在偏差。因此将房屋数据进行空间网格化,将行政单元划分为一定尺度的规则格网,统计每个网格内的房屋面积等基础信息,从而得到精度更高的房屋数据。发生地震后,根据地震影响范围,统计该范围内的网格数据,可有效改善地震灾害评估的精度,缓解房屋数据与空间特征脱节的问题。
利用ArcGIS的Fishernet工具将秭归县行政区划图进行1km×1km网格化,生成1km×1km格网数据。根据提取的秭归县房屋矢量数据可以得到该县的房屋面积分布,在ArcGIS中将行政区划格网数据与房屋面积数据进行叠加分析,统计每个网格内的房屋面积,即可得到房屋面积公里格网数据。
实验环境为Linux操作系统, GPU配置为NVIDIA GeForce RTX 3090,显存24G。采用的深度学习框架是PyTorch,编程语言为Python。
遥感影像数据源采用Google Earth影像,分辨率为0.5 m。在训练时,将房屋样本数据库的4/5样本作为训练集,其余作为验证集,训练批次大小(batch_size)设置为4,学习率设置为0.001,优化器采用Adam算法,用于更新模型参数,最优化损失函数。在利用训练好的网络模型提取房屋时,将秭归县遥感影像无重叠地切分成512×512的影像块,避免大尺寸遥感影像直接输入模型造成内存溢出。
对提取出来的房屋数据进行编辑和修改,得到秭归县房屋矢量数据如图4所示。
选取交并比(Intersection-over-Union, IoU)、精确率(Precision)、召回率(Recall)三个指标作为评价指标,来评价房屋提取精度。交并比是指正确预测的正样本数与真实正样本总数的交集与它们的并集之比,精确率是指正确预测的正样本数与被预测为正样本的总数之比,召回率是指正确预测的正样本数与真实正样本总数之比,三个指标的计算公式如下:
式中,TP为正确提取的房屋像素个数;FP为错误提取的房屋像素个数;FN为错误提取的非房屋像素个数。
图4 秭归县房屋矢量数据提取结果Fig.4 Extraction results of building vector data of Zigui County
房屋提取结果的精度评价如表1所示,由表可知,利用U-Net网络提取遥感影像上的房屋具有较高的精度, IoU、精确率和召回率分别为70.3%、82.1%、83.0%。图5是部分房屋提取结果,可以看出,U-Net网络能较为准确地检测到房屋,无论是房屋密集处还是稀疏处,检测出的房屋的边界也比较平滑。
表1 精度评价表Table 1 Accuracy evaluation table
图5 部分房屋提取结果Fig.5 Extraction results of buildings
房屋漏提取和误提取情况依然存在。当房屋被遮挡、边界不明显或与周围地物特征相似时,网络模型很难将其识别,造成遗漏,如图6中的绿色房屋。当地物与房屋的光谱特征极为相似时,网络模型无法将两者分辨,从而将地物错分类成房屋,造成误提取,容易混淆的地物包括船舶、农田、水塘、操场等,如图7中的黄色地物。可在房屋样本数据库中对这些特殊样本进行扩充,从而增强网络模型辨别房屋与其他地物的能力,提高房屋的提取精度。
图6 房屋漏提取情况Fig.6 Non-identified building
图7 房屋误提取情况(船舶、农田、水塘、操场) Fig.7 Misidentified houses(ships,farmlands,ponds,and playgrounds)
在ArcGIS中,利用Fishernet工具基于秭归县行政区划创建1 km×1 km的网格,共划分2453个网格。将行政区划格网数据与房屋矢量数据叠加,计算每个网格内的房屋面积,生成秭归县房屋面积公里格网空间分布数据,如图8所示。
图8 秭归县房屋面积公里格网分布图Fig.8 Kilometre grid distribution of building area in Zigui County
由图可知,秭归县的房屋分布大致以乡镇驻地为中心,向外逐渐减少,在乡镇驻地附近分布较为密集,自乡镇驻地向外逐渐稀疏,且在东部的茅坪镇分布尤为密集,与实际相符。
由于房屋提取存在漏提取和误提取情况,所以利用本文方法统计出来的房屋面积与实际面积相比并不完全一致。另外,通过遥感影像获取的是房屋的屋顶,也就是占地面积,计算面积时使用的也是单层面积,而房屋存在多层或高层情况,特别是在城镇区域,导致计算出来的房屋面积比实际小。这些因素导致最终的房屋面积公里格网数据存在一定的误差。
本文利用U-Net神经网络模型提取高分辨率遥感影像上的房屋数据,通过GIS技术创建公里格网与房屋矢量数据叠加,获得秭归县的房屋面积公里格网数据,将其作为地震灾害快速评估的数据源,可解决数据收集成本高、效率低、更新难等问题,为地震应急救援决策提供参考依据。
当然,基于U-Net网络模型的房屋提取精度也有待提高,房屋样本数据库的容量有待扩充,正负样本的代表性有待加强,模型参数还需进一步优化,应尽可能减少误提取和漏提取的情况。此外,本文只获取了房屋的基底面积数据,而地震灾害快速评估的基础数据也包含房屋的建筑面积、结构类型等信息,但是诸如房屋层数、结构类型、造价、建造年代等与地震灾害损失快速评估密切相关的信息,是无法直接从遥感影像上获得的,所以要结合其他资料和方法,获取更多更全面的信息,从而完善地震应急基础数据库。