基金项目:地震科技星火计划课题(XH23025YA);福建省地震局测震台网青年骨干培养专项(Q202301)联合资助。
作者简介:陈家樑(1985-),男,工程师,主要从事地震行业系统软件部署维护以及波形数据质量的监管工作。E-mail:cjlianga@163.com
Fujian Earthquake Agency , Fuzhou 50003, China
Seismic monitoring network;Seismic observation;Data quality;Process-oriented manner;Quanti⁃tative manner
DOI: 10.13512/j.hndz.2025.02.04
在常规地震数据处理中,如地震定位、震级量算、地震层析成像等,数据质量控制(Quality Contorl,QC)分析是其中重要的一环。数据质量控制分析(QC)有助于研究人员识别观测记录中的潜在问题,进而避免后续处理中因数据质量问题导致的研究结果偏差[1]。对于地震观测台网运维人员而言,也需要对各观测站点产出数据的质量状态进行监控,以分析和掌握台网的运行状态,并用于指导改善台网运维质量[2]。
地震观测数据质量的影响因素又是多方面的,包括站点观测环境、观测设备及数据采集传输等在内的各个环节均会对观测数据质量产生不同程度影响。例如,由于地震计/强震仪产生故障,会导致观测记录中出现尖脉冲、限幅、基线漂移、幅值重叠、通道失效等;由于站点授时设备故障,会导致数据授时偏差过大甚至授时中止等;由于站点选址不严谨,会导致观测环境干扰过大,背景噪声水平增加,实际观测动态范围降低等;由于观测站点中非专业设备(如供电设备)故障,导致观测数据连续率显著下降;由于站点元数据配置错误,导致仪器响应、通道方位等关键信息产生错误等。传统上,为确保观测数据的可用性,观测台网运维人员通常采用随机抽取波形的方式对观测数据质量进行人工检查,同时辅以关于数据完整率分析的自动判别结果(如授时状态、断记次数、功率谱密度分析结果等),从而对台网运维质量状态进行判别。上述方式在处理效率层面存在明显缺陷,同时又存在一定的主观性,因此通常用于验证台站的健康状况,并不适合捕捉观测设备在长期观测中可能出现的细微的时变特征[3]。
另一方面,在过去几十年里,国际上公开可用的地震观测数据量和数据集规模显著增长,这极大地激发了研究人员处理更大规模数据集的兴趣和能力[4-7]。数据集规模的扩大带来的是显著的数据管理挑战。但更为重要的是,如果不能识别并刻画这些庞大数据集中的具体数据问题,数据的解析可能会受到严重影响,同时也会影响用户提取所需的数据价值。在我国,近年来地震观测站网规模的不断扩大,特别是在“国家地震烈度速报与预警工程”项目(以下简称“预警工程”)建设完成后,传统以关注站网运行率为主的运维模式难以有效提升站网观测数据的质量及可用率。因此,探索形成一套符合我国地震观测台网实际、指标清晰、简便易行的地震观测数据质量控制流程十分有必要。
为了实现地震观测数据质量的自动化、流程化、定量化评价,美国地震学研究联合体(IRIS,In⁃corporated Research Institutions for Seismology)、阿尔伯克基地震实验室(ASL,Albuquerque Seismolog⁃ical Laboratory)、欧洲地震观测与研究实验室(OR⁃FEUS, Observatories and Research Facilities for Eu⁃ropean Seismology)等机构陆续开发了相应的数据质量分析工具或框架,用于观测台网数据质量指标定期计算和显示[2]。IRIS数据管理中心于2014年上线了地震数据质量控制web服务平台——MUS⁃TANG(Modular Utility for STatistical kNowledge Gath⁃ering)[8],该平台提供了7大类49个指标的在线数据质量分析服务,包括数据连续率、时间序列振幅特征统计、PSD噪声分析、元数据准确性、异常信号分析等。后期,IRIS又开发了基于本地数据的MUSTANG地震数据质量指标的客户端模块ISPAQ (IRIS System for Portable Assessment of Quality)[9],该系统支持使用国际数字地震仪网络联合会(Inter⁃national Federation of Digital Seismograph Networks, FDSN)提供的在线服务数据及本地的miniSEED格式的地震波形数据进行质量计算,且适合在Linux和Mac系统上单机运行。中国地震局第二监测中心每月产出的测震台网数据质量分析报告,即基于ISPAQ平台的若干指标开展。与之类似,ASL开发了一个名为数据质量分析器(Data Quality Analyzer, DQA)的框架[10],DQA框架由miniSEED数据扫描、波形质量指标计算及存储(SEEDscan)、Web界面显示等组件构成。其数据质量定量化计算结果则由用户定义,选择多个评价指标进行度量,如时间服务准确性,噪声PSD曲线不同频点与NLNM曲线的偏离度、数据断记时长等。同时,该系统可通过更改配置文件增加或删除评价指标以适应未来可能面临的更新。代码可以设置为计划任务定时运行,或根据实际需求不定时运行,以确保最新评价指标的可用性。
在我国,预警工程项目建设完成后,全国部分区域的地震台网密度已位居全球前列,所配置的仪器设备种类也十分丰富。以福建地区为例,目前全省范围内各类地震观测站点已超过1300台,仅测震一项,涉及的观测设备类型超过30余种,这也使地震台网的高质量运维面临诸多挑战。在学习借鉴国内外先进算法的基础上,福建地震台数据质量运维团队也开展二次开发和应用。本文即以福建地区地震观测台网数据质量运维为例,介绍数据质量运维团队在日常化分析等方面的一些尝试。
福建位于我国东南沿海地震带北段,是我国东南沿海地质构造的重要部分,区域内地质构造活动活跃,地震活动频繁。同时,福建还位于“东南沿海预警区”,预警工程项目建设期间,福建地区的地震台网规模得到大幅增加,台网密度已位于全国前列。目前,福建地区已建成1313台测震观测站点,其中基准站128台,基本站85台,一般站1100台。根据预警工程项目的设计,福建地区基准站为基岩台址,其中同时配置速度型测震仪和加速度型强震仪;基本站为土层台址,其中配置加速度型强震仪;一般站则主要位于铁塔公司通讯机房内,其中仅配置烈度计。在此基础上,福建省“十三五”项目建设期间,福建省地震局又规划建设了200个一般站,用于弥补部分地区站网密度的不足,预计这部分站点将于2024年底正式纳入台网运行。统计分析结果表明,福建地区现有测震站网的平均台站间距约为10.5 km,区域内大部分地区地震监测能力达到ML1.0左右,区域内绝大部分地区发生ML3.0左右地震可在震后5~10 s内产出第一报地震预警警报信息。除此之外,为了更好的处理和应对周边地区的地震事件,提高地震速报信息精度,福建地震台还接入了包括浙江、江西、广东及台湾等周边省份在内的各类型台站共计479个。其中,浙江、江西、广东的站点数据通过各省互建数据端口用户及密码方式获取,台湾地区的站点观测数据则通过科研网获取。
从观测站点所配置仪器设备种类及型号的角度统计,目前福建台网在线运行的站点中使用的观测设备型号几乎涵盖了国内外主流设备厂家的产品。速度型地震计和加速度型强震计既有港震、泰德、深研院等国内厂家的产品,也有Guralp、Kinematic等厂家的产品,数据采集器和智能电源等通用设备更是涉及国内数个
厂家。尽管设备类型的多元化有利于提升台网运行的稳健性,避免因同一型号设备批次性、系统性缺陷导致的大范围故障,但对于观测站网的标准化运维而言则意味着更多的挑战。与此同时,随着预警工程项目建设完成,地震预警系统已进入业务化运行阶段。作为具有高度时效性要求的实时处理系统,地震预警系统对于观测数据的准确性和稳定性等关键质量参数提出了更高的标准,这也使建立标准化、流程化、定量化观测站网质量运维体系迫在眉睫。
作为我国地震预警与烈度速报先行先试地区,福建台网的观测数据质量监控分析工作开展也相对较早,并在日常工作中逐步形成了一套以自动判别为主,人工校核为辅的综合性观测数据质量分析流程。观测数据自动监控分析手段也由早期的以观测数据噪声功率谱密度(power spectral density,PSD)分析为依据的单指标方法,逐步发展为考虑数据授时准确性、设备参数精确性、观测数据稳定性等在内的多指标方法,并自主研发了相应的自动处理平台。与此同时,为避免自动判别算法的疏漏,通过人工每日校核波形等手段,实现了测震台网可靠观测与数据质量的稳步提升。
地震动噪声功率谱密度(Noise Power Spectral Density,PSD)是描述观测台站台基噪声单位时间内在不同频率上的功率分布情况的物理量。在地震监测领域,PSD不仅是分析地震信号的重要工具,也是评估地震观测设备运行状态的关键指标[12]。通常,观测站点台基噪声水平的高低直接影响关系到地震观测数据的准确性和可靠性,是台站观测系统运行状态和观测数据质量定量化检测评估的重要指标。通过对站点观测噪声记录的PSD定期监测,可以及时发现设备的性能下降或故障。例如,如果某个观测站点的自噪声水平突然变化,可能意味着设备存在故障,如电子组件损坏、机械部件磨损或安装环境变化等问题。此外,PSD分析还可以揭示设备对不同频率信号的灵敏度,帮助技术人员调整设备配置,以优化其对地震信号的监测能力。
2008年,“十五”项目福建地震烈度速报台网建设中,廖诗荣[13]等将McNamara[14]提出的地震噪声概率密度函数(PDF)方法用于地震台站台址勘选测试数据的自动处理中。以此为基础,黄玲珠[15]等逐步增加实时数据流数据接入与波形展示、站点空间分布、站点断记实时监控、数据延时状态、PSD定时计算及结果展示、异常站点自动判别及展示等多个关键功能模块,开发相应的UI界面(图1),并于2012年起开始在福建台网中运行。
图1 基于PSD的站网数据质量准实时监控平台Fig.1 Quasi-real-time monitoring plateform based on power spectral density(PSD).
依托该平台,福建台网各站点运行状态及数据质量状态得以直观展示,大幅地提升了测震台网运维效率。站点设备运维中经常出现的“零漂”、“数采无输出”、“卡摆”等故障均可以通过观察PSD图进行判别。以闽侯竹岐(MHZQ)台为例,该站点Z通道2024年5月15日PSD计算结果出现明显异常(图3),站网维护人员分析认为存在“卡摆”的情形,随即远程校调地震计,待调整完成后该站点5月17日PSD计算结果也恢复正常(图2)。为了实现基于PSD计算结果的故障站点自动分析判别,林彬华[16]等根据福建台网各站点噪声记录分别统计得到了各自的PSD计算结果上、下界限。相较于Peterson[17]的研究,此时上、下界限范围更小,一旦地震动噪声PSD计算结果超出该界限,即判别站点设备发生故障。
图2 2024年5月15日和17日MHZQ台PSD计算结果Fig.2 PSD results for MHZQ station on May 15 and 17,2024
图3 福建台网台站运行状态监控软件实时监控平台Fig.3 Real-time monitoring platform for station operation status of Fujian Seismic Observation Network
在区域地震观测台网运维中,故障台站的分析与识别仅是其中的一项内容。针对观测数据质量开展定量化分析,进而建立标准化的数据分析体系是更为基础和重要的任务。如前文所述, MUSTANG、ISPAQ、DQA等数据处理平台(软件)在全球范围内得到广泛的应用。近年来,上述处理平台(软件)已陆续在福建地震台网得到本地化部署,实现了对福建台网中现有1300余个台站5000余个通道波形数据的全面监控。在此基础上, 2016年,福建台网开发了一套采用CS架构的台站状态监控软件(图3),实时处理福建台网台站的SH、BH、HH、EN、HN、EI等6类通道的波形数据,并计算数据断计、延时、基线漂移、大周期干扰、高频重复信号和尖刺等数据质量控制指标。参照ISPAQ提供的地震波形数据质量评估指标,产出数据可用率(percent_availability)、最大断记时长(max_gap)、断记次数(num_gaps)、最大数据重发 时 长(max_overlap) 、数 据 重 发 次 数(num_overlaps)、噪声数据功率谱密度(pdf)等14个项目计算结果。软件界面实时分类显示各类异常通道,还可以在软件界面上查看异常通道原始波形图,并可通过手机短信发送自动检测到的异常信息(图4)。图5即为2024年6月14日至7月3日间状态监控软件系统产出的莆田埭头台(PTDT)数据可用率等6个指标逐日变化情况。由该图可见,该站点数据可用率保持在较高水平,除6月15日和6月26日存在短时中断外,其余时间均为100%(图5(a));该站点观测数据的基线位置呈现缓慢增大的变化趋势(图5(d)),而整体噪声水平则变化不大(图5(e));另从观测数据中尖刺(spikes)次数统计结果可见(图5(f)),在统计时间段内该站点数据中明显异常干扰次数也维持在较低水平,主要与周边环境干扰有关。
尽管自动化分析软件已在福建台网中得到广泛应用,但仍无法完全避免疏漏,尤其是对于一些新发的趋势性故障。为此,福建台网日常运维值班员仍需通过人工浏览观测波形记录的方式对站网运维状态、数据质量等进行检查校核。一方面,人工分析结果是对自动化分析软件结果的确认与校正,另一方面,通过人工分析也有助于发现未能在自动分析中体现的细节问题,进而促进自动化分析软件逐步迭代升级。经过多年的摸索实践,福建台网值班员每日使用JOPENS软件检查前一日的连续波形数据,以30 s、60 s、120 s及3600 s等不同的时间窗长分别检查全网观测波形数据情况,重点关注零点漂移、零点偏移、波形失真等故障情况;每日使用噪声功率谱密度分析软件(图2)检查前一日所有台站的PSD分布,重点关注是否存在噪声PSD超限的情况;每日同时需要检查前一日最大记录事件波形,重点关注是否明显存在授时错误、振幅异常等的观测台站。上述各项人工检查结果与自动化分析软件产出结果进行对比,并逐一记录在值班日志中。对于发现的设备类故障,则由福建地震台站网室远程及各中心站上站处置。
图4 每日定时发送的台网运行状态短信Fig.4 Regularly scheduled daily SMS messages on the operational status of the seismic observation network
图5 莆田埭头(PTDT)台2024年6月14日至7月3日6个数据质量监控指标逐日变化Fig.5 Daily variation of six data quality monitoring metrics for PTDT Station between June 14 and July 3,2024
综上所述,预警工程项目建设完成后,福建台网站网规模迅速增加,运维压力陡增。为提高站网运维工作效率,提升站点观测数据质量,福建地震台在学习借鉴国内外先进经验、算法的基础上,基于福建台网实际,开发完成了一系列适用于本区域的站网运维及数据质量监控分析软件(平台)。实际运行中,这些软件(平台)极大地降低了台网运维人员的工作强度,实现了站网运维半自动化及数据质量分析的准实时化。对于地震预警、地震速报等具有高度时效性和数据准确性要求的业务应用而言,这些软件(平台)将为其提供有力支撑,保证业务系统高效、准确、安全的运行,保障其产出信息的可靠性。
目前,站网运维监控信息主要侧重于观测数据本身,对于可能造成观测数据变化的间接影响因素,如台站观测系统中的数据采集器、电源、授时设备等硬件设施运行信息,数据机房中服务器、存储设备等硬件设施在线状态,以及数据流服务等软件系统的运行信息等的挖掘和利用还较少涉及。陈家樑等(另文介绍)基于Zibbix监控平台,汇集了台站硬件设备心跳监控、服务器、存储设备、业务系统等软硬件设备的运行信息等,开发了一套基于http协议的站点及台网数据监控软件,实现了对站点及台网数据的监控,可实时或定时的产出不同类型台站的运行状态,并对超过阈值数量的台站数据中断,产出台网断记告警短信及语音电话自动播报功能。另一方面,目前对于数据质量异常站点的判别很大程度上依赖于经验。随着上述多源监控信息的汇集,如何将其合理融合利用,进而提升站网运维的精准度是值得讨论的问题。近年来大数据、人工智能等新技术也越来越多地应用于系统运维监控领域,如何将这些技术与地震监测结合,研发相应的处理系统(平台)也是值得研究的课题。总而言之,福建台网数据质量监控分析框架已基本建立,但其距离标准化、流程化的目标仍有差距。
致谢:本文研究所使用台站观测记录由福建地震台提供。