为研究云南漾濞6.4级地震灾害关注度与情感极性特征,选取云南省地震局和中国地震台网速报两大微博平台,通过网络爬虫获取相关微博及评论,使用关注度分析方法与ROSTCM情感分析方法得出微博相对关注度与评论情感极性。研究表明:漾濞地震后两大微博平台在震后2h关注度较高,且与发布量呈相关性。情感极性为中性,总体呈平稳态势。
In order to study the characteristics of attention and emotional polarity of Yangbi MS 6.4 earthquake disaster in Yunnan Province, two microblog platforms of Yunnan Earthquake Agency and China Earthquake Network Quick Report are selected to obtain relevant microblogs and comments through web crawlers. The attention analysis method and ROST CM emotional analysis method are used to obtain the relative attention of microblogs and emotional polarity of comments. The results show that after the Yangbi earthquake, the two microblog platforms have high attention 2 hours after the earthquake,and it is correlated with the amount of publication. The emotional polarity is neutral,and the overall trend is stable
引言
地震灾害具有突发性和不可预测性,严重威胁着人民生命财产安全[1] 。云南地处亚欧板块与印度洋板块交界处,地震强度大、分布广。近年来,随着社交媒体的兴起,微博、微信平台逐渐成为民众发声的重要渠道。
部分学者针对网络舆情展开分析研究。曹彦波等以九寨沟7.0级地震为例,分析此次地震微博的数量、灾情分类、时间序列和空间分布等特征[2] 。刘耀辉等以云南大理漾濞县6.4级地震为例,对震后24h微博文本、发布时间、地理位置三方面进行信息挖掘,研究本次地震的舆情特征与情感极性分布特征[3] 。曹彦波采用情感词典和规则相结合的方法,以2013年四川芦山7.0级地震和2017年九寨沟7.0级地震为例,基于震后24 h微博数据分析地震灾区民众情绪反应特点[4] 。Qu等对2010年玉树地震的新浪微博数据进行分类统计,并分析民众对地震事件的情感[5] 。Yao等以2019年四川长宁地震为例,基于新浪微博数据进行地震烈度快速判定[6] 。
本文以2021年云南漾濞6.4级地震为例,通过网络爬虫获取震后24 h新浪微博有关数据。以云南省地震局及中国地震台网速报两大官方微博为分析样本,研究此次地震事件中地震类微博随时间流变化的关注度及民众情感极性特征,并将分析结果进行可视化呈现,得到震后0~24 h微博发布量统计图、震后相对关注度变化图和情感极性统计图。
1 研究方法
1.1 数据来源
本文数据来源为新浪微博客户端网页版。采用平台固有的搜索功能,在云南省地震局和中国地震台网速报两大官方微博已发布的信息中,以云南漾濞6.4级地震发生时间(2021年5月21日21时48分)为基点检索震后24 h所有微博。经筛选、去重、去噪等数据处理后,最终得到有效微博共计342条,有效微博评论1009条。
1.2 情感分析方法
文本情感分析又称倾向性分析,它是针对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。在使用微博等新媒体平台时,用户会产生大量评论信息。通过分析这些带有主观色彩的评论,可以把握公众舆论对某一事件的情感倾向。本文使用的情感分析工具是武汉大学沈阳博士研究团队编写的ROST Content Mining软件。它将文本情感分为三类:积极、中性和消极,即情感极性。
1.3 微博关注度数据处理
在对微博关注度进行量化分析时,需提取能反映关注度的量化指标,对其进行赋值。文中所采用的信息关注度量化指标包括每条微博的点赞数、转发数、评论数,并定义点赞数(用A表示)、转发数(用B表示)、评论数(用C表示),每条微博的关注度为三者之和。鉴于云南省地震局和中国地震地震台网速报微博粉丝数差异较大,需对关注度数据进行转化处理,将绝对关注度转化为相对关注度,具体方法为:
式(1)、(2)中W云表示云南省地震局微博粉丝总数,W中表示中国地震台网速报粉丝总数;Mi 云为转化后的第i条云南省地震局微博的相对关注度;Mi 中为转化后的第i条中国地震台网速报微博的相对关注度。后续关于关注度的表述均采用相对关注度。
2 微博关注度分析与情感极性分析
2.1 微博评论关注度分析
2.1.1 微博发布量特征
震后0~24 h微博发布量呈现“双M”特征。总体而言,震后0~24 h是微博信息发布最为集中的时段,震后15 min仍处于信息的“黑箱期”,此时由于通讯被破坏、伤亡人数不易统计等因素致使信息不全。随着时间推移,信息逐步披露。从图1 中可看出震后0.5~2 h,微博发布量出现第一个高峰时期,此时云南漾濞发生6.4级地震。震后5 h出现第二个高峰时期,这是青海玛多县发生7.4级地震。微博发布主要集中于前5 h,共发布173条,占总发博量50%以上。此后,随时间推移微博发布量逐渐减少,虽在13 h和20 h再次出现发布高峰,但绝对量已大大降低。
图1 震后0~24 h微博发布量Fig.1 The number of microblog posts from 0 to 24 h after the earthquake
2.1.2 微博信息关注度变化特征
图2 显示,震后微博的相对关注度呈“单M”特征,关注度最高时刻主要集中于震后0.5 h和2 h,此为漾濞6.4级地震发震后。图3 显示,震后0.5 h及5 h关注度出现高峰,此时发生漾濞6.4级及玛多7.4级地震。图4 显示,震后0.5 h与2 h关注度出现高峰。总体而言,云南省地震局、中国地震台网速报及两大微博合计关注度均呈现一定随机性,无明显线性变化特征。可能由于某几条微博,短时间内关注度呈急速上涨趋势,也会在几小时内关注度始终保持平稳。
结合图1 和图4 的变化趋势,两图均在震后0.5 h与2 h出现数值高峰。此时正是云南漾濞6.4级地震后信息发布时刻。微博发布量与关注度呈现高度一致性。两次高峰过后,无论是发布量或关注度均呈明显下降趋势。据此可合理推测,此次地震事件微博发布量与关注度呈明显相关性。
图2 云南省地震局微博关注度Fig.2 The attention of Yunnan Earthquake Agency microblog
图3 中国地震台网速报微博关注度Fig.3 The attention of microblog of China Earthquake Network Quick Report
图4 两大微博合计关注度Fig.4 The total attention of the two microblogs
2.2 微博评论情感极性分析
运用ROST CM进行情感分析,结果如表1 所示。在共计1009条有效数据中,共有566条呈中性情绪,占总体数量的56%,所占比重最大;有247条呈积极情绪,占总体数量的25%;消极情绪196条,占总体数量的19%。本次地震从评论来看,舆情较为平稳,民众表现出的情绪为中性,多以陈述震感为主。
图5 (a)~(c)为积极情绪、消极情绪和总体情感比例图。在积极和消极情绪中,均是“一般”程度占比最高。按照情感值整体分析,评论表现出的情感呈“中间多、两边少”的分布趋势。“一般”情绪占比最大,情感值绝对值小于5的(即中性和积极、消极情绪中的“一般”类情绪)评论占总体50%以上。表明在此次地震事件发生后,民众情绪呈基本稳定态势。
表1 情感极性统计表Table 1 Statistics of emotional polarity
图5 微博情感极性分析Fig.5 Emotional polarity analysis of microblog
3 结论与讨论
(1)通过前文分析发现,微博发布量主要集中在震后5 h,特别是震后2 h内是发布量的高峰时期。出现原因为,震后15 min内信息处于“黑箱期”,此时由于震中通讯中断、灾情信息正在汇总等原因,相关信息无法在第一时间得到传播。但震后由于民众对灾区信息了解的迫切性,对于地震发生时间、地点、震级等信息,他们期待官方能做出权威性解答。6 h后关注度随时间推移而不断降低,原因为此时已是22日凌晨2时,民众大多已休息,而相关发布人员数量减少及精力下降,也使发布量出现明显下降趋势。同时官方微博的宣传重点出现转变,内容由漾濞地震相关信息转变为地震应急处置、地震科普知识宣传为主。
(2)分析震后微博关注度,主要集中于震后0~24 h,这是由地震自身具有的特点决定。地震具有突发性和破坏性强两大特征,二者共同决定震后短时间内必将引起较为强烈的社会舆论。震后24 h是震后救援的黄金时间,关于人员伤亡或死亡类信息,不仅是有关部门关注的焦点,普通民众亦聚焦于此。这些特性会让地震事件在众多热门事件中脱颖而出,成为短时间霸占微博热搜的重要内容。从关注度与发布内容也可看出,官方权威性不仅建立在信息的时效性上,同时发布内容的多样性也是增加权威性的重要一环,前期发布速度快、信息内容丰富,关注度就快速上涨。后随时间推移,发布信息数量、内容丰富程度均下降,必然带来关注度下降。
(3)此次地震事件,微博评论情绪呈平稳趋势。微博发布门槛低,受众广泛,这让其具有庞大的受众群体。而地震影响范围广、震感明显,两者融合就会在情绪上引发群体反应。评论中多以震感描述及祈愿类内容为主。前者是历次地震中最为普遍的类型,也是最易引发民众讨论和共情的叙述类型,如“住在七楼的我,这震感给我吓懵了”、“吓我一跳”、“在下关,刚刚就感受到了”等。后者,如“愿平安”、“大理的大家都要平安阿!”则多在公布伤亡人数等负面信息后出现。此次震后0~24 h出现一个特例,在震后5 h青海发生7.4级地震,叠加之后袁隆平院士去世信息,在评论中再次引发较多的祈福类信息。
通过对云南漾濞6.4级地震后,云南省地震局和中国地震台网速报两大官方微博的关注度分析,震后关注度呈现一定随机性,无明显线性变化特征。震后关注度与微博发布量相关性。此次地震事件的情感极性为中性,“一般”类情绪占比最大,总体情绪呈平稳态势。震后地震类微博应提升发布数量,使发布内容具有多样性。在微博评论中对已出现的负面情绪做到及时互动与有效疏导。
图1 震后0~24 h微博发布量Fig.1 The number of microblog posts from 0 to 24 h after the earthquake 图2 云南省地震局微博关注度Fig.2 The attention of Yunnan Earthquake Agency microblog 图3 中国地震台网速报微博关注度Fig.3 The attention of microblog of China Earthquake Network Quick Report 图4 两大微博合计关注度Fig.4 The total attention of the two microblogs 表1 情感极性统计表Table 1 Statistics of emotional polarity 图5 微博情感极性分析Fig.5 Emotional polarity analysis of microblog