分享自:

利用七个维度探索推特上的气候变化:立场、情感、攻击性、温度、性别、话题与灾害

期刊:PLOS ONEDOI:10.1371/journal.pone.0274213

关于气候变化推文多维度分析研究的学术报告

本研究由来自色雷斯民主大学电气与计算机工程系数据库与信息检索研究单元的 Dimitrios Effrosynidis 与 Avi Arampatzis,以及来自环境工程系生态工程与技术实验室的 Georgios Sylaios 共同完成。该研究论文《探索推特上关于气候变化的七个维度:立场、情感、攻击性、温度、性别、话题与灾害》发表于期刊《PLOS ONE》,发表日期为2022年9月21日。

一、研究学术背景

本研究属于环境科学与计算社会科学交叉领域,具体聚焦于利用大数据分析公众对于气候变化的感知、态度与行为。在过去十年间,社交媒体平台,尤其是推特,已成为公众表达观点和交换信息的重要场所,由此产生的大量用户生成数据为研究者提供了分析公众对环境议题认知的宝贵资源。已有大量研究利用推特数据分析公众对气候变化、环境管理与可持续发展的看法,揭示了隐藏的趋势和模式。先前的研究已从不同侧面切入,例如分析气候事件对讨论热度的影响、识别用户对气候变化的立场(支持者、怀疑者、中立者)、探究情感极性、以及考察极端天气或灾害事件如何触发相关讨论等。

然而,以往研究大多仅关注少数几个方面(如仅分析情感或立场),且使用的数据集在时间跨度、地理覆盖范围和样本量上往往有限,分析手段也未必采用最先进的机器学习方法。这限制了对气候变化这一复杂社会现象的全面、深入理解。为了弥补这些不足,本研究旨在通过一个前所未有的、大规模且多维度的数据集,系统地探索公众在社交媒体上关于气候变化的讨论。研究明确了九个具体的研究问题,旨在通过整合七个关键维度——用户性别、气候变化立场、情感、语言攻击性、历史温度偏差、讨论话题以及环境灾害事件——来全面描绘公众认知的图景,并揭示这些维度之间的内在联系。

二、详细研究流程

本研究是一项基于现有数据集的、深入的二次分析研究,其核心流程并非传统的实验操作,而是数据集的构建、维度标注、空间-时间分析以及多维度的关联性探索。

  1. 研究数据集构建与维度标注: 本研究的基础是团队前期工作中创建的一个全面的“气候变化推特数据集”。该数据集整合了三个公开的推特气候数据集,并进行了进一步的预处理和丰富。其时间跨度长达13年(2006年6月至2019年10月),包含超过1578万条推文,其中约三分之一(超过530万条)包含地理定位信息。数据集的独特性和核心价值在于其为每条推文关联了七个经过机器学习和外部工具处理的维度:

    • 地理位置: 推文发布的经纬度坐标。
    • 气候变化立场: 使用机器学习算法将每条推文分类为“相信者”(相信人为气候变化)、“否认者”(不相信人为气候变化)或“中立者”。
    • 气候变化情感: 采用最先进的算法为每条推文分配一个介于-1(极度负面)到+1(极度正面)之间的连续情感分数。
    • 攻击性: 通过算法判断推文文本是否包含攻击性语言。
    • 用户性别: 推断发布推文的用户性别(男、女或未定义)。
    • 历史温度偏差: 利用外部气候数据集,计算每条推文发布时其所在地点相对于1951-1980年历史同期平均温度的摄氏温度偏差值。
    • 讨论话题: 采用主题建模算法将推文分类到十个预定义的话题类别之一,例如“气体排放的严重性”、“人类干预的重要性”、“天气极端事件”、“特朗普与科学”等。 此外,研究还整合了一个包含4,913次自然灾害事件(发生时间在数据集覆盖期内)的数据库,用于分析灾害事件与其他维度的关联。
  2. 数据处理与分析方法:

    • 空间分布分析: 利用推文的地理位置信息,研究人员将全球地图划分为5×5弧分(约9公里×9公里)的网格单元,计算每个单元内推文在特定维度上的平均值(如平均情感、否认者/相信者比例)。为确保统计稳健性,仅分析包含至少20条相关推文(如“否认者”推文)的网格。
    • 时间序列与关联分析: 按月或按温度偏差区间(将温度偏差值等分为50个区间)对数据进行聚合。通过绘制时间序列图(如温度偏差与否认者/相信者比例随时间的变化)和散点关系图,并使用皮尔逊相关系数,来量化不同维度之间的关联性,例如气候变化立场与历史温度偏差的关联、情感与攻击性的关联等。
    • 文本内容分析: 通过词云和最高频词汇/短语列表,直观对比“相信者”和“否认者”群体在语言使用上的差异。同时,分析每个话题类别中最具代表性的词汇。
    • 灾害事件关联分析: 将灾害数据库(包含死亡人数、受灾人数、经济损失等指标)的时间线与推特数据的时间线对齐,计算灾害事件的严重性指标与特定时间段内推特上的平均情感、平均立场之间的相关性。

三、主要研究结果

  1. “相信者”与“否认者”的差异: 研究发现,在语言使用上,一个显著区别是术语偏好:“否认者”更频繁地使用“全球变暖”(global warming)一词,而“相信者”使用“全球变暖”的频率比使用“气候变化”(climate change)低5倍。“相信者”的推文更多包含“相信”、“特朗普”、“战斗”、“行动”、“应对气候”等词汇,表明他们更倾向于讨论采取行动应对气候变化。而“否认者”则更常使用“人为”、“科学家”、“骗局”、“戈尔”、“冰河时代”等词汇,更多讨论极端天气并表达怀疑。此外,“否认者”推文的攻击性语言平均得分(0.42)显著高于“相信者”(0.27)。

  2. 全球立场与情感的地理分布: 空间分析显示,“否认者”与“相信者”的比例在全球分布不均。该比例较高的地区包括加拿大、美国、古巴、南非、日本、中国东部、澳大利亚和巴西。相反,欧洲、印度和中非地区的比例较低。有趣的是,情感分布图与立场分布图呈现出相关性:那些“否认者”比例较高的地区(如北美、大洋洲),其推文的情感也倾向于更负面;而“否认者”比例较低的地区(如印度、欧洲、中东和东南亚),其推文情感则相对更积极。

  3. 气候变化立场、情感与温度偏差的关系:

    • 立场与温度: 研究发现,月度平均温度偏差与“否认者/相信者”比例之间存在负相关(相关系数为-0.53)。当温度高于历史平均水平时,社交媒体上气候变化的“相信者”声音往往会压倒“否认者”。进一步按温度区间分析发现,在经历极端低温(低于-3.8°C)时,“否认者”相对更活跃;而在温度处于-0.257°C至+4.172°C的“正常”温暖区间时,他们的比例最低。这表明,人们更容易将温暖的温度与人为气候变化联系起来,而对寒冷的温度则不那么敏感。
    • 情感与温度: 人类情感与历史温度偏差之间存在正相关关系。当温度低于历史平均值时,人们关于气候变化的推文情感偏负面;当温度高于历史平均值时,情感则转为正面(尽管气温升高本是气候变化的影响)。人们情感最积极的温度偏差区间在-1.143°C至+2.401°C之间,对偏暖的温度显示出更大的“宽容度”。
  4. 情感、立场与攻击性三者的内在关联: 分析显示,推文的情感与其立场存在很强的正相关(+90%),即“否认者”倾向于使用更负面的语言,而“相信者”则更积极。相反,情感与攻击性之间存在极强的负相关(-94%),即情感越积极的推文,其攻击性语言越少。

  5. 与灾害事件的关联: 研究考察了灾害事件(以总死亡人数、受灾人数、经济损失为指标)是否与推特上的气候变化立场或情感相关。结果发现,这些关联性非常微弱(最高相关系数仅为12%)。这表明,单次灾害事件的这些具体特征,与公众在社交媒体上关于气候变化的整体情绪和立场比例,没有明显的直接关联。可能需要考虑更复杂的因素,如媒体报道强度、事件公众知名度等。

  6. 讨论话题的发现及其特征: 算法识别出的十个话题展现了气候变化讨论的多样性。各话题特征鲜明:

    • “天气极端事件”“气体排放的严重性” 话题与“否认者”比例高度正相关,且情感偏负面。“天气极端事件”话题中,“全球变暖”一词出现频率远高于“气候变化”。
    • “人类干预的重要性”“全球立场” 话题则与“否认者”比例负相关,情感最积极,攻击性较低,主要由“相信者”讨论。
    • “特朗普与科学”“意识形态立场” 话题的“否认者”比例最高,情感最负面,攻击性也最强。
    • “政治” 话题虽然“否认者”比例不高,但其攻击性得分是所有话题中最高的。 话题的时间参与度分析显示,“天气极端事件”是长期主导话题,“特朗普与科学”在其总统任期内参与度显著升高。

四、研究结论与价值

本研究的结论是:通过多维度、大规模的分析,揭示了公众在社交媒体上关于气候变化讨论的复杂图景。研究发现,气候变化是一个高度政治化且常伴随负面情感和攻击性语言的议题,尤其在涉及极端天气、政治人物(如特朗普)和意识形态辩论时。然而,也存在大量积极讨论人类干预重要性的声音,显示出一定的乐观基调。地理上,“否认者”的集中区域与情感负面区域高度重叠。更重要的是,研究量化了公众感知与物理环境(温度)之间的有趣联系:公众更易将变暖(而非变冷)与气候变化关联,且在温和偏暖的温度下情感最为积极。

本研究的科学价值在于:首次在一个统一框架内,整合了时间、空间、态度、情感、语言风格、环境变量(温度、灾害)和社会人口(性别)等多个维度,对气候变化公众话语进行了前所未有的系统性剖析。所使用的高质量、多维度数据集和先进的分析方法为后续研究设立了新标准。其应用价值在于:为政策制定者、环保组织和传播者提供了深入的洞察,帮助他们理解不同群体的话语特征、情感触发点以及地域差异,从而设计更有效的气候传播和公众参与策略。

五、研究亮点

  1. 数据集的全面性与前沿性: 研究基于一个时间跨度长(13年)、样本量大(超过1500万推文)、且融合了七个通过先进机器学习算法生成的维度的独特数据集,这在同类研究中是前所未有的。
  2. 多维度的交互分析: 研究不仅孤立地考察每个维度,更着重分析了维度之间的复杂关联(如立场-情感-攻击性的三角关系,立场/情感-温度的地理与时间关联),提供了更立体、更深入的见解。
  3. 对“温度-感知”关系的精细刻画: 研究不仅确认了温度与公众讨论有关,还精细地揭示了这种关系是非线性的(对暖温更敏感),并找到了公众情感最积极的温度区间,这是对现有文献的重要补充。
  4. 全球视野与地理可视化: 通过高分辨率的地理网格分析,直观展示了气候变化立场和情感在全球范围内的“热点”和“冷点”分布,将线上讨论与线下地理空间明确关联。

六、其他有价值的内容

研究还揭示了性别差异:女性“相信者”比例略高于男性(73.56% vs 70.83%),女性“否认者”比例略低于男性(5.98% vs 8.38%)。在语言使用上,两性总体相似,但女性“相信者”对极端天气事件表现出更高的敏感性。此外,研究将线上讨论与线下国际政治事件(如美国退出《巴黎协定》、COP25气候大会的僵局)联系起来,提出了“特朗普效应”可能解释北美等地“否认者”比例较高的现象,体现了将社交媒体分析与宏观社会政治背景结合的视角。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com