负面性驱动在线新闻消费：基于大规模随机对照试验的证据

分享自：
负面性驱动在线新闻消费：基于大规模随机对照试验的证据

期刊:nature human behaviourDOI:https://doi.org/10.1038/s41562-023-01538-4
关于在线新闻消费驱动因素的大规模随机对照试验研究学术报告
一、 研究团队与发表信息
本研究由来自美国纽约大学（New York University）、德国吉森大学（University of Giessen）、瑞士苏黎世联邦理工学院（ETH Zurich）、瑞典卡罗林斯卡学院（Karolinska Institutet）以及德国慕尼黑大学（LMU Munich）的学者合作完成。主要作者包括Claire E. Robertson、Nicolas Pröllochs、Kaoru Schwarzenegger、Philip Pärnamets、Jay J. van Bavel和Stefan Feuerriegel。该研究以注册报告（Registered Report）的形式发表于《自然-人类行为》（*Nature Human Behaviour*）期刊2023年5月第7卷，文章标题为“Negativity drives online news consumption”。
二、 研究背景与目标
本研究属于计算社会科学、传播学与心理学交叉领域，旨在探究在线新闻消费的驱动因素。随着互联网成为主要新闻来源（美国89%的成年人至少部分从线上获取新闻），新闻机构为争夺用户有限的注意力而激烈竞争。新闻界有句俗语“If it bleeds, it leads”（流血即头条），反映了负面新闻更能吸引读者的普遍直觉。先前研究多集中于探讨负面或情绪化语言如何影响用户在社交媒体上的“分享”行为，但这些研究大多为相关性分析，或在实验室环境中进行，缺乏在真实、生态化在线环境中对新闻“消费”（点击阅读）行为的因果性检验。
本研究基于“负面偏见”（Negativity Bias）理论框架。该理论指出，人类认知普遍存在对负面刺激的优先关注倾向，这种倾向始于婴儿期并持续至成年，可能源于负面信息能自动激活威胁反应，有助于规避潜在危害。研究团队旨在利用大规模实地实验数据，首次严格检验新闻标题中负面与正面词汇对用户点击率（Click-Through Rate, CTR）的因果效应。具体目标包括：1）验证负面词汇增加点击率、正面词汇降低点击率的主假设；2）探索不同离散情绪词汇（如愤怒、恐惧、悲伤、喜悦）对点击率的影响；3）检验负面效应在不同新闻主题间的普适性。研究数据来源于以“病毒式”传播和“点击诱饵”（Click-bait）闻名的新闻网站Upworthy.com，该网站曾进行过海量的标题A/B测试，为因果推断提供了宝贵资源。
三、 研究方法与详细流程
本研究采用了对大规模历史随机对照试验（Randomized Controlled Trials, RCTs）数据进行二次分析的方法。核心流程如下：
1. 数据来源与预处理： * 数据源： 研究数据来自Upworthy研究档案库（Upworthy Research Archive）。该档案包含了2013年1月至2015年4月期间，Upworthy在其网站上进行的22,743项标题A/B测试实验数据。 * 实验设计： 每项RCT针对一个特定的新闻故事，编辑会为该故事生成多个（平均4.31个）不同的标题变体。网站用户被随机展示其中一个标题变体，系统记录展示次数（Impressions）和点击次数（Clicks），并计算点击率（CTR = Clicks / Impressions）。所有测试独立进行，确保了实验的因果有效性。 * 数据集规模： 经过预注册的过滤程序（如剔除仅测试图片的实验、合并重复标题）后，最终分析样本包含12,448项RCTs，涉及53,699个不同的新闻标题，累计获得超过2.05亿次展示和约278万次点击。 * 变量计算： 对每个标题，研究者计算了其长度（单词数）和文本复杂度（使用Gunning Fog指数）。此外，还计算了“平台年龄”（Platform Age），即实验日期距离Upworthy成立日期的天数，以控制网站知名度或用户疲劳随时间变化的影响。
2. 文本挖掘与情感分析： * 词典方法： 采用基于词典的情感分析方法。主要使用LIWC（Linguistic Inquiry and Word Count）词典来识别标题中的正面和负面词汇。例如，“love”、“pretty”被归类为正面词，“wrong”、“bad”被归类为负面词。 * 情感指标计算： 对于每个标题，计算正面词比例（正面词数/总词数）和负面词比例（负面词数/总词数）。这是研究的核心自变量。 * 否定处理： 为处理如“not happy”这类否定表达，研究采用了否定处理技术。当检测到否定词（如“not”、“no”）时，将其后一定窗口（本研究设为3个词）内的情感词极性反转（如“happy”从正面计为负面）。 * 离散情绪分析： 在次要分析中，使用NRC情绪词典（NRC Emotion Lexicon）来识别与四种基本情绪（愤怒、恐惧、喜悦、悲伤）相关的词汇，并计算各自在标题中的比例。 * 验证： 通过小规模用户研究验证了词典评分与人工情感判断之间的相关性，证实了词典方法在本研究语料中的有效性。
3. 统计建模与分析： * 主分析模型： 为了检验情感词汇对点击率的影响，并考虑同一新闻故事下不同标题变体之间的非独立性，研究采用了多层级二项式回归模型。因变量是点击次数（服从二项分布，试验次数为展示次数）。模型核心自变量是正面词比例和负面词比例。模型控制了标题长度、文本复杂度和平台年龄。此外，模型包含了实验级别的随机截距，以捕捉不同新闻故事本身吸引力差异带来的变异。这是一个关键设计，确保了效应估计是在同一新闻故事内部不同标题变体之间进行比较，从而隔离了故事内容本身的干扰，增强了因果推断的力度。 * 变斜率模型： 作为稳健性检验，研究还拟合了一个更复杂的模型，该模型不仅允许随机截距，还允许正面和负面词汇的效应斜率（即系数）在不同实验间变化，以检验情感效应是否因新闻主题不同而异。 * 离散情绪模型： 针对愤怒、恐惧、喜悦、悲伤四种情绪的比例，构建了类似的多层级回归模型进行分析。 * 主题建模分析： 为了探索负面效应在不同新闻主题间的差异，研究者使用了主题模型（Topic Modeling）将标题自动归类为7个主题（如“娱乐”、“政府与经济”、“LGBT”、“育儿与教育”、“人物”、“女性权利与女权主义”等），并在模型中加入了主题与情感词汇的交互项。 * 稳健性检验： 研究进行了大量稳健性检验，包括：使用不同的情感词典（NRC、SentiStrength）；采用不同的否定处理范围；使用不同的文本复杂度指标；控制二次项效应；剔除同时包含正负词汇的标题；剔除涉及图片变化的实验；计算净情感得分（正面比例减负面比例）进行分析；以及对因变量进行对数转换以处理偏态分布。
四、 主要研究结果
1. 描述性统计结果： * 数据集中正面词汇（占所有词汇2.83%）略多于负面词汇（2.62%），但分布有显著差异。 * 点击率分布高度右偏，平均CTR为1.39%，中位数为1.07%，绝大多数（99%）标题变体的CTR低于6%，说明只有极少数标题能获得极高点击。
2. 负面与正面词汇对点击率的因果效应（主假设验证）： * 负面词汇显著提升点击率： 在多层级回归模型中，负面词比例的系数为正且高度显著（β = 0.015, p < 0.001）。这意味着，在控制其他因素后，标题中负面词汇比例每增加一个标准差，用户点击该标题的几率（odds）增加1.5%。对于一个平均长度（约15个单词）的标题，每增加一个负面词，点击率预计提升2.3%。 * 正面词汇显著降低点击率： 正面词比例的系数为负且高度显著（β = -0.008, p < 0.001）。标题中正面词汇比例每增加一个标准差，点击几率降低0.8%。平均长度标题中每增加一个正面词，点击率预计下降1.0%。 * 控制变量： 标题更长、文本更简单（可读性更高）会带来更高的点击率。平台年龄系数为负，表明Upworthy后期发布的标题点击率较低，可能源于其“点击诱饵”策略的新颖性随时间衰减。 * 稳健性： 变斜率模型的结果与主模型一致，负面效应为正，正面效应为负。所有稳健性检验均支持主结论，效应方向稳定。
3. 道德化语言的调节作用： * 当在模型中引入道德相关词汇及其与正/负面词汇的交互项时，发现道德词汇本身对点击率有直接负向影响。同时，道德词汇会削弱负面词汇的正面效应，并加剧正面词汇的负面效应。但即使在控制道德语言后，负面词汇的直接正向效应依然显著存在。
4. 不同新闻主题间的效应差异： * 负面词汇的正面效应在不同主题间存在差异，其中在“政府与经济”相关新闻中效应最强。然而，跨所有主题，负面词汇的总体效应依然保持正向显著。这证实了负面偏见在不同内容领域具有普遍性，但在政治经济新闻中尤为突出。
5. 离散情绪词汇的影响（次要分析结果）： * 悲伤（低唤醒负面情绪） 词汇显著增加点击率。 * 喜悦（正面情绪） 词汇显著降低点击率。 * 恐惧（高唤醒负面情绪） 词汇显著降低点击率，这与假设相反。 * 愤怒（高唤醒负面情绪） 词汇对点击率的影响在统计上不显著，等效性检验结果不确定。 * 这一发现与以往关注“分享”行为的研究不同（那些研究发现愤怒和恐惧能促进分享），提示新闻消费（私人点击）与新闻分享（公共行为）的驱动因素可能存在差异。分享行为可能更多受到社会动机（如身份信号、声誉管理）驱动，而消费行为更直接地反映了个人注意力的内在偏好。
五、 研究结论与价值
本研究通过分析超大规模实地随机对照试验数据，为“负面偏见”驱动在线新闻消费提供了强有力的因果证据。核心结论是：在真实网络环境中，新闻标题中的负面语言会因果性地增加用户点击阅读的可能性，而正面语言则会降低这种可能性。即使在一个以“正面新闻”自居的媒体平台上，这一效应依然存在。
科学价值： 1. 因果推断突破： 研究超越了以往的相关性分析，利用平台自身的A/B测试架构，在生态效度极高的环境中确立了负面语言与点击行为之间的因果关系。 2. 区分消费与分享： 研究揭示了驱动新闻“消费”（点击）和“分享”的情绪因素可能不同，强调了区分这两种在线行为的重要性。悲伤促进点击但愤怒不显著，这与愤怒驱动分享的已知结论形成对比，为理解线上行为动机提供了更细致的视角。 3. 量化效应规模： 研究精确量化了负面/正面词汇对点击率的影响程度（每词约2.3%/-1.0%），为理论提供了实证校准。 4. 理论深化： 支持并扩展了负面偏见理论在数字媒体环境下的适用性，并揭示了该效应在不同新闻主题中的变化模式。
应用与社会价值： 1. 理解媒体生态： 解释了为何“标题党”和负面新闻在网络环境中盛行——因为它们有效捕获了用户基于认知偏好的注意力。 2. 平台与内容设计： 为新闻编辑、内容创作者和算法平台提供了关于语言如何影响受众参与度的实证洞察。 3. 数字素养与媒体伦理： 研究结果警示公众和监管者，基于负面偏见的注意力经济可能无意中加剧了政治极化、社会分歧以及对负面信息的过度暴露。理解这一机制是培养批判性媒体消费、设计更透明健康的新闻实践的第一步。
六、 研究亮点
数据与方法论的创新性： 创造性利用Upworthy网站遗留的海量A/B测试数据，将平台的产品优化实验转化为严谨的社会科学因果推断研究，实现了大规模、高生态效度的田野实验分析。
研究设计的严谨性： 采用预注册的注册报告形式，增强了研究的透明度和结果的可信度。运用多层级模型控制故事层面变异，精准识别语言效应的净影响。进行了极其全面和多样的稳健性检验，结论坚实。
发现的重要性与微妙性： 不仅验证了负面偏见的主效应，还发现了情绪作用的复杂性（如悲伤vs.愤怒/恐惧的不同效果），提出了新闻消费与分享行为动机可能存在差异的关键见解，推动了该领域更精细化的理论发展。
跨学科融合： 娴熟地融合了计算机科学（文本挖掘、大数据处理）、统计学（多层建模）与心理学（负面偏见理论）、传播学（媒体效果研究），是计算社会科学的典范研究。
七、 其他有价值内容
研究还发现，标题的“平台年龄”效应为负，这可能反映了网络用户对特定编辑策略（如“点击诱饵”）产生“审美疲劳”或适应性，暗示吸引注意力的策略需要不断创新或演变。此外，对道德化语言的分析表明，虽然道德词汇本身可能降低点击率，但它能与情感词汇产生交互作用，这为理解道德情绪在传播中的复杂角色提供了线索。研究团队公开了数据和代码，促进了研究的可重复性和后续探索。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问