分享自:

标记人工智能生成内容对社交媒体用户认知与情感影响的纵向研究

期刊:International Journal of Human–Computer InteractionDOI:10.1080/10447318.2026.2618553

该研究由北京师范大学新闻传播学院的Fan LiYa YangGuoming Yu以及电子科技大学公共管理学院的Yuhan Liu共同完成,并于2026年1月30日在线发表于学术期刊《International Journal of Human–Computer Interaction》。

学术背景

本研究隶属于人机交互、传播学与社会心理学交叉领域。随着生成式人工智能技术的飞速发展,人工智能生成内容在社交媒体上变得日益普遍。为了应对AIGC可能带来的虚假信息传播和信任危机,许多社交平台(如中国的抖音、知乎、小红书)开始推行“AI生成”标签政策,旨在通过增加算法透明度来校准用户信任,引导分享行为。这类标签本质上是一种“助推”(nudge)干预——通过微小的环境线索设计,在不禁止任何选项的前提下,引导人们做出更理性的决策。

尽管已有初步研究表明AIGC标签在短期能影响用户对内容的认知判断,但现有研究存在明显空白。首先,大多数研究关注标签的即时效应,对其效果的持续性(即标签在重复曝光后效果是保持、增强还是衰减)缺乏探讨。其次,理论框架整合不足,尤其缺乏将标签同时置于认知路径(如对准确性和可信度的判断)和情感路径(如引发的情绪反应)下进行统一考察的研究。第三,个体差异(如自我控制能力)如何调节标签效果的研究尚不充分。

基于此,本研究旨在填补这些空白。研究将AIGC标签理论化为一种来源披露选择架构工具,它通过两条关联路径发挥作用:一是认知路径,标签通过凸显内容来源(AI生成),激活用户对信息来源和内容真实性的反思性处理,进而影响感知准确性、信息可信度和分享意愿;二是情感路径,标签可能引发用户对内容风险和不确定性的评估,从而产生“情感税”(emotional tax),即负面的情绪成本,这种情绪变化也可能间接影响行为意图。本研究的目标是:1)检验AIGC标签效果在短期(18天)内的持续性;2)探究自我控制特质在认知和情感路径中的调节作用;3)揭示标签可能带来的情绪副作用。

详细工作流程

本研究采用了一项精心设计的两波次纵向在线实验

第一波次(Wave 1): * 参与对象与流程:于2024年4月通过Credamo数据平台招募了400名符合条件的中国成年参与者。实验采用2(信息真实性:真实 vs. 虚假)x 2(内容类别:营利性广告 vs. 非营利性新闻)的组内设计。每位参与者会随机看到四篇带有统一格式“⚠ AI生成内容”标签的社交媒体帖子,内容主题均为健康信息(以控制主题差异)。例如,真实非营利内容可能来自央视健康新闻改编,虚假营利内容则由ChatGPT生成。每看完一篇材料,参与者立即通过7点李克特量表评估其感知准确性(单题项)、信息可信度(3题项量表)和分享意愿(单题项)。实验最后收集了人口统计学信息。所有量表均基于成熟量表改编,并展示了良好的信度(如信息可信度量表的Cronbach‘s α = 0.940)。

第二波次(Wave 2): * 参与对象与流程:18天后(2024年5月),对第一波参与者进行追踪。共有267人参与,经数据清洗后,最终获得256人的配对面板数据用于分析。流失分析表明样本在人口统计学和基线结果上无显著差异,保证了样本的稳定性。 * 新增测量:第二波次在重复第一波的认知测量(感知准确性、信息可信度、分享意愿)之外,引入了两个关键新测量: 1. 情绪反应:使用“感觉量表”(Feeling Scale)在三个时间点测量参与者的情绪状态:① 接触实验材料前(基线);② 阅读完带标签的真实内容后;③ 阅读完带标签的虚假内容后。该量表通过面部表情变化测量从“非常差”到“非常好”的情绪连续体。 2. 特质自我控制:使用改编版的简要自我控制量表(Brief Self-Control Scale, BSCS),包含8个题项,测量参与者的自我控制能力(Cronbach‘s α = 0.848)。根据得分,参与者被分为高、低自我控制组进行分析。 * 实验流程:第二波次的流程与第一波类似,但在展示刺激材料前后嵌入了情绪测量点,并在实验最后测量了自我控制特质。

数据分析方法: 研究采用了多种统计方法分析面板数据:1)使用配对样本t检验比较两波次间三个核心认知/行为变量(感知准确性、信息可信度、分享意愿)的均值变化,以检验效果的持续性。2)使用线性回归分析,检验第一波次的测量结果能否预测第二波次的相应结果,以考察认知和意图的跨时间稳定性。3)使用方差分析(ANOVA)检验信息真实性、内容类别和自我控制水平对结果变量的主效应及交互作用。4)通过回归分析探究自我控制对情绪变化的调节作用。所有分析均使用SPSS 29进行。

主要结果

  1. 标签效果的持续性(假设H1):配对样本t检验结果显示,从第一波到第二波,参与者的感知准确性、信息可信度和分享意愿均未发生显著的均值变化。这表明,在本研究设定的18天时间窗口内,AIGC标签的认知和行为效应既未增强也未衰减,呈现出一种稳定或已衰减至平台期的状态。这初步支持了H1,即AIGC标签的持续使用未导致用户感知或行为的显著变化。

  2. 跨波次的预测关系(假设H2):线性回归分析揭示了认知和意图在不同信息类型下的跨时间关联模式。

    • 对于真实信息:第一波次的分享意愿能显著正向预测第二波次的分享意愿(解释力R² = 0.328),这表明分享意图表现出较强的跨时间稳定性。然而,感知准确性和信息可信度的跨波预测模型解释力相对有限。
    • 对于虚假信息:第一波次的信息可信度和分享意愿均能正向预测第二波次的相应变量(R²分别为0.219和0.324)。这意味着,对于虚假内容,用户初始形成的可信度判断和分享倾向,会在一定程度上延续到后续的接触中。
  3. 自我控制的调节作用(假设H3-H5):方差分析结果显示,自我控制与信息真实性存在显著的交互作用,但效应量很小

    • 对真实信息:自我控制水平高的用户,对带标签的真实内容报告了显著更高的感知准确性、信息可信度和分享意愿。这支持了H3和H5,表明高自控力用户更能从标签中提取有用信息,对真实的AIGC内容持更开放和信任的态度。
    • 对虚假信息:无论自我控制水平高低,用户对虚假内容的评价和分享意愿均无显著差异。这部分支持了H3,但表明自控力在抵御虚假信息方面作用有限。同时,自我控制与内容类别(营利vs.非营利)的交互作用不显著,因此H4未被支持。
  4. 标签的“情感税”及自我控制的缓冲作用(假设H6-H7):情绪测量结果带来了关键发现。

    • 情感税的存在:与基线情绪相比,参与者在阅读带标签的真实内容后,情绪出现了微小但显著的下滑,尽管整体情绪仍处于积极区间。阅读虚假内容后情绪也有下降。这证实了H6,即AIGC标签的介入确实带来了轻微的情绪成本,可能源于持续性的警觉和验证负担。
    • 自我控制的缓冲:调节模型分析发现,自我控制水平显著缓冲了这种情绪下滑。高自控力用户在接触标签内容后,情绪的正向程度下降得更少。这支持了H7,表明自我控制作为一种情绪调节资源,能够帮助用户管理标签引发的轻微负面情绪。然而,这种缓冲作用的系数值较小,表明其效果是有限的。

结论与价值

本研究得出以下核心结论: 1. 短期稳定性:在为期18天的短时间框架内,标准化的AIGC标签作为一种轻量级的透明度工具,其对于用户认知(感知准确性、可信度)和行为意图(分享意愿)的影响是稳定的,未出现显著的增强或衰减。这为平台持续部署此类标签提供了初步的实证支持。 2. 不对称的个体差异影响:自我控制特质主要调节用户对真实AIGC内容的反应,而对虚假内容的判断影响甚微。高自控用户更能从标签中受益,对真实AI内容给予更积极的评价。 3. 情感路径的独立性:AIGC标签会引发独立的“情感税”效应,即轻微的负面情绪变化,这与认知判断的变化是分离的。高自我控制能力可以部分缓解这种情绪成本。 4. 理论与实践启示:研究表明,AIGC标签的治理效果具有复杂性和情境依赖性。研究建议平台采取分层、情境化的标签设计(如根据内容风险等级调整标签显著度)、将标签与即时分享提示等干预措施结合使用,并关注设计的情感可持续性,以避免用户疲劳。从政策层面,研究支持建立最低限度的标签分类标准,并鼓励采用可互操作的内容来源元数据标准。

研究亮点

  1. 方法创新——纵向面板设计:本研究率先采用两波次纵向实验设计探究AIGC标签的持续性效应,克服了横截面研究只能捕捉即时效果的局限,为理解助推干预的时效性提供了更严谨的证据。
  2. 理论整合——双路径框架:研究创新性地将AIGC标签效应置于整合的理论框架下,同时考察了认知路径(来源可信度、准确性判断)和情感路径(情绪税),并引入自我控制作为关键调节变量,深化了对标签作用机制的理解。
  3. 重要发现——情感税的揭示:研究首次通过实证数据量化了AIGC标签可能带来的情绪副作用,并验证了自我控制的缓冲作用。这一发现提醒平台设计者和政策制定者,在追求信息透明和信任校准时,也需考量用户体验的情感维度,避免治理手段带来不必要的心理负担。
  4. 情境化与生态效度:研究基于中国社交媒体平台的真实实践设计标签,并选用与公众利益密切相关的健康信息作为实验材料,增强了研究发现的现实意义和生态效度,为区域性的数字内容治理提供了直接参考。

其他有价值的内容

研究团队在讨论部分还指出了本研究的局限性与未来方向,包括:18天的间隔对于考察“长期”效果仍较短;样本在教育程度上可能存在偏差;实验情境与真实、动态的社交媒体环境存在差距;标签设计(单一形式)和内容领域(仅健康信息)的局限性等。这些为后续研究指明了方向,例如开展更长周期、多领域、多标签设计对比的实地实验,并结合行为追踪数据(如实际分享、停留时间)进行更全面的验证。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com