该研究由北京师范大学新闻传播学院的Fan Li、Ya Yang、Guoming Yu以及电子科技大学公共管理学院的Yuhan Liu共同完成,并于2026年1月30日在线发表于学术期刊《International Journal of Human–Computer Interaction》。
学术背景
本研究隶属于人机交互、传播学与社会心理学交叉领域。随着生成式人工智能技术的飞速发展,人工智能生成内容在社交媒体上变得日益普遍。为了应对AIGC可能带来的虚假信息传播和信任危机,许多社交平台(如中国的抖音、知乎、小红书)开始推行“AI生成”标签政策,旨在通过增加算法透明度来校准用户信任,引导分享行为。这类标签本质上是一种“助推”(nudge)干预——通过微小的环境线索设计,在不禁止任何选项的前提下,引导人们做出更理性的决策。
尽管已有初步研究表明AIGC标签在短期能影响用户对内容的认知判断,但现有研究存在明显空白。首先,大多数研究关注标签的即时效应,对其效果的持续性(即标签在重复曝光后效果是保持、增强还是衰减)缺乏探讨。其次,理论框架整合不足,尤其缺乏将标签同时置于认知路径(如对准确性和可信度的判断)和情感路径(如引发的情绪反应)下进行统一考察的研究。第三,个体差异(如自我控制能力)如何调节标签效果的研究尚不充分。
基于此,本研究旨在填补这些空白。研究将AIGC标签理论化为一种来源披露和选择架构工具,它通过两条关联路径发挥作用:一是认知路径,标签通过凸显内容来源(AI生成),激活用户对信息来源和内容真实性的反思性处理,进而影响感知准确性、信息可信度和分享意愿;二是情感路径,标签可能引发用户对内容风险和不确定性的评估,从而产生“情感税”(emotional tax),即负面的情绪成本,这种情绪变化也可能间接影响行为意图。本研究的目标是:1)检验AIGC标签效果在短期(18天)内的持续性;2)探究自我控制特质在认知和情感路径中的调节作用;3)揭示标签可能带来的情绪副作用。
详细工作流程
本研究采用了一项精心设计的两波次纵向在线实验。
第一波次(Wave 1): * 参与对象与流程:于2024年4月通过Credamo数据平台招募了400名符合条件的中国成年参与者。实验采用2(信息真实性:真实 vs. 虚假)x 2(内容类别:营利性广告 vs. 非营利性新闻)的组内设计。每位参与者会随机看到四篇带有统一格式“⚠ AI生成内容”标签的社交媒体帖子,内容主题均为健康信息(以控制主题差异)。例如,真实非营利内容可能来自央视健康新闻改编,虚假营利内容则由ChatGPT生成。每看完一篇材料,参与者立即通过7点李克特量表评估其感知准确性(单题项)、信息可信度(3题项量表)和分享意愿(单题项)。实验最后收集了人口统计学信息。所有量表均基于成熟量表改编,并展示了良好的信度(如信息可信度量表的Cronbach‘s α = 0.940)。
第二波次(Wave 2): * 参与对象与流程:18天后(2024年5月),对第一波参与者进行追踪。共有267人参与,经数据清洗后,最终获得256人的配对面板数据用于分析。流失分析表明样本在人口统计学和基线结果上无显著差异,保证了样本的稳定性。 * 新增测量:第二波次在重复第一波的认知测量(感知准确性、信息可信度、分享意愿)之外,引入了两个关键新测量: 1. 情绪反应:使用“感觉量表”(Feeling Scale)在三个时间点测量参与者的情绪状态:① 接触实验材料前(基线);② 阅读完带标签的真实内容后;③ 阅读完带标签的虚假内容后。该量表通过面部表情变化测量从“非常差”到“非常好”的情绪连续体。 2. 特质自我控制:使用改编版的简要自我控制量表(Brief Self-Control Scale, BSCS),包含8个题项,测量参与者的自我控制能力(Cronbach‘s α = 0.848)。根据得分,参与者被分为高、低自我控制组进行分析。 * 实验流程:第二波次的流程与第一波类似,但在展示刺激材料前后嵌入了情绪测量点,并在实验最后测量了自我控制特质。
数据分析方法: 研究采用了多种统计方法分析面板数据:1)使用配对样本t检验比较两波次间三个核心认知/行为变量(感知准确性、信息可信度、分享意愿)的均值变化,以检验效果的持续性。2)使用线性回归分析,检验第一波次的测量结果能否预测第二波次的相应结果,以考察认知和意图的跨时间稳定性。3)使用方差分析(ANOVA)检验信息真实性、内容类别和自我控制水平对结果变量的主效应及交互作用。4)通过回归分析探究自我控制对情绪变化的调节作用。所有分析均使用SPSS 29进行。
主要结果
标签效果的持续性(假设H1):配对样本t检验结果显示,从第一波到第二波,参与者的感知准确性、信息可信度和分享意愿均未发生显著的均值变化。这表明,在本研究设定的18天时间窗口内,AIGC标签的认知和行为效应既未增强也未衰减,呈现出一种稳定或已衰减至平台期的状态。这初步支持了H1,即AIGC标签的持续使用未导致用户感知或行为的显著变化。
跨波次的预测关系(假设H2):线性回归分析揭示了认知和意图在不同信息类型下的跨时间关联模式。
自我控制的调节作用(假设H3-H5):方差分析结果显示,自我控制与信息真实性存在显著的交互作用,但效应量很小。
标签的“情感税”及自我控制的缓冲作用(假设H6-H7):情绪测量结果带来了关键发现。
结论与价值
本研究得出以下核心结论: 1. 短期稳定性:在为期18天的短时间框架内,标准化的AIGC标签作为一种轻量级的透明度工具,其对于用户认知(感知准确性、可信度)和行为意图(分享意愿)的影响是稳定的,未出现显著的增强或衰减。这为平台持续部署此类标签提供了初步的实证支持。 2. 不对称的个体差异影响:自我控制特质主要调节用户对真实AIGC内容的反应,而对虚假内容的判断影响甚微。高自控用户更能从标签中受益,对真实AI内容给予更积极的评价。 3. 情感路径的独立性:AIGC标签会引发独立的“情感税”效应,即轻微的负面情绪变化,这与认知判断的变化是分离的。高自我控制能力可以部分缓解这种情绪成本。 4. 理论与实践启示:研究表明,AIGC标签的治理效果具有复杂性和情境依赖性。研究建议平台采取分层、情境化的标签设计(如根据内容风险等级调整标签显著度)、将标签与即时分享提示等干预措施结合使用,并关注设计的情感可持续性,以避免用户疲劳。从政策层面,研究支持建立最低限度的标签分类标准,并鼓励采用可互操作的内容来源元数据标准。
研究亮点
其他有价值的内容
研究团队在讨论部分还指出了本研究的局限性与未来方向,包括:18天的间隔对于考察“长期”效果仍较短;样本在教育程度上可能存在偏差;实验情境与真实、动态的社交媒体环境存在差距;标签设计(单一形式)和内容领域(仅健康信息)的局限性等。这些为后续研究指明了方向,例如开展更长周期、多领域、多标签设计对比的实地实验,并结合行为追踪数据(如实际分享、停留时间)进行更全面的验证。