分享自:

数字风暴中的声音:用ChatGPT解析在线极化现象

期刊:Technology in SocietyDOI:10.1016/j.techsoc.2024.102534

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


《数字风暴中的声音:用ChatGPT解构在线极化现象》学术报告

一、作者与发表信息
本研究由Yunfei Xing(吉林大学)、Justin Zuopeng Zhang(北佛罗里达大学)、Guangqing Teng(东北师范大学)、Xiaotang Zhou(长春工业大学)合作完成,发表于2024年3月的期刊《Technology in Society》(Volume 77, 102534)。研究聚焦社交媒体中ChatGPT引发的观点极化现象,结合自然语言处理(NLP)与深度学习技术,提出了基于确认偏误理论(confirmation bias theory)的分析框架。

二、学术背景
1. 研究领域:社会计算与人工智能交叉领域,涉及NLP、情感分析(sentiment analysis)和话题建模(topic modeling)。
2. 研究动机:ChatGPT的快速普及引发了社交媒体上的激烈争论,用户态度呈现两极分化(polarization)。现有研究多关注技术功能或伦理风险,但缺乏对公众情感与话题演化的系统性分析,尤其忽视确认偏误在极化形成中的作用。
3. 理论基础
- 确认偏误理论:用户倾向于选择支持自身观点的信息,加剧群体对立。
- BERT模型:利用预训练语言模型(bidirectional encoder representations from transformers)捕捉文本深层语义。

三、研究方法与流程
研究分为四个核心步骤:

  1. 数据采集与预处理

    • 数据来源:通过Twitter API抓取2022年12月至2023年1月包含关键词“ChatGPT”的推文,原始数据771,320条,清洗后保留698,038条英文推文。
    • 预处理:使用Python库tweet-preprocessor去除URL、标点、表情符号等噪声,保留纯文本内容。
  2. 情感分类模型(BERTsentiment)开发

    • 任务定义:对推文进行方面级情感分类(aspect-level sentiment classification, ALSC),判定目标方面词(如“ChatGPT的伦理问题”)的情感极性(正面/中性/负面)。
    • 创新方法
      • SenticNet知识图谱:引入外部情感词典,构建依赖树权重矩阵,量化词语间情感关联。
      • 图卷积网络(GCN):融合句法依赖与情感权重,增强上下文表征。
      • 多头注意力机制(MHA):捕捉方面词间的交互依赖。
    • 模型训练:基于BERT-base英语模型微调,隐藏层维度768,GCN层数2,使用Adamax优化器,L2正则化系数λ=1e-5。
  3. 话题识别模型(BERTopic)构建

    • 流程
      1. 文档嵌入:采用Sentence-BERT生成推文向量。
      2. 降维与聚类:通过UMAP降维至2D空间,HDBSCAN算法聚类相似文档。
      3. 话题表征:改进TF-IDF算法(C-TF-IDF),计算词频-逆类别频率,提取每类关键词。
    • 输出:识别90个话题,由专家标注主题(如“AI与机器人功能”“响应质量”)。
  4. 社会网络分析

    • 网络构建:将情感极性与话题节点关联,边权重反映评论数量,可视化群体极化动态。

四、主要结果
1. 情感分布
- 中性情感占比49.02%(337,283条),正面41.66%(286,651条),负面仅9.32%(64,104条)。
- 负面评论集中于伦理担忧(如“数据隐私”“误导性回答”),但整体以技术乐观为主。

  1. 话题热点

    • 高频话题包括AI功能(18,874条)、响应质量(16,746条)、企业应用(15,534条)等。
    • 话题#16(改进模型)与#64(任务优化)相似度最高,反映技术迭代需求。
  2. 极化网络分析

    • 中性情感多关联技术性话题(如#36、#42),正面情感集中于应用场景(如#4、#17)。
    • 确认偏验证实:用户倾向于在同类话题中强化既有情感,形成“信息茧房”。

五、结论与价值
1. 理论贡献
- 提出首个融合确认偏误的极化分析框架,揭示“个体意识形态→确认偏误→观点极化”的传导机制。
- 开发BERTsentiment与BERTopic模型,在情感分类(F1=77.42)和话题一致性上超越传统方法。

  1. 实践意义
    • 技术开发:为AI设计者提供公众反馈的量化依据,优化ChatGPT的透明性与公平性。
    • 政策制定:建议社交媒体平台引入“异质信息推荐”机制,打破极化循环。

六、研究亮点
1. 方法创新:首次将GCN与SenticNet结合,提升方面级情感分析的语境感知能力。
2. 跨学科视角:整合社会心理学(确认偏误)与计算机科学(深度学习),为社交媒体研究提供新范式。
3. 数据规模:近70万条推文分析,是目前ChatGPT舆论研究的最大样本之一。

七、其他发现
- 伦理争议:10%负面评论指向AI的潜在滥用,但未形成主流舆论,反映公众对新兴技术的包容性。
- 技术局限性:HDBSCAN对多话题文档处理不足,未来需改进聚类算法。


此报告全面覆盖了研究的背景、方法、结果与价值,可作为学术界理解ChatGPT社会影响的重要参考文献。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com