学术研究报告:平台差异与价值偏向——国内外大模型中新闻工作者形象的叙事倾向比较分析
作者与发表信息
本研究由北京师范大学新闻传播学院的燕东祺(博士研究生)、张洪忠(教授、博士生导师、新媒体传播研究中心主任)和林润(硕士研究生)合作完成,发表于《新媒体与社会》(*New Media and Society*)期刊,网络首发时间为2025年8月20日。研究得到国家社会科学基金重大专项(23ZDA094)和北京市宣传文化高层次人才培养项目的支持。
学术背景
随着生成式人工智能(AIGC, Artificial Intelligence Generated Content)技术的广泛应用,大语言模型(LLM, Large Language Model)在群体形象建构中的作用日益凸显。新闻工作者的职业形象作为社会认知的重要载体,其AI生成结果可能隐含文化偏见与技术伦理问题。现有研究表明,AI生成内容常复现训练数据中的性别、种族等刻板印象(如Sun等2024年发现DALL-E2生成的女性职业形象更倾向微笑低头姿态),但跨文化语境下的系统性比较研究仍不足。本研究以视觉社会符号学(Visual Social Semiotics)与技术现象学(Technological Phenomenology)为理论框架,旨在揭示中外大模型生成新闻工作者形象的差异及其背后的文化编码逻辑。
研究流程与方法
1. 数据采集
- 研究对象:选取四个代表性大模型平台——国外模型MidJourney和GPT-4o,国内模型文心一言(4.0 Turbo)和智谱清言。
- 生成策略:每个平台设置8个独立账户,分别输入“新闻工作者形象”和“中国新闻工作者形象”提示词(英文平台对应英文指令),每账户生成4轮图像,共128组数据。
- 交互追问:对对话式模型(如GPT-4o、文心一言)进一步追问图像的国别、性别、职务等特征,以获取模型对生成内容的自我解释。
主要结果
1. 结构性偏见
- 职务单一化:59.9%的图像聚焦现场报道记者,新闻编辑、事实核查员等幕后角色占比不足3%(见表5)。
- 性别与种族偏向:国外模型生成的白人形象占100%,国内模型亚洲外貌占比53.1%;男性形象整体占比66.7%,但国外模型生成中国新闻工作者时女性比例达70.3%。
视觉叙事差异
跨文化再现问题
结论与价值
本研究揭示了生成式AI作为“文化再现代理者”的技术政治性:
- 理论意义:拓展了视觉社会符号学在AI图像分析中的应用,证实模型输出受训练语料文化语境深度制约。例如,国外模型的“个体英雄”叙事与西方新闻业的“第四权力”话语相关,而国内模型的制度化倾向反映中国媒体体制特征。
- 实践价值:为AI伦理治理提供实证依据,建议通过语料多样性优化(如增加少数族裔、非前线职务数据)和生成透明度提升(如标注符号来源)减少偏见。
研究亮点
1. 跨文化比较框架:首次系统对比中西方大模型在新闻职业形象生成中的差异,揭示文化预设对技术输出的隐性影响。
2. 方法论创新:融合量化统计(如Wilcoxon检验)与质性符号学分析,建立AI图像偏见的多维度评估模型。
3. 批判性发现:指出国外模型对中国形象的“他者化”构图可能强化文化权力不对称,为国际传播中的算法偏见研究提供新案例。
其他有价值内容
研究还发现,国外模型生成中国新闻工作者时,女性形象常被赋予“亲和型专业人士”特质(微笑、温和气质),而男性形象则更突出权威感,这一性别差异化策略值得后续研究关注。此外,国内模型对民族服饰(4.6%)等文化符号的低频调用,反映了技术对本土文化深层元素的忽视。