这篇文档属于类型a(单篇原创研究论文),以下是针对该研究的学术报告:
作者及机构:Emma Putland(兰卡斯特大学语言学与英语语言系)、Chris Chikodzore-Paterson(独立学者)、Gavin Brookes(兰卡斯特大学语言学与英语语言系)。
发表信息:2025年发表于期刊 *Social Semiotics*(第35卷第2期,228-253页),DOI: 10.1080⁄10350330.2023.2290555。
研究领域:本研究横跨社会符号学(social semiotics)、批判性话语分析(Critical Discourse Analysis, CDA)与人工智能伦理,聚焦AI生成图像如何再现社会对痴呆症(dementia)的意识形态。
研究动机:
1. 社会需求:痴呆症患者常因“悲剧叙事”(如“丧失自我”“活着的死亡”)被污名化,而视觉表征(如医疗图像、宣传海报)可能强化此类偏见。
2. 技术空白:AI文本-图像生成技术(如Stable Diffusion)的普及使其成为新兴社会文本,但其潜在的意识形态影响尚未被批判性研究。
3. 方法论创新:首次将多模态批判性话语分析(Multimodal CDA)应用于AI生成图像,填补话语分析领域的空白。
理论基础:
- 痴呆症话语:主流“悲剧叙事”与新兴“积极生活叙事”的对抗(McParland et al., 2017)。
- 视觉符号学:图像通过参与者(participants)、凝视(gaze)、色彩等符号资源构建意义(Kress & van Leeuwen, 2020)。
- AI伦理:训练数据的偏见可能导致生成内容强化社会刻板印象(Bianchi et al., 2023)。
研究目标:分析AI生成痴呆症图像的视觉话语,揭示其如何(再)生产社会偏见,并探讨技术设计的伦理改进方向。
1. 数据生成
- 工具:使用Stable Diffusion 1.4(开源文本-图像模型),基于提示词“dementia”生成171张图像。
- 参数控制:
- 采样步骤:20步(平衡生成质量与计算效率)。
- 图像尺寸:三种格式(512×512方形、512×704横版/竖版)。
- 随机种子:确保样本多样性。
- 元数据保存:记录生成参数(如种子值、提示词)以支持可重复性。
2. 多模态批判性话语分析
- 分析框架:结合Barthes的外延/内涵(denotation/connotation)理论与Kress & van Leeuwen的视觉语法,分两阶段:
- 外延层:描述图像组成(参与者、场景、凝视、色彩等)。
- 内涵层:解读视觉话语及其社会意识形态。
- 对比基线:与已有痴呆症视觉研究(如Harvey & Brookes, 2019)对比,定位AI图像的独特性。
3. 伦理与偏见分析
- 训练数据溯源:通过LAION-5B数据集检索“dementia”相关图像,验证模型偏见的来源。
1. 视觉话语的再现与强化
- 生物医学主导:23%的图像以大脑扫描或神经元结构为核心(图7),将痴呆症简化为“病变的脑”,忽视患者主体性。
- *例*:图7(d)模仿医学影像,但未标注色彩含义,依赖观众基于“脑科学权威”的预设解读。
- 丧失叙事:
- 隐喻使用:9张图像以“枯树”象征脑细胞/记忆流失(图9),呼应“痴呆即冬季”的死亡隐喻(Lakoff & Turner, 2009)。
- 色彩符号:78%的图像采用冷色调(蓝/灰),降低模态(modality),暗示“非现实”与生命力的缺失。
- 社会疏离:
- 凝视策略:85%的个体参与者避免直视观众(图5),构建“被观察的客体”而非互动主体。
- 去语境化:空白背景剥离社会关系,强化“孤独患者”刻板印象。
2. 多样性的缺失
- 人口学偏见:所有人物均为浅肤色、高龄(70+岁),无视早发性痴呆(占病例9%)及种族多样性(WHO, 2023)。
- 性别化呈现:互动场景中,仅异性恋伴侣被赋予“积极活动”形象(图11c),反映“成功老龄化”的异性恋中心主义(Sandberg, 2015)。
3. 反例与可能性
- 异常图像:少数图像突破主流叙事,如:
- 图12(a):微笑男性举牌“Dementia”,通过直视观众要求平等对话。
- 图12©:动态色彩漩涡暗示痴呆体验的多元性,挑战单一“衰退”叙事。
理论意义:
- 证明AI图像并非“中立”,而是社会话语的 dialectical(辩证)产物:既反映训练数据的偏见,又可能通过传播强化原有意识形态。
- 提出多模态批判性话语分析可作为AI伦理研究的新工具。
实践价值:
- 技术改进:呼吁开发更多元、包容的训练数据集(如纳入痴呆患者自述图像)。
- 公众传播:警示媒体与机构审慎使用AI生成图像,避免加剧污名化。
政策建议:
- 要求AI开发者公开数据来源及偏见检测流程(如Stability AI的透明度实践)。
- 推动跨学科合作(如临床医学+符号学)优化视觉表征伦理。
局限与展望:
- 未测试其他AI模型(如DALL·E)的跨平台一致性。
- 未来可结合受众研究,量化不同视觉话语的社会心理影响。
(报告字数:约2000字)