本研究由伊斯坦布尔大学的Ayşe Aydıngüçe-Dinn与波士顿大学的Catherine L. Caldwell-Harris合作完成,发表于《Bilingualism: Language and Cognition》期刊2009年第12卷第3期。
学术背景 本研究属于心理语言学与双语认知研究的交叉领域,其核心背景在于探讨双语者的情绪与记忆关系中的两个关键现象。第一个现象是,双语者普遍报告其第一语言(L1)在表达或接触情感内容(如禁忌语、个人话题)时,能引发比第二语言(L2)更强烈的情绪反应。第二个现象是,在记忆研究中,情绪词通常比中性词更容易被回忆起来,这被称为“情绪-记忆效应”。将这两个现象结合,一个自然的假设是:双语者在L1中应表现出比L2更强的情绪-记忆效应。然而,此前的研究结果存在矛盾。Anooshian和Hertel(1994)的研究支持了这一假设,发现情绪-记忆效应仅存在于L1中,而在L2中消失。但Aycıçeği和Harris(2004)对土耳其语-英语双语者的研究却得出了相反的结果:在L2(英语)中观察到了更强的情绪-记忆效应,尤其是对于禁忌语和责备语。
为了解释这种矛盾,本研究提出了两个可能的机制进行检验。第一是“语言激活度”假说:Aycıçeği和Harris(2004)的研究对象身处L2(英语)沉浸环境中,L2的高度激活可能增强了其情绪词的记忆效果。第二是“加工深度”假说:在之前的研究中,被试执行的是对词汇进行“情绪强度评分”的任务,这可能无意中导致对L2情绪词进行了更深层次的加工(例如,在心里默默翻译以确定评分),从而提升了记忆,但这种提升并非源于情绪本身,而是源于额外的认知努力。
因此,本研究旨在通过引入“加工水平”框架,系统性地操控研究任务,来厘清上述问题。研究目标明确为:1)在双语者的L1国家(土耳其)进行测试,以排除L2沉浸环境的影响;2)使用多种具有不同加工深度要求的任务,以探究任务类型是否会调节L1和L2中的情绪-记忆效应。
详细研究流程 本研究是一项实验心理学研究,流程清晰,分为参与者招募、实验任务执行和数据分析三个阶段。
1. 参与者: 研究对象为59名(88%为女性)土耳其语-英语双语者,均从伊斯坦布尔大学及周边社区招募。所有参与者均以土耳其语为母语和优势语言,并在中学阶段(约12-13岁)开始系统学习英语。他们自评英语能力为“良好”或“非常好”。为客观评估语言能力,研究者还进行了词语流畅性任务(FAS任务),结果显示参与者在土耳其语(L1)中生成的词语数量显著多于英语(L2),证实了其L1的优势地位。参与者被随机分配到以下四个实验任务组之一:情绪强度评分组(15人)、字母计数组(16人)、翻译组(14人)和词语联想组(14人)。通过随机分配,确保了各组在人口统计学和语言能力指标上基本等同。
2. 实验材料: 实验刺激材料与Aycıçeği和Harris(2004)的研究相同,包括五类词语/短语:禁忌词(9个,如“asshole”)、责备语(7个,如“Shame on you!”)、积极词(16个,如“love”)、消极词(16个,如“war”)和中性词(16个,如“window”)。为确保文化对等,土耳其语和英语的刺激材料在情感内涵和使用频率上相匹配,但并非所有责备语和禁忌词都有完全直译的对应词。所有刺激材料以随机混合顺序在电脑屏幕上呈现。
3. 实验程序与任务(核心操控): 每位参与者单独接受测试,所有指导语均使用土耳其语。实验分为学习(编码)阶段和意外回忆阶段。在学习阶段,参与者根据其所在组别,对屏幕上呈现的词语执行指定的任务,他们并不知道随后会有记忆测试。四个任务旨在引发不同层次的加工: - 情绪强度评分任务(深加工): 参与者使用1-7分制对每个词语的情绪强度进行评分。此任务是之前研究使用的基线任务。 - 字母计数任务(浅加工): 参与者数出每个词语中包含封闭圆圈(如字母o, a, b, d, g, p, q)的字母数量。此任务旨在引导参与者关注词汇的视觉特征而非语义,从而最小化对词汇意义的自动加工。 - 翻译任务(深加工): 参与者需将屏幕上出现的词语(若为土耳其语则译成英语,若为英语则译成土耳其语)口头报告给实验者。此任务强制进行语义加工,且据双语研究,从L2译到L1通常比反向翻译更容易。 - 词语联想任务(深加工): 参与者在10秒内,尽可能多地说出与所呈现词语相关的联想词,且需使用与呈现词语相同的语言。此任务也涉及深层的语义网络激活。
学习阶段结束后,立即进行一个持续10分钟的意外自由回忆测试。参与者被要求尽可能多地写下他们记住的词语,并且必须用词语最初呈现的语言书写。只有用目标语言正确回忆出的词语才被计分。
4. 数据分析方法: 主要因变量是每类词语的正确回忆百分比。研究者首先进行了全面的方差分析,考察语言(土耳其语vs.英语)、词语类别和任务类型对回忆成绩的影响。由于发现责备语在英语中的回忆率异常高,且在后续分析中被视为可能反映了“新奇效应”而非纯粹的情绪-记忆效应,因此在一些关键分析中,研究者将责备语类别排除,专注于分析禁忌词、积极词、消极词与中性词的对比。此外,还分析了用非呈现语言回忆出的“翻译对等词”错误率,以探查编码的深度和特异性。
主要研究结果 研究结果揭示了复杂的模式,表明情绪-记忆效应在L1和L2中的表现高度依赖于实验任务。
1. 跨任务的共同发现: 首先,基本的情绪-记忆效应(情绪词回忆优于中性词)在所有任务中均得到验证,但存在一个显著的例外:消极词(如war, kill)在所有任务和两种语言中,其回忆率均未显示出优于中性词的优势。这是一个出乎意料的发现。其次,情绪词的回忆优势遵循一个清晰的等级模式:禁忌词 ≈ 责备语 > 积极词 > 消极词 ≈ 中性词。最后,责备语在英语(L2)中的回忆率在所有四个任务中均显著高于在土耳其语(L1)中。研究者认为这很可能反映了“新奇效应”——对于生活在土耳其的参与者来说,用英语听到责备语显得不同寻常甚至有趣,从而增强了记忆编码。
2. 各任务的具体结果(排除责备语后): - 情绪强度评分任务: 情绪-记忆效应(情绪词回忆率减去中性词回忆率)仅存在于L1(土耳其语)中,而在L2(英语)中不明显。这一结果与“L1更具情绪性”的经典观点一致,但与Aycıçeği和Harris(2004)的早期发现相反,支持了“语言激活环境”的影响——当在L1国家测试时,L1的情绪优势得以显现。 - 字母计数任务(浅加工): 在该任务中,L1和L2表现出相似的情绪-记忆效应模式(禁忌词和积极词的回忆均优于中性词)。这表明,当一个任务不要求关注词义时,两种语言中情绪词的语义和情感内容都得到了同等程度的自动加工。值得注意的是,此任务总体回忆率最低,但情绪词相对于中性词的优势幅度却是所有任务中最大的,这符合浅加工任务的特点:情绪词因其内在显著性能自动吸引注意力,而中性词则因缺乏深度加工而记忆很差。 - 翻译任务(深加工): 出现了与情绪评分任务相反的模式:情绪-记忆效应在L2(英语)中更强。研究者推测,将L1(土耳其语)的禁忌词翻译成L2可能尤其困难(因为L1的禁忌语词汇更丰富),这种额外的加工努力可能反而加深了对L1词的编码,但结果却显示L2情绪词记忆更优。这表明L2完全有能力表现出与L1相当甚至更强的情绪记忆效应,特别是在某些特定任务条件下。 - 词语联想任务(深加工): 该任务中,L1和L2的情绪-记忆效应没有差异。虽然生成L1的词语联想更容易(流畅性任务已证实),但为L2词寻找联想词的认知努力可能同样加深了加工,导致两种语言的记忆效果相似。
3. 关于消极词的发现: 研究者对消极词未表现出记忆优势进行了深入探讨。他们检查词表发现,本实验所用的积极词(如mother, love, home)多为早期习得的基本概念,而消极词(如cruel, disease, poison)的习得年龄普遍较晚。已有研究表明,词汇的习得年龄是影响记忆的重要因素。因此,消极词记忆优势的缺失可能并非源于其情绪效价本身,而是被其较晚的习得年龄所抵消。
4. 错误回忆分析: 在回忆测试中,用非呈现语言写出翻译对等词的情况很少(少于一半的参与者这样做),且主要发生在情绪评分、翻译和词语联想这几个深加工任务中。在浅加工的字母计数任务中,此类错误最少。这证实了浅加工任务成功限制了被试对词义的刻意加工。
研究结论与价值 本研究的主要结论是:对于双语者而言,词汇的情绪属性在提升记忆方面,在第一语言和第二语言中可同等利用,但这一效应的具体表现受到实验任务性质的显著调节。 单纯认为“第一语言总是更具情绪性,因而产生更强的情绪-记忆效应”的观点过于简化。研究发现,当任务要求评估情绪强度时,在L1环境中测试会强化L1的优势;当任务要求进行浅层感知加工时,两种语言的情绪词都能自动吸引注意,产生同等的记忆增强;当任务涉及翻译等复杂语义操作时,L2甚至可能表现出更强的效应。
本研究的科学价值在于:1)方法学贡献:首次在双语情绪记忆研究中系统引入并比较了不同加工水平的任务,揭示了任务特异性效应,为解决先前研究的矛盾提供了关键证据。2)理论推进:挑战了关于双语情绪体验的简单化假设,强调必须结合认知加工的具体语境来理解语言与情绪的关系。情绪-记忆效应并非L1的固有属性,而是语言熟练度、任务要求、测试环境和新奇感等多种因素动态交互的结果。3)应用启示:研究范式(学习任务+意外回忆)简单有效,适用于课堂或学生项目,为未来探索双语记忆模型提供了实用工具。
研究亮点 1. 新颖的实验设计:通过精心设计的四个任务(情绪评分、字母计数、翻译、词语联想),巧妙分离了“情绪性”与“加工深度”对记忆的影响,这是本研究的核心创新点。 2. 重要的发现: - 明确了责备语在L2中的超高回忆率可能主要源于“新奇效应”,这对解释相关研究矛盾至关重要。 - 发现了消极词缺乏记忆优势这一反常现象,并将其与词汇的“习得年龄”这一潜在变量联系起来,为未来研究指明了新方向。 - 证明了在浅加工条件下,L1和L2的情绪-记忆效应无差异,支持了双语者两种语言的词汇意义都能被自动加工的觀點。 3. 严谨的控制:研究在参与者的L1国家(土耳其)进行,有效控制了“语言沉浸环境”这一混淆变量,使结果更清晰地反映了语言与任务本身的交互作用。
其他有价值的内容 附录部分提供了完整的刺激材料列表及其在各任务中的平均回忆百分比,数据详实,具有很高的参考价值。例如,具体数据显示“mother”、“father”等早期习得的积极词回忆率极高,而“shut up”、“I hate you”等英语责备语回忆率突出,直观地支撑了正文关于习得年龄和新奇效应的讨论。这些数据为其他研究者复制实验或进行后续分析提供了便利。