第一语言与第二语言中的情绪激活：一项双语者情绪Stroop任务研究

分享自：
第一语言与第二语言中的情绪激活：一项双语者情绪Stroop任务研究

期刊:cognition and emotionDOI:10.1080/02699930601054109
关于“第一语言与第二语言中的情绪激活”研究的学术报告
本研究由来自英国肯特大学（University of Kent）的Tiina M. Eilola, Jelena Havelka和Dinkar Sharma三位研究者共同完成。其研究成果以论文“Emotional activation in the first and second language”的形式，发表于2007年的学术期刊《Cognition and Emotion》第21卷第5期。
一、 学术背景
本研究隶属于认知心理学与心理语言学交叉领域，核心关注点是双语者的情绪加工机制。长期以来，一个普遍存在于双语者群体中的直觉是：与第二语言（L2）相比，第一语言（母语，L1）的词汇能引发更强的情绪唤起。早期的研究，如Gonzales-Reigosa (1976) 和 Bond & Lai (1986)，似乎支持这一观点，表明L1的禁忌语引发更多焦虑，且用L2讨论尴尬话题更为容易。然而，关于单词语义层面的情绪激活是否在L1和L2之间存在差异，实证证据并不一致。例如，Anooshian & Hertel (1994) 发现L1情绪词比L1中性词回忆更好，而L2情绪词则无此优势；但Ayçiçeği & Harris (2004) 的研究却显示，情绪词在L2中的记忆效果与L1相当甚至更好。Harris等人 (2003, 2006) 的研究进一步指出，L1与L2情绪性差异可能受到刺激呈现方式（听觉vs视觉）、语言材料复杂度（单词vs语篇）以及双语者习得年龄和熟练度的影响。
在此背景下，本研究旨在通过一个精密的实验范式，探究一个核心问题：对于晚期、非平衡但熟练的双语者，其L1和L2在加工单个情绪词汇时，自动化的情绪激活程度是否存在差异？具体而言，研究者采用了情绪斯特鲁普任务（Emotional Stroop Task）及其变体——禁忌语斯特鲁普任务（Taboo Stroop Task）。在该任务中，参与者需要忽略词语的意义，尽快报告其印刷颜色。若某个词语（如负面或禁忌词汇）自动捕获了注意力资源，干扰了颜色命名这一认知过程，就会导致反应时延长，即出现“干扰效应”。这一效应被认为是评估词汇自动情绪激活的有效指标。
因此，本研究的目标明确为：1）检验在L2中是否存在情绪和禁忌语斯特鲁普效应；2）如果存在，比较这些效应在L1和L2中的强度是否相同；3）直接比较负面情绪词和禁忌语词所产生的干扰水平是否存在差异。研究假设基于“L1情绪性更强”的普遍观点，预期L2中的干扰效应可能小于L1。
二、 详细研究流程
本研究采用了一项严谨的实验室行为实验，其工作流程可详细分解如下：
1. 参与者筛选与特征描述： 研究最初招募了41名芬兰语母语者。为确保样本符合“晚期、非平衡但熟练双语者”的研究要求，研究者进行了严格筛选。排除标准包括：对英语刺激词（共80个）的认知少于10个（视为L2熟练度不足），以及开始学习英语的年龄早于7岁（根据Harris等人的标准，属于早期双语者）。最终，共有34名参与者（29名女性，5名男性）的数据被纳入分析，年龄在20至44岁之间。这些参与者在7至13岁之间开始学习英语（平均年龄9.24岁），符合“晚期双语者”定义。通过问卷评估，他们虽以芬兰语为优势语言，但对英语具有熟练的掌握程度（平均认识77.8个实验用英语词），并且在日常生活中频繁接触英语（如每日浏览英文网页、观看英文影视节目等）。这确保了L2是高度熟练的，从而能够有效检验语言本身（而非熟练度差异）对情绪激活的影响。
2. 实验材料设计与准备： 实验采用2（语言：芬兰语、英语）x 4（词汇类型：中性、积极、消极、禁忌）的被试内设计。 * 词汇选择与匹配： 研究者从“英语情感词常模”数据库中选取了中性、积极和消极三组英语词汇，每组20个。这些词汇在词频上进行了组间匹配。禁忌语词汇则由研究者自行选定，以涵盖常见的脏话和性相关词汇。所有英语词汇均由其芬兰语母语者翻译成芬兰语，并确保芬兰语翻译词与对应的英语原词在长度上匹配。此外，通过预实验确认了芬兰语翻译词在不同类别间的词频无显著差异。研究者还核查了英语词汇在多项语言学指标上的可比性。 * 实验程序构建： 实验采用经典的斯特鲁普任务变式。每个词汇会以红、蓝、绿、黄四种颜色各呈现一次。词汇按语言和类型分成8个区块（芬兰语4类 + 英语4类），每个区块包含80次试验。试验顺序随机，但避免连续出现相同词汇或颜色。区块顺序（词汇类型）采用拉丁方设计平衡，语言呈现顺序（先英语还是先芬兰语）也在参与者间进行平衡。
3. 实验实施过程： 实验在电脑上使用E-Prime软件呈现。流程如下： * 前期准备： 参与者首先填写问卷，提供语言背景信息。随后进行两次练习阶段，任务是命名100个无意义的四字母字符串的颜色，以熟悉任务和反应设备（带颜色标签的按键盒）。 * 正式实验： 参与者被明确指示忽略词语含义，尽可能快速准确地报告词语的印刷颜色。每个试次中，词语一直停留在屏幕上直至参与者做出反应，随后经过32毫秒间隔出现下一个刺激。实验开始前，参与者被告知实验中可能出现冒犯性词汇，并且会使用两种语言。 * 后期核查： 实验结束后，参与者收到所有英语词汇列表，并标出不认识或不确定的词汇，以此作为其英语熟练度的客观行为指标之一。
4. 数据分析方法： 主要分析反应时和错误率数据。 * 数据清理： 首先排除错误反应的试次。随后，对反应时数据进行修剪，剔除小于300毫秒和大于3000毫秒的极端值，以确保数据质量。 * 数据分析： 对每个参与者在每种条件（语言x词汇类型）下的反应时数据，计算其中位数（而非平均数，以减少极端值影响）。随后进行2（语言）x 4（词汇类型）的重复测量方差分析。当数据违反球形假设时，使用Greenhouse-Geisser方法校正自由度。同时报告统计检验力（observed power）和效应量（partial eta-squared）。错误率数据也进行类似的方差分析。事后比较采用Bonferroni校正。
三、 主要研究结果
数据分析揭示了明确且有趣的模式：
1. 错误率分析结果： 整体错误率很低（平均3.7%）。方差分析显示，仅词汇类型的主效应显著。事后检验发现，对禁忌语词汇的反应错误率显著高于对中性词汇的反应错误率。而消极词、积极词与中性词之间的错误率无显著差异。语言的主效应以及语言与词汇类型的交互作用均不显著。这表明，任务的难度在禁忌语条件下有所增加，且这种增加在L1和L2中是相似的。更重要的是，错误率与反应时的模式基本一致（禁忌语反应时最长，错误率也最高），排除了速度-准确性权衡的可能性。
2. 反应时分析结果： 这是检验情绪干扰效应的核心数据。 * 语言主效应： 分析发现，对芬兰语词汇和英语词汇的颜色命名反应时没有显著差异。这表明，从整体反应速度来看，参与者处理两种语言词汇的认知负荷是相当的，语言本身并未造成普遍性的加工速度差异。 * 词汇类型主效应： 这是关键发现。词汇类型的主效应极其显著。事后比较显示： * 消极词汇和禁忌语词汇的颜色命名反应时，均显著长于中性词汇。这证实了在这组晚期芬兰语-英语双语者中，无论是L1还是L2，具有威胁性或高唤醒度的词汇都能自动捕获注意，干扰颜色命名任务，即产生了显著的“情绪斯特鲁普效应”和“禁忌语斯特鲁普效应”。 * 积极词汇的反应时与中性词汇无显著差异。这与前人的研究一致，表明干扰效应并非源于所有情绪词，而特指与威胁、厌恶或高唤醒相关的刺激。 * 消极词与禁忌语词之间的反应时差异未达到统计显著性，尽管禁忌语词的反应时数值上最长（比消极词长约9毫秒），且与积极词的差异接近显著水平。这暗示禁忌语可能引发最强的干扰，但在本研究中，负面词和禁忌语词的干扰强度大体相当。 * 语言与词汇类型的交互作用： 这是最核心的发现。 交互作用完全不显著。这意味着，消极词和禁忌语词相对于中性词的干扰效应（即反应时延长的量），在芬兰语（L1）和英语（L2）之间没有差异。具体数据可见：芬兰语中，禁忌语比中性词慢32.2毫秒，英语中慢31.8毫秒；芬兰语中，消极词比中性词慢22.7毫秒，英语中慢23.4毫秒。模式高度一致。
四、 结论与意义
基于以上结果，本研究得出明确结论：对于精通第二语言的晚期双语者而言，第一语言和第二语言在加工单个负面情绪词和禁忌语词时，能够引发同等强度的自动化情绪激活。L2词汇与L1词汇一样，能够有效激活对威胁性刺激的反应机制，从而对并行的认知任务（颜色命名）产生同等程度的干扰。
这一结论具有重要的理论价值： 1. 挑战了“L1绝对情绪优势”的简单观点： 研究表明，当L2达到高度熟练水平时，其在词汇层面的情绪唤起能力可以与L1媲美。这提示，语言的情绪性差异可能更多体现在复杂语篇、社会文化语境或早期习得的特定词汇上，而非高度熟练双语者的单个词汇自动化加工层面。 2. 支持双语记忆的“非选择性通达”模型： 经典的“修正层级模型”认为L1词汇与概念系统的联结强于L2，因此L1应能更快、更强地激活词义（包括情绪内容）。本研究结果（L1与L2干扰效应无差异）更符合如Dijkstra & Van Heuven (2002) 提出的BIA/BIA+等模型。这些模型认为，双语者的词汇识别初期是语言非选择性的，两种语言的词汇表征同时激活，语言选择发生在加工后期。本研究的斯特鲁普任务恰恰探测的是早期的、自动化的加工阶段，结果支持了这种语言非选择性通达的观点。 3. 强调了语言熟练度的关键作用： 研究者指出，其发现与Sutton等人（同期发表）在早期熟练双语者中的研究结果一致，并结合Tzelgov等人的观点，认为相对语言熟练度是决定双语斯特鲁普干扰模式的主导因素。在本研究中，尽管参与者是晚期习得者且L1占主导，但其L2熟练度很高，这足以使L2词汇产生与L1同等的自动情绪干扰。年龄习得因素在本研究条件下（L2高度熟练）的影响可能被熟练度所覆盖。
五、 研究亮点
精巧的范式应用： 成功地将情绪/禁忌语斯特鲁普范式应用于双语情绪研究。该范式能有效测量自动化的、前注意的情绪激活，避免了依赖主观评分或回忆任务可能带来的意识加工和策略影响。
严格的变量控制： 研究在材料准备上极为严谨，对词汇的情感效价、词频、长度、翻译对等等多个潜在混淆变量进行了匹配或控制，确保了实验结果归因于语言和情绪类型，而非其他语言学特征差异。
清晰的对比发现： 研究不仅验证了L2中存在情绪干扰效应，更重要的是发现了L1与L2效应量无差异这一关键结果，直接挑战了既有理论预期，为双语情绪加工和双语记忆表征的理论争论提供了强有力的实证证据。
对负面与禁忌语刺激的直接比较： 研究同时纳入了负面情绪词和禁忌语词，尽管未发现两者干扰强度的显著差异，但为后续探讨不同类型高唤醒词汇的干扰机制（如威胁检测 vs. 情境绑定）提供了基线数据。
六、 其他有价值的内容
研究在讨论部分还提出了一个富有启发性的观点：不同任务可能探测了双语情绪加工的不同层面。本研究使用的斯特鲁普任务主要反映早期、自动化的词汇情绪激活。而之前一些发现L1-L2差异的研究，可能使用了需要更深层、更意识化加工的任务（如评价愉悦度、识别话语情绪语调）。这提示，双语的情绪性可能不是一个全或无的现象，而是在语言加工的不同阶段、对不同复杂度的材料有不同的表现。未来的研究需要更细致地界定“情绪激活”的具体成分和加工阶段。此外，附录中提供的详细词汇列表和参与者语言使用情况问卷摘要，增强了研究的透明度和可重复性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问