本研究是一项原创性实证研究,旨在探讨非母语者(L2)在句子实时加工过程中,如何处理主语-动词一致性(subject-verb agreement)和反身代词(reflexives)这两类句法依存关系。研究发表于 Bilingualism: Language and Cognition 期刊,第一作者是Shatha Alaskar(隶属沙特阿拉伯Majmaah大学教育学院英语系),通讯作者是Ian Cunnings(隶属英国雷丁大学心理与临床语言科学学院)。文章于2024年12月13日在线发表。
该研究的学术背景主要位于第二语言习得与心理语言学的交叉领域,核心关注点在于L2句法处理的机制。长期以来,学界对于母语者(L1)和非母语者在利用句法约束解决句子中长距离依存关系(如匹配动词与其主语,或将反身代词与其先行词连接)的能力上是否存在本质差异,存在争议。一些有影响力的理论,如浅层结构假说(Shallow Structure Hypothesis, SSH),认为L2者在加工过程中难以充分利用句法信息,而更依赖浅层的、非句法的线索。另一些理论则认为,L1/L2的差异可能源于认知负荷的差异、L2熟练度的个体差异,或者源于工作记忆在句子理解中发挥的不同作用。具体到研究焦点,以往文献对主语-动词一致性的L2加工结果不一,有些研究显示L2者对其不敏感,而另一些则显示其加工模式与L1者类似。对于反身代词,部分研究表明L2者在实时加工中可能违反句法约束,更受语篇显著性的影响。此外,L1加工研究对于“基于线索的记忆提取”(cue-based memory retrieval)模型在解释不同依存关系(如一致性 vs. 反身代词)上的普适性也存在争论。本研究旨在通过在同一批L2被试中平行考察这两种句法依存关系,来澄清这些矛盾,并检验不同的L2加工理论(如SSH、工作记忆差异假说、熟练度调制假说)。研究选择了阿拉伯语为母语的英语学习者作为被试,因为阿拉伯语和英语在这两种依存关系上具有相似的句法规则,从而最大程度地排除了母语迁移的影响。
研究详细工作流程包含两个大型实验(研究1和研究2)。研究1考察主语-动词数的一致性以及反身代词的性别一致性。研究2则专门考察反身代词的数一致性,以检验研究1中观察到的L2者对一致性敏感度较低的现象,是源于对“数”特征的编码困难,还是特定于“一致性”计算本身的问题。两项研究均采用相同的实验范式组合:离线语法判断任务(Grammaticality Judgement Task, GJT)和在线自定步速阅读任务(Self-Paced Reading, SPR)。
研究被试方面,研究1最终纳入了176名L1英语母语者和176名阿拉伯语L2英语学习者。L2学习者均于5岁后开始学习英语,并通过牛津快速分级测试评估了英语熟练度,结果显示其水平主要为中高级。研究2招募了新的164名L1者和参与过研究1的164名L2者(间隔6-11个月),以确保L2被试的稳定性。
在材料设计上,两项研究均精心构造了实验句。以研究1为例,对于主语-动词一致性,实验句操纵了两个变量:1)语法性(Grammaticality):主语与动词的数是否匹配(如“The waitresses were…” vs. “*The waitress were…”);2)干扰项匹配性(Distractor match):嵌入在主名词短语中的介词短语内名词(干扰项)与动词的数是否匹配(如“…near the schoolgirls” vs. “…near the schoolgirl”)。这形成了2x2的四种条件。对于反身代词,则操纵了主语与反身代词的性别是否匹配,以及干扰项名词与反身代词的性别是否匹配。所有句子后都跟有理解性问题以确保被试认真阅读。研究2的反身代词实验句将性别操纵改为数操纵(使用复数反身代词“themselves”),并增加了无干扰项的基线条件,以验证复数反身代词确实被当作复数处理。
实验程序通过在线平台(研究1用IbexFarm,研究2用PCIBex)实施。被试分两个环节参与:第一环节完成SPR任务和(针对L2者的)熟练度测试;至少一周后,第二环节完成GJT任务。在SPR任务中,句子以词为单位非累积方式呈现,被试每按一次空格键显示下一个词,同时上一个词隐藏。记录每个词的阅读时间。GJT任务中,整个句子一次呈现,被试需判断其语法是否正确。
数据分析采用基于R语言的线性混合效应模型和广义线性混合效应模型。对于GJT的准确率数据,使用广义线性混合效应模型进行分析,固定效应包括组别(L1/L2)、语法性、干扰项存在与否及其交互作用。对于SPR的阅读时间数据,在关键区域(动词“were”或反身代词“himself/herself”)及溢出区域(后一个词)进行分析,固定效应包括组别、语法性、干扰项匹配性及其交互作用,并将阅读时间进行对数转换以符合正态分布。此外,还专门对L2组数据进行了分析,将熟练度作为连续预测变量纳入模型,以检验熟练度的调节作用。所有数据和代码均公开,遵循开放科学实践。
研究的主要结果如下。在研究1的语法判断任务中,L2者对两种依存关系都表现出较高的语法知识准确率,尽管整体略低于L1者。对于一致性,L1者在有干扰项的句子中准确率显著下降,而L2者未出现此模式。对于反身代词,L1者在有/无干扰项条件下均显示出语法性效应(正确率在语法正确句更高),而L2者仅在无干扰项条件下显示出该效应。熟练度分析表明,L2者的判断准确率随熟练度提高而增加。
更为关键的在线SPR结果显示:对于主语-动词一致性,两组被试在溢出区域均表现出显著的语法性效应(非语法句阅读时间更长),但L2者的效应量显著小于L1者。重要的是,未发现显著的干扰项效应,即匹配或不匹配的干扰项并未系统性地影响阅读时间。对于反身代词(性别操纵),两组都表现出强烈的语法性效应,且出乎意料的是,L2者的效应量甚至大于L1者。同时,发现了显著的干扰项主效应,匹配干扰项的句子阅读时间更短,该效应在非语法句中描述性上更大,提示了“促进性干扰”(facilitatory interference)的可能,但语法性与干扰项的交互作用未达显著水平。对L2者的熟练度分析揭示了关键发现:在一致性任务中,只有高熟练度的L2者才表现出与L1者方向一致的语法性效应;而在反身代词任务中,语法性效应的大小随熟练度提高而增加。
研究2专门针对反身代词的数一致性进行考察。离线GJT结果再次显示L2者具备相关知识,且有趣的是,L1者在非语法句(如“*The boy… hurt themselves”)上的接受率接近50%,可能他们将“themselves”视为泛型单数代词,而L2者在此条件下接受率更高。在线SPR结果显示,无论是在有干扰项还是无干扰项(基线)的条件下,L1和L2组都表现出了显著的语法性效应,且两组间无显著差异。此外,在研究2中未发现显著的干扰项效应。
基于这些结果,研究者得出了以下结论。首先,L2者在处理主语-动词一致性和反身代词依存关系时,其加工模式在很大程度上与L1者相似。他们能够在线应用句法约束,这表明其句法加工并非必然是“浅层”的,从而不支持浅层结构假说(SSH)在本研究条件下的预测。其次,研究所观察到的L1/L2差异(主要是一致性任务中L2者较小的语法性效应)主要受到L2熟练度的调节。高熟练度的L2者表现得更像母语者。这支持了熟练度是解释L2句法加工表现个体差异的关键因素的观点。第三,研究未发现L2者比L1者更容易受到基于相似性的记忆干扰的证据,这与Cunnings (2017)提出的L2者可能过度加权非句法线索从而更易受干扰的预测不符。第四,关于不同依存关系的比较,研究1中L2者对一致性语法性效应较弱,但在研究2中对反身代词的数违规却表现出完整的语法性效应。这表明L2者的困难可能特定于“一致性计算”过程本身,而非对“数”这一特征的普遍编码困难。最后,关于干扰效应,研究仅在研究1的反身代词(性别)中观察到了干扰效应,而在一致性任务和研究2的反身代词(数)任务中均未发现,这暗示不同特征(性别 vs. 数)在不同依存关系的记忆检索中权重可能不同,但此结论需谨慎,并凸显了在L1和L2研究中重复实验的必要性。
本研究的价值在于:它通过大规模、严格控制的设计,在同一L2群体中平行比较了两种核心句法依存关系的加工,为厘清L2句法加工机制的争论提供了强有力的新证据。研究结果强调了L2熟练度在塑造句法加工表现中的核心作用,挑战了某些认为L2加工存在普遍缺陷的理论。方法学上,研究采用大样本、公开数据和代码,增强了研究的可靠性和可重复性,为领域树立了良好榜样。应用上,该研究对二语教学和评估具有启示,强调提升整体语言熟练度对于发展近似母语的句法实时处理能力的重要性。
本研究的亮点包括:1)首次在同一L2群体中,使用平行实验设置,系统比较了主语-动词一致性与反身代词两种句法依存关系的在线加工;2)采用了大样本设计,提高了统计效力,并对以往可能因小样本而产生矛盾结论的研究进行了有效检验;3)明确将L2熟练度作为连续变量纳入分析,清晰地揭示了其对加工表现的调制作用,为解释个体差异提供了实证基础;4)研究设计精细,控制了如词长、语篇显著性等潜在混淆变量,并选择了句法特征相似的L1-L2配对以最小化迁移影响;5)全面遵循开放科学实践,公开了所有材料、数据和代码,促进了研究的透明度和可验证性。