学术研究报告:一项基于语料库与构式语法的英语“隐蔽被动构式”研究
本报告旨在介绍由Rok Sim(南卡罗来纳大学语言学项目)与Jungsoo Kim(仁荷大学英语教育学系)合作完成,并于2026年发表于期刊 English Language and Linguistics 的一项原创性语言学研究。该研究题为“A collostructional approach to the concealed passive construction in English”,旨在通过大规模真实语料分析与构式语法理论框架,深入探究英语中“隐蔽被动构式”的语法属性、动词偏好及其内部机制。
一、 学术背景与研究目标
本研究的科学领域属于理论语言学与语料库语言学的交叉领域,具体聚焦于英语语法中的一种特殊现象——隐蔽被动构式。该构式在结构上表现为一个主动形式的“矩阵动词”(如 need, require, deserve, want, bear)后接一个主动形式的“-ing补语”,但其整体意义却等同于一个被动句。例如,“The car needs washing”在语义上等同于“The car needs to be washed”,主语“the car”被理解为“washing”这一动作的受事,而非施事。这种“主动形式,被动解读”的形式-功能错配现象,对传统的句法-语义映射理论构成了挑战,是理解论元结构与句法-语义接口的重要案例。
尽管前人研究(如Visser, Huddleston & Pullum, Toyota, Kim等)已识别出可能用于该构式的动词列表,并探讨了其部分语法特性(如施事by短语的使用、主语生命性等),但存在显著的研究空白。首先,多数研究基于研究者内省或小规模语料,缺乏对当代英语大规模真实使用模式的系统性量化分析。其次,研究多集中于矩阵动词列表本身,而较少探究这些动词(或动词类型)与该构式中其他元素(如-ing补语类型、施事by短语、主语生命性)之间的统计关联与互动关系。最后,对于该构式如何在不借助显性被动形态的情况下产生被动解读,缺乏一个统一的理论解释。
因此,本研究旨在通过使用当代美国英语语料库的实证数据,结合构式搭配分析等量化方法,并最终在构式语法理论框架下建模,系统性地回答以下五个核心研究问题: 1. Visser所列动词在当代美国英语CPC中的分布与统计关联强度如何?这些动词应被视为一个整体还是应划分为不同子类? 2. 在各类-ing补语中,是否存在特定矩阵动词(或动词类型)与特定补语类型之间的关联? 3. CPC中施事by短语的使用频率如何?是否有特定动词(或动词类型)与其出现或缺失存在强关联? 4. CPC中主语生命性(有生/无生)的分布模式如何?哪些矩阵动词(或动词类型)与主语的(无)生命性存在强关联? 5. 何种机制可以解释CPC在没有显性被动形态的情况下诱发的被动解读?
二、 研究流程与方法详述
本研究遵循了严谨的语料库语言学与构式语法研究流程,主要包括数据收集与清洗、量化分析、理论建模与阐释三个阶段。
流程一:数据收集与预处理 1. 语料来源:研究使用“当代美国英语语料库”(Corpus of Contemporary American English, COCA)作为数据源。该语料库规模超过10亿词,时间跨度为1990-2019年,并平衡覆盖口语、小说、流行杂志、报纸、学术文本等五大主要语域,确保了数据的代表性与时效性。 2. 检索策略:以Visser (1963–73) 列出的22个潜在矩阵动词(如 need, bear, require, await, escape 等)为基础,在COCA中设计并执行了系统的检索式。例如,针对动词“need”,检索式为 [need]_vv v?g,以捕捉“need”的所有动词形态(need, needs, needing, needed)后接任何-ing动词的序列。 3. 数据清洗与标注:初始检索共获得39,130个原始实例。随后,研究者进行了严格的人工筛选与标注。首先,排除不符合CPC定义的实例,例如矩阵动词后接的-ing形式不表示被动意义(如“I hated having my failures monitored”)或并非动词的直接补语(如“we needed hiding places”中的“hiding”修饰“places”)。其次,对于边界案例(如“suffer bruising”),只要语境中仍可解读出被动意义,即使主动解读也可能,则予以保留,以反映语言实际使用的模糊性。此过程由两位作者独立完成,并由非作者的第三方进行复核,确保了数据标注的信度。最终,获得了2,541个合格的CPC实例用于后续分析。
流程二:量化分析——构式搭配分析法 为解决研究问题1-4,本研究采用了构式搭配分析法家族中的三种具体技术,使用R语言中的coll.analysis 4.0软件包,并以对数似然比作为关联强度度量指标。 1. 搭配词分析:用于探究哪些矩阵动词与CPC构式槽位存在显著的“吸引”或“排斥”关系。该方法通过比较一个词在特定构式中出现的观测频率与其在语料库中的总体期望频率,计算其统计关联强度,从而识别出该构式的典型填充词。 2. 共变搭配词分析:用于探究CPC内部两个槽位(矩阵动词槽位与-ing补语槽位)中词汇的共现偏好。该方法能识别出哪些“动词-补语”对的出现频率显著高于随机预期,从而揭示构式内部的语义框架或固定搭配模式。 3. 区别性搭配词分析:用于探究特定矩阵动词是否与CPC的某个变体(如有生主语 vs. 无生主语、包含施事by短语 vs. 不包含施事by短语)存在更强的统计关联。这有助于识别不同动词在触发构式子类变体时的倾向性。
流程三:理论建模与机制阐释 基于量化分析的结果,研究者发现CPC的语法属性并非单一模式,而是呈现出多样性。为解释这种多样性并回答研究问题5,研究引入了生成语法中经典的“提升”与“控制”区分,并在构式语法框架下进行了形式化。 1. 句法诊断与子类划分:通过对语料实例的句法测试(如能否进行“it is necessary that…”或“that… is necessary”的释义),研究者发现CPC的矩阵动词可分为两类。一类(如 need, want, require, deserve, bear, merit)允许非论元主语,其主语可以从嵌入补语中“提升”而来,属于CPC-提升构式。另一类(如 await, escape, avoid, prevent, suffer)的主语是矩阵动词的论元,同时“控制”着嵌入补语中未出现的逻辑主语,属于CPC-控制构式。 2. 构式语法形式化:在构式语法框架下,研究者为这两个子类分别构建了形式-功能配对。 * CPC-提升构式:形式为 [NP/CP V-ing],语义为“对主语X而言,经历事件Y是必要的/有价值的(与V相关)”。主语X的论元角色完全由嵌入的-ing补语赋予。 * CPC-控制构式:形式为 [NP V-ing],语义为“主语X执行或经历事件V,该事件指向一个作用于X自身的动作Y”。主语X同时是矩阵动词V的施事/经验者,以及嵌入补语Y的受事。 3. 历时演变假说:结合Toyota (2009)的历时分类与本研究的量化发现(need和bear是关联最强的两个动词),研究者提出一个关于CPC构式演变的假说:CPC可能最初由核心动词need(其非论元用法)和bear在CPC-提升构式中语法化,随后通过语义类推扩展到其他表“必要性/愿望”和“价值/值得”的动词(如require, want, deserve, merit)。之后,need的论元性用法(表“有…的需要”)可能作为桥梁,促使CPC-控制构式得以被await, escape等动词采用,这些动词出现的时间也相对较晚。
三、 主要研究结果详述
结果一:矩阵动词的分布与关联强度 在2,541个CPC实例中,共发现12个Visser列表中的动词。其中,need 以2,005例(占78.90%)占据绝对主导地位。其他较常见的动词包括bear (226例)、require (171例)、deserve (36例)、want (31例)和await (31例)。搭配词分析进一步证实,need 与CPC矩阵动词槽位的统计关联强度(LLR = 26523.123)远超其他所有动词,是CPC最核心、最典型的动词。除hate外,其余11个动词均与CPC槽位存在显著吸引力。根据语义,这些动词可分为五类:1) 必要性/愿望类(need, require, want);2) 价值/值得类(bear, deserve, merit);3) 期待/预期类(await);4) 避免/阻止类(escape, prevent, avoid);5) 逆境/忍受类(suffer, hate)。其中,第一类在频率上占主导。
结果二:矩阵动词与-ing补语的共现模式 共变搭配词分析揭示了强烈的特定“动词-补语”配对偏好,形成了不同的语义框架。关联最强的20对组合显示: * bear 强烈倾向于与表示“重复、强调、注意”的补语共现,如 bear repeating (LLR=165.644), bear watching (140.683), bear mentioning (129.402)。这体现了其“值得/经得起”的语义。 * await 强烈倾向于与表示“程序性、待决行动”的补语共现,如 await sentencing (120.928), await processing (30.802)。这与其“等待/预期”的语义相符。 * need 和 require 则常与表示“实际动作、修理、更换”的补语共现,如 need doing (31.747), need replacing (20.702), require staking (39.056)。这反映了其“必要性”的语义。 * escape 和 avoid 常与表示“伤害、质问”的补语共现,如 escape bombing (20.807), avoid questioning (23.224)。这与其“避免”的语义一致。 这些模式表明,CPC并非一个僵化的模板,其内部存在着基于动词语义的、规约化的词汇-构式互动。
结果三:施事by短语的使用倾向 在全部CPC实例中,仅有42例(1.65%)包含了施事by短语,这表明在真实使用中,CPC极少明确表达施事。区别性搭配词分析进一步显示: * 与包含by短语的CPC显著关联的动词主要是控制类动词,如escape, avoid, await, prevent。 * 与不包含by短语的CPC显著关联的动词则主要是提升类动词,如need和bear。 这一发现将量化数据与理论分类联系起来:虽然by短语整体罕见,但其若出现,则更可能出现在CPC-控制构式中。
结果四:主语生命性的分布模式 在全部实例中,无生主语占绝大多数(2,114例,83.1%),有生主语仅占16.9%。区别性搭配词分析显示: * 与有生主语显著关联的动词主要是控制类动词,如await, avoid, deserve, suffer, want, escape。 * 与无生主语显著关联的动词则主要是提升类动词,如bear和require。 同样,动词need在有生和无生主语中都有出现,但略微倾向于无生主语。这再次将语料观察与理论分类相结合:CPC-控制构式因其主语同时是矩阵动词的论元,更自然地与有生(通常是施事或经验者)主语结合;而CPC-提升构式的主语仅是补语事件的受事,故与无生主语兼容性更高。
结果五:理论整合——提升 vs. 控制的解释力 上述看似分散的量化结果(by短语偏好、主语生命性偏好、动词-补语搭配模式),在“提升”与“控制”的理论区分下得到了统一的、系统的解释。CPC-提升构式(核心动词:need, bear, require等)的语义核心是“主语经历某事件是必要的/有价值的”,主语是纯粹的受事,因此常为无生,且无需也无法明确施事(故by短语罕见),补语多指向施加于主语的必要改变或评价。CPC-控制构式(核心动词:await, escape, avoid等)的语义核心是“主语(有生)执行‘等待、逃避’等动作,其对象是一个将作用于自身的他动事件”,主语具有双重角色,因此常为有生,且该他动事件可能隐含一个外部施事(故by短语出现的可能性相对更高),补语多指向主语意图避免或预期的负面事件。
四、 研究结论与价值
本研究得出结论:英语的隐蔽被动构式并非一个均质的语法构式,而是由两个在句法、语义及语用偏好上存在系统差异的子构式——CPC-提升构式与CPC-控制构式——组成的家族。这一区分并非任意,而是源于核心动词(如need)本身的不同义项,并通过语义类推扩展至其他动词。研究成功地将大规模语料库的量化发现(动词频率、搭配模式、语境特征)与构式语法的定性理论分析相结合,为CPC复杂且看似矛盾的语言事实提供了一个简洁而有力的解释框架。
本研究的科学价值在于:1)首次运用系统的构式搭配分析方法,全面揭示了CPC在真实语言使用中的多维统计特征,弥补了先前研究多依赖内省或小规模数据的不足;2)创新性地将生成语法的“提升/控制”分析融入构式语法模型,为解释形式-功能错配现象提供了新的理论视角,展示了不同语言学范式互补的可能性;3)通过对CPC内部差异的精细刻画,深化了对英语非典型补语结构、论元实现以及构式网络复杂性的理解。其应用价值体现在为英语教学、词典编纂和自然语言处理中对这类特殊结构的准确描述与处理提供了实证依据和理论指导。
五、 研究亮点
六、 其他有价值内容
研究在讨论部分还触及了CPC与英语中其他“主动形式表被动意义”的构式(如中动构式、进行体被动式)的类比,暗示了语言中处理形式-功能错配的更广泛机制。同时,作者也坦诚指出了本研究的局限性,即数据收集基于Visser的动词列表,可能遗漏了其他能进入CPC的动词(文中提到了“expect”的可能用例),这为后续更全面的研究留下了空间。最后,研究者强调了核心搭配词动词(collexeme verbs)在驱动补语结构演变中的潜在作用,这对于理解语言变化中频率与范例的作用具有普遍启示意义。