本研究由刘杰(Jie Liu)与陈诗发(Shifa Chen)来自中国海洋大学,以及冯雪芳(Xuefang Feng)来自华中科技大学共同完成,并于2025年4月28日在线发表于学术期刊 The Mental Lexicon 上。该研究旨在利用复杂网络科学(Complex Network)技术,对中国英语作为外语(EFL)学习者的二语(L2)心理词汇库中的词汇磨蚀(Lexical Attrition)过程进行建模与仿真分析。
一、 学术背景
本研究隶属于应用语言学与心理语言学的交叉领域,具体聚焦于二语心理词汇的表征结构与磨蚀动态。词汇磨蚀是指语言使用者因长期不使用某种语言而导致的词汇检索能力下降或丧失的过程。传统上,对二语词汇磨蚀的研究多依赖于对学习者进行长期、多次的词汇能力测试。这种方法不仅耗时,且受限于测试的词汇量,难以全面反映拥有庞大词汇量的心理词汇库的整体变化。更重要的是,传统范式倾向于将心理词汇视为可简单量化的单词集合,而忽略了词汇在大脑中是以复杂网络形式相互联结、相互激活的本质。近年来,网络科学的发展为将心理词汇建模为网络并模拟其动态过程提供了新工具。已有研究证实一语(L1)心理词汇网络具有小世界(Small-World)、无标度(Scale-Free)等复杂网络特性,但关于二语心理词汇是否具有类似复杂结构,以及这种结构如何影响磨蚀过程,尚缺乏基于大规模网络的研究。此外,先前关于磨蚀顺序的理论假设(如“先学后忘”的回归假说或“学得最好,忘得最慢”理论)多从个体词汇层面探讨,未能从网络整体结构的角度解释不同磨蚀顺序为何会导致不同的磨蚀进程与结果。
因此,本研究旨在通过构建一个大规模的中国EFL学习者二语词汇联想网络,并模拟不同顺序的链接移除(模拟磨蚀事件),来探究以下核心问题:1)二语心理词汇是否是一个复杂网络?2)磨蚀事件如何影响二语词汇网络的结构?3)磨蚀发生的顺序是否以及如何影响磨蚀过程?研究期望通过模拟方法,揭示词汇磨蚀在复杂网络层面的非线性动态特征,弥补传统实验方法的局限。
二、 研究流程详述
本研究的工作流程主要包括三个核心阶段:大规模二语词汇联想网络的构建、基于该网络的磨蚀过程模拟、以及对模拟结果的量化分析与比较。
第一阶段:大规模二语词汇联想网络的构建 1. 研究对象与数据收集:研究招募了884名中国中部某综合性大学的EFL学习者作为参与者,平均年龄19.68岁。他们来自不同专业,英语水平均高于中国大学一年级学生的平均水平,其中96.14%自评为中级学习者。研究采用在线自由联想(Free Association)任务收集数据。 2. 刺激词选取:采用“滚雪球”抽样法构建刺激词库。起始词为BNC/COCA语料库中最常用的1000个词。在后续迭代中,将前一轮联想反应中出现至少2次的新词作为下一轮的刺激词。经过四轮迭代,最终得到4043个刺激词,覆盖了高频和低频词汇。 3. 实验程序:参与者在线完成实验,看到屏幕上出现的刺激词后,需输入脑海中浮现的第一个英语单词。若遇到不认识的词可跳过。每位参与者每次随机获得18个刺激词,系统优先分配使用频率较低的词,以确保每个刺激词获得大致相当的联想次数(约6-7次)。最终,在剔除中文回答、短语、拼写无法辨认的词等无效数据后,获得26,161条有效的“刺激词-反应词”配对。 4. 网络构建与参数化:使用R语言的igraph包构建无向、无权重的词汇联想网络。节点代表单词,若两个单词在数据集中存在联想关系(无论方向),则在它们之间建立一条边。最终构建的网络包含5746个节点(单词)和10,138条边(联想关系)。随后,计算了该网络的一系列关键参数,以分析其宏观结构,包括:网络密度、连通分量数量、最大连通分量(Largest Connected Component, LCC)大小、平均最短路径长度(Average Shortest Path Length, ASPL)、聚类系数(Clustering Coefficient, CC)以及度分布(Degree Distribution)。为了验证其复杂性,研究还将该网络与具有相同节点数和边数的随机网络进行了对比。
第二阶段:模拟词汇磨蚀过程 研究将词汇磨蚀建模为从网络中逐步移除链接(边)的过程。一次“磨蚀事件”定义为移除一条链接,这模拟了单词间联想连接的减弱或消失,可能导致单词更难被激活和检索。 1. 模拟设置: * 磨蚀程度:从完整网络开始,每次迭代移除总链接数的1%,直至所有链接被移除,共生成100个逐步受损的网络。 * 磨蚀顺序:模拟了三种不同的链接移除顺序,以探索磨蚀顺序的影响: * 随机顺序(Random):随机选择并移除链接,模拟非选择性的磨蚀。 * 从外围到中心(Peripheral-to-Central):按照链接的中介中心性(Betweenness Centrality)升序移除,即先移除网络中最不中心(外围)的链接。这模拟了更符合认知现实的磨蚀过程,即不常用、不关键的连接先失效。 * 从中心到外围(Central-to-Peripheral):按照链接的中介中心性降序移除,即先移除网络中最中心、最关键(如枢纽)的链接。这模拟了一种“最坏情况”或某些临床场景(如失语症)下的磨蚀。 * 评估指标:为了量化磨蚀对网络功能的影响,在每次移除链接后计算三个核心网络指标: * 最大连通分量大小(Size of LCC):反映网络中仍能相互通达的最大单词集群规模,可视为“仍可有效激活的词汇量”。 * 平均最短路径长度(ASPL):反映LCC内任意两个单词之间平均需要经过多少步联想才能连接,衡量信息传递的效率。 * 网络效率(Network Efficiency, E):计算所有节点对之间最短路径倒数和的平均值,能更好地处理网络断裂(不连通)的情况,综合衡量网络的全局效率。
第三阶段:数据分析 研究对上述模拟过程产生的数据进行了系统的分析和可视化。 1. 结构分析:通过绘制网络图、计算并对比网络参数,验证二语词汇网络是否具备复杂网络特征(如小世界、无标度特性)。 2. 磨蚀影响分析:绘制了在不同磨蚀顺序下,三个评估指标(LCC大小、ASPL、网络效率)随链接移除比例变化的动态曲线。通过对比二语网络与随机网络在这些曲线上的差异,分析二语网络结构对磨蚀的独特响应模式。 3. 顺序效应分析:使用弗里德曼检验(Friedman test)比较三种磨蚀顺序对三个网络指标的影响是否存在显著差异,并进行事后两两比较,确定差异具体存在于哪些顺序之间。 4. 案例剖析:选取网络中的一个局部子图作为示例,直观展示移除单个高中心性链接和单个低中心性链接对局部网络连通性的不同影响,以及连续移除多个中心链接如何导致网络“区室化”(Compartmentalization)。
三、 主要研究结果
1. 二语心理词汇是一个复杂网络 分析表明,所构建的中国EFL学习者二语词汇联想网络具有典型的复杂网络特征: * 稀疏性与连通性:网络密度极低(0.0006),表明连接稀疏。但网络包含36个连通分量,其中最大连通分量(LCC)包含了98.36%的节点,远高于对应随机网络的96.69%,表明网络整体连通性良好。 * 小世界特性:网络的平均最短路径长度(ASPL = 6.5902)较短,低于随机网络(6.9243),意味着任意两个单词平均只需约6步中介即可相连。同时,其聚类系数(CC = 0.0559)远高于随机网络(0.0005),表明单词倾向于形成紧密的局部集群。短路径与高聚类并存,符合小世界网络特征。 * 无标度(幂律)倾向:网络的度分布(节点连接数的分布)在双对数坐标下近似为直线,与随机网络的正态分布截然不同。Kolmogorov-Smirnov检验支持其符合幂律分布(p > 0.05),标度参数α=4.009,表明网络是“弱无标度”的,即存在少量连接数极高的“枢纽”词和大量连接数较少的词。 * 与一语网络的比较:该二语网络的密度低于以往研究报道的一语网络密度,这与二语学习者词汇知识深度和广度通常弱于一语者的预期相符,但也可能受样本量、网络规模差异等方法论因素影响。
2. 磨蚀事件削弱二语心理词汇的结构 模拟结果显示,磨蚀事件对网络结构的影响是非线性的,且不同结构指标的变化模式不同: * LCC大小与网络效率:随着链接移除比例的增加,LCC大小和网络效率均呈下降趋势,但效率的下降更为线性。这意味着随着磨蚀进行,网络中相互连通的单词集群规模缩小,信息传递的整体效率降低。 * ASPL的变化:ASPL呈现先上升后下降的“倒U型”曲线。初期移除链接会破坏单词间的直接路径,导致平均距离增加,搜索难度加大。但当磨蚀达到一定阈值(如中心到外围顺序下约移除54%链接时),网络严重碎片化,LCC急剧缩小至原规模的21.97%,剩余的小型连通组件内部路径变短,导致ASPL下降。这警示我们,仅测量单词间的共激活或反应时,可能在网络严重受损时产生误导性结论。 * 磨蚀事件与词汇损失的区别:研究验证了Meara (2004)的观点,即“磨蚀事件”(结构微小变化)不一定立即导致“词汇损失”(可观测的单词激活数量减少)。模拟显示,移除少量链接(即使是关键链接)可能不会立即导致单词从LCC中孤立出来,但会削弱网络结构,使其对未来磨蚀事件更加脆弱。这解释了为何短期研究中可能观察不到明显的词汇能力下降。
3. 磨蚀顺序显著影响磨蚀过程 统计分析证实,三种磨蚀顺序对LCC大小、ASPL和网络效率的影响存在显著差异(p < 0.001)。即使在磨蚀初期(链接移除比例0-10%),顺序效应就已显现。 * 中心到外围顺序破坏性最强:与随机和外围到中心顺序相比,从中心到外围的磨蚀顺序导致ASPL上升更快、网络效率下降更剧烈。这表明,首先攻击网络中的核心连接(枢纽)会对网络功能造成最迅速、最严重的破坏。有趣的是,在磨蚀初期,中心链接的移除导致的LCC规模下降反而更缓慢,但这是一种“假象”,因为核心连接的破坏虽未立即孤立单词,却严重削弱了网络的整体架构,为后续的“雪崩式”词汇损失埋下伏笔。当移除链接比例达到20%时,中心到外围顺序导致的LCC下降就显著快于其他顺序。 * 外围到中心顺序最具韧性:从外围到中心的磨蚀顺序对网络结构的破坏最慢。移除外围链接主要影响局部连接,对网络的全局连通性和效率影响较小,网络表现出较强的韧性。 * 随机顺序介于两者之间:随机移除链接的影响介于上述两种选择性顺序之间。 * 案例佐证:通过分析局部网络示例发现,移除一个高中心性的链接(如“look-beautiful”)虽未立即孤立任何单词,但显著增加了网络中部分区域到达其他部分的路径长度,并使网络更依赖于少数剩余的关键链接,从而变得脆弱。而移除一个低中心性的链接(如“disgust-hatred”)影响微乎其微。连续移除多个中心链接会迅速将连通网络分割成多个孤立的小集群,导致大量单词无法相互通达。
四、 研究结论与意义
本研究通过构建大规模二语词汇联想网络并模拟磨蚀过程,得出以下核心结论: 1. 中国EFL学习者的二语心理词汇具有复杂网络的结构特征(小世界、弱无标度),这种结构决定了其信息存储和检索的经济性与效率。 2. 词汇磨蚀是一个在词汇网络中运作的、非线性的过程。磨蚀事件(链接失效)会逐步削弱网络结构,降低其连通性和效率,但不一定立即表现为可观测的词汇量下降。累积效应和网络结构的整体性使得磨蚀过程复杂且难以仅通过测试少量单词来准确评估。 3. 磨蚀发生的顺序至关重要。首先侵蚀网络核心连接的磨蚀模式(如某些病理情况)破坏性最大;而从外围开始的磨蚀(可能更接近自然遗忘)进程则缓慢得多。这强调了在理解和研究磨蚀时,不仅要关注“发生了多少次磨蚀”,更要关注“磨蚀发生在网络的哪个部位”。
本研究的科学价值在于: * 方法论创新:首次将大规模复杂网络建模与可控的模拟攻击相结合,应用于二语词汇磨蚀研究,提供了一种超越传统纵向测试的新范式。 * 理论贡献:从网络科学视角为二语心理词汇的组织结构和磨蚀动态提供了实证证据,将“回归假说”等经典理论置于网络动力学的框架下重新审视,强调了网络整体结构对理解局部变化的重要性。 * 应用启示:对二语教学和语言障碍干预具有启示意义。研究提示,识别并巩固词汇网络中的核心枢纽词,可能对维护二语词汇系统的稳定性和促进词汇恢复具有关键作用。同时,研究也警示,评估语言退化时需采用更全面、更注重网络连通性的方法。
五、 研究亮点
六、 其他有价值的内容与局限
研究在讨论部分进一步阐述了网络结构复杂性(如小世界、无标度)与磨蚀过程非线性特征之间的内在关联。例如,小世界结构因其存在大量冗余路径(替代路由)而增强了网络韧性;无标度特性则决定了网络对中心节点/链接的攻击异常脆弱。
作者也坦诚指出了本研究的局限性:1) 网络是基于群体数据构建的,可能不精确代表任何单个学习者的词汇网络;2) 参与者来自同一所大学且母语相同,样本多样性有限;3) 模拟的磨蚀方式(仅移除链接)相对简单,未来可考虑更复杂的模型(如同时移除节点、重新链接等);4) 磨蚀顺序的设定基于一般的网络中心性,未来可结合具体的词汇变量(如词频、具体性、情感因素)进行模拟,以更贴近真实的认知过程。尽管如此,本研究作为一项探索性工作,为在复杂系统框架下研究语言磨蚀开辟了富有前景的新路径。