韩语母语者与二语学习者预测性加工中词共现频率的影响:基于网络摄像头的眼动研究
作者与发表信息
本研究由香港中文大学英语系的Haerim Hwang和梨花女子大学韩国学系的Sun Hee Park合作完成,并于2025年4月25日发表在《Applied Psycholinguistics》期刊(第46卷,文章编号e18)。
学术背景
本研究属于心理语言学(psycholinguistics)与二语习得(second language acquisition)交叉领域,聚焦预测性加工(predictive processing)机制,即语言使用者如何利用上下文信息预判即将出现的词汇、句法结构等。尽管已有研究表明母语者(L1)能高效利用语言线索进行预测,但二语学习者(L2)是否具备同等能力仍存在争议。
研究背景基于以下关键问题:
1. 预测速度的忽视:既往研究多关注预测成功与否,而忽略了预测速度这一关键指标。
2. 词共现频率的作用:词汇或短语的共现频率(word co-occurrence frequency)可能影响预测效率,但这一因素在L1和L2预测性加工中的作用尚未明确。
3. 韩语量词系统(Korean classifier system)的独特性:韩语量词与名词的强制性搭配为研究预测性加工提供了理想范式,因其能系统操控共现频率与语法/语义线索的交互作用。
研究目标包括:
- 探究L1和L2使用者能否基于量词预判名词;
- 分析词共现频率对预测速度与鲁棒性的影响;
- 考察L2学习者的语言水平如何调节预测性加工。
研究流程与方法
1. 参与者
- L1组:21名韩语母语者(平均年龄26.43岁)。
- L2组:30名以汉语为母语的韩语学习者(平均年龄27.43岁,韩语学习起始年龄19.9岁,平均在韩居住3.82年)。所有L2参与者需通过筛选测试(填空任务准确率≥80%)。
2. 实验设计
核心实验:基于网络摄像头的视觉情境眼动任务(webcam-based visual-world eye-tracking)
- 刺激材料:
- 关键句:12句含韩语量词(如“calwu”用于细长物体)的句子,分高共现频率(如“calwu-铅笔”)和低共现频率(如“calwu-枪”)两种条件,通过韩语语料库验证频率差异(L1语料库:t=3.551, p=0.005;L2语料库:t=5.955, p<0.001)。
- 视觉场景:每句配有两张图片(目标物与竞争物),如图1所示。
- 任务流程:
- 参与者通过个人电脑完成校准后,边听句子边观看图片,眼动数据由Gazerecorder平台记录。
- 预测区域(predictive region)定义为从第一个量词偏移到目标名词起始的时间段(平均2537毫秒)。
辅助任务:
- 填空知识测试:评估参与者对量词-名词搭配的离线知识,两组均表现优异(L1组准确率96.03%,L2组92.45%)。
- C-test语言水平测试:L2组平均得分32.4/50,按中位数分为高、低水平组(各15人)。
3. 数据分析
- 眼动数据处理:
- 清洗数据(剔除技术问题或未达标者)。
- 将注视比例转换为经验对数(elogits),采用广义加性混合模型(GAMM)分析时间动态,辅以生长曲线分析(growth curve analysis)检验交互效应。
- 关键指标:目标物与竞争物的注视比例差异及其时间进程。
主要结果
预测性加工的存在性(RQ1):
- L1组在所有条件下均表现出显著的目标物注视偏好(高频率条件:从-2449.49毫秒开始;低频率条件:从-1944.44毫秒开始)。
- L2组仅在高共现频率条件下显示预测效应(从-1944.44毫秒开始),且比L1组延迟505.05毫秒。
词共现频率效应(RQ2):
- 高共现频率加速L1组的预测速度(高vs.低频率:差异505.05毫秒)。
- L2组仅在高频率条件下能启动预测,表明共现频率提升其预测鲁棒性。
语言水平效应(RQ3):
- 高水平L2学习者表现接近L1组,在高低频率条件下均能预测(高频率:-2222.22毫秒;低频率:-883.83毫秒)。
- 低水平L2学习者仅在高频率条件下预测(-1262.63毫秒)。
结论与意义
理论贡献:
- 提出健全预期生成能力假说(Sound Ability to Generate Expectations, SAGE),认为L1与L2预测机制本质相似,差异源于语言水平、共现频率等因素的调节。
- 支持效用账户理论(utility account),即L2预测受处理成本与收益权衡的影响。
方法论创新:
- 验证网络摄像头眼动技术(webcam-based eye-tracking)在视觉情境范式中的可行性,为缺乏实验室设备的研究者提供替代方案。
- 首次将GAMM应用于预测性加工研究,精准捕捉效应出现的时间节点。
应用价值:
- 为二语教学提示:高频词搭配训练可增强学习者预测能力;高阶学习者能逐步发展类母语的预测策略。
研究亮点
- 跨语言比较:首次在韩语量词系统中验证共现频率效应,补充了汉语(Grüter et al., 2020)和日语(Mitsugi, 2020)的研究空白。
- 词频与语言水平的交互:揭示高水平L2学习者能克服低频障碍,拓展了RAGE假说的解释范围。
- 技术低成本化:通过开源工具(Gazerecorder、Python的Konlpy包)实现实验设计,推动研究可及性。
其他发现
- 母语迁移效应:汉语量词与韩语的词源联系(如“tay”源自中文“台”)加速了L2学习者的高频条件预测(-2247.47毫秒 vs. 无词源联系的-858.59毫秒)。
- 离线与在线加工的分离:填空任务中两组均无频率效应,但眼动任务显示频率影响实时加工,提示生产与预测系统的差异性。
(注:全文参考文献及附录详见原文献,此处从略。)