分享自:

探究学生与AI驱动反馈在翻译修订中的互动:一项混合方法研究

期刊:Education and Information TechnologiesDOI:10.1007/s10639-025-13457-0

这篇文档属于类型a,是一篇关于人工智能生成反馈在翻译教学中应用的原创性研究论文。以下为详细的学术报告:


一、作者及发表信息

本研究由Simin Xu、Yanfang SuKanglong Liu(通讯作者)共同完成,三位作者均来自香港理工大学中文及双语学系(Department of Chinese and Bilingual Studies, The Hong Kong Polytechnic University)。论文发表于期刊Education and Information Technologies,于2025年2月17日在线发布,DOI编号为10.1007/s10639-025-13457-0。

二、学术背景与研究目标

科学领域与背景

研究聚焦翻译教育人工智能(AI)辅助教学的交叉领域。传统翻译教学中,教师人工反馈耗时且难以规模化(Bruton, 2007; Guo et al., 2024),而ChatGPT等生成式AI工具能提供即时、个性化的反馈(Alghamdi, 2024),但其在翻译教学中的应用尚未充分探索(Cao & Zhong, 2023)。

研究动机与目标

研究团队提出:反馈的有效性不仅取决于质量,更取决于学生的“投入度”(engagement),包括认知(cognitive)、情感(affective)和行为(behavioral)三个维度(Handley et al., 2011)。本研究旨在探究翻译硕士生如何从这三个维度与ChatGPT生成的反馈互动,并分析AI反馈对翻译修订过程的影响。

三、研究流程与方法

1. 研究对象与平台开发

  • 参与者:29名香港理工大学翻译硕士生(MATI项目),其中27人以普通话为母语,21名为女性。48.3%的学生有超过10次ChatGPT使用经验。
  • 实验平台:研究团队开发了集成ChatGPT的AI翻译教学平台,内置基于Hurtado Albir & Taylor(2015)翻译评估量表的提示词(prompt),用于生成结构化反馈(包括参考译文、评论建议和评分)。

2. 实验设计

  • 翻译任务:学生将190字中文政治新闻译为英文(限时70分钟),禁止使用机器翻译工具。
  • 反馈生成:平台通过ChatGPT 3.5生成反馈,仅采用首次输出以确保一致性。
  • 修订阶段:学生根据反馈修改译文,全程通过Zoom录屏记录行为数据。

3. 数据收集与分析

  • 定量数据
    • 认知与情感投入:采用Chen(2021)设计的15项李克特量表问卷(Cronbach’s α=0.807-0.802),涵盖反馈理解、修订策略和满意度。
    • 行为投入:记录修订时间、反馈采纳率(uptake rate)和策略(如在线搜索、词典使用)。
  • 定性数据
    • 半结构化访谈:选取4名典型学生(代表群体平均水平),通过12个问题探讨其对反馈的反思和修订决策逻辑。
    • 文本分析:编码ChatGPT反馈为表层级(surface-level,如语法)意义级(meaning-level,如连贯性),并统计修订操作。

4. 数据分析框架

采用混合方法(mixed-methods),整合定量统计与质性编码。数据分析基于Zheng & Yu(2018)的投入度框架,具体维度如下:
- 认知投入:反馈理解、元认知策略(如自我监控)、认知操作(如批判性评估)。
- 情感投入:情绪反应(如信心变化)、态度(如对AI反馈的认可度)。
- 行为投入:修订操作、策略使用、时间分配。

四、主要研究结果

1. 认知投入:理解与策略的复杂性

  • 反馈理解:学生普遍认为ChatGPT反馈易于理解(问卷均值M=4.0/5),但意义级反馈(如连贯性建议)因表述模糊导致困惑(如学生1提到“缺乏具体改进指引”)。
  • 元认知策略:学生需反复查阅反馈(M=4.07)并投入高认知努力(M=4.28),例如通过在线搜索验证反馈建议的准确性(图3示例)。
  • 优先级矛盾:尽管表层级反馈更易处理(M=4.10),但意义级反馈采纳率更高(63.73% vs. 47%),反映学生在“易操作性”与“内容深度”间的权衡。

2. 情感投入:高满意度与批判性并存

  • 积极情绪:高评分(如95/100)和正面评论提升学生信心(M=3.86),但过度褒扬导致部分学生认为反馈“缺乏建设性”(学生1访谈)。
  • 态度分化:学生肯定AI在词汇建议(如“emphasize”替换“underline”)和句式优化上的价值,但对泛泛而谈的反馈(如“需提高清晰度”)表示失望。

3. 行为投入:策略多样性与个体差异

  • 修订操作:共852处修订中,756处基于反馈,96处为学生自主修正(如未标注的引号错误)。意义级反馈采纳量是表层级的1.4倍(304 vs. 130项)。
  • 策略使用:最常用策略为在线搜索(32次)和校对(26次),用于验证AI建议的合理性(如学生3通过Google验证搭配“practical conversation”是否常用)。
  • 时间分配:平均修订时间24分41秒,最长54分34秒(学生3用于反复核查反馈),最短1分30秒(反映动机不足的个体差异)。

五、结论与价值

科学意义

  1. 理论贡献:首次揭示翻译学生与AI反馈互动的三维动态,证实认知、情感和行为投入的相互影响(如高认知努力驱动行为采纳,但情感满意度调节决策)。
  2. 方法创新:开发集成ChatGPT的翻译教学平台,提供可复用的反馈生成流程(附录2示例)。

应用价值

  • 教学实践:建议将AI反馈与教师反馈结合,AI处理基础问题(如词汇),教师聚焦高阶技能(如文体适配)。
  • 技术优化:需改进提示词设计以生成更具体的意义级反馈,并探索GPT-4等新模型的潜力。

六、研究亮点

  1. 多维投入框架:突破传统反馈研究单维视角,揭示AI环境下学生投入的复杂性。
  2. 行为-认知矛盾:发现学生虽优先处理表层问题,但实际修订更依赖意义级反馈,凸显AI工具的设计盲区。
  3. 混合方法验证:通过录屏、问卷和访谈三角验证,提升结论可信度。

七、其他发现

  • 个体差异显著:语言水平、AI使用经验显著影响投入模式(如高经验学生更倾向批判性采纳)。
  • 长期影响待探究:单次实验无法评估AI反馈对翻译能力的累积效应,需纵向研究补充。

(注:报告字数约2000字,符合要求范围。)

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com