一、 研究作者、机构与发表情况
本研究由北京师范大学教育学部的Hao Yu、Huajun Zhang和通讯作者Yan Dong共同完成。研究论文以“*‘Cognitive Co-pilot’ or ‘Ghostwriter’?—The Usage Mechanism and Adjustment Strategies of Learners for Generative AI in Academic Research*”为题,发表于国际学术期刊 European Journal of Education 2026年第61卷。论文在线发表日期为2026年2月19日。
二、 学术背景与研究目标
本研究属于教育技术与人工智能交叉领域,聚焦于生成式人工智能(Generative AI, GenAI) 在学术研究中的实际应用。随着以ChatGPT、DeepSeek为代表的大型语言模型(LLMs)迅速渗透学术界,GenAI在提升研究效率、辅助认知过程方面展现出巨大潜力,但同时也带来了内容不准确、学科适应性不足、学术伦理风险(如“AI代笔效应”)和认知依赖等问题。由此引发了学界关于GenAI角色定位的激烈争论:它究竟应是赋能研究者、保持其主体性的“认知副驾驶(Cognitive Co-pilot)”,还是可能削弱原创性与学术严谨性的“代笔人(Ghostwriter)”。
现有的相关研究多从技术功能视角出发,探讨GenAI的应用价值与潜在风险,或是从技术接受模型(TAM)等视角关注用户态度与接受度,缺乏从学习者(即学生研究者)视角出发,对其具体使用过程、内在驱动力、面临的困境及应对策略的系统性、机制性探索。同时,现有研究常将学习者视为同质群体,忽视了学科背景、教育阶段等因素带来的使用模式差异。
基于此,本研究旨在填补上述研究空白,其核心目标是:从学习者视角出发,揭示GenAI辅助学术研究的使用机制,并提炼不同学习者的认知与使用模式特征。具体通过三个研究问题(RQs)展开探索:RQ1,学习者在学术研究中使用GenAI感知到的主要优势与困境是什么,这些因素如何影响其研究?RQ2,学习者如何调整使用策略以应对这些困境?RQ3,不同学习者在利用GenAI辅助学术研究时,呈现出哪些认知与使用模式特征?
三、 研究方法与详细流程
本研究采用了基于扎根理论(Grounded Theory) 的质性研究方法,通过半结构化访谈收集数据,并利用NVivo 12软件进行系统化的四阶段编码分析,最终构建理论模型。整个研究流程严谨、系统,具体步骤如下:
1. 研究设计与数据收集: * 访谈对象选取: 遵循目的性抽样和最大差异抽样原则,从中国北方一所大学中选取了18名访谈对象(编号BS1至DS9)。样本覆盖了从本科到博士的不同教育层次,以及教育、外语文学、化学、生命科学、马克思主义、物理天文、环境研究、水利科学等多个学科领域,确保了样本的多样性与代表性。其中本科生4名,硕士生5名,博士生9名;男性8名,女性10名。 * 访谈提纲设计: 围绕“认知与使用体验、优势评价、具体应用场景、技术瓶颈、伦理困境”五个核心维度,设计了半结构化访谈提纲。关键问题包括对GenAI的总体理解、使用体验与习惯改变、感知到的主要优势与具体影响、典型学术任务应用实例、遇到的技术困难及应对方式、以及对伦理问题的考量和处理方式。 * 数据收集与整理: 访谈于2025年6月至9月间进行,采用线上或线下形式,每次持续30-45分钟。在获得知情同意后,所有访谈被全程录音并转录成文字稿。经双人转录与交叉核对,最终形成了约8.2万字的访谈文本。文本在导入NVivo软件前进行了预处理,标注了情绪词、行为描述和学科差异表达。
2. 质性数据分析(四阶段编码): 本研究的数据分析严格遵循并扩展了Strauss和Corbin的经典扎根理论编码体系,增加了第四级的理论补充编码,形成了一套完整、深入的分析流程。
第一阶段:开放式编码(Open Coding): 研究者逐句分析访谈文本,提取语义单元和初始概念。通过对623个有效语义单元的编码,最终形成了118个初始概念,并将其进一步归纳凝练为16个子类别。例如,从“节省了文献整理时间”、“增加了论文写作速度”等陈述中提取出“时间节省与效率提升”这一初始概念,最终归纳为“效率感知”子类别。其他子类别还包括“认知补充”、“学术需求匹配”、“内容不准确”、“逻辑泛化”、“学科适应性低”、“数据隐私担忧”、“原创性模糊”等。
第二阶段:主轴式编码(Axial Coding): 通过持续比较法,分析16个子类别之间的逻辑关系,将其归纳为3个主类别,并厘清了每个主类别的内涵与边界。 * 优势驱动因素: 包含效率感知、认知补充、学术需求匹配3个子类,指驱动学习者开始并持续使用GenAI的核心动力。 * 困境约束因素: 包含技术限制(如内容不准确、逻辑泛化)、学科适应性低、伦理风险(数据隐私、原创性模糊)、认知依赖4个子类,指阻碍学习者有效使用GenAI的负面因素。 * 使用调整策略: 包含工具优化、指令优化、内容验证、风险规避、认知与边界重构等子类,指学习者为应对困境而采取的主动调整行为。
第三阶段:选择性编码(Selective Coding): 确定核心范畴为“学习者使用GenAI辅助学术研究的机制”。围绕该核心范畴,梳理出各主类别间的逻辑关系,形成一个完整的故事线:学习者在学术研究中,受到效率、认知、需求三重优势驱动而开始使用GenAI;在使用过程中,遭遇技术、学科、伦理、认知四重困境的约束;为突破约束,学习者采取“风险规避”与“效果优化”两类调整策略,实现对GenAI使用的动态优化。最终,构建出一个“优势驱动—困境约束—调整策略”的闭环使用机制理论模型。
第四阶段:补充理论编码(Supplementary Theoretical Coding): 在三级编码结果的基础上,本研究进行了更深层次的抽象与整合。通过深入归纳原始文本,根据学习者的认知与使用模式特征,对用户进行了归类分析,提炼出GenAI使用机制背后五种抽象的存在模式:工具性存在、差异性存在、矛盾性存在、流动性存在、反思性存在。这五种模式超越了具体的使用场景,揭示了使用机制的普遍性特征。
3. 研究的信度与效度保障: 为确保研究结论的科学性与可信度,本研究采取了多项严谨措施: * 双盲编码: 由两位熟悉扎根理论的研究者独立对同一批访谈文本进行编码,计算得出编码者间一致性系数(Krippendorff‘s α)为0.86,高于可接受的0.8标准,验证了编码过程的可靠性。 * 理论饱和度检验: 在编码至第15名参与者时,未出现新的概念或子类别。随后对剩余3名参与者的文本进行编码,仍未发现新的维度,判定研究已达到理论饱和。 * 参与者验证: 将构建的使用机制模型反馈给6名随机选取的参与者。其中5名表示模型“完全符合实际使用过程”,1名认为基本一致但学科差异部分可进一步细化,总体验证了模型的可信度与实践拟合度。
四、 主要研究结果
本研究的结果主要体现在两个方面:一是构建了一个完整的理论模型,二是提炼了五种核心的存在模式。研究结果紧密回应了三个研究问题。
1. GenAI辅助学术研究的“优势驱动—困境约束—调整策略”使用机制模型 * 优势驱动因素(触发使用行为): * 效率感知: 这是最核心的初始驱动力。16名参与者明确提及“节省时间”。本科生多用于生成研究表格、计算配比等操作性任务(如BS3用AI计算人工脑脊液分子量);研究生则扩展到文献核心观点总结、研究热点梳理等(如MS5用AI总结5年内化学教育研究热点,节省3天检索时间)。 * 认知补充: 主要用于填补知识空白,且效果呈现梯度差异。本科生用于解释专业术语和原理(如BS1理解拉格朗日中值定理的应用场景);博士生则用于补充跨学科知识(如DS3,物理专业者用AI理解计算机数据可视化算法)。 * 学术需求匹配: 体现GenAI对整个学术研究流程的适应性,覆盖文献综述、论文写作、数据处理、结果优化等环节,但适应性程度不同。例如,BS2用AI从日语论文中提取敬语演变趋势;MS2用AI调整复杂反应条件的句式;DS9用AI修正英文摘要中的中式表达。
困境约束因素(阻碍使用效果): * 技术限制: 所有18名参与者均提及。具体包括:内容不准确(如AI虚构文献引用、误译专业名词);逻辑泛化(如给出的观点流于常识、框架过于模式化,缺乏深度与针对性);技术卡顿(如上传大量文献时崩溃、响应延迟)。 * 学科适应性低: 呈现明显的学科分化特征。STEM(科学、技术、工程、数学)领域学习者主要面临数据处理能力不足的问题(如DS3指出AI推荐的粒子物理算法并非前沿,无法处理小样本数据)。人文社科领域学习者则遇到立场偏见和语言表达僵化的问题(如BS2发现AI生成的中日文化比较文稿偏向日本立场;MS3指出AI写的教育政策分析语言过于口语化)。处理外文文献困难是跨学科的共同限制。 * 伦理风险: 主要集中在数据隐私和学术原创性模糊两个维度,并表现出一定的学历相关性。学历越高,对数据隐私的担忧越强(如DS1担心未发表的博士论文被AI存储泄露)。原创性模糊则引发广泛担忧(如DS8难以区分AI观点与原创观点;MS3论文经AI润色后检测率高达25%)。 * 认知依赖: 长期使用可能削弱独立思考与创新能力。这在本科和硕士生中更为突出(如BS2最初依赖AI产生日语论文思路,导致独立写作时毫无头绪)。博士生也意识到潜在风险(如DS7担心依赖AI产生关于教育本质的想法,会忽视对经典著作的阅读)。
使用调整策略(优化使用过程): * 工具选择与指令优化: 为应对技术限制,学习者通过更换工具(如从DeepSeek换到豆包)、精细化提问(添加时间、案例等限制条件)、分步式提问等方式,提升AI反馈的针对性与准确性。 * 内容验证与风险规避: 为应对内容准确性不足和伦理风险,学习者采取严格的人工验证(如DS1要求AI标注的文献必须在CNKI或Web of Science核实)、风险规避(如MS2明确只上传公开数据,DS4在让AI修改论文前删除作者、基金等敏感信息)。 * 认知与边界重构: 这是应对认知依赖和原创性模糊的核心策略。学习者主动调整认知,明确人机协作的合理边界。例如,将AI定位为“工具,而非导师”(MS4);调整合作模式为“先自己构建大纲,再用AI填充细节”(BS2);坚持“在使用AI拓宽思路前,先阅读经典著作以确保基本认知”(DS7),从而始终保持人在学术研究中的主导地位。
2. GenAI使用机制的五种存在模式(回应RQ3) 基于编码和访谈数据,本研究凝练了五种本质性的存在模式,反映了不同学习者认知与使用模式的抽象特征: * 工具性存在: GenAI本质上是一种学术辅助工具,但学习者对其定位存在差异。博士生和STEM学习者多视其为强调功能性与可验证性的“功能性工具”;本科生和人文社科学习者则更倾向于视其为强调交互性与陪伴感的“学术伙伴”。无论哪种定位,都以辅助学术研究为核心,否定了将其作为完全替代的“代笔人”的倾向。 * 差异性存在: 使用特征存在显著的学科和学历双重分野。学科上,STEM学习者关注数据准确性与技术适应性;人文社科学习者关注语言润色与立场正确性。学历上,随着教育层次提高,使用场景越发精准(从本科生的基础任务到博士生的专项问题解决),对AI输出的验证意识也逐步增强。 * 矛盾性存在: 学习者在使用中面临两组核心张力平衡。一是效率与质量的矛盾:AI节省时间,但验证错误需额外耗时,有时总效率反而不如手动完成。二是依赖与原创的矛盾:需要在AI提供的思路支持与保持自身独立思考能力之间动态划界。 * 流动性存在: 使用场景和策略并非静态,而是随着研究任务进展和约束因素变化而动态调整。例如,在研究的不同阶段(前期选题、中期综述、后期润色)使用AI的不同功能;根据风险认知调整使用强度(从直接生成论文到仅用于润色建议)。 * 反思性存在: 学习者通过“反思—调整—迭代”的过程持续优化使用行为。例如,BS2从“不假思索地向AI要想法”转变为“先自己思考,再用AI补充”;MS3记录每次使用AI的“优、缺点及改进策略”并积累笔记。这种反思性实践是学习者将Genai转化为合格“认知副驾驶”的关键能力。
五、 研究结论与价值意义
本研究通过扎根理论方法,系统构建了学习者使用GenAI辅助学术研究的闭环机制模型,并提炼了其背后五种抽象的存在模式。主要结论包括:
使用机制是“驱动—约束—调整”的动态闭环: 学习者的使用行为由效率、认知和需求优势驱动,同时受到技术、学科、伦理和认知四重困境的约束。为应对约束,学习者发展出工具、内容和认知三个层面的调整策略,从而实现对GenAI使用的持续优化。这一机制清晰地描绘了学习者从接触、使用到适应GenAI的完整认知与行为路径。
GenAI的本质是“认知副驾驶”,其有效性的关键在于人的主体性坚守: 研究揭示,无论学习者将AI视为“功能性工具”还是“学术伙伴”,其核心都是坚持人类在学术研究中的主导地位。只有通过学习者主动的策略调整(尤其是认知与边界重构),明确“辅助而非替代”的定位,才能让GenAI有效赋能研究,避免其滑向消除原创性、导致认知依赖的“代笔人”。
存在显著的差异化使用模式: 不同学科背景和教育阶段的学习者,在使用场景、关注重点、验证意识和依赖程度上均存在系统性差异。这表明对GenAI的引导和支持不能采取“一刀切”的方式,必须考虑到用户的异质性。
本研究的价值体现在理论与实践两个层面: * 理论价值: 填补了现有研究“重技术、轻用户”的局限,首次从学习者视角系统揭示了GenAI在学术研究中的微观使用机制和内在逻辑。它将GenAI在学术中的应用研究,从功能罗列和态度调查,推进到了对行为过程、认知互动和策略形成的深度理解。提出的五种存在模式为理解人机协作的复杂性提供了新的理论视角。 * 实践价值: 为多方利益相关者提供了实证依据和行动指南。对学习者而言,强调了明确AI辅助定位、强化验证意识、保护数据隐私和规范使用声明的重要性,为其负责任地使用AI、坚守学术伦理提供了具体策略。对教育者而言,揭示了基于学科和学历的差异化指导需求,为实施精准教学与学术规范训练提供了依据。对技术开发者而言,指出了优化GenAI学科适应性(如提升STEM领域数据处理准确性、纠正人文领域立场偏见)的明确方向。
六、 研究亮点
七、 研究局限与未来展望
研究者也指出了本研究的局限性:样本量较小(18人),学科覆盖仍相对有限,结论的普适性有待更大规模研究的验证;采用横截面访谈设计,未能追踪学习者使用行为的长期演变过程;未关注职业院校、私立大学等不同类型高校间的潜在差异。
未来研究可以扩大样本量与学科覆盖面,开展纵向追踪研究以捕捉行为变化,结合量化研究方法验证理论模型,并深入探索个体心理特征对GenAI使用机制的影响,从而为GenAI在学术研究中的规范化应用提供更全面的支持。