生成式人工智能在学术研究中的使用机制与调整策略——学习者的视角

分享自：
生成式人工智能在学术研究中的使用机制与调整策略——学习者的视角

期刊:european journal of educationDOI:10.1111/ejed.70563
一、 研究作者、机构与发表情况
本研究由北京师范大学教育学部的Hao Yu、Huajun Zhang和通讯作者Yan Dong共同完成。研究论文以“*‘Cognitive Co-pilot’ or ‘Ghostwriter’?—The Usage Mechanism and Adjustment Strategies of Learners for Generative AI in Academic Research*”为题，发表于国际学术期刊 European Journal of Education 2026年第61卷。论文在线发表日期为2026年2月19日。
二、 学术背景与研究目标
本研究属于教育技术与人工智能交叉领域，聚焦于生成式人工智能（Generative AI， GenAI） 在学术研究中的实际应用。随着以ChatGPT、DeepSeek为代表的大型语言模型（LLMs）迅速渗透学术界，GenAI在提升研究效率、辅助认知过程方面展现出巨大潜力，但同时也带来了内容不准确、学科适应性不足、学术伦理风险（如“AI代笔效应”）和认知依赖等问题。由此引发了学界关于GenAI角色定位的激烈争论：它究竟应是赋能研究者、保持其主体性的“认知副驾驶（Cognitive Co-pilot）”，还是可能削弱原创性与学术严谨性的“代笔人（Ghostwriter）”。
现有的相关研究多从技术功能视角出发，探讨GenAI的应用价值与潜在风险，或是从技术接受模型（TAM）等视角关注用户态度与接受度，缺乏从学习者（即学生研究者）视角出发，对其具体使用过程、内在驱动力、面临的困境及应对策略的系统性、机制性探索。同时，现有研究常将学习者视为同质群体，忽视了学科背景、教育阶段等因素带来的使用模式差异。
基于此，本研究旨在填补上述研究空白，其核心目标是：从学习者视角出发，揭示GenAI辅助学术研究的使用机制，并提炼不同学习者的认知与使用模式特征。具体通过三个研究问题（RQs）展开探索：RQ1，学习者在学术研究中使用GenAI感知到的主要优势与困境是什么，这些因素如何影响其研究？RQ2，学习者如何调整使用策略以应对这些困境？RQ3，不同学习者在利用GenAI辅助学术研究时，呈现出哪些认知与使用模式特征？
三、 研究方法与详细流程
本研究采用了基于扎根理论（Grounded Theory） 的质性研究方法，通过半结构化访谈收集数据，并利用NVivo 12软件进行系统化的四阶段编码分析，最终构建理论模型。整个研究流程严谨、系统，具体步骤如下：
1. 研究设计与数据收集： * 访谈对象选取： 遵循目的性抽样和最大差异抽样原则，从中国北方一所大学中选取了18名访谈对象（编号BS1至DS9）。样本覆盖了从本科到博士的不同教育层次，以及教育、外语文学、化学、生命科学、马克思主义、物理天文、环境研究、水利科学等多个学科领域，确保了样本的多样性与代表性。其中本科生4名，硕士生5名，博士生9名；男性8名，女性10名。 * 访谈提纲设计： 围绕“认知与使用体验、优势评价、具体应用场景、技术瓶颈、伦理困境”五个核心维度，设计了半结构化访谈提纲。关键问题包括对GenAI的总体理解、使用体验与习惯改变、感知到的主要优势与具体影响、典型学术任务应用实例、遇到的技术困难及应对方式、以及对伦理问题的考量和处理方式。 * 数据收集与整理： 访谈于2025年6月至9月间进行，采用线上或线下形式，每次持续30-45分钟。在获得知情同意后，所有访谈被全程录音并转录成文字稿。经双人转录与交叉核对，最终形成了约8.2万字的访谈文本。文本在导入NVivo软件前进行了预处理，标注了情绪词、行为描述和学科差异表达。
2. 质性数据分析（四阶段编码）： 本研究的数据分析严格遵循并扩展了Strauss和Corbin的经典扎根理论编码体系，增加了第四级的理论补充编码，形成了一套完整、深入的分析流程。
第一阶段：开放式编码（Open Coding）： 研究者逐句分析访谈文本，提取语义单元和初始概念。通过对623个有效语义单元的编码，最终形成了118个初始概念，并将其进一步归纳凝练为16个子类别。例如，从“节省了文献整理时间”、“增加了论文写作速度”等陈述中提取出“时间节省与效率提升”这一初始概念，最终归纳为“效率感知”子类别。其他子类别还包括“认知补充”、“学术需求匹配”、“内容不准确”、“逻辑泛化”、“学科适应性低”、“数据隐私担忧”、“原创性模糊”等。
第二阶段：主轴式编码（Axial Coding）： 通过持续比较法，分析16个子类别之间的逻辑关系，将其归纳为3个主类别，并厘清了每个主类别的内涵与边界。 * 优势驱动因素： 包含效率感知、认知补充、学术需求匹配3个子类，指驱动学习者开始并持续使用GenAI的核心动力。 * 困境约束因素： 包含技术限制（如内容不准确、逻辑泛化）、学科适应性低、伦理风险（数据隐私、原创性模糊）、认知依赖4个子类，指阻碍学习者有效使用GenAI的负面因素。 * 使用调整策略： 包含工具优化、指令优化、内容验证、风险规避、认知与边界重构等子类，指学习者为应对困境而采取的主动调整行为。
第三阶段：选择性编码（Selective Coding）： 确定核心范畴为“学习者使用GenAI辅助学术研究的机制”。围绕该核心范畴，梳理出各主类别间的逻辑关系，形成一个完整的故事线：学习者在学术研究中，受到效率、认知、需求三重优势驱动而开始使用GenAI；在使用过程中，遭遇技术、学科、伦理、认知四重困境的约束；为突破约束，学习者采取“风险规避”与“效果优化”两类调整策略，实现对GenAI使用的动态优化。最终，构建出一个“优势驱动—困境约束—调整策略”的闭环使用机制理论模型。
第四阶段：补充理论编码（Supplementary Theoretical Coding）： 在三级编码结果的基础上，本研究进行了更深层次的抽象与整合。通过深入归纳原始文本，根据学习者的认知与使用模式特征，对用户进行了归类分析，提炼出GenAI使用机制背后五种抽象的存在模式：工具性存在、差异性存在、矛盾性存在、流动性存在、反思性存在。这五种模式超越了具体的使用场景，揭示了使用机制的普遍性特征。
3. 研究的信度与效度保障： 为确保研究结论的科学性与可信度，本研究采取了多项严谨措施： * 双盲编码： 由两位熟悉扎根理论的研究者独立对同一批访谈文本进行编码，计算得出编码者间一致性系数（Krippendorff‘s α）为0.86，高于可接受的0.8标准，验证了编码过程的可靠性。 * 理论饱和度检验： 在编码至第15名参与者时，未出现新的概念或子类别。随后对剩余3名参与者的文本进行编码，仍未发现新的维度，判定研究已达到理论饱和。 * 参与者验证： 将构建的使用机制模型反馈给6名随机选取的参与者。其中5名表示模型“完全符合实际使用过程”，1名认为基本一致但学科差异部分可进一步细化，总体验证了模型的可信度与实践拟合度。
四、 主要研究结果
本研究的结果主要体现在两个方面：一是构建了一个完整的理论模型，二是提炼了五种核心的存在模式。研究结果紧密回应了三个研究问题。
1. GenAI辅助学术研究的“优势驱动—困境约束—调整策略”使用机制模型 * 优势驱动因素（触发使用行为）： * 效率感知： 这是最核心的初始驱动力。16名参与者明确提及“节省时间”。本科生多用于生成研究表格、计算配比等操作性任务（如BS3用AI计算人工脑脊液分子量）；研究生则扩展到文献核心观点总结、研究热点梳理等（如MS5用AI总结5年内化学教育研究热点，节省3天检索时间）。 * 认知补充： 主要用于填补知识空白，且效果呈现梯度差异。本科生用于解释专业术语和原理（如BS1理解拉格朗日中值定理的应用场景）；博士生则用于补充跨学科知识（如DS3，物理专业者用AI理解计算机数据可视化算法）。 * 学术需求匹配： 体现GenAI对整个学术研究流程的适应性，覆盖文献综述、论文写作、数据处理、结果优化等环节，但适应性程度不同。例如，BS2用AI从日语论文中提取敬语演变趋势；MS2用AI调整复杂反应条件的句式；DS9用AI修正英文摘要中的中式表达。
困境约束因素（阻碍使用效果）： * 技术限制： 所有18名参与者均提及。具体包括：内容不准确（如AI虚构文献引用、误译专业名词）；逻辑泛化（如给出的观点流于常识、框架过于模式化，缺乏深度与针对性）；技术卡顿（如上传大量文献时崩溃、响应延迟）。 * 学科适应性低： 呈现明显的学科分化特征。STEM（科学、技术、工程、数学）领域学习者主要面临数据处理能力不足的问题（如DS3指出AI推荐的粒子物理算法并非前沿，无法处理小样本数据）。人文社科领域学习者则遇到立场偏见和语言表达僵化的问题（如BS2发现AI生成的中日文化比较文稿偏向日本立场；MS3指出AI写的教育政策分析语言过于口语化）。处理外文文献困难是跨学科的共同限制。 * 伦理风险： 主要集中在数据隐私和学术原创性模糊两个维度，并表现出一定的学历相关性。学历越高，对数据隐私的担忧越强（如DS1担心未发表的博士论文被AI存储泄露）。原创性模糊则引发广泛担忧（如DS8难以区分AI观点与原创观点；MS3论文经AI润色后检测率高达25%）。 * 认知依赖： 长期使用可能削弱独立思考与创新能力。这在本科和硕士生中更为突出（如BS2最初依赖AI产生日语论文思路，导致独立写作时毫无头绪）。博士生也意识到潜在风险（如DS7担心依赖AI产生关于教育本质的想法，会忽视对经典著作的阅读）。
使用调整策略（优化使用过程）： * 工具选择与指令优化： 为应对技术限制，学习者通过更换工具（如从DeepSeek换到豆包）、精细化提问（添加时间、案例等限制条件）、分步式提问等方式，提升AI反馈的针对性与准确性。 * 内容验证与风险规避： 为应对内容准确性不足和伦理风险，学习者采取严格的人工验证（如DS1要求AI标注的文献必须在CNKI或Web of Science核实）、风险规避（如MS2明确只上传公开数据，DS4在让AI修改论文前删除作者、基金等敏感信息）。 * 认知与边界重构： 这是应对认知依赖和原创性模糊的核心策略。学习者主动调整认知，明确人机协作的合理边界。例如，将AI定位为“工具，而非导师”（MS4）；调整合作模式为“先自己构建大纲，再用AI填充细节”（BS2）；坚持“在使用AI拓宽思路前，先阅读经典著作以确保基本认知”（DS7），从而始终保持人在学术研究中的主导地位。
2. GenAI使用机制的五种存在模式（回应RQ3） 基于编码和访谈数据，本研究凝练了五种本质性的存在模式，反映了不同学习者认知与使用模式的抽象特征： * 工具性存在： GenAI本质上是一种学术辅助工具，但学习者对其定位存在差异。博士生和STEM学习者多视其为强调功能性与可验证性的“功能性工具”；本科生和人文社科学习者则更倾向于视其为强调交互性与陪伴感的“学术伙伴”。无论哪种定位，都以辅助学术研究为核心，否定了将其作为完全替代的“代笔人”的倾向。 * 差异性存在： 使用特征存在显著的学科和学历双重分野。学科上，STEM学习者关注数据准确性与技术适应性；人文社科学习者关注语言润色与立场正确性。学历上，随着教育层次提高，使用场景越发精准（从本科生的基础任务到博士生的专项问题解决），对AI输出的验证意识也逐步增强。 * 矛盾性存在： 学习者在使用中面临两组核心张力平衡。一是效率与质量的矛盾：AI节省时间，但验证错误需额外耗时，有时总效率反而不如手动完成。二是依赖与原创的矛盾：需要在AI提供的思路支持与保持自身独立思考能力之间动态划界。 * 流动性存在： 使用场景和策略并非静态，而是随着研究任务进展和约束因素变化而动态调整。例如，在研究的不同阶段（前期选题、中期综述、后期润色）使用AI的不同功能；根据风险认知调整使用强度（从直接生成论文到仅用于润色建议）。 * 反思性存在： 学习者通过“反思—调整—迭代”的过程持续优化使用行为。例如，BS2从“不假思索地向AI要想法”转变为“先自己思考，再用AI补充”；MS3记录每次使用AI的“优、缺点及改进策略”并积累笔记。这种反思性实践是学习者将Genai转化为合格“认知副驾驶”的关键能力。
五、 研究结论与价值意义
本研究通过扎根理论方法，系统构建了学习者使用GenAI辅助学术研究的闭环机制模型，并提炼了其背后五种抽象的存在模式。主要结论包括：
使用机制是“驱动—约束—调整”的动态闭环： 学习者的使用行为由效率、认知和需求优势驱动，同时受到技术、学科、伦理和认知四重困境的约束。为应对约束，学习者发展出工具、内容和认知三个层面的调整策略，从而实现对GenAI使用的持续优化。这一机制清晰地描绘了学习者从接触、使用到适应GenAI的完整认知与行为路径。
GenAI的本质是“认知副驾驶”，其有效性的关键在于人的主体性坚守： 研究揭示，无论学习者将AI视为“功能性工具”还是“学术伙伴”，其核心都是坚持人类在学术研究中的主导地位。只有通过学习者主动的策略调整（尤其是认知与边界重构），明确“辅助而非替代”的定位，才能让GenAI有效赋能研究，避免其滑向消除原创性、导致认知依赖的“代笔人”。
存在显著的差异化使用模式： 不同学科背景和教育阶段的学习者，在使用场景、关注重点、验证意识和依赖程度上均存在系统性差异。这表明对GenAI的引导和支持不能采取“一刀切”的方式，必须考虑到用户的异质性。
本研究的价值体现在理论与实践两个层面： * 理论价值： 填补了现有研究“重技术、轻用户”的局限，首次从学习者视角系统揭示了GenAI在学术研究中的微观使用机制和内在逻辑。它将GenAI在学术中的应用研究，从功能罗列和态度调查，推进到了对行为过程、认知互动和策略形成的深度理解。提出的五种存在模式为理解人机协作的复杂性提供了新的理论视角。 * 实践价值： 为多方利益相关者提供了实证依据和行动指南。对学习者而言，强调了明确AI辅助定位、强化验证意识、保护数据隐私和规范使用声明的重要性，为其负责任地使用AI、坚守学术伦理提供了具体策略。对教育者而言，揭示了基于学科和学历的差异化指导需求，为实施精准教学与学术规范训练提供了依据。对技术开发者而言，指出了优化GenAI学科适应性（如提升STEM领域数据处理准确性、纠正人文领域立场偏见）的明确方向。
六、 研究亮点
视角新颖，聚焦用户机制： 突破技术中心论，从学习者（用户）的微观体验和过程视角出发，深入探究GenAI在真实学术研究场景中的使用逻辑，选题具有重要的前沿性和现实意义。
方法严谨，理论构建扎实： 采用经典的扎根理论质性研究方法，通过系统的四阶段编码分析，并辅以双盲编码、理论饱和检验和参与者验证，确保了研究过程的科学性与结论的可信度，最终构建了一个完整且具有解释力的理论模型。
发现深刻，提炼多重模式： 不仅揭示了“驱动—约束—调整”的动态机制，还进一步抽象出“工具性、差异性、矛盾性、流动性、反思性”五种存在模式，深化了对人机协作复杂性的理解，理论贡献突出。
结论具有强实践指向性： 研究结论直接指向学习者、教育者和开发者三类核心群体，提出的建议具体、可操作，对于推动GenAI在学术领域的健康、规范和有效应用具有重要的指导价值。
七、 研究局限与未来展望
研究者也指出了本研究的局限性：样本量较小（18人），学科覆盖仍相对有限，结论的普适性有待更大规模研究的验证；采用横截面访谈设计，未能追踪学习者使用行为的长期演变过程；未关注职业院校、私立大学等不同类型高校间的潜在差异。
未来研究可以扩大样本量与学科覆盖面，开展纵向追踪研究以捕捉行为变化，结合量化研究方法验证理论模型，并深入探索个体心理特征对GenAI使用机制的影响，从而为GenAI在学术研究中的规范化应用提供更全面的支持。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问