该文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:
主要作者及研究机构
该研究由željana bašić、ana banovac、ivana kružić和ivan jerković共同完成,他们均来自克罗地亚斯普利特大学法医科学系。研究论文于2023年发表在期刊《Humanities and Social Sciences Communications》上。
学术背景
该研究属于教育技术与人工智能交叉领域,主要探讨了ChatGPT-3.5作为写作辅助工具在学术写作中的应用效果。随着ChatGPT-3.5的发布,其在文本生成、翻译、摘要撰写和问答等任务中表现出色,已被证明能够生成高质量的摘要、研究论文和论文。然而,ChatGPT在学术写作中的使用引发了伦理问题,如AI作者身份和学术作品评估的争议。尽管已有研究探讨了ChatGPT在生成学术内容方面的能力,但ChatGPT作为写作辅助工具在学生环境中的表现及其是否能够提升学生的写作能力仍不明确。因此,本研究旨在通过实验评估ChatGPT是否能够提高学生的论文成绩、减少写作时间以及影响文本的原创性。
研究流程
研究分为以下几个步骤:
1. 研究对象与分组:研究邀请了斯普利特大学法医科学系的50名硕士二年级学生,最终有18名学生自愿参与。根据研究模块和加权平均绩点(GPA),将学生分为对照组(n=9)和实验组(n=9)。对照组采用传统方式撰写论文,实验组则使用ChatGPT-3.5作为写作辅助工具。
2. 实验设计:两组学生均被要求撰写一篇关于“生物识别技术在法医科学中的优缺点”的论文,字数在800-1000字之间,使用克罗地亚语并遵循Vancouver引用格式。实验组学生被允许自由使用ChatGPT进行全文撰写、概念草稿、主题相关问题或修改建议等操作。
3. 写作与评分:学生有4小时完成写作任务,完成后由两名教师根据Schreyer Institute for Teaching Excellence的评分标准对论文进行评分,评分标准包括内容、风格、格式和语法四个方面,最终成绩为四项得分的平均值。
4. 文本原创性检测:使用PlagScan检测每篇论文的原创性,并通过R Studio和textreuse包进行文本相似性分析。同时,使用AI文本分类器检测文本是否由AI生成。
5. 数据分析:使用Excel和R Studio进行统计分析和可视化,采用线性回归模型分析组别、写作时间、研究模块和GPA对论文成绩的影响。
主要结果
1. 论文成绩:实验组和对照组的平均论文成绩均为C,对照组略高(2.39±0.71 vs. 2.00±0.73)。线性回归分析显示,组别、写作时间、研究模块和GPA对论文成绩均无显著影响。
2. 写作时间:实验组的平均写作时间为172.22±31.59分钟,对照组为179.11±31.93分钟,两组无显著差异。
3. 文本原创性:实验组的文本非原创性比例略高(11.87%±13.45 vs. 9.96%±9.81%),但整体样本的文本相似性较低(Jaccard相似性指数中位数为0.002)。
4. AI生成文本检测:实验组中有3篇文本被标记为“可能”由AI生成,5篇为“很可能”由AI生成,1篇为“不明确”。对照组中有2篇为“可能”,1篇为“很可能”,2篇为“不太可能”,4篇为“不明确”。
5. GPA与成绩关系:GPA较高的学生在对照组中表现更好,而在实验组中,GPA与成绩的关系较弱。
6. 非原创性与成绩关系:实验组中,非原创性比例较高的学生论文成绩较低。
结论与意义
研究表明,使用ChatGPT-3.5作为写作辅助工具并未显著提高学生的论文成绩、写作速度或文本原创性。相反,实验组的学生可能因过度依赖ChatGPT或对其不熟悉而导致表现不佳。这一发现与部分研究结果一致,即ChatGPT在缺乏深度理解主题的情况下,可能导致写作质量下降。此外,AI生成文本检测工具的局限性也表明,需要开发更准确的多语言检测算法。尽管ChatGPT在学术写作中的应用引发担忧,但本研究结果并未显示其显著负面影响,提示学术界对其使用的担忧可能被夸大。然而,ChatGPT的使用仍可能因学生对其不熟悉而影响写作效果,特别是在缺乏指导的情况下。
研究亮点
1. 首次实验验证:本研究是首次在学生样本中测试ChatGPT-3.5作为写作辅助工具的效果,填补了相关领域的研究空白。
2. 多维度评估:研究从论文成绩、写作时间和文本原创性三个维度全面评估了ChatGPT的使用效果,提供了更全面的视角。
3. 现实情境模拟:研究设计模拟了学生使用ChatGPT完成学术任务的实际情境,增强了研究结果的外部效度。
4. 多语言研究:研究使用克罗地亚语进行实验,揭示了AI生成文本检测工具在多语言环境中的局限性,为未来研究提供了重要参考。
其他有价值的内容
研究还指出,ChatGPT的使用效果可能取决于用户的知识水平和技能,经验丰富的用户可能更擅长利用ChatGPT生成高质量内容。此外,ChatGPT在写作初期的加速作用可能被后期整合和修改的时间所抵消,这提示ChatGPT的使用可能并不总能提高写作效率。未来研究应扩大样本规模,探索不同语言和文化背景下ChatGPT的使用效果,并进一步分析用户提问质量对生成内容的影响。