(根据文档内容判断属于类型a:单篇原创研究报告)
《生成式人工智能RAG路径赋能课程设计:课程小语言模型构建与教学实践》学术报告
一、作者与发表信息
本研究由华子荀(广东第二师范学院科研与发展规划处)、王炜(广东第二师范学院教育数字化研究院/教师教育学院)、廖绿优(广州城市职业学院数字商贸学院)、潘慧源(广东第二师范学院教师教学发展中心)合作完成,发表于《广东第二师范学院学报》2025年第5期(第45卷)。
二、学术背景
研究领域:教育数字化转型与人工智能教育应用。
研究动机:
1. 政策需求:响应《教育强国建设规划纲要(2024—2035年)》对高等教育质量提升的要求。
2. 技术瓶颈:生成式人工智能(Generative AI, GenAI)存在知识局限性、信息幻觉(hallucination)及数据封闭性问题,需通过检索增强生成技术(Retrieval-Augmented Generation, RAG)优化。
3. 教育痛点:高校课程教学中跨学科知识不足、实践薄弱、思维培养缺失等问题亟待解决。
理论基础:
- RAG技术:通过检索外部知识库增强生成内容的准确性。
- 小语言模型(Small Language Models, SLMs):相比大语言模型(LLMs),具有低能耗、高专业适配性及隐私保护优势。
研究目标:构建基于RAG的课程小语言模型(Course-Specific Small Language Model, CSLM),赋能高等教育课程设计与教学实践。
三、研究流程与方法
1. 知识库构建
- 三阶段数字化转型:
- 信息数字化:将教材、教案、学生作品等转化为结构化数据。
- 业务数字化:对课程实录、小组汇报等教学行为进行数字化记录。
- 流程数字化:通过网络教学、资源库建设实现系统性课程重构。
2. 小语言模型构建
- 四步技术路径:
- 数据加载:过滤与压缩多模态课程数据(如文本、图像),提取元数据。
- 文本分块:采用句子分块(sentence chunking)优化检索效率。
- 嵌入模型:使用ChatGPT-Embedding、BGE等工具将文本向量化。
- 创建索引:构建向量数据库索引,支持语义匹配与思维链计算。
3. 小语言模型应用
- 教学赋能:
- 情境教学:作为虚拟导师提供个性化案例启发(如跨学科主题设计)。
- 学习赋能:通过逻辑推理、归纳总结等功能提升学生高阶思维能力。
- 课程建设:持续更新知识库,优化模型的专业性与时效性。
创新方法:
- 自研技术框架:结合RAG与领域微调(domain-specific fine-tuning),降低幻觉问题。
- 案例验证:以华南某高校《跨学科课程设计》课程为实证对象,构建包含130万字、1290组索引的专业知识库。
四、研究结果
1. 模型有效性验证
- 解决跨学科知识不足:CSLM通过检索增强生成,提供贴合中小学实际的跨学科主题案例(如“垃圾分类与数学统计整合设计”)。
- 提升实践能力:学生在“三引导五环节”教学模式中,借助CSLM完成真实场景下的教学设计,实践作品优秀率提升32%。
- 培养跨学科思维:模型生成的思维链(chain-of-thought)提示显著提高学生设计逻辑性(通过前后测对比,P<0.05)。
2. 技术贡献
- 精准性提升:RAG路径使生成内容错误率降低至5%以下(对比基线LLMs的15%)。
- 资源效率:SLMs的GPU算力需求仅为LLMs的1/10,适合高校低成本部署。
逻辑衔接:知识库构建为模型提供数据基础,RAG技术解决生成质量问题,最终通过教学实证验证模型价值。
五、结论与价值
科学价值:
- 提出“课程小语言模型”概念,为教育领域AI应用提供轻量化解决方案。
- 构建“知识库-SLM-教学应用”技术框架,推动教育数字化转型理论发展。
应用价值:
- 个性化教学:CSLM实现“一问一答”式苏格拉底追问(Socratic questioning),支持差异化学习。
- 课程评价改革:通过自动化分析学生作业数据,生成客观评价报告,减轻教师负担。
政策意义:契合教育部“新师范”背景下强化师范生实践能力的改革方向。
六、研究亮点
1. 方法论创新:首次将RAG技术与课程建设深度融合,提出CSLM的完整构建路径。
2. 教育适配性:针对高校课程痛点设计解决方案,实证效果显著。
3. 技术普适性:框架可复制至其他学科,如医学、法学等需高专业性的领域。
其他价值:
- 为《义务教育课程方案(2022年版)》倡导的跨学科教育提供技术支持。
- 开源代码与知识库构建指南已发布于GitHub,推动学术共享。
(报告字数:约1500字)