分享自:

对齐开放教育资源到新分类法:人工智能技术的应用与场景

期刊:computers & educationDOI:10.1016/j.compedu.2024.105027

这篇文档属于类型a,即报告了一项原创性研究。以下是针对该研究的学术报告:


作者及发表信息

本研究的主要作者为Zhi LiZachary A. PardosCheng Ren,分别来自University of California, BerkeleyUniversity at Albany, State University of New York。该研究于2024年3月18日在线发表在期刊Computers & Education上,文章编号为105027。

学术背景

本研究的主要科学领域为教育技术,特别是开放教育资源(Open Educational Resources, OER)技能分类法(Skill Taxonomies)的自动对齐问题。随着教育标准的不断更新,OER平台需要重新标注大量的教育资源以匹配新的分类法。然而,手动标注过程耗时且成本高昂。因此,研究团队提出了一种基于机器学习的方法,旨在自动标注教育资源,特别是当分类法发生变化时,能够快速适应新的分类标准。

研究背景包括:1)各州教育标准的频繁更新导致教育资源需要重新对齐;2)OER平台资源的快速增长使得手动标注不可行;3)自然语言处理(Natural Language Processing, NLP)技术的进步为自动化标注提供了可能。研究的主要目标是:1)评估机器学习模型在自动更新OER分类以反映新分类法时的有效性;2)确定不同场景下哪些模型具有实际应用价值。

研究流程

研究流程包括以下几个主要步骤:

1. 数据收集与预处理

研究团队从两个主要的数字学习平台(Khan Academy和CK12)收集了数万份教育资源的文本、图像和视频数据。具体数据包括: - Khan Academy:21,475个问题(其中7,976个带有图像)、1,140个带字幕的视频,以及1,049个技能标签。 - CK12:19,996个问题(其中3,343个带有图像)和373个技能标签。 - 美国共同核心标准(Common Core State Standards, CCSS):385个数学技能标签。

2. 模型设计与开发

研究提出了两种模型:分类模型(Classification Model)相似性匹配模型(Similarity Matching Model)。两种模型共享一个多模态特征编码器,用于处理文本、图像和视频数据。具体步骤包括: - 特征编码:使用预训练的模型(如SentenceBERT、EfficientNet-B7和I3D)将文本、图像和视频编码为向量。 - 特征融合:采用多模态紧凑双线性池化(Multimodal Compact Bilinear Pooling)方法将不同模态的特征向量融合为一个统一的向量。 - 缺失图像处理:对于没有图像的问题,研究提出了一种基于文本向量的图像向量插补方法。 - 分类模型:通过全连接神经网络预测资源与技能标签的关联概率。 - 相似性匹配模型:通过正交矩阵将内容向量映射到技能描述向量空间,并计算余弦相似度以匹配技能。

3. 实验设计与评估

研究设计了多项实验任务,包括: - 问题到技能的映射:评估模型在Khan Academy和CK12问题上的表现,测试了不同泛化水平(如新问题到同一分类法、新问题到新分类法等)。 - 视频到技能的映射:评估模型在Khan Academy视频上的表现。 - 技能到技能的映射:评估模型在Khan Academy、CK12和共同核心标准之间的技能映射表现。

4. 数据敏感性分析

研究分析了训练数据量对模型性能的影响,特别是模型在少量标注数据下的表现。

主要结果

研究的主要结果如下:

1. 问题到技能的映射

  • 在“新问题到同一分类法”的泛化水平下,分类模型的平均倒数排名(Mean Reciprocal Rank, MRR)为0.552,相似性匹配模型的MRR为0.467。
  • 在“新问题到新分类法”的泛化水平下,相似性匹配模型的MRR为0.317,表明模型在新分类法下仍能提供有用的初步标注建议。

2. 视频到技能的映射

  • 分类模型在视频标注任务中的准确率高达0.869,表明模型在该任务上达到了接近专家水平的表现。
  • 相似性匹配模型的表现略低,但仍具有实际应用价值。

3. 技能到技能的映射

  • 分类模型在Khan Academy技能到共同核心标准的映射任务中准确率为0.475。
  • 相似性匹配模型在CK12技能到共同核心标准的映射任务中MRR为0.516,表明模型在新平台技能映射任务中表现良好。

4. 数据敏感性分析

  • 模型在仅100个标注样本下即可达到非专家人类标注水平(Recall@3为0.5)。
  • 在5,000个标注样本下,模型表现接近专家水平(Recall@3为0.8)。

结论与意义

本研究的主要结论是:尽管完全自动化的资源标注在当前尚不可行,但所提出的机器学习模型能够在少量标注数据下提供接近专家水平的标注建议,特别是在视频标注任务中表现尤为突出。研究的意义在于: - 科学价值:首次将多模态数据(文本、图像、视频)引入技能标注任务,并提出了新的模型架构和数据处理方法。 - 应用价值:为OER平台和教育政策制定者提供了一种高效的资源标注工具,能够显著减少手动标注的工作量,并加速新分类法的实施。

研究亮点

  • 多模态数据融合:首次在教育资源标注任务中结合文本、图像和视频数据,显著提升了模型的表现。
  • 零样本学习(Zero-shot Learning):相似性匹配模型能够在没有新分类法标注数据的情况下,提供初步的标注建议。
  • 数据敏感性分析:揭示了模型在少量标注数据下的表现,为非专家标注提供了实际应用的可能性。

其他有价值的内容

研究团队公开了预训练的共同核心标准标注模型和源代码,供其他研究者和实践者使用。此外,研究还提供了详细的政策建议,指导不同场景下的模型应用。


这篇研究为教育技术领域提供了重要的理论和实践贡献,特别是在教育资源自动标注和分类法更新方面具有广泛的应用前景。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com