本文题为《HGKT: Hypergraph-based Knowledge Tracing for Learner Performance Prediction》,主要作者包括Yuwei Ye和Zhilong Shan,分别来自South China Normal University(华南师范大学)计算机科学学院及人工智能学院。该研究发表于2023年于IEEE《International Joint Conference on Neural Networks (IJCNN)》。本文提出了一种基于超图(Hypergraph)的知识追踪(Knowledge Tracing, KT)方法,用于预测学习者的学习表现。
知识追踪(KT)是智能教育系统(ITS)中的关键任务之一,其目的是追踪学习者知识状态的变化,并基于学习历史数据预测其在未来答题中的表现。近年来,图神经网络(Graph Neural Network, GNN)技术在KT领域的应用取得了突破性进展。然而,现有GNN模型大多仅关注概念与习题间的静态两两关系,未能充分挖掘边特征(Edge Features)和动态高阶关系。针对这些局限性,本文提出了一种基于超图的知识追踪模型(Hypergraph-based Knowledge Tracing, HGKT),并通过一系列实验验证其有效性。
在教育领域,知识追踪是一个研究热点,特别是在COVID-19疫情推动在线教育的背景下,了解学生的表现并为其提供个性化学习路径变得尤为重要。早期的知识追踪方法从传统机器学习模型发展到深度学习模型,例如基于长短期记忆网络(LSTM)的Deep Knowledge Tracing(DKT)模型开创了这一领域。然而,随着图表示学习技术的兴起,研究者将图神经网络引入知识追踪领域,如Graph-based Knowledge Tracing(GKT)通过有向图建模。此后,结合练习与概念关系的双边图(Bipartite Graph),以及高阶关联的研究方法逐步发展。
现有研究存在以下不足: 1. 边特征未被充分利用。 2. 未能有效捕捉学习者答题行为中的动态高阶关系。 3. 侧信息(如练习难度和答题时间)在隐状态的学习中未被充分引入。
因此,本研究的目标是通过超图建模学生答题交互过程,结合丰富的边特征、侧信息与自注意力机制,提出一种改进的知识追踪模型,提升学习表现预测的准确性。
HGKT模型总体框架包括三大模块: 1. 图嵌入模块(Graph Embedding Module):通过扩展的双边图(Weighted Bipartite Graph, WBG)和超图生成练习、概念及学习者的嵌入表示。 2. 序列建模模块(Sequence Modeling Module):通过引入练习难度和平均答题时间,配合LSTM捕捉学习者的知识演化状态。 3. 信息交互与预测模块(Information Interaction and Prediction Module):通过注意力机制提取关键历史信息,并融合多种嵌入实现预测。
双边图嵌入的构造与学习:
学习交互超图的构建与学习:
知识演化模块的改进:
预测模块:
实验基于三大公开数据集进行: 1. ASSIST09:包含4,217名学生共282,619条交互记录,与123个知识概念相关。 2. ASSIST12:规模更大的数据集,包含46,674名学生共2,709,436条记录,仅一对一关联练习与知识概念。 3. EdNet:从Santa学习平台中选取5000名学生的数据子集,包含653,761条交互记录,多对多关联练习与知识概念。
实验对比了多种经典与最新的知识追踪模型: - BKT(经典隐马尔可夫模型) - DKT及其强化版本DKT+ - DKVMN(基于动态记忆网络的模型) - PEBG-DKT 和PEBG-DKVMN(结合预训练嵌入与侧信息的模型) - GIKT(结合图卷积网络与LSTM的模型)
本文提出的HGKT模型具有如下科学与应用价值: 1. 科学价值: - 通过引入超图神经网络,深入挖掘学习者答题行为中的高阶关系。 - 将边特性与节点特性结合,引入动态注意力机制,提升知识图的表示能力。 - 集成练习难度和答题时间,为复杂序列建模提供新的优化方向。
未来研究可进一步探索更多侧信息、扩展超图建模的适用场景,或结合更多领域的知识图实现跨学科应用。