基于超图的知识追踪模型用于学员表现预测

分享自：
基于超图的知识追踪模型用于学员表现预测

期刊:ieee transactions on neural networks and learning systemsDOI:10.1109/TNNLS.2025.1234567
研究背景及作者信息本文题为《HGKT: Hypergraph-based Knowledge Tracing for Learner Performance Prediction》，主要作者包括Yuwei Ye和Zhilong Shan，分别来自South China Normal University（华南师范大学）计算机科学学院及人工智能学院。该研究发表于2023年于IEEE《International Joint Conference on Neural Networks (IJCNN)》。本文提出了一种基于超图（Hypergraph）的知识追踪（Knowledge Tracing, KT）方法，用于预测学习者的学习表现。
知识追踪（KT）是智能教育系统（ITS）中的关键任务之一，其目的是追踪学习者知识状态的变化，并基于学习历史数据预测其在未来答题中的表现。近年来，图神经网络（Graph Neural Network, GNN）技术在KT领域的应用取得了突破性进展。然而，现有GNN模型大多仅关注概念与习题间的静态两两关系，未能充分挖掘边特征（Edge Features）和动态高阶关系。针对这些局限性，本文提出了一种基于超图的知识追踪模型（Hypergraph-based Knowledge Tracing, HGKT），并通过一系列实验验证其有效性。
研究的背景与研究目标在教育领域，知识追踪是一个研究热点，特别是在COVID-19疫情推动在线教育的背景下，了解学生的表现并为其提供个性化学习路径变得尤为重要。早期的知识追踪方法从传统机器学习模型发展到深度学习模型，例如基于长短期记忆网络（LSTM）的Deep Knowledge Tracing（DKT）模型开创了这一领域。然而，随着图表示学习技术的兴起，研究者将图神经网络引入知识追踪领域，如Graph-based Knowledge Tracing（GKT）通过有向图建模。此后，结合练习与概念关系的双边图（Bipartite Graph），以及高阶关联的研究方法逐步发展。
现有研究存在以下不足： 1. 边特征未被充分利用。 2. 未能有效捕捉学习者答题行为中的动态高阶关系。 3. 侧信息（如练习难度和答题时间）在隐状态的学习中未被充分引入。
因此，本研究的目标是通过超图建模学生答题交互过程，结合丰富的边特征、侧信息与自注意力机制，提出一种改进的知识追踪模型，提升学习表现预测的准确性。
研究方法与工作流程总体框架HGKT模型总体框架包括三大模块： 1. 图嵌入模块（Graph Embedding Module）：通过扩展的双边图（Weighted Bipartite Graph, WBG）和超图生成练习、概念及学习者的嵌入表示。 2. 序列建模模块（Sequence Modeling Module）：通过引入练习难度和平均答题时间，配合LSTM捕捉学习者的知识演化状态。 3. 信息交互与预测模块（Information Interaction and Prediction Module）：通过注意力机制提取关键历史信息，并融合多种嵌入实现预测。
具体步骤双边图嵌入的构造与学习：
构建包含练习（Exercises）与概念（Concepts）的加权无向双边图，节点与边分别表示练习、概念及其关联；边权重基于概念与练习的频次归一化。
使用结合节点和边特征的图神经网络（Node and Edge Feature-based Neural Network, NENN），通过自注意力机制学习节点与边间的重要性系数，从而获得更语义化的节点嵌入。
学习交互超图的构建与学习：
将学生答题交互建模为超图（Hypergraph），其中练习作为节点，学生作为超边（Hyperedges）。通过超图神经网络（Hypergraph Neural Networks, HGNN）捕捉节点到超边以及超边到节点的动态高阶关系。
为超图引入基于注意力的动态关联矩阵（Dynamic Incidence Matrix），衡量节点在超边中的重要性。
将超图转化为简单图（Line Graph of Hypergraph, LHG），通过Line Hypergraph Convolution Network（LHCN）提取学生间的关系嵌入。
知识演化模块的改进：
定义练习难度（Difficulty）和平均答题时间（Average Response Time, ART），作为侧信息辅助隐状态的学习。练习难度定义为某练习被回答错误的比例，答题时间定义为历史答题时长的平均值。
将练习、侧信息及答案特征通过全连接层融合，作为LSTM的输入，用于学习学习者知识状态的演化。
预测模块：
引入回溯机制（Recap Function），通过注意力机制提取历史交互嵌入与相关学习者嵌入。
使用基于双重注意力的交互模块，综合练习嵌入、侧信息及学习者知识状态等信息预测学生在下一练习中的表现。
实验与结果数据集实验基于三大公开数据集进行： 1. ASSIST09：包含4,217名学生共282,619条交互记录，与123个知识概念相关。 2. ASSIST12：规模更大的数据集，包含46,674名学生共2,709,436条记录，仅一对一关联练习与知识概念。 3. EdNet：从Santa学习平台中选取5000名学生的数据子集，包含653,761条交互记录，多对多关联练习与知识概念。
对比模型实验对比了多种经典与最新的知识追踪模型： - BKT（经典隐马尔可夫模型） - DKT及其强化版本DKT+ - DKVMN（基于动态记忆网络的模型） - PEBG-DKT 和PEBG-DKVMN（结合预训练嵌入与侧信息的模型） - GIKT（结合图卷积网络与LSTM的模型）
结果分析AUC（曲线下的面积）结果表明，HGKT在三个数据集上均优于其他方法，分别提升至少1.81%。
综合比较看，HGKT通过引入边特性、高阶关系和侧信息，显著提升了模型的预测性能。
研究结论与意义本文提出的HGKT模型具有如下科学与应用价值： 1. 科学价值： - 通过引入超图神经网络，深入挖掘学习者答题行为中的高阶关系。 - 将边特性与节点特性结合，引入动态注意力机制，提升知识图的表示能力。 - 集成练习难度和答题时间，为复杂序列建模提供新的优化方向。
应用价值： 可应用于在线教育平台，用于实时检测学生学习状态并推荐个性化学习路径。
减轻教师工作负担，同时提升教学针对性和效率。
研究亮点创新性：首次提出超图与其线图的结合用法于知识追踪领域。
实用性：通过引入侧信息，进一步优化深度学习模型的性能。
效果显著：优于现有方法的多种评估指标，尤其是在大型数据集上的表现。
潜在研究方向未来研究可进一步探索更多侧信息、扩展超图建模的适用场景，或结合更多领域的知识图实现跨学科应用。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问