本项研究由土耳其的研究人员完成,基于国际学生评估项目(PISA)2022年的数据,探讨了土耳其学生在数学素养上的潜在类别及其关键预测因素。研究将潜在剖面分析(Latent Profile Analysis, LPA)与最小绝对收缩和选择算子(Least Absolute Shrink and Selection Operator, LASSO)逻辑回归分析相结合,旨在识别数学素养的异质性模式并确定最具影响力的预测变量。这是一篇单篇的原创性实证研究报告。以下将根据学术报告的结构,对该研究进行全面介绍。
一、 研究基本信息
本研究的主要作者是Ceylan Gundeger Kilci。研究已提交至Current Psychology期刊,文稿编号为CPS-D-25-08893。这是一项旨在探究学生数学素养潜类别的识别及其预测因素的定量研究,属于教育测量、教育心理学和数据分析的交叉领域。
二、 学术背景与研究目的
在全球化和信息化时代,数学素养被定义为个体运用数学知识和推理解决现实生活问题的能力,是培养21世纪公民核心素养的关键。PISA项目是评估各国15岁学生核心素养的国际性研究,其数据为探索教育成果的影响因素提供了宝贵资源。尽管大量研究探讨了与数学成绩相关的变量,如性别、社会经济地位、态度信念等,但大多数采用变量中心的方法,忽略了学生群体内部的异质性。
现有研究的不足主要体现在三个方面:第一,较少采用“以人为中心”的方法(如LPA)来探索学生数学素养的潜在类别结构;第二,预测数学素养的研究常面临多变量间多重共线性的挑战,传统方法难以同时进行有效的变量选择与正则化;第三,缺乏整合识别潜在类别、验证其效度、纳入广泛理论变量并运用机器学习技术评估模型预测性能的综合分析框架。
因此,本研究旨在填补上述空白。具体目标如下:1. 利用PISA 2022土耳其学生数据,基于数学素养的四个核心过程维度识别学生的潜在类别,并提供其内部和外部效度证据。2. 采用LASSO逻辑回归,从28个理论驱动的预测变量中,确定最能区分不同数学素养类别的关键预测因素。3. 通过接收者操作特征曲线(ROC)分析,评估所建立模型的预测准确性和泛化能力。
三、 详细研究流程与方法
研究采用定量设计,结合了描述性和相关性研究方法。具体流程包含数据准备、潜在剖面分析、预测变量建模和模型验证四个主要阶段,涉及对PISA 2022土耳其学生样本的复杂统计分析。
1. 数据来源与样本 研究数据来源于PISA 2022的学生问卷及OECD官网公开数据库。PISA采用两阶段分层抽样。本研究最终分析样本为6969名土耳其15-16岁学生,其中女生占49.1%,男生占50.9%,绝大多数(91.6%)为十年级学生。
2. 变量定义 * 因变量:通过潜在剖面分析识别出的“数学素养潜在类别”。数学素养在PISA 2022中由四个核心过程维度构成:数学推理(Mathematical Reasoning, MPR)、数学化地表述情境(Formulating Situations Mathematically, MPF)、运用数学概念、事实和程序(Employing Mathematical Concepts, Facts and Procedures, MPE)以及解释、应用和评估数学结果(Interpreting, Applying and Evaluating Mathematical Outcomes, MPI)。每个维度生成10个似真值。由于各似真值高度相关(r > .90),研究仅使用每个维度的第一个似真值(PV1)进行建模。 * 自变量:共包含28个预测变量,涵盖了五大领域:学生人口学特征(性别)、社会经济与文化地位(ESCS指数、ICT资源可及性指数ICTRes)、对数学的信念、态度、情感和行为(如数学偏好mathpref、数学自我效能感matheff、数学概念熟悉度famcon等)、ICT熟悉度(13个不同侧面的指数,如课堂ICT使用、学校相关ICT使用、寻求反馈的ICT使用等)、教育路径与职业抱负(留级、长期缺勤、期望职业地位等)。这些变量大多基于项目反应理论标定,或为二元/有序分类变量。研究排除了缺失值的个案(缺失率%),对连续变量的缺失值采用序列均值进行插补。
3. 统计分析流程 * 步骤一:识别潜在类别并进行效度验证。为回答第一个研究问题,研究首先对四个数学素养过程维度的PV1分数进行潜在剖面分析。LPA是一种“以人为中心”的建模技术,旨在根据个体在观测指标上的反应模式,将其划分为不同的、互斥的潜在类别(剖面)。研究评估了包含1到10个剖面的模型。模型选择依据多个拟合指标:赤池信息准则(AIC)、贝叶斯信息准则(BIC)、样本校正BIC(SABIC)、熵(Entropy)和自助法似然比检验(BLRT)。研究采用肘部图辅助判断,并优先选择熵值高、BLRT显著、且后验分类概率最小值高的模型。LPA确定最佳剖面数量后,研究进一步提供了效度证据:内部效度通过比较不同潜在类别在PISA数学总分上的差异进行验证;外部效度通过比较他们在阅读和科学素养总分上的差异进行验证,使用独立样本t检验(α = .01)。 * 步骤二:识别关键预测变量(LASSO逻辑回归)。为回答第二个研究问题,研究采用LASSO逻辑回归进行变量选择。这是一种正则化回归技术,通过在损失函数中添加一个惩罚项(λ),将一些不重要的自变量的系数压缩至零,从而实现变量选择和解决多重共线性问题。具体操作如下: * 数据分割:采用机器学习思路,将总样本随机分为训练集(70%,用于建模)和测试集(30%,用于验证)。 * 模型拟合与变量选择:在训练集上,对28个自变量运行LASSO逻辑回归。研究使用了两种常用的λ值:λ_min(使交叉验证误差最小的λ)和λ_1se(使交叉验证误差在一个标准误范围内的、惩罚最严格的λ)。此外,还引入了系数绝对值标准(|β| > 0.10)作为第三个筛选条件。 * 确定最终变量集:综合以上三个标准,只保留被所有标准同时选中的变量,以此构建最简约且具有预测效力的模型。 * 步骤三:评估模型预测性能。为回答第三个研究问题,研究基于选出的关键变量,使用二元逻辑回归建立了最终预测模型。随后,通过ROC分析和曲线下面积(AUC)值来评估模型的分类准确性。AUC值在0.7、0.8、0.9以上分别代表可接受、优秀和杰出的预测性能。此评估同时在训练集和测试集上进行,以检验模型的稳健性和泛化能力。 * 软件工具:所有分析均在R语言环境中完成,使用了tidylpa、mclust、glmnet、caret、pROC等多个专业统计包。
四、 主要研究结果
1. 数学素养潜在类别的识别与验证 潜在剖面分析的结果表明,两剖面模型是最优解。根据BIC等指标的肘部图显示,从一到二剖面时拟合指标下降幅度最大,且两剖面模型的熵值高达0.89,BLRT显著(p = .01),表明分类准确且剖面间差异显著。 * 剖面描述:剖面1(占样本44.1%)在所有四个数学过程维度上的平均分数(约525-530分)均显著高于剖面2(占样本55.9%,平均分数约382-395分)。因此,剖面1被命名为“高数学素养剖面”,剖面2被命名为“低数学素养剖面”。 * 效度证据:内部效度检验显示,高剖面组的数学总分(平均530.17)显著高于低剖面组(平均394.55),差异极显著(t = -99.42, p < .001)。外部效度检验显示,高剖面组在阅读(520.59 vs. 407.25)和科学(547.70 vs. 420.31)总分上也均显著高于低剖面组(p < .001)。这强有力地支持了两个潜在类别不仅基于数学内部维度是有效的,也与学生的整体学术能力表现一致。
2. 数学素养类别的关键预测因素 LASSO逻辑回归分析从28个预测变量中,筛选出了14个被所有三个标准(λ_min, λ_1se, |β| > 0.10)共同选中的关键变量。根据最终建立的二元逻辑回归模型结果(见表2),这些变量可分为正向和负向预测因子: * 正向预测因子(增加成为高数学素养剖面的几率):按影响强度降序排列,依次是:数学偏好(mathpref, OR=1.82)、数学自我效能感(matheff, OR=1.73)、经济社会文化地位(ESCS, OR=1.47)、ICT资源可及性(ICTRes, OR=1.41)、数学课使用数字工具(ICTSubj, OR=1.36)、数学概念熟悉度(famcon, OR=1.20)、在线信息实践参与度(ICTInfo, OR=1.20)、性别(男性, OR=1.17)。 * 负向预测因子(降低成为高数学素养剖面的几率):按影响强度降序排列,依次是:使用ICT寻求支持/反馈(ICTFeed, OR=0.83)、工作日闲暇时间使用ICT(ICTWkdy, OR=0.80)、学校相关的ICT使用(ICTEnq, OR=0.79)、留级(Repeat, OR=0.33)、长期缺勤(Misssc, OR=0.26)。
值得注意的是,学生“认为数学比其他学科更容易”的感知(mathease)并未达到统计显著性(p > .05)。该模型解释了数学素养潜在类别36%的方差(Nagelkerke R² = 0.36)。
3. 模型的预测性能 ROC分析结果显示,基于14个关键变量建立的模型,在训练集上的AUC值为0.81,在测试集上的AUC值为0.80。两者数值接近且均高于0.80,表明该模型具有优秀的分类预测能力,并且从训练集到测试集的泛化性能良好,模型稳健可靠。
五、 结论与意义
本研究的核心结论是:在PISA 2022土耳其学生样本中,数学素养存在两个明显不同的潜在类别——高素养组和低素养组。研究成功识别出一系列具有不同影响方向的关键预测因素。 * 正向因素的核心地位:学生个体对数学的偏好和自我效能感是预测其归属高素养类别的最强因素,这凸显了情感和动机因素在数学学习中的核心作用。紧随其后的是社会经济资源(ESCS和ICTRes)和教育中的有效ICT整合(课堂使用ICT、在线信息实践),这些代表了环境与资源的支持。男性性别优势的发现,则揭示了土耳其教育背景中持续存在的性别差异问题。 * 负向因素的警示:留级和长期缺勤作为教育中断的标志,显示出强烈的负面影响。某些类型的ICT使用(如用于寻求反馈、学校相关任务、工作日休闲)与较低的数学素养相关联,这可能反映了ICT使用质量、情境或过度使用的问题,而非ICT本身有害。
研究的价值体现在理论与实践两个层面: * 学术价值:本研究提供了一个创新的、可推广的分析框架,将LPA与LASSO回归及机器学习验证流程相结合,为处理教育领域复杂、高维的预测问题提供了方法论范例。研究结果深化了对数学素养多维度、异质性本质的理解。 * 实践与政策意义:研究为土耳其的教育工作者和政策制定者提供了明确的干预方向。建议包括:1. 关注学生情感:通过设计更有趣、相关的数学教学活动来提升学生对数学的偏好和自信心。2. 促进教育公平:实施政策干预,缩小由社会经济地位和ICT资源获取不平等带来的差距,并特别关注支持女生的数学学习。3. 审慎利用ICT:鼓励在课堂上进行有教育意义的ICT整合,同时引导学生健康、有节制地使用数字设备,警惕某些ICT使用模式可能带来的负面影响。4. 优化学生支持:重新评估“留级”政策的有效性,并建立机制预防和应对长期缺勤问题。
六、 研究亮点
七、 其他有价值的内容
研究的附录提供了所有28个自变量的详细定义和克隆巴赫α系数,显示了数据测量的可靠性。同时,作者也坦诚地指出了研究的局限性:相关分析无法推断因果关系;自我报告数据可能存在偏差;结论主要适用于土耳其情境,其普适性有待在其他国家和地区进行检验。这些局限也为未来研究指明了方向,例如进行跨国比较、纵向追踪研究,以及将潜在剖面分析拓展至阅读和科学素养领域。