关于《Journal of Baltic Science Education》最新研究:《初中七年级学生科学教育中的跨学科思维》的学术研究报告
一、 研究作者、机构与发表信息
本研究由华东师范大学(East China Normal University, P. R. China)的陈莎莎、池少辉 和王祖浩 三位研究者共同完成。研究成果以题为《Interdisciplinary thinking among seventh-grade students in lower-secondary science education》的学术论文形式,发表于2025年 出版的《Journal of Baltic Science Education》第24卷第1期。
二、 研究的学术背景与目标
本研究隶属于科学教育 与教育测量评估 交叉领域。其核心研究动机源于21世纪科学教育对培养学生应对复杂现实世界问题能力的高度重视。现实挑战(如气候变化、可持续发展)本质上是复杂、结构不良(ill-structured)且跨学科的,因此,跨学科思维(Interdisciplinary Thinking)——即整合多个学科的知识与方法以分析、解决复杂问题的认知能力——被认为是学生进行有效科学问题解决和决策的关键素养。
尽管跨学科思维的重要性已被广泛认可,并成为K-12阶段科学教育的重要目标,但针对其有效评估的研究仍存在显著缺口。已有研究指出,现有评估工具(如书面作业、访谈)往往难以严谨、全面地捕捉跨学科思维的多维性,且评估实践与发展目标之间存在脱节。尤其对于初中阶段(lower-secondary school)的学生,缺乏专门开发并经过严格效度验证的评估工具,这导致教育者无法准确了解学生此方面能力的发展水平,从而难以制定有针对性的教学策略。
鉴于此,本研究旨在开发并经验证一套适用于中国初中七年级学生的跨学科思维评估工具。具体研究目标包括:1) 提出并验证一个跨学科思维的多维概念框架;2) 开发一套基于该框架的建构反应式(constructed-response)评估工具;3) 运用多维项目反应理论(Multidimensional Item Response Theory)检验工具的信度、效度及测量不变性;4) 评估七年级学生在跨学科思维各维度上的表现水平,为教学实践提供实证依据。
三、 研究详细流程与方法
本研究遵循威尔逊(Wilson)的构念建模(Construct Modeling)方法,流程严谨,包含多个阶段,具体如下:
流程一:概念框架构建与工具初步开发 1. 框架构建:研究团队通过对文献的系统回顾,将“跨学科思维”操作化定义为一种多方面的认知能力,使学生能够整合多学科知识和方法,从不同视角动态分析、阐述和反思现实世界现象。基于此,研究提出了一个包含四个相互关联维度的评估框架: * 综合分析(Comprehensive Analysis, CA):识别和分析跨学科问题中因果关系的能力。 * 解释论证(Interpretive Argumentation, IA):基于学科知识阐述和证明主张或解释的能力。 * 系统整合(Systematic Integration, SI):连接和应用不同学科见解以产生新观点或形成整合性理解的能力。 * 批判反思(Critical Reflection, CR):在元学科层面比较和评价学科知识整合的方法与局限的能力。 每个维度均定义了从初级到高级的渐进式表现水平。 2. 题目设计:为确保评估的生态效度,研究选取了四个与真实世界问题相关的跨学科情境:全球气候变化、生态系统与生物多样性、农业与食品科学、科学技术。针对这些情境,研究团队(由两位科学教育教授、两位资深科学教师和三位科学教育博士生组成)开发了建构反应式题目。题目设计遵循以下原则:与七年级学生已学的中国义务教育科学课程标准内容对接;鼓励学生整合而非复述知识;促进不同科学概念间的联系;覆盖构念图中从基础到高级的不同表现水平。最终,初始评估工具包含7个真实场景下的23道题目。
流程二:预测试与工具修订 1. 研究对象与过程:采用便利抽样法,从中国江苏省一所初中选取120名七年级学生参与预测试。测试不设时间限制,以确保学生充分作答。 2. 数据分析与工具修订:使用多维Rasch模型分析学生反应数据,检查题目拟合度。同时,通过半结构化访谈和有声思维法收集学生对题目难度和表述的反馈。基于定量分析和质性反馈,研究团队删除了1道区分度不佳的题目,并修订了2道题目的表述以提升清晰度。 3. 最终工具:经过修订,最终形成包含22道建构反应式题目的评估工具,覆盖上述四个跨学科情境。
流程三:正式测试与数据收集 1. 研究对象:采用随机抽样方法,从预测试的同一所学校抽取了316名七年级学生(男生159人,女生157人)参与正式测试。这些学生未参与过预测试。样本量基于相关研究建议确定,以保证足够的统计检验力。 2. 测试实施:学生在课堂环境下独立完成评估,时限为60分钟。所有流程符合伦理规范,确保参与者匿名与数据保密。 3. 评分者一致性:为确保评分可靠性,由一位科学教育研究生和一位资深初中科学教师独立评分。评分前经过系统培训,并使用部分信用评分法(Partial Credit Scoring)。评分者间信度Kappa系数高达0.94,表明评分高度一致。
流程四:数据分析——多维Rasch建模 本研究采用多维随机系数多项Logit模型(Multidimensional Random Coefficients Multinomial Logit Model, MRCML) 作为核心数据分析方法,这是一种先进的多维项目反应理论模型。 1. 分析软件:使用ConQuest 2.0软件进行分析。 2. 分析步骤: * 维度结构检验:比较单维模型与四维部分信用模型(Partial Credit Model, PCM)的整体拟合度,以验证四维框架的合理性。通过偏差值(Deviance)、赤池信息准则(AIC)和贝叶斯信息准则(BIC)等指标判断模型优劣,并进行似然比检验。 * 信度分析:计算四个维度各自的期望后验/似真值(EAP/PV)信度系数,评估测量的内部一致性。 * 构念效度分析:检查每个题目的加权(Infit)和非加权(Outfit)均方拟合统计量(MNSQ)及标准化t值,以评估数据与模型的拟合程度。同时,通过项目-人员对应图(Wright Map)直观展示学生能力与题目难度分布的匹配情况。 * 测量不变性检验:进行项目功能差异(Differential Item Functioning, DIF)分析,检验评估工具在不同性别群体间是否存在测量偏差。以0.5个logit作为判断DIF是否显著的临界值。 * 学生表现分析:基于EAP方法估计每位学生在四个维度上的能力值。通过计算各维度内不同水平题目的平均难度作为分界点,将学生的能力估计值划分为初级、中级和高级水平,进而统计各水平的学生比例。
四、 研究主要结果与逻辑关联
本研究获得了一系列相互印证、逻辑清晰的实证结果,直接支持了研究结论。
结果一:四维框架的有效性与工具的心理测量学质量得到验证 数据分析有力地支持了研究提出的四维概念框架。首先,模型比较结果显示,四维PCM模型的拟合指标(偏差值12339.51, AIC 12463.51, BIC 12696.37)显著优于单维模型(偏差值差异为432.27, 自由度9, p < .05)。这表明跨学科思维确实是一个多维构念,而非单一能力。其次,维度间相关分析显示四个维度之间存在高度正相关(相关系数在0.738至0.871之间),说明它们虽是独立成分,但共同构成一个有机的整体能力。 在信度方面,四个维度的EAP/PV信度系数分别为.74, .75, .77和.71,均达到可接受的中等水平,证实了工具测量的稳定性。 在构念效度方面,绝大多数题目的加权和非加权MNSQ值均在0.7-1.3的理想范围内,t值在-2到+2之间,表明题目数据与Rasch模型拟合良好。项目-人员对应图显示,学生能力分布(约-2.51至+1.80 logits)与题目难度分布(-1.30至+1.06 logits)广泛且适当地匹配,说明工具能有效覆盖从低到高不同能力水平的学生。特别重要的是,DIF分析未发现任何题目存在显著的性别偏差(所有题目的男女能力估计差异均小于0.5 logits)。这证明了该评估工具具有测量不变性(Measurement Invariance),对不同性别学生是公平的,为其在不同群体中的推广使用提供了关键依据。这些结果共同构成了对工具质量的有力支持,为后续分析学生表现奠定了可靠的测量基础。
结果二:七年级学生跨学科思维表现存在维度间差异与总体不足 基于有效可靠的工具,研究揭示了七年级学生跨学科思维的具体表现特征。学生总体表现显示,大部分学生仅达到跨学科思维的基础认知水平,这与先前研究结论一致。 更深入的分析发现了显著的维度间表现差异: 1. 综合分析(CA)与解释论证(IA)维度:学生表现相对较好。在CA维度,约三分之一学生达到高级水平(30.70%),另有31.33%和18.04%分别达到初级和中级水平。在IA维度,半数学生(50.00%)达到初级水平,但达到中级(31.65%)和高级(15.51%)水平的比例逐级下降。 2. 系统整合(SI)与批判反思(CR)维度:学生面临较大挑战。在SI维度,仅有12.97%的学生达到高级水平,而有高达38.92%的学生未达到初级水平。在CR维度,情况类似,44.62%的学生未达到初级水平,达到初级和中级水平的学生各占约26%。
结果之间的逻辑关联:首先,高质量的工具(结果一)确保了学生表现数据(结果二)的信度和效度。其次,学生在不同维度上的表现差异,直接呼应了文献综述中提到的跨学科思维的多面性和某些维度(如整合与反思)的固有复杂性。表现较差的SI和CR维度,恰恰是跨学科思维中更高阶、更核心的成分,涉及知识的深度融合与元认知评估。这一发现将抽象的“学生有困难”具体化为“学生在哪些特定方面存在困难”,为教育干预指明了精准的方向。
五、 研究结论、意义与价值
本研究成功开发并经验证了一套适用于中国初中七年级科学教育的跨学科思维评估工具。该工具基于一个包含综合分析、解释论证、系统整合和批判反思四个维度的理论框架,并展现出良好的心理测量学特性(信度、效度、无性别偏差)。
其科学价值在于:1) 理论贡献:通过实证研究验证了一个具体的、可操作的跨学科思维四维框架,深化了对这一复杂构念内部结构的理解。2) 方法论贡献:展示了将构念建模、基于真实情境的建构反应式题目设计与先进的多维Rasch分析相结合的研究路径,为科学教育领域评估复杂高阶思维能力提供了方法学范本。
其应用价值与实践意义尤为突出:1) 诊断功能:工具能为教育工作者提供量化数据,精确诊断学生在跨学科思维各维度上的优势与短板,超越模糊的整体印象。2) 教学指导:研究发现学生在系统整合与批判反思维度上尤为薄弱,这提示科学课程与教学应加强对知识深度整合、跨学科联系建立以及元认知反思能力的刻意培养。例如,教师可以设计更多需要融合多学科视角解决真实问题的项目式学习活动,并示范如何进行跨学科的批判性思考。3) 评估公平性:工具的无性别偏差特性确保了其在多元化教育环境中的公平使用。
六、 研究亮点
七、 其他有价值的发现与未来展望
研究在讨论部分指出,学生跨学科思维能力的不足不能仅仅归因于学科知识限制,可能还受到自信心、态度、动机、先前的跨学科学习经验、学习环境、同伴支持及整体科学素养等多重因素影响。这提示未来研究需要采用更综合的视角。
作者建议未来研究可以:1) 采用纵向研究或混合方法,追踪学生跨学科思维的发展轨迹,并探究影响其发展的深层原因和机制。2) 扩大样本的多样性与代表性,从更多不同社会经济背景和教育机构中随机抽样,以提升研究结果的普适性和统计稳健性。这些建议为后续研究开辟了富有潜力的方向。