本文档是一篇发表于BMC Psychiatry期刊的学术教程论文。作者Maria Prokofieva等人旨在为研究者提供一个清晰、逐步的指南,以在开源软件R中实现探索性结构方程建模(Exploratory Structural Equation Modeling, ESEM)。鉴于ESEM在整合EFA和CFA优势方面的潜力及其在软件实现上的复杂性,本教程通过一个具体实例(SDQ问卷的因子结构分析)演示了操作流程,并提供了可复现的代码。
一、 作者、机构与发表信息
二、 论文主题与核心目标
论文的核心主题是推广和应用探索性结构方程建模(ESEM)方法,特别是为使用R软件的研究者提供一个简化、易操作的逐步教程。其直接目标是解决ESEM方法虽理论优势明显,但因软件操作(尤其是编码)复杂而应用受限的问题。论文以“长处与困难问卷”(Strengths and Difficulties Questionnaire, SDQ)的因子结构验证为例,利用澳大利亚儿童纵向研究(LSAC)的公开数据,详细演示了如何在R中执行ESEM分析,并与传统CFA和Mplus软件中的ESEM实现进行对比。
三、 论文主要观点与论述
1. ESEM的理论优势:弥补传统EFA和CFA的不足 论文开篇即阐述了传统验证性因子分析(Confirmatory Factor Analysis, CFA)和探索性因子分析(Exploratory Factor Analysis, EFA)在心理测量学应用中的局限性。 * CFA的局限:CFA要求项目(items)仅在其指定的潜变量(因子)上具有负荷,交叉负荷(cross-loadings)被强制设定为零。然而,在多维量表中,项目常常与多个因子存在理论或实证上的关联(即存在非零的交叉负荷)。忽略这些交叉负荷会导致模型拟合不佳、因子间相关系数膨胀,从而影响测量的效度和信度估计。 * EFA的局限:EFA虽然允许交叉负荷,但其提取的因子结构可能缺乏理论意义,且难以直接进行模型拟合优度检验、测量不变性等高级分析。 * ESEM的整合方案:ESEM被提出作为一种混合方法,它在结构方程模型(SEM)的框架内进行EFA。这意味着它既允许项目在多个因子上存在交叉负荷(继承了EFA的灵活性),又能提供如CFA般的模型拟合指数和进行后续的扩展分析(如测量不变性、潜增长模型)。ESEM通过目标旋转(target rotation)等技术,可以在允许小幅度交叉负荷的同时,使模型保持与理论假设的大致一致。
2. ESEM的不同实现路径与选择 论文详细梳理了实施ESEM的不同技术路径,这对于理解其方法学至关重要。 * 传统路径: * 路径1a(扩展CFA):从CFA模型出发,将所有非主要负荷(即交叉负荷)的起始值或约束设定为接近零(~0)。这是Mplus软件中通过其ESEM代码生成器实现的典型方法。 * 路径1b(EFA负荷作为阈值):首先进行EFA以获取各项目的因子负荷,然后将这些EFA负荷作为先验信息,在后续的ESEM分析中设定项目在其主要因子和非主要因子上的负荷估计阈值。 * 路径2(扩展EFA):以EFA为核心,通过两阶段法先识别主要负荷项目,再在ESEM框架下关联潜变量。 * 变体方法: * 集合ESEM(Set-ESEM):仅在理论预设的特定因子集合内允许交叉负荷,而非所有因子之间。 * CFA内的ESEM(ESEM-within-CFA, EWC):利用ESEM的负荷结果来为CFA模型提供起始值,并将小的交叉负荷固定为其ESEM估计值,以提高CFA模型的拟合度和解释性。 * 估计量与旋转的选择:论文指出,选择适当的估计量(如用于连续数据的最大似然估计ML,或用于序次数据的加权最小二乘法WLSMV及其稳健版本)和旋转方法(如斜交的Geomin旋转或目标旋转)对ESEM结果有重要影响。
3. ESEM的应用价值与适用场景 论文明确了ESEM并非万能工具,并指出了其适用的理想条件。 * 适用条件:ESEM主要适用于多维量表,其中项目方差可能由多个潜变量共同解释。在以下情况可优先考虑ESEM:(a) 相比CFA,ESEM模型拟合指数显著更优;(b) ESEM得出的因子间相关低于CFA结果;© 交叉负荷为小到中度(<0.5),且有理论解释(如项目表述相似);(d) 主要因子负荷强且理论意义明确;(e) 信度估计(如α, ω)可接受。 * 应用领域:在精神病学和心理健康领域,ESEM可用于验证预设因子结构、探究潜变量间关系、执行跨组或跨时间的测量不变性检验,甚至用于潜增长曲线建模,从而优化流行病学调查和临床评估。
4. 当前ESEM应用的障碍与本文的解决方案 论文指出,尽管ESEM有诸多优点,但其应用受到软件僵化性和编码复杂性的限制。Mplus虽功能强大但需付费,且其ESEM语法生成器(路径1a)对非主要负荷的处理相对固定(均设为近零)。R软件虽免费灵活,但缺乏直观的ESEM实现工具。 * 本文的贡献:为此,本教程提出了一个在R中实现ESEM路径1b的简化、自动化流程。作者开发并提供了一个R包(esem),该流程的核心创新在于自动化了从EFA到ESEM的过渡,并自动选择因子参照项(factor-referent items),减少了人工操作错误,且允许基于EFA结果对每个项目设置差异化的负荷阈值,而非统一设为近零。论文声称,这种方法可能比Mplus的路径1a产生更好或相当的模型拟合结果。
5. 教程实例:SDQ因子结构的ESEM分析 论文以SDQ问卷的五因子结构为例,逐步演示了如何在R中实现ESEM。 * 背景:SDQ的因子结构在不同文化和年龄群体中存在争议,许多研究指出其项目存在交叉负荷,传统CFA拟合不佳,因此是检验ESEM的理想案例。 * 数据:使用澳大利亚儿童纵向研究(LSAC)中3956名4-5岁儿童的家长报告SDQ数据。 * 分析步骤: 1. 准备:安装并加载必要的R包(esem, lavaan, psych等),载入数据。 2. ESEM路径1b(Geomin旋转):使用esem包的函数,通过Geomin旋转(探索性方式)自动确定项目的主要负荷因子,并拟合ESEM模型。 3. ESEM路径1b(目标旋转):研究者预先指定每个因子的主要负荷项目列表,使用make_target和esem_c函数进行目标旋转(更偏向验证性)。 4. 对比分析:同时提供了使用Mplus执行ESEM路径1a(固定交叉负荷~0)的语法作为对照。 5. 与传统CFA比较:使用lavaan包拟合标准的五因子CFA模型。 * 结果展示:教程展示了两种ESEM模型(Geomin和目标旋转)的拟合指数(χ², CFI, TLI, RMSEA, SRMR),并与CFA模型进行比较。结果表明,两种ESEM模型的拟合度均显著优于CFA模型,且ESEM模型中的因子间相关性普遍更低、更合理。Geomin旋转与目标旋转的ESEM模型拟合度无显著差异,且均优于Mplus路径1a的ESEM模型。这支持了使用EFA衍生负荷作为阈值(路径1b)可能比统一使用近零阈值(路径1a)更能反映数据真实情况、获得更佳模型拟合的观点。
四、 论文的意义与价值
总结而言,这篇论文不仅是一篇关于ESEM方法的综述和评论,更是一份具有高度实操性的教学指南。它系统阐述了ESEM的原理、优势与局限,清晰区分了不同的实现路径,并最终通过一个完整的、可重复的案例分析,成功地将理论方法转化为实践操作,对推动ESEM在实证研究中的广泛应用具有重要意义。