使用R软件进行探索性结构方程建模：简明逐步教程

分享自：
使用R软件进行探索性结构方程建模：简明逐步教程

精神卫生和精神病学
神经科学与心理学
期刊:BMC PsychiatryDOI:https://doi.org/10.1186/s12888-023-05028-9
【点击此处】阅读全文、收藏及针对性提问
本文档是一篇发表于BMC Psychiatry期刊的学术教程论文。作者Maria Prokofieva等人旨在为研究者提供一个清晰、逐步的指南，以在开源软件R中实现探索性结构方程建模（Exploratory Structural Equation Modeling, ESEM）。鉴于ESEM在整合EFA和CFA优势方面的潜力及其在软件实现上的复杂性，本教程通过一个具体实例（SDQ问卷的因子结构分析）演示了操作流程，并提供了可复现的代码。
一、 作者、机构与发表信息
主要作者：Maria Prokofieva, Daniel Zarate, Alex Parker, Olympia Palikara, Vasileios Stavropoulos。
所属机构：分别来自澳大利亚维多利亚大学健康与体育研究所、皇家墨尔本理工大学健康与生物医学科学学院、英国华威大学教育研究系以及希腊雅典大学心理学系。
发表期刊与时间：发表于BMC Psychiatry期刊，2023年。
二、 论文主题与核心目标
论文的核心主题是推广和应用探索性结构方程建模（ESEM）方法，特别是为使用R软件的研究者提供一个简化、易操作的逐步教程。其直接目标是解决ESEM方法虽理论优势明显，但因软件操作（尤其是编码）复杂而应用受限的问题。论文以“长处与困难问卷”（Strengths and Difficulties Questionnaire, SDQ）的因子结构验证为例，利用澳大利亚儿童纵向研究（LSAC）的公开数据，详细演示了如何在R中执行ESEM分析，并与传统CFA和Mplus软件中的ESEM实现进行对比。
三、 论文主要观点与论述
1. ESEM的理论优势：弥补传统EFA和CFA的不足 论文开篇即阐述了传统验证性因子分析（Confirmatory Factor Analysis, CFA）和探索性因子分析（Exploratory Factor Analysis, EFA）在心理测量学应用中的局限性。 * CFA的局限：CFA要求项目（items）仅在其指定的潜变量（因子）上具有负荷，交叉负荷（cross-loadings）被强制设定为零。然而，在多维量表中，项目常常与多个因子存在理论或实证上的关联（即存在非零的交叉负荷）。忽略这些交叉负荷会导致模型拟合不佳、因子间相关系数膨胀，从而影响测量的效度和信度估计。 * EFA的局限：EFA虽然允许交叉负荷，但其提取的因子结构可能缺乏理论意义，且难以直接进行模型拟合优度检验、测量不变性等高级分析。 * ESEM的整合方案：ESEM被提出作为一种混合方法，它在结构方程模型（SEM）的框架内进行EFA。这意味着它既允许项目在多个因子上存在交叉负荷（继承了EFA的灵活性），又能提供如CFA般的模型拟合指数和进行后续的扩展分析（如测量不变性、潜增长模型）。ESEM通过目标旋转（target rotation）等技术，可以在允许小幅度交叉负荷的同时，使模型保持与理论假设的大致一致。
2. ESEM的不同实现路径与选择 论文详细梳理了实施ESEM的不同技术路径，这对于理解其方法学至关重要。 * 传统路径： * 路径1a（扩展CFA）：从CFA模型出发，将所有非主要负荷（即交叉负荷）的起始值或约束设定为接近零（~0）。这是Mplus软件中通过其ESEM代码生成器实现的典型方法。 * 路径1b（EFA负荷作为阈值）：首先进行EFA以获取各项目的因子负荷，然后将这些EFA负荷作为先验信息，在后续的ESEM分析中设定项目在其主要因子和非主要因子上的负荷估计阈值。 * 路径2（扩展EFA）：以EFA为核心，通过两阶段法先识别主要负荷项目，再在ESEM框架下关联潜变量。 * 变体方法： * 集合ESEM（Set-ESEM）：仅在理论预设的特定因子集合内允许交叉负荷，而非所有因子之间。 * CFA内的ESEM（ESEM-within-CFA, EWC）：利用ESEM的负荷结果来为CFA模型提供起始值，并将小的交叉负荷固定为其ESEM估计值，以提高CFA模型的拟合度和解释性。 * 估计量与旋转的选择：论文指出，选择适当的估计量（如用于连续数据的最大似然估计ML，或用于序次数据的加权最小二乘法WLSMV及其稳健版本）和旋转方法（如斜交的Geomin旋转或目标旋转）对ESEM结果有重要影响。
3. ESEM的应用价值与适用场景 论文明确了ESEM并非万能工具，并指出了其适用的理想条件。 * 适用条件：ESEM主要适用于多维量表，其中项目方差可能由多个潜变量共同解释。在以下情况可优先考虑ESEM：(a) 相比CFA，ESEM模型拟合指数显著更优；(b) ESEM得出的因子间相关低于CFA结果；© 交叉负荷为小到中度（<0.5），且有理论解释（如项目表述相似）；(d) 主要因子负荷强且理论意义明确；(e) 信度估计（如α, ω）可接受。 * 应用领域：在精神病学和心理健康领域，ESEM可用于验证预设因子结构、探究潜变量间关系、执行跨组或跨时间的测量不变性检验，甚至用于潜增长曲线建模，从而优化流行病学调查和临床评估。
4. 当前ESEM应用的障碍与本文的解决方案 论文指出，尽管ESEM有诸多优点，但其应用受到软件僵化性和编码复杂性的限制。Mplus虽功能强大但需付费，且其ESEM语法生成器（路径1a）对非主要负荷的处理相对固定（均设为近零）。R软件虽免费灵活，但缺乏直观的ESEM实现工具。 * 本文的贡献：为此，本教程提出了一个在R中实现ESEM路径1b的简化、自动化流程。作者开发并提供了一个R包（esem），该流程的核心创新在于自动化了从EFA到ESEM的过渡，并自动选择因子参照项（factor-referent items），减少了人工操作错误，且允许基于EFA结果对每个项目设置差异化的负荷阈值，而非统一设为近零。论文声称，这种方法可能比Mplus的路径1a产生更好或相当的模型拟合结果。
5. 教程实例：SDQ因子结构的ESEM分析 论文以SDQ问卷的五因子结构为例，逐步演示了如何在R中实现ESEM。 * 背景：SDQ的因子结构在不同文化和年龄群体中存在争议，许多研究指出其项目存在交叉负荷，传统CFA拟合不佳，因此是检验ESEM的理想案例。 * 数据：使用澳大利亚儿童纵向研究（LSAC）中3956名4-5岁儿童的家长报告SDQ数据。 * 分析步骤： 1. 准备：安装并加载必要的R包（esem, lavaan, psych等），载入数据。 2. ESEM路径1b（Geomin旋转）：使用esem包的函数，通过Geomin旋转（探索性方式）自动确定项目的主要负荷因子，并拟合ESEM模型。 3. ESEM路径1b（目标旋转）：研究者预先指定每个因子的主要负荷项目列表，使用make_target和esem_c函数进行目标旋转（更偏向验证性）。 4. 对比分析：同时提供了使用Mplus执行ESEM路径1a（固定交叉负荷~0）的语法作为对照。 5. 与传统CFA比较：使用lavaan包拟合标准的五因子CFA模型。 * 结果展示：教程展示了两种ESEM模型（Geomin和目标旋转）的拟合指数（χ², CFI, TLI, RMSEA, SRMR），并与CFA模型进行比较。结果表明，两种ESEM模型的拟合度均显著优于CFA模型，且ESEM模型中的因子间相关性普遍更低、更合理。Geomin旋转与目标旋转的ESEM模型拟合度无显著差异，且均优于Mplus路径1a的ESEM模型。这支持了使用EFA衍生负荷作为阈值（路径1b）可能比统一使用近零阈值（路径1a）更能反映数据真实情况、获得更佳模型拟合的观点。
四、 论文的意义与价值
方法论推广价值：本教程极大地降低了在免费、开源的R软件中应用ESEM这一先进统计方法的技术门槛。提供的逐步指南、可复现代码和对比示例，使研究者，特别是初级研究者或对R不熟悉者，能够相对容易地理解和实施ESEM分析。
实践指导价值：通过使用一个广为人知且存在争议的量表（SDQ）作为实例，教程生动地演示了ESEM如何在实际研究问题中解决传统方法（CFA）的困境，为心理测量学、精神病学、教育学等领域的量表验证和修订工作提供了直接参考。
技术贡献：作者提供的R包和自动化流程（特别是自动选择参照项）是对现有ESEM实现工具的有益补充，提供了一种可能比传统Mplus方法更灵活、更基于数据的替代方案。
促进开放科学：鼓励使用免费开源的R软件进行复杂统计分析，有利于研究的可重复性和方法的普及。
总结而言，这篇论文不仅是一篇关于ESEM方法的综述和评论，更是一份具有高度实操性的教学指南。它系统阐述了ESEM的原理、优势与局限，清晰区分了不同的实现路径，并最终通过一个完整的、可重复的案例分析，成功地将理论方法转化为实践操作，对推动ESEM在实证研究中的广泛应用具有重要意义。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问