多元纵向因果效应模型的推导与应用

分享自：
多元纵向因果效应模型的推导与应用

期刊:journal of applied statisticsDOI:10.1080/02664763.2025.2457013
基于对文档内容的分析，该文档属于 类型a：报告了一项单一的原创性研究。以下是据此生成的学术报告。
学术报告：《应用统计学杂志》2025年多变量纵向因果效应建模研究
一、 作者、机构与发表信息
本研究由来自马拉维大学、比勒陀利亚大学、宾夕法尼亚大学（统计系和社会学系）的研究团队共同完成。主要作者包括：Halima S. Twabi（通讯作者，马拉维大学数学科学系）、Samuel O. M. Manda（比勒陀利亚大学统计系）、Dylan S. Small（宾夕法尼亚大学统计系）和 Hans-Peter Kohler（宾夕法尼亚大学社会学系）。该研究以题为“Derivation of a multivariate longitudinal causal effects model”的论文形式，发表于学术期刊 Journal of Applied Statistics 2025年第52卷第12期，具体页码为2207-2225，并已在线发布。
二、 学术背景与研究目的
本研究立足于因果推断和纵向数据分析的交叉领域，具体针对健康社会科学研究中普遍存在的多变量纵向观测数据。在许多纵向观测研究（如流行病学调查、公共卫生干预评估）中，研究者经常从同一研究对象身上收集多个相关的结局变量，这些结局变量之间可能存在相关性，并随时间动态变化。例如，在艾滋病研究中，知晓自身HIV阳性状态（处理变量）可能同时影响安全套使用情况和性伴侣数量等多个相关行为结局。传统的因果推断方法，如边际结构模型（Marginal Structural Model， MSM）结合逆概率处理加权（Inverse Probability Treatment Weighting， IPTW），已广泛应用于处理纵向数据中的时变混杂偏倚。然而，标准的MSM-IPTW方法通常针对单一结局变量构建，当存在多个相关结局时，分别对每个结局拟合单独的MSM会忽略结局间的相关性，可能导致效率损失或偏倚。
因此，本研究旨在填补这一方法学空白。其核心目标是：开发一种适用于具有多个相关结局的纵向观测研究的因果推断估计方法。该方法需要同时满足三个要求：1) 控制时变处理和时变混杂因素的影响；2) 考虑多个结局变量之间（Between-outcome）的相关性；3) 考虑同一结局变量内部随时间测量的序列（Within-outcome/Serial）相关性。研究团队提出通过扩展传统的MSM-IPTW框架，将多结局的相关性结构纳入加权和估计过程，从而实现对多变量纵向数据平均因果效应（ATE）的更有效、更准确的估计。
三、 详细研究流程与方法
研究流程主要包括三个核心部分：理论模型构建、模拟研究评估、以及真实数据应用。
第一流程：理论模型构建与扩展 本研究从标准的单结局纵向边际结构模型出发，将其系统地扩展至多结局情形。 1. 模型定义：假设有n个研究对象，在时间点t观测到J个结局变量构成的向量Y_it，一个时变二值处理变量A_it，以及时变混杂因子L_it和基线混杂因子X_0。潜在结局框架下，关注的是基于处理历史ā_t的潜在结局期望E[Y(ā_t)]。 2. 因果识别假设：为识别多结局纵向数据中的因果效应，研究团队将Rosenbaum和Rubin的经典假设（一致性、正性、序列可忽略性、处理值稳定性假设）进行了适应性的扩展。特别强调了在结局相关的背景下，假设所有结局受到相同的混杂因素影响，且不存在结局特异性的混杂因子。 3. 权重的扩展：这是方法的核心创新点。传统的IPTW权重基于处理概率给定过去处理和混杂因素的历史。为了纳入多结局的信息，研究者将权重重新定义为每个时间点上、针对每个结局的逆概率权重的乘积。具体而言，非稳定化权重修改为：W = Π_t Π_j [1 / P(At | Ā{t-1}, L̄_t, X0, Ȳ{j,t-1})]，其中Ȳ_{j,t-1}代表了第j个结局的过去历史。这意味着在计算个体在某个时间点接受处理的概率时，不仅考虑了过去的处理、混杂因素，还考虑了所有结局变量的过去观测值，从而更全面地控制可能影响处理和多个结局的路径。稳定化权重也做了相应调整，以减小权重变异。 4. 估计方程：研究者采用广义估计方程（Generalized Estimating Equations， GEE）框架进行参数估计。在GEE中，他们提出了一个包含两个部分的联合工作相关矩阵：一个用于刻画同一结局不同时间点测量值之间的序列相关（如可交换的、一阶自回归AR(1)结构），另一个用于刻画同一时间点不同结局变量之间的相关性（如可交换的结构）。这两个矩阵通过克罗内克积（Kronecker product）组合，形成了一个统一的JT×JT维工作协方差矩阵，从而同时建模了两种类型的相关性。最终的加权GEE估计方程形式为：Σ_i Σ_j Σ_t D_i(β) V_i^{-1} Wi (Y{ijt} - μ_i(β)) = 0，其中V_i包含了上述的联合相关结构，W_i是扩展后的IPTW权重。
第二流程：模拟研究评估 为了评估所提出的“联合MSM-IPTW”方法的性能，研究团队进行了广泛的蒙特卡洛模拟。 1. 数据生成机制：模拟设计遵循一个具有三个时间点的纵向研究。生成一个基线混杂变量（如性别，二项分布）和一个时变混杂变量（如年龄，正态分布，且受其前一期值和处理影响）。时变处理变量（代表HIV知晓状态）通过逻辑回归模型生成，其概率依赖于前一期处理、时变混杂和基线混杂。两个连续的结局变量（代表如安全套使用倾向和性伴侣数量倾向）通过线性模型生成，其均值依赖于当前处理、时变混杂和一个共同的截距项，误差项ε则服从二元正态分布，其相关系数ρ_jj‘用于控制结局间的相关性（ρ_j取0， 0.3， 0.75）。同时，每个结局在三个时间点的测量值被赋予序列相关性（ρ_k取0.1， 0.4， 0.8）。 2. 研究场景：设置了两种关键场景。场景一：两个结局受到相同的处理效应（β1j = 0.3 或 0.8）。场景二：两个结局受到不同的处理效应（β11=0.8， β12=0.3）。样本量设置了四种规模：50， 200， 500， 1000。 3. 比较方法：在每个模拟生成的数据集上，同时拟合两种模型：a) 非加权联合模型：即标准的、包含所有混杂变量作为协变量的多结局GEE模型，但不使用IPTW权重。b) 加权联合模型（即提出的MSM-IPTW）：使用扩展的IPTW权重并纳入联合工作相关结构的GEE模型。 4. 评估指标：对每个场景、每种相关系数组合、每个样本量，重复模拟1000次。计算以下指标来评估处理效应估计值β̂1j的性能：偏倚（估计值均值与真实值之差）、均方根误差（RMSE，衡量估计精度）、覆盖率（95%置信区间包含真实值的比例）。 5. 软件实现：使用R软件（4.4.1版）进行模拟和分析。权重通过ipw包计算，加权联合MSM使用geepack和jgee包进行拟合，并对jgee包的源代码进行了修改以支持稳定化权重的纳入。
第三流程：真实数据应用 将提出的方法应用于“马拉维家庭与健康纵向研究”（MLSFH）的数据，旨在估计“知晓自身HIV阳性状态”对两个高风险性行为（安全套使用和多个性伴侣）的因果效应。 1. 数据与变量：使用MLSFH在2004至2019年间多个波次的调查数据。处理变量是二值的HIV阳性知晓状态。两个结局变量均为二值：最近一次性行为是否使用安全套；是否拥有两个或以上性伴侣。控制了一系列基线（如性别、年龄、财富、教育、宗教、地区）和时变混杂因素（如调查波次、HIV综合知识等）。 2. 分析步骤： * 权重计算：首先，为每个结局分别拟合处理模型（逻辑回归），预测个体在每个时间点知晓HIV阳性状态的概率，模型协变量包括基线混杂、时变混杂、过去处理史以及过去结局值。基于此计算稳定化IPTW权重。同时，计算针对失访（拒绝参与、死亡、迁出等）的删失权重。最终权重为二者乘积。 * 模型拟合：使用提出的联合MSM-IPTW方法，拟合一个多结局逻辑回归模型。模型设定结局的边际期望（通过logit链接）与HIV知晓状态和调查波次相关。在工作相关矩阵设定上，假设结局间为可交换结构，序列相关为AR(1)结构。 * 比较分析：为了对比，同时拟合了标准的（未加权的）双结局逻辑回归模型，以及分别针对每个结局的单变量MSM-IPTW模型。 * 敏感性分析：使用E-value统计量评估估计出的因果关联对未测量混杂的稳健性。
四、 主要研究结果
模拟研究结果： 结果详细展示于论文的表1、表2和表3中，主要结论可归纳如下： 1. 场景一（相同处理效应）：当两个结局的处理效应相同时，提出的联合MSM-IPTW方法在大样本（n=1000）和中等至强的结局间/序列相关性（如ρ_j=0.3， 0.75；ρ_k=0.4， 0.8）下表现优异。其覆盖率稳定在预期的95%水平附近。在相同条件下，其性能与调整了协变量的标准联合模型（非加权）相近甚至更优，特别是在控制混杂方面更具理论上的鲁棒性。 2. 场景二（不同处理效应）：当两个结局的处理效应不同时（表3），两种方法对各自效应的估计偏倚均随样本量增大而减小。在无相关性（ρ_j=0）或低样本量下，标准联合模型有时表现更稳定。然而，在中高相关性和足够大的样本量（n≥500）下，联合MSM-IPTW方法在减少偏倚和降低RMSE方面显示出优势。这表明在复杂依赖结构下，明确建模相关性并结合正确的加权机制可以提高估计效率。 3. 样本量与相关性的影响：小样本（n=50）时，两种方法的RMSE都较高，且加权模型可能因极端权重而不稳定。高序列相关性（ρ_k=0.8）会增加小样本下的变异性。但随着样本量增加，联合MSM-IPTW方法的性能迅速改善并趋于稳定。 4. 整体结论：模拟研究验证了所提出方法的有效性。它在处理多结局纵向数据、控制时变混杂、并利用结局间相关性提高估计效率方面，特别是在大样本和存在相关性的现实情境下，具有实用价值。
真实数据应用结果： 1. 权重分布：生成的最终稳定化权重均值接近1，变异较小（标准差0.14），表明权重计算稳定，未出现严重的极端值问题。 2. 因果效应估计： * HIV阳性知晓对安全套使用的影响：联合MSM-IPTW模型估计的优势比（OR）为1.90（95% CI： 1.59， 2.27）。这表明，在控制了时变混杂、失访以及多个性行为结局间的相关性后，知晓自身HIV阳性状态的个体，其使用安全套的几率是知晓阴性状态个体的1.90倍。该效应具有统计学显著性。 * HIV阳性知晓对多性伴侣的影响：联合MSM-IPTW模型估计的优势比（OR）为0.95（95% CI： 0.78， 1.16）。这表明，HIV阳性知晓状态对是否拥有多个性伴侣没有显著的因果效应。 3. 方法比较： * 与标准双结局逻辑模型（表4）相比，联合MSM-IPTW得到的效应估计值（特别是对安全套使用）更为保守（OR从2.53降至1.90），标准误更小，体现了对时变混杂进行正确调整后，避免了可能因“屏蔽”中介路径而导致的高估。 * 与单变量MSM（表5）相比，联合MSM-IPTW得到了相似的点估计（安全套使用：1.90 vs 2.22；多性伴侣：0.95 vs 0.96），但标准误更小，置信区间更窄。这证实了通过联合建模利用结局间相关性，可以提高估计的精确度（效率）。 4. 敏感性分析：E-value分析表明，安全套使用效应的估计（OR=1.90）对未测量混杂相对更稳健（点估计的E值为2.16），而多性伴侣效应的估计（OR=0.95）则相对更脆弱（点估计的E值为1.48）。
五、 研究结论与价值
本研究成功推导并验证了一种适用于多变量纵向观测数据的因果效应估计方法。主要结论是：通过将逆概率处理权重（IPTW）扩展至包含多个结局的历史信息，并在广义估计方程（GEE）框架下采用一个联合工作相关矩阵来同时刻画结局间和序列相关性，所构建的“联合边际结构模型-逆概率处理加权”（Joint MSM-IPTW）方法，能够有效地控制时变混杂，并提高在多结局存在相关性情形下因果效应估计的效率和准确性。
研究的科学价值与应用价值： 1. 方法学贡献：本研究为因果推断领域提供了一个重要的方法学工具，解决了多结局纵向数据分析中长期存在的挑战。它将经典的MSM-IPTW框架与多变量纵向数据建模技术（如GEE与联合相关结构）相结合，具有明确的创新性。 2. 实际应用价值：该方法可直接应用于公共卫生、流行病学、社会科学等领域中涉及多维度结局的纵向观测研究。例如，评估一项健康干预对一系列相关健康行为或生理指标的综合影响。 3. 实证发现：在MLSFH数据的应用中，不仅演示了方法的实用性，也得出了有意义的实证结论：在马拉维农村地区，知晓自身HIV阳性状态显著促进了安全套的使用，但并未显著减少多性伴侣行为。这提示公共卫生干预在促进安全性行为时可能需要更有针对性的策略。 4. 可重复性与推广性：研究提供了完整的模拟代码和实际分析流程（使用R软件），有助于其他研究者理解和应用该方法。提出的框架具有灵活性，可以适应不同类型的结局变量（如连续、二分类）和相关结构。
六、 研究亮点
问题新颖且重要：聚焦于多结局纵向因果推断这一前沿且具有广泛实际需求的方法学问题。
方法创新性强：核心创新在于对IPTW权重的多结局扩展和联合相关矩阵的构建，理论推导清晰。
评估系统全面：通过精心设计的模拟研究，在多维度（样本量、相关性强度、效应异质性）下严格评估了方法性能，并与常规方法进行了对比，结论可靠。
实证应用与验证结合：不仅提出了理论方法，还通过一个具有重要公共卫生意义的真实世界研究案例，完整展示了方法的实施步骤、优势及其产生的科学见解。
关注实践细节：讨论了权重稳定化、失访处理、软件实现等实际操作问题，并进行了未测量混杂的敏感性分析（E-value），增强了研究的实用性和严谨性。
七、 其他有价值内容
研究团队在讨论部分也坦诚指出了本方法的局限性，并为未来研究指明了方向： 1. 当前方法假设所有相关结局受同一组混杂因素影响，未来可探索存在结局特异性混杂的情形。 2. 模拟研究仅针对连续结局，未来需评估方法在二值、计数等类型结局上的表现。 3. IPTW方法可能产生极端权重，影响小样本下的效率。未来可研究权重修剪、其他平衡方法（如G-估计、双重稳健估计）在该框架下的应用。 4. 需要进一步探讨在存在非随机缺失数据时，如何将本方法与缺失数据机制建模相结合。
此外，论文的“致谢”和“利益声明”部分显示，该研究获得了包括非洲科学院、惠康信托、英国政府、欧莱雅-联合国教科文组织女科学家计划以及南非医学研究理事会等多个机构的资助，并遵循了相关的伦理审查程序，体现了研究的合规性与协作性。作者也说明使用了ChatGPT 4.0进行语言润色，这反映了当前学术写作中的一种新兴辅助工具使用情况。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问