分享自:

纵向数据因果推断的联合混合效应模型

期刊:Stat MedDOI:10.1002/sim.7567

本研究由美国国家老龄研究所的Michelle Shardell*和Luigi Ferrucci共同完成,论文题为“Joint Mixed-Effects Models for Causal Inference with Longitudinal Data”,发表在*Statistics in Medicine*期刊2018年2月28日第37卷第5期上。

学术背景 本研究属于生物统计学与因果推断领域,重点关注纵向数据中因果效应的估计问题。在观察性纵向研究中,评估时变暴露的因果效应面临两大核心挑战:时间依赖性混杂和未测量混杂。现有主流方法,如边际结构模型或目标最大似然估计,通常依赖于“无未测量混杂”的强假设;而工具变量等方法则需要一个与暴露相关但未被混杂的变量,这在实践中往往难以满足。此外,当数据存在缺失时,许多方法的有效性还依赖于“随机缺失”的假设。因此,在存在未测量混杂和时间依赖性混杂,且数据可能为非随机缺失的情况下,如何稳健地估计因果效应,是一个亟待解决的重要方法学问题。本研究旨在提出一种新方法,结合参数化的联合混合效应模型与G-计算法,以应对上述挑战,并增强方法在应用研究者中的可及性。

详细工作流程 本研究并非一项传统的实验性研究,而是一项方法学开发与验证研究。其工作流程主要包括方法提出、模拟研究验证和实证数据应用三个核心环节,并辅以代码实现以提升方法实用性。

第一环节:方法提出与模型构建。 研究者提出了一个用于因果推断的联合混合效应模型框架。该框架的核心是建立一个参数化的联合混合效应模型,将研究结局(Y)和时变暴露(A)的生成机制联合建模。具体而言: 1. 结局模型:采用线性混合效应模型,其中包含随机效应(如随机截距和随机斜率),以捕捉个体异质性和未测量的、不随时间变化的混杂因素。模型允许结局依赖于其过去值,从而纳入了由序列相关性引起的时间依赖性混杂。 2. 暴露选择模型:对于二分类暴露,采用包含随机效应的逻辑斯蒂模型。该模型与结局模型共享相同的随机效应。这种共享参数结构是关键,它允许未测量的个体水平因素(由随机效应代表)同时影响结局和暴露选择,从而在模型层面处理未测量混杂。 3. 识别与估计:在正确设定模型并满足“给定随机效应的序贯随机化”假设下,模型参数可以无偏估计。然而,这些参数本身通常不具有因果解释(因为模型包含了时间依赖性混杂)。为了估计因果效应,研究者将上述联合模型与G-计算法相结合。G-计算法的本质是在固定暴露历史的同时,对协变量历史(包括过去结局和随机效应)进行积分,从而计算潜在结局的期望值。通过对比不同暴露历史下的潜在结局期望,即可得到个体特定或总体平均的因果效应估计。 4. 模型扩展:研究进一步将基本框架扩展到更复杂的现实情境: * 非随机缺失与“死亡截断”:在联合似然函数中加入了描述生存过程和应答过程的模型(如逻辑斯蒂模型),这些模型同样可以共享随机效应,从而处理非随机缺失和因死亡导致的数据缺失问题。 * 额外的时变混杂:将其他内源性时变混杂变量纳入联合建模框架。 * 过程特异性随机效应:允许暴露选择过程拥有独立于结局过程的随机效应(两部分随机效应可能相关),即广义共享参数模型,以处理暴露选择本身的异质性。

第二环节:模拟研究评估。 为了评估所提出方法的性能,研究者进行了广泛的模拟研究。 1. 比较方法:将联合混合效应模型结合G-计算的方法与三种现有方法进行比较:① 常规线性混合效应模型结合G-计算;② 固定效应模型结合G-计算;③ 纵向目标最大似然估计法(一种半参数双重稳健方法,但依赖于无未测量混杂假设)。 2. 模拟设置:生成了1000个数据集,每个数据集包含1000名个体,模拟两次随访。设置了多种复杂场景以全面测试方法: * 场景一:仅存在未测量混杂,且随机效应服从正态分布。 * 场景二:存在未测量混杂,且随机效应分布被错误指定(模拟为指数分布,但拟合时误设为正态分布)。 * 场景三:存在未测量混杂和非随机缺失(即缺失与未观测到的结局相关)。 3. 数据处理与分析:使用SAS PROC NLMIXED软件(提供了示例代码)拟合联合混合效应模型、线性混合效应模型和固定效应模型,并使用R语言的ltmle包拟合纵向目标最大似然估计。评估指标主要是因果效应估计的偏差百分比和效率。

第三环节:实证数据应用。 将提出的方法应用于一项真实的流行病学研究——“基安蒂老龄化研究”,以探讨老年人血清维生素D水平对抑郁症状的因果效应。 1. 研究对象与数据:分析包括了1203名参与者。暴露变量是二分类的血清25-羟基维生素D水平(以20 ng/mL为界),结局变量是CES-D抑郁症状评分。数据包含基线及多次随访测量。 2. 分析过程:构建联合混合效应模型,将抑郁症状(连续变量)模型、维生素D状态(二分类)模型以及缺失机制模型联合拟合,其中包含与年龄相关的随机斜率。同样应用G-计算法来估计维生素D在不同时间滞后(lag 1, lag 2, lag 3)对抑郁症状的因果效应,以及三者联合的因果效应。 3. 对比分析:同样使用线性混合效应模型、固定效应模型和纵向目标最大似然估计法对同一数据进行分析,比较结果。

主要结果 模拟研究结果表明,没有任何一种方法在所有场景下都表现最优,但联合混合效应模型展现出独特的优势: 1. 在存在未测量混杂时:联合混合效应模型在所有相关模拟场景中均能产生无偏估计,而依赖于“无未测量混杂”假设的线性混合效应模型、固定效应模型和纵向目标最大似然估计法则出现了超过10%的显著偏差。这验证了联合模型处理未测量混杂的有效性。 2. 在模型假设被违背时:当随机效应分布被错误指定且不存在未测量混杂时,联合混合效应模型会出现较大偏差,而半参数的纵向目标最大似然估计法表现稳健。这揭示了参数方法对模型假设的敏感性。然而,当同时存在未测量混杂和分布误指定时,联合混合效应模型的无偏估计能力克服了分布误指定的劣势,表现优于其他方法。 3. 在存在非随机缺失时:联合混合效应模型在未测量混杂存在与否、缺失是否可忽略的各种组合下均表现良好。线性混合效应模型在无未测量混杂时表现良好,但一旦存在未测量混杂则出现偏差。纵向目标最大似然估计法和固定效应模型在部分场景下存在偏差。 4. 效率与收敛性:纵向目标最大似然估计法通常效率最低(置信区间最宽)。线性混合效应模型效率略高于联合混合效应模型。固定效应模型在所有比较中均表现不佳。联合混合效应模型在随机效应方差较大时可能出现收敛困难的问题。

实证应用结果显示,所有方法都得出了定性一致的结论:长期维持维生素D充足(≥20 ng/mL)比长期不足能降低抑郁症状的严重程度。然而,定量估计和统计显著性存在差异: 1. 联合混合效应模型估计的因果效应幅度最大(分布式滞后效应为-1.80),且其95%置信区间未包含0,具有统计学意义。 2. 线性混合效应模型和固定效应模型估计的效应值略小,置信区间较宽。 3. 纵向目标最大似然估计法估计的效应值最小,置信区间最宽,且其估计的滞后3效应方向出人意料(为正)。作者指出,这可能与其双重稳健特性、对暴露权重的敏感性以及对结局模型设定的依赖程度较低有关。 4. 对随机斜率的估计表明,在调整已测量因素后,影响维生素D对抑郁症状效应的未测量异质性可能较小,这解释了联合混合效应模型与其他参数方法结果相对一致的原因。

结论与意义 本研究开发并验证了一种将联合混合效应模型与G-计算法相结合的新框架,用于估计纵向数据中的因果效应。该方法的科学价值在于,它同时解决了时间依赖性混杂未测量混杂这两个关键难题,且不依赖于“无未测量混杂”的强假设或工具变量的存在。这在许多观察性研究中更具现实可行性。其应用价值显著:方法通过主流的SAS PROC NLMIXED软件实现,并提供了详细代码,极大增强了其对于生物医学、流行病学等领域应用研究者的可及性和实用性。研究明确指出,维生素D与抑郁症状的实证分析示例展示了该方法处理复杂现实数据的能力。

研究亮点 1. 方法创新性:首次系统地将共享参数的联合混合效应模型框架与潜在结果框架下的G-计算法相结合,用于识别和估计存在未测量混杂的纵向因果效应,并系统性地处理了非随机缺失和死亡截断问题。 2. 全面验证:通过精心设计的模拟研究,在多维复杂场景(未测量混杂、模型误指定、非随机缺失)下,与多种主流方法进行了全面、透明的性能对比,清晰勾勒了各种方法的适用边界和优劣。 3. 实践导向:不仅提出了理论方法,还提供了完整的软件实现代码(SAS PROC NLMIXED),并应用于真实的流行病学问题,完成了从方法提出、模拟验证到实际应用的全链条展示,有力促进了方法的落地使用。 4. 辩证结论:研究没有宣称新方法万能,而是通过模拟结果客观指出,联合混合效应模型在存在未测量混杂时优势明显,但其参数性质使其对随机效应分布误指定敏感。因此,作者建议在实际研究中将其与像纵向目标最大似然估计法这样依赖不同假设的灵活方法结合使用,进行敏感性分析,以权衡不同假设并提高结论的稳健性。这种辩证的视角对方法学应用具有重要的指导意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com