纵向数据的两部分及相关回归模型

分享自：
纵向数据的两部分及相关回归模型

期刊:Annu Rev Stat ApplDOI:10.1146/annurev-statistics-060116-054131
这篇文档属于类型b（综述类论文），以下是针对中文读者的学术报告：
作者与机构
 本文由V.T. Farewell（英国剑桥大学公共卫生学院医学研究委员会生物统计单位）、D.L. Long（美国西弗吉尼亚大学生物统计系）、B.D.M. Tom、S. Yiu和L. Su（均来自剑桥大学）合作完成，发表于《Annual Review of Statistics and Its Application》2017年3月刊。
主题与背景
 论文题为《Two-Part and Related Regression Models for Longitudinal Data》，系统综述了纵向数据中“两部分模型”（two-part models）的应用与挑战。这类模型适用于存在大量零值或半连续数据（semicontinuous data）的场景，例如医学研究中零膨胀计数数据（zero-inflated count data）或生活质量评分数据。其核心思想是将数据生成过程分为两部分：一部分建模二元响应变量（如是否为零），另一部分建模条件响应变量（如非零值的分布）。
主要观点与论据
 1. 两部分模型的理论基础与类型
 - 模型结构：论文以Aitchison（1955）提出的半连续数据模型为起点，介绍了两部分模型的基本形式，包括零膨胀泊松模型（zero-inflated Poisson, ZIP）和跨栏模型（hurdle models）。
 - 纵向数据扩展：传统两部分模型通过引入随机效应（random effects）处理纵向数据的组内相关性，例如Olsen & Schafer（2001）提出的混合效应模型，其中二元部分和连续部分的随机效应可存在相关性（如ρ≠0）。
模型估计的挑战与解决方案
计算复杂性：由于似然函数涉及不可解析的积分，论文对比了拉普拉斯近似（Laplace approximation）、自适应高斯求积（adaptive Gaussian quadrature）和EM算法等数值方法。
 
边际效应解释：作者强调，若忽略随机效应间的相关性（如假设ρ=0），会导致连续部分截距项的高估（如模拟中偏差达20%）。Su et al.（2009）通过理论推导和模拟验证了这一结论。
 
边际推断与模型变体
边际化模型：针对临床更关注的总体均值（overall marginal mean），论文提出“边际化ZIP模型”（marginalized ZIP model），直接建模总体均值而非条件泊松均值，并通过SAS NLMIXED实现（Long et al., 2015）。
 
桥分布应用：Su et al.（2015）在二元部分采用桥分布（bridge distribution），使边际效应与条件效应具有比例关系，简化了遗传标志物（如HLA-B27）效应的解释。
 
移动者-停留者模型（Mover-Stayer Models）
应用场景：以银屑病关节炎（PsA）患者的关节损伤数据为例，论文讨论了存在“永不发病亚组”（stayer population）时的建模方法，如复合泊松分布（compound Poisson, CP）和负二项分布（negative binomial）的变体。
 
模型选择争议：不同随机效应分布（如Gamma与逆高斯分布）对“停留者比例”（π）的估计差异显著（0 vs. 56%），需结合似然比检验和拟合优度指标（如Pearson统计量）综合判断。
 
实际应用与案例
PsA研究：通过HAQ（健康评估问卷）数据分析，证明疾病活动度与关节变形对功能障碍的影响随时间变化，且HLA-B27等位基因与功能障碍概率显著相关（OR=1.605）。
 
HIV干预试验：SAFETALK项目的边际化ZIP模型显示，动机访谈干预可使高风险性行为减少46%（IDR=0.54），且随机效应相关性（ρ=−0.79）不可忽略。
 
论文价值与意义
 本文为处理纵向零膨胀数据提供了方法学框架，尤其强调：
 1. 相关性假设的必要性：忽略随机效应相关性会导致参数估计偏差；
 2. 边际化模型的临床意义：直接建模总体均值更符合实际需求；
 3. 分布选择的敏感性：不同随机效应分布对亚组存在性的结论影响显著。
亮点
 - 首次系统比较了纵向两部分模型的估计偏差问题；
 - 提出边际化ZIP模型，解决了传统ZIP模型参数解释困难的问题；
 - 通过PsA和HIV案例，展示了方法在遗传流行病学和行为干预中的应用潜力。
（注：全文约1500字，涵盖原文核心内容，术语翻译如“two-part models”首次出现时标注英文，后续使用中文表述。）
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问