分享自:

随机对照试验中患者报告结果统计方法的比较:模拟研究

期刊:Statistical Methods in Medical ResearchDOI:10.1177/09622802241275361

本研究由Yirui Qian(约克大学健康经济学中心)、Stephen J Walters(谢菲尔德大学医学院与公共卫生学院人口健康部)、Richard M Jacques(同前)和Laura Flight(同前)共同完成,发表于《Statistical Methods in Medical Research》2024年第33卷(11-12期)。论文标题为《Comparison of Statistical Methods for the Analysis of Patient-Reported Outcomes in Randomised Controlled Trials: A Simulation Study》。

学术背景

患者报告结局(Patient-Reported Outcomes, PROs)是一种通过患者主观反馈评估健康状态的工具,在随机对照试验(Randomised Controlled Trials, RCTs)中的应用日益广泛。然而,PRO数据通常具有有界性、离散性和偏态分布的特征,这使得选择合适的统计分析方法成为挑战。目前,学术界对于PRO分析的最佳统计方法尚未达成共识。本研究旨在通过蒙特卡洛模拟(Monte Carlo simulation)比较三种统计方法——多元线性回归(MLR)、Tobit回归(Tobit)和中位数回归(Median)——在平衡双臂RCT中分析离散化PRO数据时的性能,包括偏差、经验标准误、置信区间覆盖率、I类错误和统计功效等指标。

研究方法与流程

1. 研究设计

本研究采用模拟分析方法,基于正态分布生成潜在连续变量,并通过离散化技术将其转换为具有4、10和26个等级的PRO数据。研究模拟了五种预定义的治疗效应(Cohen效应量:0、0.2、0.5、0.8、1.0),并考虑了六种样本量(100至1600)。研究框架遵循ADEMP策略(Aims, Data-generating mechanism, Estimands, Methods, Performance measures)。

2. 数据生成机制

以SF-36健康调查为PRO代表,选取其三个维度:情感角色限制(RE,4等级)、身体疼痛(BP,10等级)和心理健康(MH,26等级)。数据生成基于正态分布(μ=50,σ=22),并通过区间划分将连续值离散化为等间距分数。对于超出边界(0-100)的值,采用截断处理。

3. 统计方法比较

  • 多元线性回归(MLR):假设因变量与预测变量呈线性关系,误差项服从正态分布。
  • Tobit回归:假设潜在变量存在截断,适用于有界数据。
  • 中位数回归:估计条件中位数,不依赖于分布假设。

每种方法在5000次重复模拟中评估性能指标,包括偏差、经验标准误、均方误差(MSE)、95%置信区间覆盖率和统计功效。

主要结果

1. 模型性能

  • MLR:在多数场景下表现最优,偏差最小(如治疗效应为22时,4等级偏差为-0.67,26等级为-1.03),置信区间覆盖率接近95%(如样本量1600时覆盖率为94.3%-95.7%)。
  • Tobit:在分析高离散等级(如26等级)时表现接近MLR,但在低离散等级(如4等级)中偏差较大(治疗效应22时偏差达4.8)。
  • 中位数回归:表现最差,尤其在低离散等级中偏差显著(如4等级偏差达15.8),且统计功效低于50%。

2. 样本量与离散等级的影响

  • 样本量增大时,MLR和Tobit的MSE显著降低(如样本量从100增至1600,MLR的MSE从4.8降至1.2)。
  • 离散等级增加(如从4增至26)可改善中位数回归的精度,但其性能仍逊于MLR。

结论与意义

本研究推荐MLR作为RCT中分析PRO数据的通用方法,因其在大多数场景下具有低偏差、高精度和稳健性。Tobit可作为高离散等级数据(如≥10等级)且治疗效应较大时的替代选择。中位数回归因性能缺陷不推荐使用。
科学价值
1. 首次系统比较了MLR、Tobit和中位数回归在PRO分析中的性能差异,填补了方法学空白。
2. 为RCT中PRO数据的统计分析提供了循证选择依据,支持FDA和CONSORT-PRO等指南的实践应用。

研究亮点

  1. 创新性方法:通过离散化正态分布模拟PRO数据的真实特征,解决了潜在连续变量与离散观测值之间的建模矛盾。
  2. 全面性评估:涵盖多种离散等级、样本量和治疗效应场景,性能指标覆盖偏差、精度和稳定性。
  3. 明确应用建议:基于证据提出MLR优先的决策框架,为临床研究者提供实操指导。

其他价值

研究局限性包括未涵盖极端偏态分布和缺失数据处理,未来可扩展至更复杂的PRO数据类型(如效用分数)。该研究为后续方法学比较奠定了基准框架。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com