本研究由Yirui Qian(约克大学健康经济学中心)、Stephen J Walters(谢菲尔德大学医学院与公共卫生学院人口健康部)、Richard M Jacques(同前)和Laura Flight(同前)共同完成,发表于《Statistical Methods in Medical Research》2024年第33卷(11-12期)。论文标题为《Comparison of Statistical Methods for the Analysis of Patient-Reported Outcomes in Randomised Controlled Trials: A Simulation Study》。
患者报告结局(Patient-Reported Outcomes, PROs)是一种通过患者主观反馈评估健康状态的工具,在随机对照试验(Randomised Controlled Trials, RCTs)中的应用日益广泛。然而,PRO数据通常具有有界性、离散性和偏态分布的特征,这使得选择合适的统计分析方法成为挑战。目前,学术界对于PRO分析的最佳统计方法尚未达成共识。本研究旨在通过蒙特卡洛模拟(Monte Carlo simulation)比较三种统计方法——多元线性回归(MLR)、Tobit回归(Tobit)和中位数回归(Median)——在平衡双臂RCT中分析离散化PRO数据时的性能,包括偏差、经验标准误、置信区间覆盖率、I类错误和统计功效等指标。
本研究采用模拟分析方法,基于正态分布生成潜在连续变量,并通过离散化技术将其转换为具有4、10和26个等级的PRO数据。研究模拟了五种预定义的治疗效应(Cohen效应量:0、0.2、0.5、0.8、1.0),并考虑了六种样本量(100至1600)。研究框架遵循ADEMP策略(Aims, Data-generating mechanism, Estimands, Methods, Performance measures)。
以SF-36健康调查为PRO代表,选取其三个维度:情感角色限制(RE,4等级)、身体疼痛(BP,10等级)和心理健康(MH,26等级)。数据生成基于正态分布(μ=50,σ=22),并通过区间划分将连续值离散化为等间距分数。对于超出边界(0-100)的值,采用截断处理。
每种方法在5000次重复模拟中评估性能指标,包括偏差、经验标准误、均方误差(MSE)、95%置信区间覆盖率和统计功效。
本研究推荐MLR作为RCT中分析PRO数据的通用方法,因其在大多数场景下具有低偏差、高精度和稳健性。Tobit可作为高离散等级数据(如≥10等级)且治疗效应较大时的替代选择。中位数回归因性能缺陷不推荐使用。
科学价值:
1. 首次系统比较了MLR、Tobit和中位数回归在PRO分析中的性能差异,填补了方法学空白。
2. 为RCT中PRO数据的统计分析提供了循证选择依据,支持FDA和CONSORT-PRO等指南的实践应用。
研究局限性包括未涵盖极端偏态分布和缺失数据处理,未来可扩展至更复杂的PRO数据类型(如效用分数)。该研究为后续方法学比较奠定了基准框架。