分享自:

基于群体的轨迹建模是否会产生虚假轨迹?

期刊:BMC Medical Research MethodologyDOI:10.1186/s12874-022-01622-9

该文档属于类型a,即报告了一项单一原创研究。以下是针对该研究的学术报告:

主要作者及机构:该研究由Miceline Mésidor、Marie-Claude Rousseau、Jennifer O’Loughlin和Marie-Pierre Sylvestre共同完成。作者来自加拿大蒙特利尔大学附属医院研究中心(Centre de recherche du centre hospitalier de l’université de Montréal)和蒙特利尔大学社会与预防医学系(Department of Social and Preventive Medicine, Université de Montréal)。研究发表于2022年的《BMC Medical Research Methodology》期刊。

学术背景:该研究属于医学研究方法学领域,重点关注群体轨迹建模(Group-Based Trajectory Modeling, GBTM)在识别个体亚组中的潜在问题。GBTM是一种广泛应用于纵向数据分析的方法,用于识别具有相似模式的个体亚组。然而,已有研究表明,GBTM在某些情况下可能生成虚假轨迹,尤其是在模型假设被违反时。因此,该研究旨在通过模拟数据和真实数据,探讨GBTM在识别虚假轨迹方面的局限性,并评估模型拟合标准的有效性。

研究目标:该研究的主要目标是:(1)证明GBTM可能生成虚假轨迹;(2)评估模型拟合标准在识别模型误设方面的能力。研究通过模拟六种不同场景的数据,分析GBTM在识别轨迹亚组数量、轨迹形状和亚组参与者数量方面的表现,并比较不同模型拟合标准的性能。

研究流程
1. 数据模拟:研究模拟了六种场景的数据,其中两种场景模仿了已发表的研究。每种场景生成了500名个体(场景2为300名)的纵向数据,包含5次重复测量。模拟数据的设计考虑了亚组内和亚组间的异质性。
2. 模型估计:研究使用GBTM对每种场景的数据进行建模,估计了1到10个轨迹亚组的模型,并选择贝叶斯信息准则(Bayesian Information Criterion, BIC)最小的模型作为最优模型。
3. 模型评估:研究评估了GBTM在识别轨迹亚组数量、轨迹形状和亚组参与者数量方面的准确性,并比较了平均后验概率(Average Posterior Probability, APP)、相对熵(Relative Entropy)和失配(Mismatch)三种模型拟合标准的性能。
4. 敏感性分析:研究还使用潜在类别增长模型(Latent Class Growth Model, LCGM)进行敏感性分析,以评估亚组内变异性对结果的影响。
5. 真实数据应用:研究使用“青少年尼古丁依赖研究”(Nicotine Dependence in Teens, NDIT)的真实数据,分析睡眠困难的轨迹,以验证模拟研究的结果。

主要结果
1. 模拟数据结果:在六种场景中,GBTM仅在两种场景中正确识别了轨迹亚组数量,在四种场景中正确识别了轨迹形状,仅在一种场景中正确估计了亚组参与者数量。相对熵和失配标准在检测虚假轨迹方面优于平均后验概率。
2. 模型拟合标准比较:研究发现,平均后验概率在大多数场景中未能检测到虚假轨迹,而相对熵和失配标准在识别模型误设方面表现更好。
3. 敏感性分析结果:LCGM在存在亚组内变异性或数据无亚组的情况下表现优于GBTM,但在某些场景中未能收敛。
4. 真实数据结果:在NDIT数据中,GBTM识别了三个睡眠困难轨迹亚组,但失配标准表明分类存在误差,表明GBTM可能低估了个体模式的变化。

结论:该研究揭示了GBTM在识别虚假轨迹方面的局限性,尤其是在模型假设被违反时。研究强调,仅依赖平均后验概率作为模型拟合标准可能导致错误的结论,建议使用多种模型拟合标准来评估分类的准确性。此外,研究还建议在分析纵向数据时,结合其他方法(如LCGM)以提高结果的可靠性。

研究意义:该研究对医学研究中的轨迹分析方法具有重要启示。通过揭示GBTM的潜在问题,研究为改进轨迹分析提供了理论依据和实践指导。研究结果有助于提高纵向数据分析的准确性,特别是在健康行为和发展轨迹研究中。

研究亮点
1. 创新性:该研究首次系统评估了GBTM在多种场景下的表现,揭示了其生成虚假轨迹的潜在风险。
2. 方法学贡献:研究提出了使用多种模型拟合标准(如相对熵和失配)来评估GBTM分类准确性的建议,为未来研究提供了重要参考。
3. 应用价值:研究结果对健康行为和发展轨迹研究具有重要应用价值,有助于提高数据分析的可靠性和结论的科学性。

其他有价值的内容:研究还提供了SAS代码,用于计算相对熵和失配标准,为其他研究者提供了实用工具。此外,研究通过模拟数据和真实数据的结合,增强了结果的普适性和说服力。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com