本研究由Chao Li、Ji Chen、Mengshi Dong等作者共同完成,合作机构包括中国医科大学附属第一医院、中山大学附属第三医院、上海交通大学未来技术学院等。论文发表于BMC Psychiatry期刊(2025年卷25期,文章编号372),标题为《Classification of schizophrenia spectrum disorder using machine learning and functional connectivity: reconsidering the clinical application》。研究聚焦精神分裂症谱系障碍(Schizophrenia Spectrum Disorder, SSD)的早期识别,探讨基于慢性期患者脑功能连接(Functional Connectivity, FC)特征的机器学习模型能否推广至早期患者群体。
学术背景
SSD的诊断目前主要依赖临床症状,缺乏客观的生物学标志物。既往神经影像学研究多基于慢性期、长期用药患者,其脑功能连接特征是否可作为疾病“特质性生物标志物”(trait biomarker)尚不明确。早期识别SSD对干预和预后至关重要,但慢性期模型能否适用于早期患者存在争议。本研究旨在验证:慢性期SSD的FC特征是否可推广至早期未用药患者,从而区分状态依赖(如药物影响)与特质性神经病理特征。
研究流程与方法
数据收集与预处理
- 样本:来自4个中心的1077名参与者(502例SSD患者,575例健康对照)。训练集包含3个中心的慢性用药患者(227例)和健康对照(300例);独立测试集来自中国医科大学数据集(CMU),包括慢性用药、首次发作用药及未用药患者(共275例)及匹配对照。
- 影像采集:使用3.0T MRI设备采集5-8分钟静息态功能磁共振成像(rs-fMRI)数据,预处理包括头动校正、空间标准化(蒙特利尔神经学研究所模板,MNI)、去噪(回归白质、脑脊液信号等),未进行空间平滑以避免人为相关性。
- 功能连接计算:基于Brainnetome图谱提取246个脑区的平均时间序列,计算全脑30,135对FC(Pearson相关,Fisher Z转换)。
机器学习模型构建
- 特征降维:采用主成分分析(PCA)保留95%方差,解决高维小样本问题。
- 分类器训练:使用线性支持向量机(SVM,C=1,类别权重平衡),以慢性期患者数据训练模型,测试集评估性能。
- 补充分析:包括5折交叉验证、留一站点交叉验证(leave-one-site-out)及针对首次发作未用药患者的单独验证。
统计与验证
- 性能评估:通过准确率、敏感性、特异性、受试者工作特征曲线下面积(AUC)等指标。
- 药物与病程影响:采用基于网络的统计(Network-Based Statistic, NBS)比较用药/未用药组及不同病程组的FC差异,控制年龄、性别、头动等协变量。
主要结果
模型性能
- 训练模型在独立测试集(CMU)中区分慢性用药SSD与健康对照的准确率为69%(p=0.002),敏感性71%(p=0.04),但推广至首次发作未用药患者时敏感性降至48%(p=0.44)。
- 其他验证策略(如5折交叉验证)显示类似趋势,首次发作未用药患者分类性能显著低于慢性患者。
药物与病程影响
- 药物效应:首次发作用药与未用药患者的FC在基底节/纹状体、视觉网络等区域存在显著差异(NBS校正p<0.05)。
- 病程效应:慢性与首次发作用药患者的FC无显著差异,提示FC变化主要与药物相关而非病程。
结论与意义
研究表明,基于慢性用药SSD的FC分类模型无法有效识别早期未用药患者,提示现有模型可能捕获的是药物诱导的“状态特征”(state-dependent)而非疾病特质性标志物。这一发现对神经影像学生物标志物的临床应用提出挑战:
- 科学价值:揭示了药物对脑功能连接的显著影响,强调未来研究需区分药物与疾病本身的作用。
- 应用价值:呼吁开发针对早期患者的独立模型,避免慢性期数据的局限性。
研究亮点
- 多中心大样本:整合4个机构数据,增强结果泛化性。
- 临床分层分析:首次系统比较慢性与早期患者(含未用药亚组)的模型泛化能力。
- 方法创新:结合PCA降维与SVM分类,优化高维数据处理流程;通过NBS明确药物对FC的调控作用。
局限性
- 仅基于FC特征,未整合多模态数据(如结构影像)。
- 未用药慢性患者样本量不足(仅9例),限制药物与病程交互作用的全面分析。
- 不同中心扫描参数未完全统一,可能引入变异。
该研究为SSD神经影像学生物标志物的开发提供了关键证据,推动领域重新审视慢性期数据的适用性,并为早期干预策略的优化奠定基础。