作者及发表信息
本研究由Ying Ren(黑龙江省第三医院)、Min-Yu Tsai、Liyuan Chen、Jing Wang、Shulong Li(均来自美国德克萨斯大学西南医学中心MAIA实验室)、Yufei Liu(重庆大学)、Xun Jia及Chenyang Shen(通讯作者)共同完成,发表于《International Journal of Computer Assisted Radiology and Surgery》(2019年11月)。
研究领域与动机
肺癌是全球第二大高发癌症,早期诊断依赖放射科医生对CT图像中肺结节的良恶性判断,但人工阅片存在效率低、经验依赖性强等问题。传统方法分为两类:
1. 影像组学(Radiomics):基于手工提取的结节强度、纹理等特征构建分类器,但特征选择存在主观性;
2. 深度学习方法:虽能自动提取特征,但面临医学影像数据量不足导致的过拟合问题。
科学问题与目标
作者提出流形正则化分类深度神经网络(MRC-DNN),通过将高维CT图像映射到低维流形(Manifold),结合重构约束与分类任务,提升小样本下的分类性能,旨在解决以下问题:
- 传统特征提取的局限性;
- 深度学习在医学影像中的过拟合风险。
MRC-DNN模型包含三部分(图1):
- 编码器(Encoder):将32×32×32体素的3D结节图像压缩至低维流形空间;
- 解码器(Decoder):从流形重构原始图像,约束信息保留;
- 全连接网络(FCNN):基于流形特征进行良恶性分类。
损失函数联合优化重构误差与分类误差:
$$
\mathcal{L} = |x - d(e(x))|_2^2 + \lambda |y - f(e(x))|_2^2
$$
其中$\lambda=0.2$为权衡参数,通过反向传播(Backpropagation)和随机梯度下降(SGD)训练。
数据集:采用LIDC-IDRI公开数据库,筛选≥3 mm的结节(1226例,恶性431例,良性795例)。随机划分80%训练(含验证集)、20%测试。
对比方法:
- C-DNN:移除解码器的基准网络;
- 5种前沿深度学习模型(如Multi-crop Net、ALNC等)。
$\lambda$取值实验表明,$\lambda=0.2$时验证集准确率最高(92%),过小($\lambda=0.1$)会导致分类性能下降至87%。
MRC-DNN的训练-验证损失差距显著小于C-DNN(图3),证明流形约束有效缓解了小样本过拟合。
局限与展望
- 未探索不同流形维度的敏感性;
- 未来可结合多模态数据(如PET-CT)进一步优化分类边界。