基于拉曼光谱与深度学习的肝癌快速无标记病理诊断研究
作者及机构
该研究由温州医科大学附属第一医院的黄丽萍(Liping Huang)、孙宏伟(Hongwei Sun)、施克青(Keqing Shi)团队,联合温州医科大学眼视光学院生物医学工程学院的王毅(Yi Wang)、张庆文(Qingwen Zhang)团队,以及奥地利技术研究院(Austrian Institute of Technology)的Wolfgang Knoll团队共同完成,发表于Nature Communications期刊(2023年14卷48期)。
学术背景
肝癌是全球第七大常见癌症和第三大癌症相关死因,传统诊断依赖活检(biopsy)结合H&E染色(Haematoxylin & eosin staining),但存在耗时、依赖病理专家等局限。拉曼光谱(Raman spectroscopy)作为一种非破坏性、无标记的光学技术,能够通过分子振动信号提供生物样本的“化学指纹”。本研究旨在开发一种结合拉曼光谱与深度学习(deep learning)的肝癌快速病理诊断方法,实现体外和术中癌症组织识别、亚型分型及分级。
研究流程
1. 样本准备与拉曼光谱采集
- 研究对象:120例原发性肝癌患者(98例肝细胞癌HCC,22例肝内胆管癌ICC)的配对癌组织及癌旁组织(共240个样本)。
- 样本处理:组织块冷冻保存,检测前仅简单吸水处理以避免破坏分子结构。
- 光谱采集:使用532 nm激光的显微拉曼光谱仪(Renishaw),每样本采集至少50个光谱(范围500–2000 cm⁻¹),空间分辨率达亚微米级。
- 创新方法:采用LiveTrack技术实时调整样品高度,解决组织表面不平整问题。
2. 深度学习模型构建
- 数据预处理:基线校正和Savitzky-Golay平滑处理。
- 模型架构:基于VGG-16框架改进的一维卷积神经网络(CNN),包含13个卷积层、5个池化层和3个全连接层,使用Softmax优化器和Dropout(50%)防止过拟合。
- 训练数据:12,000条光谱(120对样本),按8:2划分训练集与验证集。
3. 组织代谢组学验证
- 方法:液相色谱-质谱联用(LC-MS)分析25对HCC与癌旁组织的代谢物差异。
- 结果:发现108种差异代谢物,如酪氨酸(tyrosine)、多不饱和脂肪酸(PUFA-tagged phosphatidylcholines)在癌组织中显著下调,与拉曼光谱强度变化一致。
4. 拉曼成像与肿瘤边界识别
- 技术:通过自建模曲线分辨(SMCR)和层次聚类分析(HCA)算法,重构未处理组织切片的2D/3D分子组成图像。
- 结果:成功可视化肝癌细胞的蛋白质与脂质分布差异(如核区蛋白浓度高),并识别肿瘤浸润区域(图4)。
5. 术中实时诊断验证
- 设备:自主研发的便携式拉曼系统(785 nm激光,光纤耦合探头)。
- 应用:术中实时检测显示癌组织拉曼信号强度显著低于正常组织(图6),验证了技术的临床可行性。
主要结果
- 癌与癌旁组织区分:CNN模型准确率达92.6%(灵敏度90.8%,特异性94.6%),显著优于传统血清标志物AFP(灵敏度仅27.2%)。
- 亚型与分级识别:HCC与ICC的鉴别准确率82.4%;不同分化程度(中/低分化)准确率72.3%。
- 分子机制验证:代谢组学证实癌组织中氨基酸、核酸代谢紊乱,与拉曼特征峰(如1003 cm⁻¹对应AFP)高度相关。
- 成像突破:亚微米级拉曼图像首次实现肝癌边界无标记可视化,与H&E染色结果一致(图5)。
结论与价值
科学价值:
- 首次系统证明拉曼光谱结合深度学习可替代传统病理诊断,提供分子水平的癌症异质性信息。
- 为术中实时肿瘤边界识别提供新工具,辅助精准切除。
应用潜力:
- 便携式拉曼系统有望缩短术中病理诊断时间至分钟级,减少冷冻切片依赖。
- 技术可扩展至其他癌症(如脑瘤、结肠癌)的诊断。
研究亮点
方法创新:
- 开发了针对拉曼光谱的VGG-16-CNN模型,解决传统化学计量学对大数据集的局限性。
- 首创术中拉曼探头结合无菌防护罩的临床实施方案。
技术整合:
- 将代谢组学(LC-MS)与拉曼光谱(Ramanomics)交叉验证,增强结果可靠性。
- 实现未处理组织的3D分子成像,突破染色技术的空间分辨率限制。
临床意义:
- 克服了肝癌异质性导致的诊断难点,为个性化治疗提供分子依据。
其他价值
研究开源了CNN模型代码(GitHub),并提出了拉曼设备标准化建议(如激光波长、功率),为后续多中心研究奠定基础。