这篇文档属于类型a,即报告了一项原创性研究。以下是对该研究的学术报告:
本研究的主要作者包括黄星烨、韦国超、郭云霞、沈嘉豪、毕昆、张泽群、黄炎和赵祥伟。他们分别来自东南大学生物科学与医学工程学院、扬州大学附属医院麻醉科以及广州大学计算科技研究院。该研究于2025年4月发表在《中国生物医学工程学报》(Chinese Journal of Biomedical Engineering)第44卷第2期上。
本研究的主要科学领域是生物医学工程,特别是神经干细胞分化的图像识别与分析。随着神经系统疾病的高发,神经干细胞治疗成为研究热点。然而,现有技术在评估神经干细胞分化过程中存在挑战,尤其是在非标记细胞图像的分化阶段识别方面。本研究旨在开发一种基于卷积神经网络(CNN)和迁移学习技术的方法,以高效分类非标记神经细胞分化阶段的图像,并结合单细胞转录组数据提高分化阶段检测的准确性,验证方法的有效性。
研究流程包括以下几个主要步骤:
数据采集与预处理
研究团队采集了1026张不同分化阶段的PC12细胞明场图像,并补充了公开数据集中的HEK-293A细胞和HT1080细胞图像各100张。所有图像经过多中心点裁剪和分位数归一化处理,生成224像素×224像素的图像数据集。图像数据由三位细胞养育专家人工标注,分为未分化、低分化和高分化三组。
迁移学习模型训练
研究使用了四种卷积神经网络模型(AlexNet、VGG16、ResNet34和DenseNet121)进行迁移学习训练。模型在ImageNet数据集上预训练后,通过细胞图像数据集进行微调。训练过程中采用数据增强策略(如旋转、翻转、放大裁剪等),并使用随机梯度下降(SGD)优化算法进行反向传播。训练轮次设置为200,初始学习率为0.001。
模型评价
通过混淆矩阵、准确率、精确率、召回率、F1-score、ROC曲线和AUPR曲线等指标评估模型性能。测试集包含每个类别100张图像,模型在测试集上的表现通过混淆矩阵和各类评价指标进行详细分析。
单细胞形态信息采集与分类
使用A-Pick单细胞分离装置采集32个不同分化阶段的PC12细胞样本,并保留采样时刻的细胞图像。通过ResNet34-TL模型对细胞图像进行分类,将样本分为未分化(A组)、低分化(B组)和高分化(C组)三组。
单细胞转录组测序与生物信息学分析
对分类后的细胞样本进行单细胞RNA测序(scRNA-seq)建库测序,获得基因表达数据。通过FastQC、Drop-seq流程和STAR比对工具对原始数据进行过滤和比对,生成基因表达矩阵。利用主成分分析(PCA)和统一流形逼近与投影(UMAP)进行降维可视化,并通过差异基因表达分析和基因本体论(GO)富集分析进一步验证分类结果的生物学意义。
模型性能
ResNet34-TL模型在细胞分类任务中表现最佳,测试集准确率达到95.8%。其他模型(如VGG16-TL和DenseNet121-TL)也表现出较高的分类能力,但ResNet34-TL在低分化细胞的分类上表现尤为突出。
单细胞转录组分析
转录组分析显示,未分化组和高分化组细胞在基因表达上存在显著差异,低分化组细胞表现出介于未分化组和高分化组之间的过渡状态。特征基因的表达量差异进一步验证了模型分类结果的生物学合理性。
生物学意义
研究结果表明,ResNet34-TL模型能够有效区分不同分化状态的神经细胞,为神经干细胞分化研究提供了一种高效、可靠的工具。此外,结合转录组学分析的方法为非标记细胞图像的分化阶段识别提供了新的思路。
本研究开发了一种基于卷积神经网络和迁移学习技术的非标记神经细胞分化阶段分类方法,并通过单细胞转录组分析验证了其有效性。该方法无需额外的染色步骤,对细胞生理状态无影响,且能够适应显微镜下细胞图像的复杂性与多样性。研究为神经干细胞分化研究提供了新的技术手段,并为神经系统疾病的诊断和治疗提供了潜在支持。
研究中使用的数据增强策略和迁移学习技术为其他生物医学图像分类任务提供了参考。此外,A-Pick单细胞分离装置和scRNA-seq技术的结合为单细胞研究提供了高效的技术平台。
本研究在神经细胞分化阶段识别领域取得了重要进展,为神经干细胞治疗和神经系统疾病研究提供了新的工具和方法。