本文由Heba Asker、Marwa A. A. Fayed、Heba Mamdouh Farghaly、Mamdouh M. Gomaa、Enas Elgeldawi、Yaseen A. M. M. Elshaier、Ashraf Darwish和Aboul Ella Hassanien共同撰写,发表于《Scientific Reports》期刊,预计于2025年发表。该研究的主要目标是探索硫(sulfur)和氧化镁(magnesium oxide, MgO)的抗癌活性,并通过深度学习(deep learning, DL)和模糊粗糙集(fuzzy rough set, FRS)分析结合vidarabine生物碱的特征,重新发现潜在的抗癌药物。
癌症是全球最严重的健康危机之一,开发新的抗癌药物或改进现有药物以减少副作用是科学家面临的重要挑战。药物发现和开发是一个耗时且成本高昂的过程。本文提出了一种结合人工智能(AI)技术的模型,旨在加速药物发现过程,特别是通过药物再利用(drug repurposing)来发现新的抗癌药物。Vidarabine是一种从海洋来源中分离出的天然药物,已被FDA批准用于抗病毒治疗,但其抗癌活性尚未得到充分研究。本文通过实验室实验发现,Vidarabine对非小细胞肺癌(A-549)、人类黑色素瘤(A-375)和人类表皮皮肤癌(A-431)的IC50值分别为6.97 µg/ml、25.78 µg/ml和>100 µg/ml。为了进一步探索其抗癌潜力,研究团队开发了一个结合深度学习、模糊粗糙集和可解释人工智能(explainable artificial intelligence, XAI)的模型,旨在识别新的抗癌药物候选物。
研究分为七个主要阶段,详细流程如下:
Vidarabine的抗癌研究(湿实验)
研究首先通过湿实验评估了Vidarabine对三种癌细胞系(A-549、A-375、A-431)和两种正常细胞系(OEC、HSF)的细胞毒性。实验使用SRB(sulforhodamine B)法测定IC50值,结果显示Vidarabine对A-549和A-375细胞系表现出较强的细胞毒性,但对A-431细胞系无显著活性。
数据收集与预处理
研究团队从CancerRxGene数据库中收集了标准药物的IC50值,并使用PubChem和DrugBank数据库生成了这些药物的SMILES(Simplified Molecular Input Line Entry System)格式。随后,使用RDKit工具包生成了每个药物的分子描述符(descriptors),并将数据保存为CSV文件,作为后续分析的输入。
基于模糊粗糙集的特征选择
该阶段的目标是从大量分子描述符中选择对IC50值预测最重要的特征。模糊粗糙集理论被用于处理不确定和不精确的数据,帮助识别与药物活性相关的关键分子特征。研究团队通过计算模糊上下近似值,确定了每个癌细胞系的最重要描述符。
基于前期结果的药物再利用
在前一阶段的基础上,研究团队构建了新的数据集,包括Vidarabine衍生物、核苷类药物和其他已报道的化合物。通过分析这些化合物的分子特征,筛选出潜在的抗癌药物候选物。
深度学习预测模型
研究团队开发了一个卷积神经网络(CNN)模型,用于预测新化合物的IC50值。该模型通过训练从SMILES格式生成的分子描述符,能够有效预测药物对不同癌细胞系的抑制浓度。模型的性能通过均方误差(MSE)和平均绝对误差(MAE)进行评估,结果显示其对A-375细胞系的预测性能最佳。
深度学习模型的性能评估与可解释性分析
研究使用XAI技术(如LIME模型)来解释深度学习模型的预测结果,帮助理解哪些分子特征对IC50值的预测贡献最大。通过LIME模型,研究团队能够识别出对A-549、A-375和A-431细胞系IC50值预测具有显著影响的特征。
选定药物的抗癌研究(湿实验验证)
最后,研究团队通过湿实验验证了AI模型预测的硫和氧化镁的抗癌活性。结果显示,硫对所有测试的癌细胞系均表现出显著的细胞毒性,而氧化镁对A-431细胞系表现出较强的活性,但对A-549和A-375细胞系的活性较弱。进一步的细胞周期和凋亡实验表明,硫和氧化镁通过诱导细胞周期阻滞和凋亡发挥其抗癌作用。
Vidarabine的抗癌活性
Vidarabine对A-549和A-375细胞系表现出较强的细胞毒性,但对A-431细胞系无显著活性。其IC50值分别为6.97 µg/ml、25.78 µg/ml和>100 µg/ml。
硫和氧化镁的抗癌活性
硫对A-549、A-375和A-431细胞系的IC50值分别为3.06 µg/ml、1.86 µg/ml和4.55 µg/ml,表现出显著的抗癌活性。氧化镁对A-431细胞系的IC50值为17.29 µg/ml,但对A-549和A-375细胞系的活性较弱。
深度学习模型的性能
CNN模型在预测IC50值方面表现出色,特别是对A-375细胞系的预测误差最低(MSE = 0.000194,MAE = 0.011517)。
本研究通过结合深度学习、模糊粗糙集和可解释人工智能技术,成功识别了硫和氧化镁作为潜在的抗癌药物候选物。研究结果表明,AI技术在药物发现中具有巨大的潜力,能够加速新药物的发现过程,并揭示传统方法难以识别的隐藏化学特征。硫和氧化镁的抗癌活性为未来的临床前研究提供了新的方向,特别是在治疗人类表皮皮肤癌(A-431)方面。此外,硫在治疗非小细胞肺癌(A-549)和人类黑色素瘤(A-375)方面也表现出良好的前景。
未来的研究将进一步探索硫和氧化镁在临床前和临床试验中的应用,特别是在治疗人类表皮皮肤癌、非小细胞肺癌和人类黑色素瘤方面的潜力。此外,研究团队计划将该模型应用于其他天然产物,以发现更多具有抗癌活性的化合物。