分享自:

基于注意力机制的双向意图网络用于药物-靶点相互作用识别的研究

期刊:IEEE Journal of Biomedical and Health InformaticsDOI:10.1109/JBHI.2024.3375025

类型a

主要作者与机构及发表信息
这篇研究由彭丽红(Lihong Peng)、刘欣(Xin Liu)、杨龙(Long Yang)、刘龙龙(Longlong Liu)、白宗正(Zongzheng Bai)、陈敏(Min Chen)、卢旭(Xu Lu)和聂立波(Libo Nie)等人合作完成,他们分别隶属于湖南工业大学生命科学与化学学院、湖南工学院计算机科学学院以及广东技术师范大学计算机科学学院。该研究于2023年被《IEEE Journal of Biomedical and Health Informatics》接收,并计划在2024年正式出版。

学术背景
药物-靶标相互作用(Drug-Target Interactions, DTIs)的识别是药物发现中的关键步骤。传统的体外实验方法虽然可靠,但成本高昂、耗时且劳动密集。近年来,深度学习技术在生物信息学领域取得了显著进展,尤其是在DTI预测方面。然而,如何精确表示药物和蛋白质的特征仍然是DTI预测的主要挑战之一。为此,本研究开发了一种基于双向意图网络(Bi-directional Intention Network)的端到端框架BINDTI,旨在通过注意力机制(Attention Mechanisms)提高DTI预测的准确性。

详细研究流程
本研究的工作流程包括四个主要步骤:

  1. 药物特征编码
    研究首先使用图卷积网络(Graph Convolutional Networks, GCNs)对药物特征进行编码。药物的二维分子图(2D Molecular Graph)通过其SMILES字符串(Simplified Molecular Input Line Entry System)生成。每个节点(原子)根据其化学性质初始化为74维向量,随后通过线性变换模型计算出实值稠密矩阵作为GCN的输入。研究采用三层GCN结构,通过聚合邻近原子的信息更新每个原子的特征向量,从而提取药物的局部结构信息。

  2. 蛋白质特征编码
    蛋白质特征编码采用了混合模型ACmix,该模型结合了卷积(Convolution)和自注意力机制(Self-Attention)。所有23种氨基酸被初始化为一个可学习的特征矩阵,蛋白质序列则通过嵌入矩阵初始化为张量。研究通过标准卷积操作和多头自注意力机制分别提取蛋白质特征,并将两者加权融合以获得最终的蛋白质特征表示。

  3. 药物与蛋白质特征融合
    为了融合药物和蛋白质特征,研究提出了一种双向意图网络(Bi-directional Intention Network),该网络结合了多头注意力和意图模块(Intention Module)。双向意图网络不仅考虑了药物对蛋白质的注意力,还考虑了蛋白质对药物的注意力,从而更有效地整合了生物特征。此外,研究还通过最大池化层将融合后的特征向量连接起来,形成药物-靶标对的联合特征表示。

  4. 未知药物-靶标对分类
    最后,研究使用多层感知机(Multilayer Perceptron, MLP)对未知药物-靶标对进行分类。融合后的特征向量被输入到包含四个全连接层的MLP中,最终通过sigmoid函数计算每对药物-靶标的交互概率。

主要结果
研究在BindingDB、BioSNAP、DrugBank和Human四个公开数据集上对BINDTI进行了评估,并将其与四种基线方法(CPI-GNN、TransfomerCPI、MolTrans和IIFDTI)进行了比较。实验结果表明,BINDTI在大多数指标(AUC、AUPRC、Accuracy、F1-Score和MCC)上均显著优于基线方法。特别是在BindingDB数据集上,BINDTI的AUC、AUPRC和MCC分别比MolTrans高出2.53%、3.62%和8.92%。此外,在不平衡数据集(如Human数据集)上,BINDTI的表现也优于其他方法,证明了其在处理新药物和新靶标交互预测方面的优势。

消融实验进一步验证了双向意图网络、ACmix和GCN对DTI预测性能的提升作用。可视化分析显示,BINDTI能够将融合后的药物和蛋白质特征映射到不同区域,形成更密集的药物和蛋白质簇。案例研究也表明,BINDTI预测的药物-靶标相互作用与真实标签高度一致,进一步验证了其可靠性。

结论与意义
BINDTI框架的成功开发为DTI预测提供了一个强大的工具。它不仅能够发现低成本的候选药物,还能促进虚拟筛选、药物重定位以及药物发现。BINDTI的科学价值在于其创新的双向意图网络设计,该网络通过多头注意力和意图模块显著增强了特征表示能力。此外,ACmix模型有效结合了卷积和自注意力机制,进一步提高了蛋白质特征提取的效率。

研究亮点
1. 提出了双向意图网络,显著提升了药物和蛋白质特征的融合效果。
2. 创新性地结合了GCN和ACmix,分别用于药物和蛋白质特征的编码。
3. 在多个数据集上的表现均优于现有方法,特别是在不平衡数据集上的预测能力突出。
4. 案例研究表明,BINDTI能够准确预测新药物和新靶标的相互作用,具有重要的实际应用价值。

其他有价值内容
研究还探讨了未来可能的改进方向,例如结合药物的三维分子图和蛋白质的三维结构信息,以进一步提高预测性能。此外,BINDTI框架还可扩展至非编码RNA(如microRNA或circRNA)与小分子药物的关联预测,为未来的药物靶标研究提供了新的思路。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com