分享自:

基于子图匹配学习揭示蛋白质网络中的草药-症状关联及其作用机制

期刊:IEEE Journal of Biomedical and Health InformaticsDOI:10.1109/JBHI.2025.3554520

学术研究报告:基于子图匹配学习的蛋白质网络中草药-症状关联及作用机制揭示

作者及机构
本研究的通讯作者为华中农业大学的Wen Zhang和Zhinan Mei,第一作者Menglu Li与Yongkang Wang(共同一作)。合作单位包括华中农业大学信息学院、中南民族大学药学院,以及华中农业大学园艺植物生物学教育部重点实验室。论文发表于《IEEE Journal of Biomedical and Health Informatics》,2025年正式刊出。

学术背景
研究领域为网络药理学(Network Pharmacology)图学习(Graph Learning)的交叉应用。传统中医药(TCM)中,草药-症状关联(Herb-Symptom Associations, HSAs)的解析是连接传统知识与现代生物医学的关键,但现有方法(如基于蛋白质互作网络(PPI)的拓扑分析)存在两大局限:一是均质化处理所有蛋白质节点,忽略其异质性贡献;二是难以动态捕捉草药多成分、多靶点的复杂作用机制。为此,研究团队提出GraphHSA模型,旨在通过子图匹配学习和对比学习策略,预测HSAs并揭示其分子机制。

研究流程与方法
1. 数据准备与子图构建
- 数据集:整合1,430组已验证的HSAs、327,924个蛋白质互作(PPI)、128,255组草药-蛋白质互作(HPI)及12,601组症状-蛋白质互作(SPI),覆盖798种草药、174种症状和18,505个蛋白质。
- 子图提取:将草药(h)和症状(s)映射至PPI网络,提取其h跳蛋白质邻居(如式1),构成子图G_h和G_s。为统一规模,对邻居节点进行固定数量采样。

  1. 子图匹配学习

    • 注意力权重计算:通过内积计算子图中各蛋白质节点对草药/症状的贡献权重(式2),加权聚合生成嵌入向量(式3)。多层迭代后,拼接各层嵌入得到最终表示(式4)。
    • 匹配关系建模:将草药与症状的子图嵌入拼接,输入多层感知机(MLP)生成PPI-based表示(式5)。
  2. HSA网络表征学习

    • 使用图卷积网络(GCN)从HSA网络中学习节点嵌入(式6),拼接后生成HSA-based表示(式7)。
  3. 双对比学习策略

    • 自监督对比损失(L_cl1):最大化同一HSAs对的PPI与HSA表示相似性(式12)。
    • 监督对比损失(L_cl2):通过锚点(已验证HSAs均值)拉近正样本、推远负样本(式13)。
  4. 预测与优化

    • 联合PPI与HSA表示,通过注意力机制加权(式8),MLP输出关联概率(式9)。总损失函数为分类损失与对比损失的加权和(式14)。

主要结果
1. 预测性能
- 在独立测试集中,GraphHSA在“冷启动”(新草药或症状)场景下表现优异:
- 冷启动草药:AUPR=0.9646,AUC=0.9651;
- 冷启动症状:AUPR=0.9455,AUC=0.9501;
- 冷启动对(新草药+新症状):AUPR=0.9093,AUC=0.9217,显著优于基线方法(如Node2Vec、GraphSynergy)。

  1. 机制解析案例

    • 单味药“白芷”:预测与“腹痛”高关联(置信度>0.9),其高注意力靶点(如NGF、IGF1)通过TRK受体信号通路调控痛觉过程。
    • 复方“四妙丸”:预测11种高置信症状(如湿疹、皮肤瘙痒),与临床报道一致;富集分析显示其靶点显著参与IL-17信号通路(图3),印证抗炎机制。
  2. 生物学验证

    • 对湿疹相关草药靶点的GO/KEGG分析发现,炎症反应(inflammatory response)、氧化应激响应(response to oxidative stress)等术语显著富集,与湿疹治疗机制相符。

结论与价值
1. 科学价值
- 提出首个基于子图匹配学习的HSAs预测框架,突破传统方法对蛋白质节点均质化处理的局限,动态量化靶点贡献。
- 通过双对比学习缓解标注数据不足问题,为小样本生物网络分析提供新思路。

  1. 应用价值
    • 可扩展至复方研究,解析多草药协同机制(如“四妙丸”),助力TCM现代化。
    • 开源代码(GitHub)及高置信HSAs数据库为后续研究提供资源。

研究亮点
1. 方法创新:首次将子图匹配学习引入HSAs预测,结合注意力机制与对比学习,实现高精度、可解释性建模。
2. 跨学科融合:整合TCM经验知识与AI算法,为网络药理学提供新工具。
3. 临床验证:预测结果与已知药理机制高度一致(如IL-17通路),证实模型生物学意义。

其他价值
研究团队计划进一步开发草药剂量预测方法,并优化负样本选择策略以减少假阴性干扰。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com