分享自:

基于动态临床轨迹聚合与几何增强分子表示的增强型药物推荐

期刊:Expert Systems with ApplicationsDOI:10.1016/j.eswa.2026.132225

本文旨在介绍一项发表于Expert Systems with Applications期刊(2026年卷321期,文章ID 132225)的研究工作。该研究由大连海事大学信息科学技术学院的张世迪、李晓波、马子伟和张一佳(通讯作者)共同完成。研究团队针对临床决策支持中的关键问题——精准、安全的药物推荐,提出了一种名为DCGM的创新框架。该框架的核心在于整合动态临床轨迹聚合与几何增强的分子表征,以克服现有方法的局限性。

一、 研究的学术背景与目标

药物推荐是智能医疗领域的热点研究方向,其目标是根据患者的当前健康状况和电子健康记录数据,辅助临床医生制定最合适的药物组合处方。随着电子健康记录的普及,基于人工智能的药物推荐方法得以发展,能够系统挖掘诊断信息和治疗历史以支持数据驱动的临床决策。

然而,现有的主流方法面临两大核心挑战,这也是本研究的出发点: 1. 对动态临床轨迹捕捉不足:患者(尤其是慢性病患者)的疾病进展往往是非线性且不连续的。现有方法通常对所有历史就诊记录进行统一聚合,难以区分与当前病情相关和不相关的历史轨迹,导致患者建模不精确,易受临床噪声干扰。 2. 对药物分子几何知识的利用不足:大多数现有方法依赖药物的二维分子结构图来学习药物表示。然而,药物的疗效和安全性在很大程度上取决于其三维空间几何构型。仅使用二维结构会丢失关键的立体化学信息,可能导致推荐错误。一个经典例子是沙利度胺:其R-对映体具有镇静作用,而S-对映体则具有致畸性。二维结构相同的对映体,其药理作用截然不同,凸显了三维感知建模的至关重要性。

为了填补上述空白,本研究旨在开发一个多粒度药物推荐框架DCGM,通过整合动态临床轨迹和几何增强的药物知识,实现对患者疾病进展的更精准建模和对药物药理特性的更忠实表征,最终提升推荐系统的准确性与安全性。

二、 研究详细工作流程

DCGM框架包含三个核心模块:动态临床轨迹聚合模块、几何增强分子表征模块和药物推荐模块。研究在两个公开的大型临床数据库MIMIC-III和MIMIC-IV上进行实验验证。

1. 动态临床轨迹聚合模块 此模块旨在从患者历史就诊记录中,有选择性地检索和整合与当前状态相似的疾病和用药轨迹,以构建精准且对噪声鲁棒的患者表征。 * 输入与嵌入:对于患者的第t次就诊,模型获取当前诊断向量、当前操作向量以及上一次就诊的药物向量。这些向量通过可学习的嵌入矩阵被映射到低维表示空间。 * 非线性特征提取与相似性检索:研究采用了一种新颖的Kolmogorov-Arnold网络(KAN)来对当前患者状态(由诊断和操作嵌入拼接而成)进行非线性特征提取,生成聚合表示。KAN结合了基函数和样条函数,相比传统的多层感知机,能更好地拟合复杂分布和局部模式。随后,该聚合表示被用于查询一个历史记忆池。通过计算与每个历史状态表示的欧氏距离,模型筛选出距离小于预设阈值γ的历史就诊,认为这些就诊与当前状态临床相关。这一机制实现了对历史信息的动态、选择性聚合,而非简单的时间序列建模。 * 序列编码与健康表征构建:检索到的相关历史诊断、操作和药物序列,分别通过三个独立的门控循环单元进行编码,生成对应的隐藏表示。最后,将这些表示与上一时间步的药物表示进行拼接,形成最终的临床健康表征向量,作为后续药物推荐任务的关键输入。

2. 几何增强分子表征模块 此模块旨在突破传统二维分子表征的局限,通过引入三维药物先验知识,构建更丰富的药物表示。 * 三维分子图构建:对于每种药物,首先将其SMILES字符串转化为分子对象,并补充氢原子。接着,利用ETKDG算法结合MMFF94力场优化(通过RDKit工具包)生成低能量的三维构象,获得每个原子的三维空间坐标。基于此,研究创新性地构建了两种图: * 原子-键图:以原子为节点,化学键为边。节点特征包含原子序数、手性、度数等;边特征包含键类型、是否在环内等。 * 键-角图:以化学键为节点,共享一个中心原子的两个键构成一条边。节点特征包含键长;边特征包含键角、拓扑极性表面积等关键几何描述符。 * 空间几何特征学习:采用基于GeoGNN的框架,在构建的双图上进行多轮消息传递。在键-角图上,通过聚合关联键角的特征来更新键的表示;在原子-键图上,通过聚合相邻原子和键的特征来更新原子的表示。聚合和组合函数采用了图注意力网络机制。经过多层传播后,对最终的所有原子表示采用全局注意力池化策略,生成全局分子级嵌入。 * 子结构增强机制:为了在更细粒度上捕获分子内部相互作用,研究使用BRICS算法将每个分子分解为多个子结构,并通过共享的图同构网络编码器将每个子结构编码为高维嵌入。然后,采用集合注意力块结构,基于多头自注意力机制对不同子结构间的相互作用进行建模,生成上下文感知的子结构表示,以补充和强化整体分子嵌入。

3. 药物推荐模块 此模块根据患者的临床健康状态,生成个性化的药物组合预测。 * 临床状态引导的多粒度交互:首先,通过前馈网络将临床健康表征向量映射为粗粒度分子相关性权重向量和子结构相关性权重向量。这些权重用于对患者感知的分子特征和子结构特征进行自适应调制。 * 结构感知注意力与预测:调制后的特征通过一个结构感知注意力机制进行计算,得到交互感知的融合分子表示。该表示与患者引导的粗粒度表示拼接后,输入一个多层感知机,并通过Sigmoid激活函数预测所有药物在当前就诊中被处方的概率。 * 训练与损失函数:药物推荐被构建为一个多标签二分类问题。研究提出了一个预测对齐损失,结合了二元交叉熵损失和多标签边际损失,以同时提高预测准确性和排序一致性。为确保安全性,引入了DDI损失,基于已知的药物-药物相互作用邻接矩阵,惩罚推荐组合中潜在的不良相互作用。总损失函数是预测对齐损失和DDI损失的加权和,其中权重系数α可根据模型当前DDI率动态调整,以实现准确性与安全性之间的有效权衡。整个训练过程如算法1所述。

三、 研究主要结果

研究在MIMIC-III和MIMIC-IV数据集上进行了广泛的实验,使用Jaccard相似系数、F1分数、PR-AUC和DDI率作为评估指标,并与包括逻辑回归、ECC、RETAIN、LEAP、GAMENet、SafeDrug、COGNet、MoleRec、DEPOT、CausalMed、RASNet和MR-DTR在内的多种基线方法进行了比较。

  • 整体推荐性能:实验结果表明,DCGM在两个数据集上的Jaccard、F1和PR-AUC指标均 consistently outperforms 所有基线模型,同时在DDI率上保持了有竞争力的低水平。例如,在MIMIC-III上,DCGM的Jaccard达到0.5453,F1达到0.6958,PR-AUC达到0.7876,DDI率为0.0697,综合性能最优。这验证了动态患者建模和几何增强分子特征的有效性。此外,DCGM预测的药物平均数量更接近真实处方量,避免了如COGNet等方法过度开药或如LEAP等方法开药不足的问题,更具临床实用性。
  • 计算成本与实时可行性分析:尽管DCGM引入了额外的几何分子编码和动态轨迹聚合计算,导致每个训练周期的耗时略有增加,但由于其收敛所需周期更少,总训练时间仍具有竞争力。平均每次就诊的推理延迟为62.69毫秒,表明其具备实时应用的潜力。三维分子特征可离线提取,不影响运行时推理效率。
  • 消融研究:通过系统性地移除或替换核心组件,验证了各模块的贡献。移除动态临床轨迹聚合模块或将其中的KAN层替换为传统MLP层,性能均显著下降,特别是替换为MLP会导致严重过度开药,证明了KAN在过滤历史噪声、捕捉复杂临床依赖方面的优势。移除几何增强分子编码器或子结构增强机制也会导致性能退化,证实了三维空间编码和细粒度结构建模的重要性。有趣的是,将子结构增强机制也替换为三维编码(DCGM w/ 3DSM)反而导致性能下降,作者推测分子子结构通常较小且简单,在此级别引入三维信息可能引入噪声导致过拟合,因此保留传统的二维图神经网络进行子结构建模更为稳定有效。
  • 三维编码器对比:研究比较了将GeoGNN替换为EGNN、SchNet、DimeNet等其他三维编码器的效果。虽然所有三维编码器都优于二维变体,但它们的提升有限且不一致,DimeNet甚至导致性能下降且内存开销极高。而DCGM结合GeoGNN取得了最佳性能,这表明优势来自于与任务对齐的、轻量级的几何表示,而非简单地引入三维信息。
  • 临床效用与可解释性分析
    • “复制上次处方”效应评估:定量分析显示,DCGM预测与上一次真实处方的Jaccard相似度略低于真实情况本身的变化,而GAMENet、SafeDrug等基线模型的相似度显著高于基线,表明DCGM成功避免了简单地复制历史处方的 trivial 策略,而是基于当前健康状态进行推理。
    • 新旧处方性能:将药物区分为“再次使用”和“新开”两类进行评估。DCGM在两类药物上的推荐性能均达到领先水平,特别是在“新开”药物上表现出色,说明模型不仅能有效利用历史处方连续性,还能基于当前临床状态和三维药物知识识别出合适的替代或新增药物。
    • 长尾药物泛化:DCGM推荐的药物频率分布与真实分布高度吻合,即使在排名靠后的长尾药物区域也能保持良好的覆盖,显著优于基线模型,表明其能更好地捕捉个性化用药需求,缓解推荐中的马太效应。
    • 轨迹选择可解释性:可视化显示,基于MLP的基线模型对所有历史就诊赋予近乎均匀的高权重,存在过度平滑问题。而基于KAN的DCGM模块能自适应地抑制不相关的交互,突出关键的历史转折点,证明了其捕捉患者轨迹非线性演变的能力。
  • 鲁棒性与泛化性分析:按患者就诊次数分层评估。在冷启动情况下(仅单次就诊),DCGM凭借其三维药物先验知识取得了最高准确率。随着就诊次数增加,DCGM在所有分层上均持续优于基线,表明其能有效利用信息性历史模式并抑制噪声,在不同数据稀疏度和临床数据集上都表现出良好的鲁棒性和泛化能力。
  • 参数分析:对相似性阈值γ、GeoGNN层数T和目标DDI率φ等关键超参数进行了敏感性实验,确定了最优参数设置(γ=0.05, T=4, φ=0.06),平衡了模型的准确性和安全性。
  • 个案研究:通过对一个具有五次就诊的肝硬化并发症患者的案例分析,展示了DCGM如何动态筛选出与当前就诊最相似的历史记录(第1、4次),而忽略不相关的急性感染就诊(第2、3次)。与SafeDrug、MoleRec等基线相比,DCGM的推荐药物组合更接近真实处方,避免了不必要的药物和已知的高风险DDI组合,且推荐药物数量合理,体现了其临床适用性。

四、 研究结论与价值

本研究提出了DCGM,一个通过联合建模动态临床轨迹和几何增强药物分子结构的多粒度药物推荐框架。该框架通过选择性聚合临床相关的历史就诊来捕捉患者不断演变的健康状况,并通过显式构建的原子-键图和键-角图来编码反映药物三维空间构象的分子结构。这些表征通过统一的交互框架进行整合,以生成有效且安全的药物推荐。在基准数据集上的大量实验验证了该多粒度建模方法的有效性。消融实验和个案研究进一步强调了整合分子几何信息和患者就诊动态的独特优势。

科学价值与应用价值: 1. 方法论创新:首次在药物推荐任务中系统性地整合了动态临床轨迹选择与三维几何增强的分子表示,为解决现有方法的两大核心局限提供了新思路。 2. 模型性能提升:DCGM在推荐准确性指标上显著优于现有先进方法,同时在药物安全性(DDI率)上保持竞争力,证明了所提框架的有效性。 3. 临床实用性:模型推荐药物数量更符合真实临床实践,并能更好地处理长尾药物和新药推荐场景,增强了其在真实世界临床决策支持系统中的潜在应用价值。 4. 可解释性增强:通过可视化历史就诊选择权重等方式,为模型的决策提供了一定程度的洞察,有助于建立临床信任。

五、 研究亮点

  1. 动态临床轨迹聚合:提出了基于KAN和相似性检索的动态临床轨迹聚合模块,能够智能筛选与当前病情相关的历史信息,有效过滤临床噪声,实现了更精准的患者建模。
  2. 几何增强分子表征:创新性地将三维药物构象信息引入药物推荐领域,通过构建原子-键图和键-角图的双图结构,编码了原子、键和键角级别的空间几何约束,实现了对药物药理特性更忠实的建模。
  3. 多粒度融合框架:设计了一个统一的多粒度框架,将患者层面的动态健康表征与药物层面的几何结构表征、子结构表征进行深度融合,通过临床状态引导的注意力机制进行交互,最终生成个性化的药物推荐。
  4. 综合性能优越:在广泛使用的MIMIC数据集上,DCGM在准确性、安全性、鲁棒性和临床实用性等多个维度上展现了全面的优势。

六、 其他有价值的内容

研究在讨论部分也坦诚地指出了当前工作的局限性并展望了未来方向: 1. 严重程度加权的DDI:目前使用的DDI率是基于AERS数据库的二元指标,将所有相互作用视为同等风险。未来计划整合严重程度加权的DDI知识库,构建更能反映临床风险的优化目标。 2. 可解释性深化:当前的可解释性方法多为事后分析。未来计划探索更细粒度的可解释性技术,如反事实推理或逻辑规则提取,以更好地将模型预测与明确的临床指南对齐,增强临床可信度。

这些思考体现了研究工作的严谨性和对临床落地应用的深入考量。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com