本文旨在介绍一项发表于Expert Systems with Applications期刊(2026年卷321期,文章ID 132225)的研究工作。该研究由大连海事大学信息科学技术学院的张世迪、李晓波、马子伟和张一佳(通讯作者)共同完成。研究团队针对临床决策支持中的关键问题——精准、安全的药物推荐,提出了一种名为DCGM的创新框架。该框架的核心在于整合动态临床轨迹聚合与几何增强的分子表征,以克服现有方法的局限性。
一、 研究的学术背景与目标
药物推荐是智能医疗领域的热点研究方向,其目标是根据患者的当前健康状况和电子健康记录数据,辅助临床医生制定最合适的药物组合处方。随着电子健康记录的普及,基于人工智能的药物推荐方法得以发展,能够系统挖掘诊断信息和治疗历史以支持数据驱动的临床决策。
然而,现有的主流方法面临两大核心挑战,这也是本研究的出发点: 1. 对动态临床轨迹捕捉不足:患者(尤其是慢性病患者)的疾病进展往往是非线性且不连续的。现有方法通常对所有历史就诊记录进行统一聚合,难以区分与当前病情相关和不相关的历史轨迹,导致患者建模不精确,易受临床噪声干扰。 2. 对药物分子几何知识的利用不足:大多数现有方法依赖药物的二维分子结构图来学习药物表示。然而,药物的疗效和安全性在很大程度上取决于其三维空间几何构型。仅使用二维结构会丢失关键的立体化学信息,可能导致推荐错误。一个经典例子是沙利度胺:其R-对映体具有镇静作用,而S-对映体则具有致畸性。二维结构相同的对映体,其药理作用截然不同,凸显了三维感知建模的至关重要性。
为了填补上述空白,本研究旨在开发一个多粒度药物推荐框架DCGM,通过整合动态临床轨迹和几何增强的药物知识,实现对患者疾病进展的更精准建模和对药物药理特性的更忠实表征,最终提升推荐系统的准确性与安全性。
二、 研究详细工作流程
DCGM框架包含三个核心模块:动态临床轨迹聚合模块、几何增强分子表征模块和药物推荐模块。研究在两个公开的大型临床数据库MIMIC-III和MIMIC-IV上进行实验验证。
1. 动态临床轨迹聚合模块 此模块旨在从患者历史就诊记录中,有选择性地检索和整合与当前状态相似的疾病和用药轨迹,以构建精准且对噪声鲁棒的患者表征。 * 输入与嵌入:对于患者的第t次就诊,模型获取当前诊断向量、当前操作向量以及上一次就诊的药物向量。这些向量通过可学习的嵌入矩阵被映射到低维表示空间。 * 非线性特征提取与相似性检索:研究采用了一种新颖的Kolmogorov-Arnold网络(KAN)来对当前患者状态(由诊断和操作嵌入拼接而成)进行非线性特征提取,生成聚合表示。KAN结合了基函数和样条函数,相比传统的多层感知机,能更好地拟合复杂分布和局部模式。随后,该聚合表示被用于查询一个历史记忆池。通过计算与每个历史状态表示的欧氏距离,模型筛选出距离小于预设阈值γ的历史就诊,认为这些就诊与当前状态临床相关。这一机制实现了对历史信息的动态、选择性聚合,而非简单的时间序列建模。 * 序列编码与健康表征构建:检索到的相关历史诊断、操作和药物序列,分别通过三个独立的门控循环单元进行编码,生成对应的隐藏表示。最后,将这些表示与上一时间步的药物表示进行拼接,形成最终的临床健康表征向量,作为后续药物推荐任务的关键输入。
2. 几何增强分子表征模块 此模块旨在突破传统二维分子表征的局限,通过引入三维药物先验知识,构建更丰富的药物表示。 * 三维分子图构建:对于每种药物,首先将其SMILES字符串转化为分子对象,并补充氢原子。接着,利用ETKDG算法结合MMFF94力场优化(通过RDKit工具包)生成低能量的三维构象,获得每个原子的三维空间坐标。基于此,研究创新性地构建了两种图: * 原子-键图:以原子为节点,化学键为边。节点特征包含原子序数、手性、度数等;边特征包含键类型、是否在环内等。 * 键-角图:以化学键为节点,共享一个中心原子的两个键构成一条边。节点特征包含键长;边特征包含键角、拓扑极性表面积等关键几何描述符。 * 空间几何特征学习:采用基于GeoGNN的框架,在构建的双图上进行多轮消息传递。在键-角图上,通过聚合关联键角的特征来更新键的表示;在原子-键图上,通过聚合相邻原子和键的特征来更新原子的表示。聚合和组合函数采用了图注意力网络机制。经过多层传播后,对最终的所有原子表示采用全局注意力池化策略,生成全局分子级嵌入。 * 子结构增强机制:为了在更细粒度上捕获分子内部相互作用,研究使用BRICS算法将每个分子分解为多个子结构,并通过共享的图同构网络编码器将每个子结构编码为高维嵌入。然后,采用集合注意力块结构,基于多头自注意力机制对不同子结构间的相互作用进行建模,生成上下文感知的子结构表示,以补充和强化整体分子嵌入。
3. 药物推荐模块 此模块根据患者的临床健康状态,生成个性化的药物组合预测。 * 临床状态引导的多粒度交互:首先,通过前馈网络将临床健康表征向量映射为粗粒度分子相关性权重向量和子结构相关性权重向量。这些权重用于对患者感知的分子特征和子结构特征进行自适应调制。 * 结构感知注意力与预测:调制后的特征通过一个结构感知注意力机制进行计算,得到交互感知的融合分子表示。该表示与患者引导的粗粒度表示拼接后,输入一个多层感知机,并通过Sigmoid激活函数预测所有药物在当前就诊中被处方的概率。 * 训练与损失函数:药物推荐被构建为一个多标签二分类问题。研究提出了一个预测对齐损失,结合了二元交叉熵损失和多标签边际损失,以同时提高预测准确性和排序一致性。为确保安全性,引入了DDI损失,基于已知的药物-药物相互作用邻接矩阵,惩罚推荐组合中潜在的不良相互作用。总损失函数是预测对齐损失和DDI损失的加权和,其中权重系数α可根据模型当前DDI率动态调整,以实现准确性与安全性之间的有效权衡。整个训练过程如算法1所述。
三、 研究主要结果
研究在MIMIC-III和MIMIC-IV数据集上进行了广泛的实验,使用Jaccard相似系数、F1分数、PR-AUC和DDI率作为评估指标,并与包括逻辑回归、ECC、RETAIN、LEAP、GAMENet、SafeDrug、COGNet、MoleRec、DEPOT、CausalMed、RASNet和MR-DTR在内的多种基线方法进行了比较。
四、 研究结论与价值
本研究提出了DCGM,一个通过联合建模动态临床轨迹和几何增强药物分子结构的多粒度药物推荐框架。该框架通过选择性聚合临床相关的历史就诊来捕捉患者不断演变的健康状况,并通过显式构建的原子-键图和键-角图来编码反映药物三维空间构象的分子结构。这些表征通过统一的交互框架进行整合,以生成有效且安全的药物推荐。在基准数据集上的大量实验验证了该多粒度建模方法的有效性。消融实验和个案研究进一步强调了整合分子几何信息和患者就诊动态的独特优势。
科学价值与应用价值: 1. 方法论创新:首次在药物推荐任务中系统性地整合了动态临床轨迹选择与三维几何增强的分子表示,为解决现有方法的两大核心局限提供了新思路。 2. 模型性能提升:DCGM在推荐准确性指标上显著优于现有先进方法,同时在药物安全性(DDI率)上保持竞争力,证明了所提框架的有效性。 3. 临床实用性:模型推荐药物数量更符合真实临床实践,并能更好地处理长尾药物和新药推荐场景,增强了其在真实世界临床决策支持系统中的潜在应用价值。 4. 可解释性增强:通过可视化历史就诊选择权重等方式,为模型的决策提供了一定程度的洞察,有助于建立临床信任。
五、 研究亮点
六、 其他有价值的内容
研究在讨论部分也坦诚地指出了当前工作的局限性并展望了未来方向: 1. 严重程度加权的DDI:目前使用的DDI率是基于AERS数据库的二元指标,将所有相互作用视为同等风险。未来计划整合严重程度加权的DDI知识库,构建更能反映临床风险的优化目标。 2. 可解释性深化:当前的可解释性方法多为事后分析。未来计划探索更细粒度的可解释性技术,如反事实推理或逻辑规则提取,以更好地将模型预测与明确的临床指南对齐,增强临床可信度。
这些思考体现了研究工作的严谨性和对临床落地应用的深入考量。