使用异构图卷积网络进行电子健康记录文本分类的增强混合方法

使用异构图卷积网络进行电子健康记录文本分类的增强混合方法

EHR-HGCN:一种用于电子健康记录文本分类的新型混合异构图卷积网络方法 学术背景介绍 随着自然语言处理(NLP)的迅速发展,文本分类已经成为该领域一个重要的研究方向。文本分类不仅帮助我们理解文献背后的知识,还在生物医学文本,包括电子健康记录(Electronic Health Records, EHR)等领域有着广泛的应用。现有的研究主要集中在基于双向变压器的编码表示方法(如BERT)和卷积神经网络(CNN)的深度学习方法。然而,这些方法在处理医学长文本时往往面临输入长度的限制和高计算资源的需求。与此同时,针对文本分类的代表性CNN方法往往只提取了附近上下文特征,忽略了文本中更长范围的关系。 为了解决这些问题,近年来异构图卷积网络(Heterogeneous Graph Convolut...

基于知识图谱推荐的生物医学关系提取

医学关系抽取与知识图谱推荐结合的研究报告 背景介绍 在医学领域,文献的爆炸式增长使得研究人员难以及时跟踪各自领域内的最新进展。从自然语言处理(NLP)领域来看,不断发展的自动化工具能够帮助识别和提取非结构化文本中的相关信息,这一任务被称为关系抽取(Relation Extraction,RE)。RE的主要目标是从文本中提取和分类医学实体之间的关系,增强我们对生物医学过程的理解。 目前,大多数尖端的医学RE系统使用深度学习方法,主要针对同类型实体间的关系,如基因和药物等实体。然而,这些系统大多仅限于从文本直接提取的信息,忽略了专门领域的知识库,如本体论(Ontology),这些本体论通常结构化为有向无环图(Directed Acyclic Graphs,DAG)。 另一方面,基于知识图谱(Kn...

双层交互感知的异构图神经网络用于药物包推荐

医学包推荐系统研究:基于双层次交互意识的异构图神经网络 随着电子健康记录(electronic health records, EHRs)在医疗领域中的广泛应用,如何从中挖掘潜在的、有价值的医学知识来支持临床决策,成为深度学习技术的重要研究方向之一。个性化医学包推荐是这一领域的重要任务之一,其目标是利用大量医疗记录帮助医生为每位患者选择更安全、有效的药物包。然而,现有的医学包推荐方法主要将任务建模为多标签分类或序列生成问题,主要关注的是个体药物与其他医学实体之间的关系,却普遍忽视了药物包与其他医学实体之间的交互,从而可能导致推荐的药物包不完整。此外,现有方法所考虑的医学常识知识相对有限,使得深入研究医生的决策过程变得非常困难。 来源概述 本文由山东大学软件学院的研究人员Fanglin Zhu...

从生物网络中学习蛋白质知识预测药物靶标亲和力

##基于生物网络学习蛋白质知识来预测药物-靶点亲和力 背景介绍 药物-靶点亲和力(drug-target affinity, DTA)预测在药物发现环节中占据重要地位。高效且准确的DTA预测可以显著缩短新药开发的时间和经济成本。近年来,深度学习技术的爆炸性发展为DTA预测提供了强大的支持。现有的DTA预测方法主要分为基于1D蛋白质序列和基于2D蛋白质结构图的方法。然而,这些方法仅关注靶蛋白的内在特性,忽略了过往研究中明确揭示的蛋白质交互的广泛先验知识。 针对上述问题,本文提出了一种名为MSF-DTA(基于多源特征融合的药物-靶点亲和力)的端到端DTA预测方法。MSF-DTA通过利用邻接蛋白的信息,增强蛋白质的表示,并使用高级图预训练框架VG-AE(变分图自动编码器)来学习这些表示,使得预测结...

基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策

基于知识图谱的可解释和个性化认知推理模型--助力全科医学决策

面向全科诊断决策的基于知识图谱的可解释个性化认知推理模型 背景介绍 全科医学作为社区和家庭医疗的重要组成部分,覆盖了不同年龄、性别、器官系统及各类疾病。其核心理念是以人为中心、以家庭为单位,强调长期负责的综合健康维护和促进。然而,现有证据显示,中国的初级卫生保健(Primary Health Care, PHC)质量仍未达到令人满意的水平。在临床诊断和治疗准确性方面存在着显著需要提升的空间。为了应对这一问题,基于人工智能的决策工具逐渐成为全科医生诊断疾病的有力辅助。然而,现有的研究主要存在两个问题:一是缺乏足够的可扩展性和解释能力;二是现有模型大多操作复杂,难以适用于实际的全科医疗环境。 论文来源 这篇名为《An Explainable and Personalized Cognitive ...

基于知识增强图主题Transformer的可解释生物医学文本摘要

基于知识增强的图主题Transformer在可解释生物医学文本摘要中的应用 研究背景 由于生物医学文献发表量持续增加,自动生物医学文本摘要任务变得愈加重要。2021年,仅在PubMed数据库中就发表了1,767,637篇文章。现有的基于预训练语言模型(Pre-trained Language Models,简称PLMs)的摘要方法虽然提升了摘要性能,但在捕捉领域特定知识和结果可解释性方面存在显著局限。这可能导致生成的摘要缺乏连贯性,包括冗余句子或重要领域知识的遗漏。此外,变压器模型的黑箱特性使得用户难以理解摘要生成的原因和方式,因此在生物医学文本摘要中,包含领域特定知识和可解释性对提高准确性和透明度至关重要。 研究来源 本文的论文由Qianqian Xie、Prayag Tiwari(IEE...