使用模型投影的联邦学习进行多中心疾病诊断

使用模型投影的联邦学习进行多中心疾病诊断

使用模型投影的联邦学习进行多中心疾病诊断 背景介绍 随着医学影像技术的快速发展,基于自动化诊断方法的研究在单中心数据集上表现出良好的性能。然而,这些方法在实际应用中往往难以泛化到其他医疗机构的数据。主要原因是这些方法通常假设不同医疗中心的数据是独立同分布(IID)的,而实际上不同中心由于使用不同的扫描仪和成像参数,导致数据分布非独立同分布(Non-IID)。此外,不同中心诊断的患者数量和种类也存在较大差异。因此,多中心的数据具有异质性,无法通过集中化学习(Centralized Learning)有效解决这一问题。 近年来,联邦学习(Federated Learning,FL)作为一种去中心化框架,为多中心协同训练全球模型提供了可能,同时还保留了各中心患者数据的隐私。然而,Non-IID数据...

利用电子健康记录特征识别未诊断的常见变异型免疫缺陷症患者

利用电子健康记录特征识别未诊断的常见变异型免疫缺陷症患者

利用电子健康记录特征识别未诊断的常见变异型免疫缺陷症患者 Johnson等人最近在 Science Translational Medicine 发表了一篇题为《Electronic health record signatures identify undiagnosed patients with common variable immunodeficiency disease》的研究论文。该研究通过电子健康记录(EHRs)和机器学习算法PheneT,识别未被诊断的普通变量免疫缺陷病(common variable immunodeficiency,CVID)的患者,为更早的诊断和治疗提供新途径。 研究背景和研究目的 人类先天性免疫缺陷(inborn errors of immunity...

StrokeClassifier:使用电子健康记录的集合共识模型进行缺血性脑卒中病因分类

StrokeClassifier:人工智能工具基于电子健康记录对缺血性卒中进行病因分类 项目背景及研究动机 脑卒中(尤其是急性缺血性卒中,AIS)的病因识别工作对二次预防至关重要,但诊断起来往往非常困难。在美国,每年的缺血性卒中新发病例近67.6万,其中四分之一的患者曾有过卒中史。这种病症的再发率较高,甚至可能导致死亡或进一步的残疾。缺血性卒中的病因可以多种多样,包括大动脉粥样硬化、心源栓塞、小血管病以及其他罕见病因。然而,美国大约20-30%的缺血性卒中患者在经过评估后,病因依然无法确定,被归类为隐源性卒中。这部分患者的再发卒中风险特别高。因此,能够准确识别隐源性卒中的病因,对于优化治疗方案、提高患者预后具有重要意义。然而,做出准确诊断需要整合大量的数据,包括临床史、体检结果、实验室数据、...

大语言模型利用电子健康记录中识别健康的社会决定因素

大语言模型利用电子健康记录中识别健康的社会决定因素 背景及研究动机 健康社会决定因素(Social Determinants of Health, SDOH)对患者的健康结果具有重要影响。然而,在电子健康记录(EHR)结构化数据中,这些因素的记录往往不完整或缺失。大语言模型(Large Language Models, LLMs)有望从EHR的叙述性文本中高通量提取SDOH,以支持研究和临床护理。然而,类别不平衡和数据限制为这种稀疏记录的关键信息带来了挑战。本文旨在探讨使用LLMs从EHR叙述性文本中提取六种SDOH类别(就业、住房、交通、父母身份、关系和社会支持)的最佳方法。 研究来源 这项研究由Harvard Medical School的Mass General Brigham人工智能...

使用病历预测现象广泛的疾病发生并支持对新兴健康威胁的快速响应

使用病历预测现象广泛的疾病发生并支持对新兴健康威胁的快速响应 研究背景和动机 新冠疫情暴露了全球系统性、数据驱动指导缺乏的问题,这对识别高风险人群以及应对疫情准备造成了严重影响。个体未来疾病风险评估对于指导预防干预、早期疾病检测和治疗启动至关重要。然而,对于常见疾病,只有一小部分有定制的风险评分,医疗提供者和个人对于大多数相关疾病缺乏指导。即便在有既定风险评分的情况下,对于使用哪种评分和相关的生理或实验室测量也缺乏共识,导致常规医疗实践高度碎片化。特别是在新冠疫情初期,由于缺乏可用数据,无法识别脆弱人群的风险评分不可用。 同时,大多数医学决策,包括诊断、治疗和预防疾病,都是基于个人的医学史。随着数字化的普及,这些信息已经被医疗提供者、保险公司和政府以电子健康记录的形式收集,但由于人类处理和理...