分享自:

利用大语言模型将冠状动脉血管造影报告转换为机器可读格式的标准框架

期刊:Scientific ReportsDOI:10.1038/s41598-025-32150-3

研究概述

本研究报告了一项原创性研究,其题为“使用大型语言模型将冠状动脉造影报告转换为机器可读格式的标准框架”。该研究由Ji Woo Song(延世大学医学院)、Ji Yong Jang(国民健康保险服务一山医院)、Hyeongsoo Kim(国民健康保险服务一山医院)、Young-Guk Ko(延世大学医学院)以及Seng Chan You(延世大学)共同完成。该研究的预印本发布于2025年10月3日,其正式记录版本已于2026年1月3日发表于《Scientific Reports》期刊。

学术背景

本研究隶属于医学信息学与心血管病学的交叉领域,核心目标是解决临床研究中普遍存在的数据利用难题。具体而言,冠状动脉造影(Coronary Angiography, CAG)报告是记录冠心病解剖细节、病变特征以及经皮冠状动脉介入治疗(Percutaneous Coronary Intervention, PCI)过程的关键临床文档,蕴含大量对研究极具价值的信息。然而,这些报告通常以自由文本形式书写,缺乏统一的结构,这使其难以被计算机自动化地搜索、分析和整合,极大地限制了其在大型观察性研究、质量监控和临床决策支持系统中的深度应用。

传统上,为了将这些非结构化文本转化为可用于分析的数据,研究者需要依赖人工标注,这既耗时又费力,且难以大规模推广。虽然近期兴起的大型语言模型(Large Language Models, LLMs)在转换放射学、病理学报告方面展现了高精度,但在处理信息更为复杂、包含大量专业术语和逻辑关系的CAG报告方面,尚无系统性的探索和应用。因此,本研究旨在填补这一空白。其具体目标是:开发并验证一个结合了层次化标注(Hierarchical Annotation)和LLM的自动化框架,能够高效、准确地将自由文本的CAG报告转换为标准化的机器可读格式,并从中提取关键的临床信息点,其精度需达到甚至超过心脏专科医生的人工审阅水平。

详细工作流程

本研究的工作流程严谨而系统,主要包含以下几个关键步骤:数据集构建、框架开发(含层次化标注模式设计)、内部验证和外部验证。

1. 数据集的构建与划分 研究团队从两家医院获取了历史CAG报告。训练集和内部测试集来自一家三级医院(Severance Hospital),时间跨度为2009年至2023年。其中,随机选取了50份报告作为训练集,用于框架的开发和迭代优化;另选取100份报告作为内部测试集,用于评估框架性能并与心脏科医生的手动提取结果进行直接比较。此外,为了检验框架的泛化能力,研究从另一家二级医院(国民健康保险服务一山医院)随机选取了100份2023年期间的报告,作为外部测试集。所有报告均以英文书写。值得注意的是,每份报告中CAG相关信息和PCI相关信息通常交织在一起,因此在统计时,训练集包含47例CAG和27例PCI,内部测试集包含96例CAG和44例PCI,外部测试集包含98例CAG和58例PCI。

2. 层次化标注模式的开发 这是确保转换准确性和结构逻辑性的基础。研究团队由介入心脏病学家和临床信息学专家共同合作,定义了一个专门针对CAG报告的层次化标注模式(Schema)。该模式系统地规定了如何组织冠状动脉解剖结构、病变特征以及手术细节等关键临床信息。它被实现为JavaScript对象表示法格式,这种格式能够高效地组织多个临床事件(如多个病变或多次操作),并以不同的粒度灵活呈现临床细节。该模式是框架的“蓝图”,指导LLM如何理解并重组报告中的信息。

3. 自动化框架的两步走流程 本研究的核心创新在于提出的两步走自动化框架。第一步是标准化:利用大型语言模型(本研究主要使用GPT-4o),根据上述专家定义的层次化标注模式,将原始的自由文本CAG报告直接转换为结构化的机器可读格式。为了提高转换的准确性和一致性,研究团队精心设计了指令提示(Instruction Prompt),其中编码了领域专业知识,例如用于精确描述冠状动脉解剖的SYNTAX评分分割系统、基于美国心脏病学会/美国心脏协会(ACC/AHA)分类的病变形态学特征等。此外,还采用了少样本提示(Few-shot Prompting)策略,从训练集中选取了8个涵盖不同临床场景的代表性案例作为参考示例,引导模型学习复杂信息的处理方式。第二步是提取:在获得标准化的结构数据后,运行一个自动化的提取算法。该算法基于心脏科专家制定的特定规则,从结构化数据中抽取出预设的、具有明确临床意义的12个关键信息点。

4. 验证流程与对比分析 为了全面评估框架的性能,研究设计了内部和外部两套验证方案。内部验证是最严格的测试:两位经验丰富的介入心脏病学家独立地从内部测试集的100份报告中手动提取同样的12个关键信息点。他们之间的任何分歧会通过讨论达成共识,从而建立一个“金标准”。随后,将框架自动提取的结果与这个“金标准”进行逐一比对,计算准确率,并使用Fisher精确检验进行统计学比较。这直接回答了框架能否达到专家水平的问题。

外部验证则侧重于评估框架的泛化能力:使用来自另一家不同级别、不同机构的外部测试集的100份报告。在此环节,心脏科医生不进行独立的手动提取来建立新“金标准”,而是直接对框架的输出结果进行彻底的检查和评判,计算其准确率。这种做法模拟了真实世界中将框架部署到新机构时的评估场景。

主要结果

1. 内部测试结果:框架表现优于或媲美心脏科医生 在内部测试中,框架的整体表现非常出色。对于4个CAG相关的关键信息点(既往支架位置、既往支架信息、病变位置与类型、解剖学诊断),框架的平均准确率达到99.5%,显著高于两位心脏科医生91.8%的平均准确率。具体来看,框架在“既往支架位置”、“既往支架信息”和“病变位置与类型”三个项目上的准确率(分别为100%, 100%, 97.9%)均显著高于医生组(分别为91.1%, 95.3%, 80.7%)。仅在“解剖学诊断”一项上,两者均达到100%准确率。定性分析发现,医生常因误标位置或遗漏“偏心性”、“开口部”等关键描述词而犯错,而框架则在处理复杂病例时表现出高度一致的精确性。

对于8个PCI相关的关键信息点(包括多支血管PCI、治疗≥3处病变、使用≥2个支架的分叉病变PCI、植入≥3个支架、慢性完全闭塞病变PCI、总支架长度>60mm、复杂PCI判定、当前支架信息),框架的平均准确率为98.3%,与心脏科医生97.4%的平均准确率相当,所有单项比较均无统计学显著差异。这表明框架在提取手术细节方面已经具备了与专家相当的可靠性。

2. 外部测试结果:框架展现出强大的泛化能力 在外部测试中,框架的表现依然稳健。对于CAG相关的4个关键点,平均准确率为96.2%;对于PCI相关的8个关键点,平均准确率高达99.4%。这一结果强有力地证明了该框架能够适应不同医院、不同报告风格的CAG文本,具备良好的普适性。分析指出,PCI部分在原始报告中往往已采用一定的结构化项目列表(如位置、指引导管、导丝等),这为LLM的转换提供了良好基础,从而获得了极高的提取精度。而CAG部分的一些错误则主要源于报告文本自身固有的模糊性和不一致性。

结论与价值

本研究成功开发并验证了一个新颖的、基于大型语言模型和层次化标注的自动化框架,能够以高精度将自由文本的冠状动脉造影报告转换为机器可读的结构化格式。该框架在提取冠状动脉解剖和介入手术复杂信息方面的准确度,达到了与经验丰富的心脏介入专家相当甚至更优的水平,并展示了良好的跨机构泛化能力。

本研究的科学价值在于,它首次系统性地探索并实现了将包含复杂解剖和手术细节的CAG报告自动化、标准化处理的可行路径,为心血管领域医学自然语言处理研究提供了重要的范例。其应用价值则更为广泛和深远: 1. 促进大规模临床研究:使利用海量、详细的CAG和PCI数据开展回顾性或前瞻性观察研究成为可能,无需依赖耗时的手工数据录入。 2. 赋能医疗质量评估:可高效地对不同中心、不同术者的介入手术质量和性能进行系统性监测与评估。 3. 加速临床实验入组:能够快速从历史数据中筛选出符合特定解剖或手术标准(如复杂PCI)的潜在受试者。 4. 辅助临床决策:通过将历史手术数据转化为可分析的结构,为医生制定新的治疗策略提供数据支持。

研究亮点

本研究的亮点突出体现在以下几个方面: 1. 方法学的创新性:首创了“层次化标注模式定义 + LLM标准化转换 + 规则化信息提取”的两步走框架。这种设计巧妙地结合了LLM在理解复杂医学文本方面的优势与专家知识在逻辑推理和规则制定方面的严谨性,克服了单纯依靠LLM进行复杂医学推理可能存在的困难。 2. 验证的严谨性:不仅进行了内部测试,还与心脏科医生的手动提取结果进行了头对头比较,并设置了独立的外部测试集以评估泛化能力,验证流程全面而可靠。 3. 结果的高效性:框架在多项关键信息提取任务上表现优于人工,证明了自动化方法在保证甚至提升数据质量的同时,能极大解放人力,具备显著的实际应用效率优势。 4. 成果的开放性与可扩展性:研究团队公开了其开发的层次化标注模式框架和提取算法,为其他研究机构提供了可直接采用或适配的标准化蓝图。框架被设计为模型无关(Model-agnostic),理论上可与任何能力足够的大型语言模型配合使用,这为其未来的演进和在不同计算环境下的部署提供了灵活性。

其他有价值的内容

研究也坦诚地指出了其局限性,包括:数据均来自韩国医院,需要在更多样化的国家和语言环境中验证;主要测试了GPT-4o,未来需验证其在其他开源LLM上的性能;外部验证未与人工提取进行直接对比等。这些为后续研究指明了方向。此外,研究遵循了医疗领域LLM研究报告的透明性规范,并详细披露了利益冲突声明,体现了学术的严谨性。这项研究为高效利用隐藏在非结构化临床文本中的宝贵数据开辟了一条切实可行的道路,对推动心血管疾病的数据驱动型研究和精准医疗具有重要的意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com