分享自:

医疗问诊聊天机器人:系统综述与未来展望

期刊:JMIR Medical InformaticsDOI:10.2196/56628

本文是2024年发表于《JMIR Medical Informatics》上的一篇系统性综述(systematic review),由德国慕尼黑工业大学医学院及健康学院(TUM School of Medicine and Health)皮肤病学与过敏科的Michael Hindelang(通讯作者)、Sebastian Sitaru以及Alexander Zink博士共同完成。文章全面梳理了人工智能(Artificial Intelligence, AI)聊天机器人(Chatbots)在医学问诊(medical history-taking)领域的应用、效果、挑战及未来方向。

该综述的核心目标是评估聊天机器人在收集病史方面的作用、有效性、可用性和患者接受度,并探讨其融入临床实践面临的潜在挑战和未来机遇。作者指出,在医疗领域,采集准确的病史对诊断和治疗至关重要,但传统方式(如面谈和问卷)存在效率低下、记录不完整、患者参与度低等问题。而集成了AI和自然语言处理(Natural Language Processing, NLP)技术的聊天机器人,有望通过结构化、可扩展的交互方式,数字化地收集患者信息,从而变革这一核心流程,提升医疗服务的效率和质量。尽管聊天机器人在其他领域(如客户服务)已广泛应用,但专门针对其在医疗问诊领域的系统评估尚显不足,特别是在公开可用的大型语言模型(如ChatGPT)出现后,这一技术变得更加触手可及,因此进行全面的评估显得尤为必要。

文章主要研究方法: 本文严格按照PRISMA(Preferred Reporting Items for Systematic Reviews and Meta-Analyses)指南,并已在PROSPERO数据库(注册号:CRD42023410312)预注册了研究方案。研究采用系统性的文献检索和筛选流程,以PICOS(Participants, Interventions, Comparators, Outcomes, Study Design)框架确定纳入标准。纳入标准为:关注使用聊天机器人进行医学问诊的人群(P);干预措施为旨在促进医学问诊的聊天机器人(I);比较对象不限(C);主要结局为基于聊天机器人的病史采集的可行性、接受度和可用性(O);除会议论文外,所有研究设计(S)且为英文发表的文献均符合条件。作者检索了包括PubMed、Embase、MEDLINE(via Ovid)、CENTRAL、Scopus和Open Science在内的多个数据库,检索截止至2024年7月。检索词围绕“聊天机器人”和“病史采集”的相关概念展开。筛选过程由两位作者独立进行,并通过讨论或第三位作者裁决解决分歧。最终从203篇文献中筛选出18篇符合条件的研究纳入分析,其中包括15项观察性研究和3项随机对照试验(Randomized Controlled Trial, RCT)。

研究质量评估与主要结果: 作者对纳入研究进行了严格的质量评估。对于15项观察性研究,采用STROBE(Strengthening the Reporting of Observational Studies in Epidemiology)标准评估,结果显示:5项(33%)为高质量(A类),5项(33%)为中等质量(B类),5项(33%)为低质量(C类)。低质量研究普遍存在的问题包括样本代表性不足、缺乏明确的纳入标准或控制组等,这在一定程度上影响了其结果的可靠性和普遍性。对于3项RCT研究,使用ROB 2(Risk Of Bias 2)工具评估,其中2项为低风险,1项为高风险。

这些纳入研究发表于2015年至2023年间,其中2020年和2022年的研究数量最多。研究主要来自德国和美国,涵盖了广泛医学领域,包括遗传学、癌症研究、精神健康、放射学、过敏学、家庭医学、音乐治疗和普通医学等。研究涉及的样本量差异较大,从最小的5例到最大的61,070例不等。

综述提炼出以下主要观点和证据:

第一,聊天机器人能有效改善病史采集的效率和结构化,并提高患者参与度。 多项研究支持这一观点。例如,Denecke等人(2018, 2022)的研究发现,用于音乐疗法和放射学诊断的聊天机器人用户界面受到好评,可用性评分很高(平均96分),显示了其在采集病史数据方面的潜力。Schneider等人(2023)的一项RCT研究专门针对蜂毒过敏史采集,发现使用聊天机器人支持的问诊方式节省了57.3%的时间,同时具有高完整度(73.3%)和患者满意度(75%)。这证明聊天机器人可以标准化问诊流程,减少医护人员的工作负担。Ponathil等人(2020)和Welch等人(2020)的研究则聚焦于家族史采集,发现使用聊天机器人(尤其是语音助手界面)不仅能减少耗时,还能获得更高的用户参与度。Welch的研究中有超过54%的用户开始了评估,超过22%完成了全部评估,表明聊天机器人是收集大规模人口家族史信息的可行工具。

第二,聊天机器人具备辅助诊断的潜力,但其准确性因疾病复杂程度而异,且仍需优化。 证据表明,聊天机器人在某些场景下能有效识别高风险人群。Nazareth等人(2021)的一项大规模观察性研究(n=61,070)发现,聊天机器人能有效筛选出符合遗传性癌症综合征基因检测标准的高风险患者(27.2%)。Heald等人(2021)的研究也证实了聊天机器人在增加结直肠癌遗传风险筛查方面的可行性。然而,在更复杂或需要细微判断的诊断领域,聊天机器人的表现则有局限性。例如,Hennemann等人(2022)评估了一款用于精神障碍诊断的AI聊天机器人,其建议的第一种诊断与治疗师诊断的一致性为51%,前五种诊断的一致性为69%,表明其具有一定的辅助价值但远非完美。Jungmann等人(2019)的研究也指出,聊天机器人在诊断儿童和青少年精神障碍方面的准确性有待提高。一个重要的对比是,Faqar-uz-Zaman等人(2022)的RCT研究发现,在急诊科对于腹痛患者的诊断,传统的医患互动在准确性上优于患者自行使用的AI诊断工具,但该AI工具仍能提高临床医生的诊断效能。这表明,聊天机器人作为辅助工具而非替代品,其价值定位至关重要。

第三,患者对聊天机器人的接受度呈现积极但复杂的图景,人机交互的局限性是其关键考量。 多项研究探讨了患者的感知和态度。Hong等人(2022)的研究发现,大多数初级保健患者认为聊天机器人可以帮助医生更好地了解他们的健康状况并识别健康风险。Ireland等人(2021)开发的用于支持基因组学二次发现决策的聊天机器人Edna,被认为在帮助患者做出知情决策方面具有潜力。然而,聊天机器人的接受度并非无条件的。Frick等人(2021)的研究直接对比了患者向医生和向对话机器人披露/隐瞒医疗信息的意愿,结果显示患者更倾向于向医生披露信息。这表明,尽管聊天机器人提供了便利和匿名性,但在涉及敏感或复杂的个人信息时,建立在信任和同理心基础上的人际互动仍然不可替代。

第四,成功整合聊天机器人进入临床实践面临多重挑战,需要在技术、人文和管理层面进行平衡。 作者基于现有研究,归纳了实施过程中的主要障碍。首先,数据安全与隐私(Cybersecurity) 是重中之重,因为聊天机器人处理高度敏感的医疗信息,必须防范未经授权的访问和数据泄露。其次,同理心与情感智能的缺失是当前AI聊天机器人的一个核心局限。它们缺乏人类互动中固有的情感理解和共情能力,这在敏感的医疗对话中可能会影响医患关系建立和患者信任。第三,临床工作流程整合是一大难题。聊天机器人需要无缝嵌入现有的医院信息系统和诊疗流程中,这要求强大的数据基础设施和用户友好的界面。Reis等人(2020)的研究就指出了用户抵制和期望管理的重要性,一项失败的AI项目案例强调了克服这些障碍的必要性。此外,算法准确性和可靠性,特别是在复杂医疗情境下的表现,也需要持续改进和严格验证。不加完善地匆忙部署聊天机器人,可能导致错误诊断或治疗建议,带来危害。

第五,未来研究应朝着标准化、深入化和整合化方向发展,以充分释放聊天机器人在医疗问诊中的潜力。 作者在讨论和结论部分提出了明确的未来方向。在研究设计上,需要更多大规模、设计严谨(如RCT)且采用标准化结局指标(如诊断准确性、患者满意度、系统可用性量表分数)的研究,以增强证据的说服力和可比性。在应用场景上,应探索聊天机器人在不同医疗环境和特定患者群体(如慢性病患者、老年人、技术素养较低人群)中的适用性和定制化需求。在技术发展上,未来的工作应聚焦于:1. 精炼算法:利用更先进的机器学习和自然语言处理技术,提高对复杂、模糊症状的理解和诊断推理能力。2. 提升情感智能:探索如何使聊天机器人交互更具同理心,以更好地支持患者。3. 加强系统整合:将聊天机器人与电子健康记录系统、临床决策支持系统等相结合,实现数据的实时流动和基于证据的建议提供。

本文的意义与价值: 这篇系统性综述为医疗人工智能领域的研究者和实践者提供了及时、全面的参考。它不仅系统性地总结了聊天机器人在医学问诊领域已有的证据,清晰地展示了其优势(效率提升、患者参与、标准化数据收集)和局限(准确性限制、同理心缺失、整合挑战),还批判性地评估了现有研究的质量,指出了证据基础的薄弱环节。更重要的是,它为未来的技术开发、临床实施和学术研究指明了方向,强调了以患者为中心、安全可靠、以及作为辅助工具而非替代角色的基本原则。在AI技术迅速渗透医疗行业的背景下,本文的审慎分析和框架性建议,对于推动聊天机器人技术负责任、有效地融入现代医疗体系,从而最终改善医疗服务质量和可及性,具有重要的学术价值和实践指导意义。

上述解读依据用户上传的学术文献,如有不准确或可能侵权之处请联系本站站长:admin@fmread.com