人工智能与人类控制的医生在虚拟现实模拟中用于脓毒症团队培训的随机对照研究
作者及机构
本研究由新加坡国立大学Alice Lee护理研究中心的Sok Ying Liaw博士领衔,合作作者包括Jian Zhi Tan、Khairul Dzakirin Bin Rusli等来自新加坡国立大学的多位学者,以及美国密歇根州立大学媒体与信息系的Rabindra Ratan博士。研究发表于《Journal of Medical Internet Research》(JMIR)2023年7月刊。
学术背景
脓毒症(sepsis)是一种高致死率的临床急症,早期识别与团队协作对改善患者预后至关重要。然而,护理学生与医学生的培训常因人数差异(如护理学生1500人 vs 医学生300人)和日程冲突难以实现频繁的跨专业团队训练。传统模拟培训(如线下高仿真模拟)存在成本高、协调难等问题,而虚拟现实模拟(Virtual Reality Simulation, VRS)虽能部分解决这些问题,但仍需依赖人类控制的医生角色。为此,研究团队开发了一种由人工智能(Artificial Intelligence, AI)驱动的虚拟医生,旨在探索其在脓毒症团队培训中的效果是否不劣于人类控制的医生角色。
研究设计与方法
本研究采用双臂随机对照试验(Randomized Controlled Trial, RCT),纳入64名护理学生,随机分为两组:
1. AI组:与AI驱动的虚拟医生合作完成脓毒症团队培训;
2. 人类对照组:与医学生控制的虚拟医生合作。
核心流程:
1. 干预阶段:两组均通过VRS完成两个脓毒症场景(早期脓毒症和脓毒性休克)的模拟训练,包括患者评估(采用ABCDE方法)和跨专业沟通(基于TeamSTEPPS沟通策略)。AI组通过Google Cloud的Dialogflow引擎实现自然语言交互,人类对照组则通过多用户虚拟环境进行实时协作。
2. 评估阶段:干预后两周内,通过模拟评估(使用RAPIDS工具评分)和知识测试(脓毒症知识与沟通知识)比较两组表现,同时采用自我效能量表(Patient Clinical Information Exchange and Interprofessional Communication Self-Efficacy Scale)评估跨专业沟通信心。
数据分析:采用描述性统计、配对样本t检验和ANOVA分析组间差异,显著性阈值设为p<0.05。
主要结果
1. 脓毒症知识:AI组的脓毒症知识后测分数(均值9.06,标准差1.78)显著高于人类对照组(均值7.75,标准差2.08;p=0.009),且仅AI组表现出显著基线提升(p<0.001)。
2. 模拟表现:两组在脓毒症护理(p=0.39)和跨专业沟通(p=0.21)的模拟评估中无显著差异,但AI组在知识测试中表现更优。
3. 自我效能:人类对照组在跨专业沟通自我效能感(均值69.6)上显著高于AI组(均值60.1;p=0.008),可能与人类互动的社交性有关。
结论与价值
研究表明,AI驱动的虚拟医生在脓毒症团队培训中不劣于人类控制的医生,尤其在知识传递方面更具优势。这为解决跨专业培训的规模化和可及性问题提供了新思路。然而,AI组较低的自我效能感提示需进一步优化AI的社交表现(如情感表达和自然对话能力)。研究建议未来结合AI培训与人类模拟的混合模式,以平衡知识学习与社交技能培养。
研究亮点
1. 创新性方法:首次在跨专业培训中对比AI与人类虚拟角色的效果,并开发了基于深度学习的AI医生对话系统。
2. 实践意义:为护理学生提供了不受医学生数量限制的团队培训方案,推动AI在医学教育中的应用。
3. 理论贡献:验证了高功能保真度(high functional fidelity)比物理保真度(physical fidelity)更能影响临床表现的观点。
局限性
研究未评估长期知识保留效果,且AI的社交互动能力仍需提升。未来可探索多模态AI(如结合面部表情识别)以增强培训的真实感。
其他价值
本研究得到新加坡教育部高等教育研究基金支持,数据可向通讯作者申请获取,为后续研究提供了重要基准。