用于自动化科学发现的多智能体系统ROBIN

分享自：
用于自动化科学发现的多智能体系统ROBIN

医学
信息科学
期刊:NatureDOI:10.1038/s41586-026-10652-y
【点击此处】阅读全文、收藏及针对性提问
一项开创性研究：ROBIN——首个实现科学发现全流程自动化的多智能体系统
一、 研究团队与发表信息
本研究由来自美国Futurehouse的Ali Essam Ghareeb、Benjamin Chang、Ludovico Mitchener、Angela Yiu、Caralyn J. Szostkiewicz、Dmytro Shved、Gavin J. Gyimesi、Jon M. Laurent、Samantha M. Wright、Muhammed T. Razzak、Andrew D. White、Silvia C. Finnemann、Michaela M. Hinks和Samuel G. Rodriques共同完成。其中，Ali Essam Ghareeb与Benjamin Chang为共同第一作者，Andrew D. White、Michaela M. Hinks和Samuel G. Rodriques为共同通讯作者和共同指导者。该研究于2026年5月12日被接受，并作为“加速文章预览”在线发表于顶级学术期刊《自然》（Nature），其最终引用格式为：Ghareeb, A. E. et al. A multi-agent system for automating scientific discovery. Nature https://doi.org/10.1038/s41586-026-10652-y (2026)。
二、 学术背景与研究目的
本研究属于人工智能（AI）与实验生物学交叉的前沿领域，核心目标是解决科学发现过程中的关键瓶颈。尽管近年来人工智能，特别是大语言模型（LLMs），在生物学数据分析、文献总结乃至初步假设生成方面展现出潜力，但尚未有系统能够实现从观察、假设生成、实验设计、数据分析到假设迭代优化的完整科学发现循环的自动化。传统的药物研发，尤其是老药新用（drug repurposing），严重依赖于专家对海量、分散的科学文献的深度整合能力，这一过程耗时漫长且易受限于个人知识领域，导致许多潜在的关联被忽视，从科学洞见到新疗法应用之间存在显著的“时间滞后”。
因此，本研究旨在开发并验证一个名为ROBIN的多智能体AI系统。该系统旨在整合基于文献的假设生成与实验数据的自主分析，形成一个“实验室在环”（lab-in-the-loop）的半自主科学发现范式。研究团队选择以干性年龄相关性黄斑变性（dry age-related macular degeneration, dAMD）——发达国家不可逆视力丧失的首要原因——作为概念验证的疾病模型，旨在证明ROBIN能够自主发现并验证有前景的治疗候选药物，从而建立AI驱动科学发现的新范式。
三、 详细研究流程与方法
ROBIN系统的核心是一个由多个专门化语言智能体（Agent）协同工作的结构化工作流。整个研究流程可概括为“假设生成-实验验证-数据分析-假设迭代”的循环，具体步骤如下：
1. 假设生成阶段： * 输入与初步探索：研究人员向ROBIN系统输入目标疾病名称“干性年龄相关性黄斑变性”。ROBIN首先调用名为Crow的文献搜索智能体，对疾病病理学提出一系列概括性问题并进行文献检索与总结。 * 疾病机制与实验模型筛选：基于Crow提供的报告，ROBIN识别出10个潜在的dAMD致病机制。针对每个机制，ROBIN再次调用Crow，生成详细的、可用于测试药物效力的体外疾病模型报告。随后，ROBIN利用一个大语言模型（LLM）作为“裁判”，对这些报告进行两两比较，通过计算相对排名（采用Bradley-Terry-Luce模型）选出最优的体外实验策略。最终，ROBIN将“增强视网膜色素上皮（Retinal Pigment Epithelium, RPE）细胞的吞噬功能”确定为治疗dAMD的策略，并建议使用流式细胞术检测药物对RPE细胞吞噬能力的影响。 * 候选药物生成与排序：确定了实验模型后，ROBIN进行类似的文献回顾，提出30个治疗候选药物。接着，它调用另一个名为Falcon的深度文献搜索智能体，为每个候选药物生成包含科学原理、药理学特性和文献支持局限性的详细评估报告。这些候选药物再次通过LLM裁判进行的“锦标赛”进行排序，排序依据包括科学论证的强度、药理学特征和支持文献的质量。研究人员从排名前列的药物中选择了前五名进行实验测试：Exendin-4、Fingolimod、MFGE8、Y-27632以及AICAR与TUDCA的组合。其中MFGE8作为已知能增强RPE吞噬作用的阳性对照。
2. 实验执行与数据分析阶段： * 初始药物筛选实验：研究人员根据ROBIN的建议，在ARPE-19细胞系（一种人RPE细胞系）中进行了吞噬功能检测实验。他们使用了pH敏感的荧光标记微珠（pHrodo beads）作为吞噬底物，通过流式细胞术量化细胞内的荧光强度来评估吞噬活性。 * 自主数据分析（Finch智能体）：实验完成后，原始流式细胞术数据（.fcs文件）和分析提示（如“进行流式细胞术分析”）被上传给ROBIN。ROBIN随即调用其数据分智能体Finch。Finch是一个自主的、基于Jupyter Notebook的数据分析智能体。为了应对生物数据解释固有的模糊性（如流式细胞术的门控策略），ROBIN配置了8个独立的Finch分析轨迹。每个Finch实例独立编写并执行代码（Python/R）来分析数据：包括通过前向散射（FSC）与侧向散射（SSC）图去除碎片，通过FSC-H与FSC-A图筛选单细胞，利用DAPI通道排除死细胞，最后进行统计检验并绘制结果图。所有轨迹完成后，ROBIN进行元分析，综合所有输出形成共识结论。分析结果显示，Rho激酶（ROCK）抑制剂Y-27632能显著增强ARPE-19细胞的吞噬作用，这与人类科学家对相同数据的独立分析结果一致。
3. 假设迭代与验证阶段： * 机制探索实验提议与分析：基于第一轮实验结果，ROBIN提议对Y-27632处理的细胞进行RNA测序（RNA-seq），以研究其转录组效应。研究人员执行了该实验，并将RNA-seq数据交给Finch分析。Finch进行了差异基因表达（Differential Gene Expression, DGE）分析、基因本体（GO）富集分析，并生成了火山图等。分析发现，Y-27632处理显著上调了ABCA1（一种关键的脂质外排泵）的表达，并影响了与肌动蛋白丝组织、小GTP酶信号转导和自噬相关的通路。 * 新一轮候选药物生成与验证：结合第一轮实验的见解，ROBIN启动了新一轮治疗候选药物生成循环，提出了包括Ripasudil在内的新一批候选药物。研究人员测试了其中10种药物。Finch对第二轮实验数据的分析表明，Ripasudil（一种在日本获批用于治疗青光眼的ROCK抑制剂）的效果优于Y-27632，能将RPE细胞的吞噬作用提高约1.89倍（与DMSO对照相比）。剂量反应实验证实了Ripasudil比Y-27632具有更高的效力。 * 在原发性人RPE细胞中的验证：为了更接近生理条件，研究团队在从老年供体分离的原代人视网膜色素上皮干细胞（RPE-SC）中，使用荧光标记的牛视杆细胞外段（rod outer segments, ROS）作为更生理性的底物，重复了药物筛选。结果再次验证了Ripasudil和Y-27632的活性，且Ripasudil效力更高。此外，另一个候选药物KL001（一种通过防止CRY蛋白泛素化降解来调节生物钟的化合物）在RPE-SC中也显示出增强吞噬的作用，这是一个此前未被报道的新发现。对RPE-SC的RNA-seq分析也证实了Ripasudil能上调ABCA1的表达。
4. 系统验证与性能评估： * 智能体消融实验：为了验证Crow和Falcon智能体的必要性，研究团队将它们替换为通用的OpenAI o4-mini模型。结果显示，移除Falcon或同时移除Crow和Falcon会导致生成的参考文献中出现大量“幻觉”（虚构内容），且最终药物提案的质量在LLM裁判评估中显著下降。单独移除Crow在最终药物报告中未增加幻觉，这是因为Falcon纠正了Crow阶段可能出现的错误，但在生成实验方案报告时，o4-mini产生了大量幻觉参考文献，而Crow则没有。 * Finch性能基准测试：在专门为计算生物学设计的BIXbench基准测试中，Finch在170个问题上的总体准确率为22.8%，显著高于其基础模型Claude 3.7 Sonnet单独运行的1.6%。其在生物统计学任务上表现更好（47.9%），而在需要多步骤流程的生物信息学子集上表现较低（15.3%），指出了未来改进方向。 * 与通用AI研究工具对比：研究团队将相同的候选药物生成提示给OpenAI的Deep Research（一个通用的多步骤研究智能体）。Deep Research提出的19个独特候选药物中，没有一个在RPE-SC吞噬实验中显示活性，也没有提出ROCK抑制这一策略，凸显了ROBIN领域专用架构的优势。 * 效率与成本分析：在一个典型的ROBIN工作流中（分析约825篇参考文献），系统在约30分钟内完成，而估计人类完成同等工作需超过800小时，认知劳动时间从估计的872-937人时减少到不足2小时，实现了超过200倍的效率提升。单次运行成本约为10.76美元。
四、 主要研究结果
成功构建并验证了ROBIN系统：研究证明，ROBIN是首个能够整合假设生成与实验数据分析、实现半自主科学发现闭环的多智能体系统。
高效识别治疗策略与候选药物：针对dAMD，ROBIN自主地将“增强RPE吞噬作用”确定为治疗策略，并从文献中筛选出包括ROCK抑制剂在内的候选药物。实验验证了Y-27632和Ripasudil能有效增强RPE细胞的吞噬功能。
发现具有临床转化潜力的老药新用机会：Ripasudil作为一个已上市、具有已知眼部用药安全性的药物，被ROBIN首次提出用于治疗干性AMD（通过增强吞噬的机制），这为快速临床转化提供了可能。
揭示新的作用机制与潜在靶点：通过ROBIN提议并由Finch分析的RNA-seq实验，发现ROCK抑制剂Y-27632不仅能通过已知的转录后机制影响吞噬，还能引起快速的转录组变化，特别是显著上调了ABCA1基因。ABCA1是维持RPE健康功能的关键脂质外排泵，其与载脂蛋白E（APOE，已知的AMD遗传风险因子）的关联，为理解ROCK抑制剂的作用机制和发现新的治疗靶点（如ABCA1）提供了线索。
发现全新作用机制的候选物：除了ROCK抑制剂，ROBIN还基于“吞噬作用受昼夜节律调控”的文献知识，提出了生物钟调节剂KL001，并在原代RPE-SC细胞中验证了其增强吞噬的活性，这是一个全新的发现。
验证系统组件的关键作用：消融实验证实，专用的文献搜索智能体（Crow, Falcon）对于生成高质量、基于真实文献的假设至关重要，能有效减少幻觉。专用的数据分析智能体（Finch）在生物数据分析任务上远超通用大语言模型。
证明工作流的迭代优化能力：ROBIN能够根据第一轮实验数据（Y-27632有效）的分析结果，提出进一步的机制研究（RNA-seq）并生成新一轮更优的候选药物（如效力更强的Ripasudil），体现了其假设迭代优化的能力。
五、 研究结论与价值
本研究成功开发并实证了ROBIN系统，它代表了AI驱动科学发现的一个新范式。该系统首次实现了从文献挖掘、假设生成、实验设计建议到实验数据自主分析的完整科学流程自动化，并在“实验室在环”的人机协作框架下，针对干性年龄相关性黄斑变性（dAMD）这一重大未满足医疗需求的疾病，自主发现了具有潜力的老药新用候选药物（Ripasudil）和全新机制的化合物（KL001），同时揭示了新的潜在作用靶点（ABCA1）。
其科学价值在于：（1）方法论创新：构建了一个可扩展、多智能体协作的自动化科学发现框架，为其他领域的探索提供了蓝图。（2）加速知识合成：通过AI高效连接跨领域的分散知识，发现人类专家可能忽略的“组合式合成”机会，解决了科学知识碎片化带来的创新滞后问题。（3）提升研究可重复性：通过代码生成进行数据分析，增强了分析过程的透明度和可重复性。
其应用价值在于：（1）极大提升药物发现效率：将假设生成与初步验证的周期从数百小时缩短至数小时，成本极低，为应对药物研发效率停滞的挑战提供了新工具。（2）直接产出转化研究成果：系统输出的不是泛泛的建议，而是经过初步实验验证、具备明确作用机制和细胞学效力的候选药物，显著降低了后续研发的不确定性。（3）平台普适性：虽然本研究聚焦于生物治疗学，但ROBIN的架构原则上可应用于材料科学等其他需要从文献和数据中产生假设的领域。
六、 研究亮点
全流程自动化首创：ROBIN是首个实现“假设生成-实验分析-假设迭代”全链条自动化的AI系统，填补了该领域的空白。
有效的“实验室在环”验证：并非纯计算预测，所有关键假设均通过湿实验验证，并在原代人细胞中得到确认，证明了其产出具有生物学相关性。
发现具有双重新颖性的成果：既发现了已上市药物Ripasudil用于治疗dAMD的新用途（新适应症），又发现了KL001这一全新作用机制的候选物（新机制）。
超越表面关联的机制洞察：系统不仅能提出“什么药可能有效”，还能通过自主设计并分析后续实验（如RNA-seq），深入揭示“为什么有效”的潜在分子机制（如ABCA1上调），推动了科学理解。
严谨的系统性能评估：通过消融实验、基准测试和与通用工具的对比，严格证明了其专用智能体架构的必要性和优越性，为未来改进提供了明确方向。
解决实际痛点：精准针对了药物重定位中“知识存在但关联未被发现”的核心痛点，并通过自动化大幅提升了效率。
七、 其他有价值的内容
研究团队在文中也讨论了ROBIN系统的局限性与未来发展，例如：目前系统生成的是实验大纲而非可直接执行的详细协议；Finch智能体仍需领域专家进行提示工程；系统性能将随着底层基础模型的进步而提升。同时，他们提到了针对AI驱动发现可能产生的生物安全担忧，已在ROBIN框架内设置了防护措施，如优先选择具有已知安全性的候选物，并将所有输出视为必须经过标准临床前验证的假设，且利用经过安全对齐的LLM并设置了不安全话题分类器。这些讨论体现了研究的审慎性和前瞻性。
上述解读依据用户上传的学术文献，如有不准确或可能侵权之处请联系本站站长：admin@fmread.com
【点击此处】阅读全文、收藏及针对性提问