
DRUGONE
随着大语言模型驱动的智能体不断发展,其在自动化复杂任务和科学数据探索中的潜力日益凸显,但在生物医学数据分析领域仍受限于多工具调用和多步骤推理的复杂性。研究人员提出BioMedAgent,一种具备自进化能力的多智能体大语言模型框架。该系统通过交互式探索与记忆检索机制,学习使用多种生物信息学工具,并将其自动串联为可执行分析流程。用户只需通过自然语言输入任务,即可完成复杂数据分析,无需专业计算背景。在包含327个任务的BioMed-AQA基准测试中,BioMedAgent达到77%的成功率,显著优于现有方法,并在外部数据集上展现出良好的泛化能力。此外,该系统能够自主完成跨组学分析、机器学习建模以及病理图像分割,展示出在生物医学研究中的广泛应用潜力。

生物医学领域正经历数据规模的快速增长,从电子健康记录到高分辨率医学影像,再到多组学数据,海量数据的产生推动了疾病研究和药物开发的进步。然而,这些数据的分析需要整合生物信息学、人工智能、统计学和编程等多方面能力,使得分析流程复杂且门槛较高。
尽管已有诸如Galaxy、Nextflow等平台简化了分析流程构建,但这些工具仍依赖预定义工作流,缺乏灵活性和自然语言交互能力,难以满足复杂研究需求。与此同时,大语言模型在自然语言理解与推理方面取得突破,催生了能够自主决策与执行任务的AI智能体。然而,现有生物医学领域的LLM智能体多局限于特定任务,难以整合多种工具,也缺乏经验复用能力。
因此,研究人员提出构建一种通用、可扩展且具备自进化能力的多智能体框架,使其能够像“AI数据科学家”一样,自动完成复杂的生物医学数据分析任务。
方法
BioMedAgent由多个基于大语言模型的智能体协同构成,围绕“规划—编码—执行”三阶段流程运行。在规划阶段,多个智能体协同解析任务并设计分析流程;在编码阶段自动生成调用工具的代码;在执行阶段运行分析并输出结果。系统引入交互式探索机制扩展解空间,同时通过记忆检索算法存储并复用成功经验,使模型在迭代过程中持续优化决策与执行能力。
结果
多智能体框架实现复杂任务自动化
BioMedAgent能够从自然语言输入出发,自动完成从任务理解到分析执行的全过程。系统通过规划、编码与执行三个阶段协同运行,并结合多智能体交互机制,能够动态调整分析策略并优化结果。

图1: BioMedAgent框架与基准数据集。
在生物医学基准任务中的整体表现
在BioMed-AQA基准测试中,BioMedAgent在多种任务类别中均表现出较高成功率,整体平均达到77%。其中,在组学分析、机器学习和精准医学任务中表现尤为突出,显示出其在多类型任务中的广泛适用性。与其他基于LLM的智能体相比,该系统在成功率和可分析任务范围上均显著领先。

图2: BioMedAgent的整体性能评估。
工具调用能力显著提升分析性能
研究人员发现,集成专业生物信息学工具对于复杂任务至关重要。通过引入工具管理智能体,BioMedAgent能够学习工具文档并正确调用相关工具,从而显著提升任务成功率。在整合数十种工具后,系统在关键任务上的成功率超过90%,验证了工具感知能力的重要性。
交互式探索提升多步骤问题求解能力
通过模拟人类群体协作,交互式探索机制显著增强了系统在复杂任务中的表现。该机制能够扩展潜在解决方案空间,使原本失败的任务转化为成功执行,整体成功率显著提升。

图3: 交互式探索(IE)算法的性能评估。
自进化机制持续提升模型能力
借助记忆检索算法,BioMedAgent能够在多轮迭代中不断优化自身性能。随着学习轮数增加,系统成功率由初始水平逐步提升至77%,表明其具备持续学习和自我改进能力。同时,该机制还能有效减少重复探索,提高效率。

图4: 基于记忆检索(MR)算法的自进化机制。
在外部数据集上的泛化能力
在独立的BixBench基准测试中,BioMedAgent在无需专用工具的情况下仍显著优于现有方法,展现出良好的泛化能力。这表明其不仅能够适应内部任务,还能够推广到新的分析场景。

图5: 在外部基准BixBench上的评估及与其他智能体的比较。
跨组学分析与真实应用验证
在实际应用中,BioMedAgent能够自动完成跨组学数据分析任务,例如整合RNA-seq与单细胞数据,识别疾病相关基因来源细胞类型。系统可自动执行从数据处理到结果解释的全过程,展示出其作为“AI数据科学家”的实际应用价值。

图6: BioMedAgent在多样化生物医学数据研究中的应用。
讨论
研究人员提出的BioMedAgent框架展示了大语言模型在复杂科学数据分析中的巨大潜力。通过多智能体协作、工具感知能力以及自进化机制的结合,该系统能够自动完成多步骤分析任务,并持续提升自身性能。
相比传统分析平台和现有智能体方法,BioMedAgent在任务覆盖范围、工具整合能力以及评估体系方面均表现出显著优势。其核心贡献在于实现了从“工具使用困难”到“自动化工具链构建”的转变,使非计算背景的生物医学研究人员也能够直接参与复杂数据分析。
未来,该框架有望进一步扩展至更多科学领域,并结合更强大的模型能力,实现更高水平的自动化科研分析。整体而言,该研究推动了“AI数据科学家”的发展,为智能化科研提供了重要方向。
整理 | DrugOne团队
参考资料
Bu, D., Sun, J., Li, K. et al. Empowering AI data scientists using a multi-agent LLM framework with self-evolving capabilities for autonomous, tool-aware biomedical data analyses. Nat. Biomed. Eng (2026).
https://doi.org/10.1038/s41551-026-01634-6

内容为【DrugOne】公众号原创|转载请注明来源