0次浏览 发布时间:2025-05-30 16:25:00
【导读】多AI智能体系统的复杂构建与优化,长期以来是用智能体解决科研问题和场景落地的瓶颈。来自英国格拉斯哥大学的研究团队发布了全球首个AI智能体自进化开源框架EvoAgentX,通过引入自我进化机制,打破了传统多智能体系统在构建和优化中的限制!
在大语言模型技术迅猛发展的今天,各类AI智能体已广泛应用于科研和工业场景。然而,在实际应用中,构建一个高效、稳定的多智能体系统仍面临诸多挑战:从智能体选型、提示词调试到工作流设计,流程复杂,成本高昂。
更重要的是,当前多智能体系统通常「部署即固化」,缺乏自我演化机制。
每当目标调整,开发者往往需要手动修改提示词、重构系统结构,陷入「搭建—调试—重构」的低效循环,严重制约了智能体系统的规模化落地。
EvoAgentX针对目前多智能体系统应用搭建和优化过程中存在的痛点,推出全球首个AI智能体自进化开源框架!
支持一键搭建工作流,用户只需提供任务目标或场景描述,系统即可自动完成智能体配置和工作流搭建。
同时,EvoAgentX引入了「自进化」机制,使得多智能体系统可在实际运行中根据环境与目标的变化,持续优化系统结构与整体性能。
该开源平台旨在为研究者与工程人员提供统一实验和部署土壤,促进多智能体系统从静态设计迈向动态演化,推动AI多智能体系统从「人工调试」迈向「自主进化」的新范式。
EvoAgentX是一个开源的、以自我进化为导向的AI智能体研究框架,专为探索具备自我优化能力的多智能体系统而设计,旨在构建一个开放、可进化的智能体生态。
EvoAgentX旨在打破当前多智能体系统在构建与优化上的壁垒,从三大维度切入关键问题:自动化构建+自进化机制+系统性评估。
通过整合建模、执行与反馈链路,EvoAgentX不仅让智能体系统的搭建更轻,更快,也为其演化能力奠定了基础。无论是科研探索还是原型开发,它都能作为核心工具链,帮助用户高效验证策略设计与协同机制,加速多智能体能力从「可用」走向「可靠」。
一句话智能体自动构建:告别繁琐手工设计
痛点:构建一个高效的多智能体工作流通常需要专业知识、复杂配置和大量的人工干预,搭建过程耗时耗力。
EvoAgentX方案:提供任务驱动的一键式工作流生成能力,自动完成任务拆解、智能体配置与交互建模,显著降低系统搭建门槛,加快实验验证与原型开发。
协作智能体持续自我进化:让系统「越用越强」
痛点:传统的多智能体系统一旦搭建完成,难以持续优化,无法灵活适应新任务或者变化的运行环境,严重依赖人工调整
EvoAgentX方案:集成面向智能体提示词、工作流结构和记忆机制的多维度进化算法,实现AI智能体的持续自我优化,提升长期适应性和协同效率。
环境自动评估及反馈:灵活对接任务场景提供量化反馈
痛点:缺乏统一的评估机制,导致系统表现难以量化,优化方向不明确,实验结果也难以复现和对比。
EvoAgentX方案:内置标准任务环境和评估指标,支持对多智能体系统的表现进行量化分析,同时支持MCP对接场景工具实现垂类环境交互及快速反馈,为系统性优化和科研实验提供一致、可复现的测试基准。
研究人员通过两个具代表性的应用场景,系统性展示了EvoAgentX在多智能体工作流自动化构建方面的能力与适用性:
场景1:根据候选人的PDF简历内容,从互联网上检索并推荐匹配的职位信息
场景2:A股股票的可视化分析
为了验证不同任务场景下的自我进化能力,EvoAgentX选取了三个具有代表性的AI任务数据集,涵盖多跳问答(HotPotQA),代码生成(MBPP)和数学推理(MATH)。
在这些任务中,EvoAgentX以一个预设的初始智能体系统为基础,结合其自进化机制,从提示词生成策略与工作流结构配置两个维度出发,持续对系统性能进行迭代优化。
优化过程中,智能体能够基于大语言模型(LLM)的反馈以及任务执行结果,动态调整提示词内容与工作流拓扑结构,从而实现闭环自我改进。
优化前后系统在各项任务中的性能表现如下图所示,清晰展示了自进化机制在提升智能体系统整体效能方面的实际效果。
实验结果显示,EvoAgentX 在多跳问答(HotPotQA)、代码生成(MBPP)和数学推理(MATH)三类具有代表性的任务中均实现了稳定且显著的性能提升,平均提升幅度高达 8%~13%
这一成果不仅验证了其进化机制在跨任务场景中的广泛适应性,也进一步印证了 EvoAgentX 在构建可持续优化的多智能体系统方面的实际效能,展现出强大的泛化能力与工程应用价值。
值得一提的是,当前的优化尚未充分利用框架的全部潜力,随着未来策略优化、模块扩展和生态协同能力的不断增强,EvoAgentX仍具备广阔的性能提升与应用扩展空间。
为了进一步验证 EvoAgentX 在优化现有AI智能体工作流方面的能力,该框架也优化GAIA基准测试上现有的多智能体系统,包括了GAIA排行榜中开源且可复现的代表性多智能体框架:Open Deep Research
该框架由Huggingface团队开发的可实时进行网络搜索回答问题的多智能体系统。基于这些智能体的原始结构,EvoAgentX对其提示词进行自动优化。
优化后的在GAIA基准测试验证集上的性能如下图所示:
优化后的实验结果显示,EvoAgentX能够在不同基础系统上均带来稳定且显著的性能提升,进一步验证了该框架在提升现有智能体通用能力与任务适应性方面的实际效用。
完整报告与实验细节:
https://github.com/eax6/smolagents
为了支持AI智能体的持续优化与自我演化,EvoAgentX构建了一个由多个功能层组成的模块化架构,涵盖了从AI智能体的底层组件到进化机制的完整链路。系统的整体架构如下:
EvoAgentX的架构一共包括:
基础组件层:提供框架运行的通用能力支持,如基础模块、日志管理等,确保系统具备良好的适用性和可扩展性。
智能体层:包含构建AI智能体的核心模块,包括大语言模型、记忆模块、动作执行组件等,用于定义AI智能体的核心功能与外部交互能力。
工作流层:构建和管理一个面向复杂任务的多智能体系统,包括工作流图、智能体管理等组件,适用于多阶段、多任务、多角色的智能体任务。
进化层:聚焦AI智能体系统的优化功能,提供针对智能体提示词、工作流结构及记忆机制的多维度优化器,助力AI智能体的持续进化。
评估层:提供灵活的性能评估机制,支持对AI智能体系统的有效性和泛化能力进行可定量的评估。
EvoAgentX团队认为,AI不应依赖繁复的人工干预,而应该成为能够自主感知需求、动态规划目标、持续迭代策略的智能伙伴。
该团队致力于构建一个真正具备自主进化的AI智能体生态系统。
在这一生态中,每个智能体都具备根据任务自动搭建和优化工作流与策略的能力,并通过开放协议实现经验与知识的全局共享。
通过开源社区的协同进化机制,EvoAgentX将重新定义AI系统的开发范式:开发者无需从零构建复杂的工作流,只需要给出目标,系统就能自主生成执行并持续优化方案;科研用户不再受限于静态的AI模型,便可实时获取生态中最新进化的智能体能力。
这种「需求即指令、使用即进化」的模式,使得每个参与者的实践反馈都将加速智能体的智慧成长,突破当前AI系统的能力边界,让智能体能够自主拆解复杂问题、动态重组技能模块,并持续反馈学习。
这是通向可持续智能未来的必经之路:一个越用越聪明、越共享越强大的自进化AI智能体,终将成为赋能各行业创新的进化引擎。
为了实现以上愿景,EvoAgentX将循序推进以下关键里程碑:
阶段一: 工作流自动构建与模块化组件集成
搭建和持续优化一键生成多智能体工作流功能;
集成典型任务模板与AI智能体模块;
提供可视化的工作流图结构展示与编辑接口;
持续扩展开源的组件库以支持快速重用和复合任务构建。
阶段二:多维度自进化能力与反馈学习机制
集成提示词、工作流结构和记忆模块等维度的AI智能体自进化算法
引入性能反馈驱动的策略优化机制
支持系统在多次任务执行中进行自适应优化
提供任务间迁移能力与演化路径记录机制
阶段三:开放智能体生态与协同进化机制
构建面向开发者与研究者的智能体与工作流「市场」,支持上传、共享与复用高质量智能体模块与优化工作流
支持用户将本地优化成果(如改进的提示词、结构配置、策略方案)上传至生态,实现系统级协同进化
建立跨任务、跨用户的进化轨迹追踪与知识融合机制,让每一次实践反馈都能反哺整个生态系统
设计开放协议与标准接口,推动形成智能体能力共享、经验迁移的生态循环
参考资料:
https://github.com/EvoAgentX/EvoAgentX
本文来自微信公众号“新智元”,编辑:LRST 好困 ,36氪经授权发布。
“全球首个800V智能超混MPV”2026款岚图梦想家预售价38.99万起 8月29日第二十八届成都车展,全面焕新升级的“新时代旗舰MPV”2026款岚图梦想家预售亮相。本次新车共推出智能超混版和智能纯电版两个动力版本,预售价为38.99万-45.99万,同步推出了价值超万元的多项重磅权益。此次车展,2026款岚图梦想家发布8大领先科技,是新能源领域唯一同时搭载62.5度超 2025-08-29 14:23:00
工人村社区双管齐下守护平安家园 为进一步夯实社区安全基础,提升全民防火自救能力,近日,西岗区香炉礁街道工人村社区精心组织,成功举办了一场面向居民的消防安全知识讲座,并同步对辖区商户进行了专项安全隐患排查。讲座现场,专干通过播放警示教育片和实物操作演示,重点围绕家庭火灾预防、电动车违规充电危害等与居民生活息息相关的主题进行了生动讲解 2025-08-26 13:00:00
“补贴未至涨价先来”?读懂来自市场的提醒 每孩每年3600元,补贴直至年满3周岁,预计惠及超2000万育儿家庭……近期,旨在用“真金白银”缓解家庭养育压力的国家育儿补贴政策发布。然而,有新手父母反映,奶粉、纸尿裤等母婴用品近期“悄悄涨价”,部分产品涨幅“甚至不小”。另一边,有商家称仅少数品类价格略有波动,且涨价与育儿补贴政策出台并无关联。消 2025-08-26 09:24:00
脑机接口技术新突破!苏州“国字号”院所发布重磅成果 近日,位于苏州高新区的科研院所——中国兵器工业集团第二一四研究所苏州研发中心(简称二一四所苏州研发中心)发布信息,其利用“脑控运动康复训练系统”,促进了一名脑卒中患者的运动功能恢复。该患者是一名16岁男孩,因突发性左侧脑出血,在苏州市立医院接受左脑开颅急救后,右手完全丧失了基本活动能力。二一四所苏州 2025-08-25 11:02:00
以人才之力筑乡村振兴之基 河南西峡县推出“产业技术总监”制度,围绕产业发展需要,精准匹配技术人才深入一线把脉问诊;四川荣县设立“人才专员”岗位,依托专员“点单”、部门“接单”机制,有效推动各类人才为乡村发展服务;内蒙古鄂托克前旗推动干部人才下沉一线、赋能乡村振兴,让选调生、驻村干部、“双百”人才沉到田间地头……这些各具特色的 2025-08-24 07:00:00