作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
AI Agent是一种具有自主性或半自主性的智能实体,能够利用人工智能技术在数字或物理环境中感知、决策、采取行动并实现目标。与Copilot、聊天机器人等相比,AI Agent能够自主规划和行动,实现用户预设的目标。
伴随着人工智能技术的迭代,AI Agent也经历了多个发展阶段。从2024年开始,基于大模型(主要是指“大语言模型LLM”)的AI Agent正在成为企业落地AI应用/解决方案时的必备功能。
构建基于大模型的AI Agent系统需要采用模块化和可组合的软件架构方法,各个能力通常拆解为独立的功能模块(例如记忆、感知、执行、LLM接口等),各模块之间通过标准化接口通信,形成松耦合的分布式系统(类似微服务架构),这种架构的优点是简单、灵活且易于扩展,可以根据具体需求添加或修改模块。
基于大模型的AI Agent代表了未来的AI应用落地趋势,虽然具有巨大潜力,但也给企业开发人员带来了一系列新的挑战。为了帮助企业更好地理解Agent可以支持的能力,并识别交付这些能力的机会和复杂性,沙丘智库发布《AI Agent架构设计模式研究报告》,将当前最常见、最成熟且最重要的基于大模型的AI Agent的架构设计模式分为7大类、具体26种,通过合理使用这些模式,企业可以构建出高效、可靠且安全的AI Agent系统。
· 架构模式:架构模式用于指导基于大模型的AI Agent的整体结构,是构建AI Agent的基础,决定了Agent如何在系统中交互、通信以及履行其指定的角色。在选择架构模式时,企业需要考虑Agent的功能范围、用于开发Agent的框架或平台。所选的架构模式将影响Agent的响应速度、可维护性、适应性以及评估和保证Agent质量的方法。架构模式包括单Agent、Agent角色、多Agent、 Agent交接 。
· 工作流模式:工作流模式用于定义Agent完成任务的工作流,这些工作流可以是线性的、循环的或动态的。采用动态工作流的AI Agent解决方案的自主性更强,但对于明确需求,使用预定义工作流(静态)是更加简单的方法,可以简化设计、评估和安全实施。工作流模式包括预定义计划、多跳问答、动态计划生成、编排Agent、协作Agent、人机协同。
· 大模型交互模式:大模型交互模式是指如何利用大模型的能力完成信息收集、动态规划、状态监控等一系列任务,包括如何构造prompt从大模型获取最佳响应,以及如何调用LLM API来执行特定任务。大模型交互模式包括:ReAct、思维链(CoT)、反思、结构化响应、重试限制。
· 行动模式:行动模式是指Agent根据其对输入的解释、对系统环境的感知,做出决策来采取行动的模式。例如,Agent可能需要调用特定的函数来执行任务,选择使用特定的工具,或者与外部环境(如数据库或API)集成以获取或发送信息。行动模式包括:函数调用(Function Call)、工具使用(tool use)。
· 记忆模式:记忆是指用于获取、检索、保留和后续检索信息的过程,记忆模式是指定义和管理记忆的模式,对Agent性能至关重要,支持短期记忆(任务内)、公共记忆(跨每个用户的任务)和全局记忆(跨所有Agent使用)。与决策、行动和活动相关的记忆可以用来帮助Agent提高学习和适应能力,同时也确保了信息访问的隐私和控制。记忆模式包括:RAG、记忆持久性、记忆共享范围。
· 评估模式:评估模式可用于实施持续的评估、验证和改进,从而提高Agent的性能和可靠性。评估模式包括:用户参与反馈、将大模型作为裁判、确定性评估、交互日志。
· 安全和身份管理模式:安全和身份模式侧重于保护Agent系统的安全性和身份管理,有助于保护Agent系统免受安全威胁,并确保其操作符合安全和合规要求。安全和身份管理模式包括:大模型防护栏、身份传播。
每种模式的介绍、适用场景、优劣势分析等详见完整报告:沙丘智库《AI Agent架构设计模式研究报告》(58页PPT)
* 以上内容节选自沙丘智库《AI Agent架构设计模式研究报告》
报告目录
1.基于大模型的AI Agent定义
2.基于大模型的AI Agent架构设计
3.基于大模型的AI Agent工作流
4.基于大模型的AI Agent典型特征
5.基于大模型的AI Agent实现方式
5.1 架构模式
5.1.1 架构模式:单Agent
5.1.2 架构模式:Agent角色
5.1.3 架构模式:多Agent
5.1.4 架构模式:Agent交接
5.2 工作流模式
5.2.1 工作流模式:预定义计划
5.2.2 工作流模式:多跳问答
5.2.3 工作流模式:动态计划生成
5.2.4 工作流模式:编排Agent
5.2.5 工作流模式:协作Agent
5.2.6 工作流模式:人机协同
5.3 大模型交互模式
5.3.1 大模型交互模式:ReAct
5.3.2 大模型交互模式:思维链(CoT)
5.3.3 大模型交互模式:反思
5.3.4 大模型交互模式:结构化响应
5.3.5 大模型交互模式:重试限制
5.4 行动模式
5.4.1 行动模式:函数调用(Function Call)
5.4.2 行动模式:工具使用(tool use)
5.5 记忆模式
5.5.1 记忆模式:RAG
5.5.2 记忆模式:记忆持久性
5.5.3 记忆模式:记忆共享范围
5.6 评估模式
5.6.1 评估模式:用户参与反馈
5.6.2 评估模式:将大模型作为裁判
5.6.3 评估模式:确定性评估
5.6.4 评估模式:交互日志
5.7 安全和身份管理模式
5.7.1 安全和身份管理模式:大模型防护栏
5.7.2 安全和身份管理模式:身份传播
6.给企业用户的建议
▎更多研究(可前往“沙丘智库”查阅)
2025年中国银行业大模型应用跟踪报告
2025年中国消费品零售业大模型应用跟踪报告
国资央企DeepSeek大模型应用跟踪报告
银行业DeepSeek大模型应用跟踪报告
2025年中国保险业大模型应用跟踪报告
2024年AI Agent最佳实践报告
2024年“大模型+数据分析”最佳实践报告
...
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738