跳到主要内容
ffc998ffffe1af118077b4c51dc75148

AgentScope快速入门实战

[toc]

image-20251110204209239 a8a3a270d93e69abe955710b35c92383

一、国产最强!AgentScope框架快速入门介绍

1. 大模型性能飞跃推动Agent开发范式转变

​ 从2025年起,人工智能领域迎来了一个显著的转折点:以 DeepSeek‑R1 模型的问世为标志,基础大语言模型(Large Language Models, LLM)在 推理能力工具调用能力自主规划能力调试能力等多个维度都实现了跳跃式发展。

image-20251110202018124

​ 传统的智能体开发方式多依赖于工作流式的脚本化结构——例如早期的 LangChain 提供了模块化的 Prompt Chain、工具调用和多步骤流程,这在当时是非常实用的范式。但随着大模型自身能力的大幅提升,这类「预定义流程 + 序列化调用」的方式逐渐暴露出局限:它们依赖于人为提前设计流程,智能体的自主性和灵活性受限。

image-20251110202142792

​ 相比之下,当下被广泛采用的开发范式是 ReAct Agent(Reason + Act 智能体)。在这一范式中,智能体不仅接收输入,还能:

  • 在同一轮对话中自行决定 是否调用工具调用哪一个工具
  • 决定是否需要 并发调用多个工具多步使用工具
  • 自主评估并 调试自身输出,例如在思考链 (“chain-of-thought”) 过程中发现偏差并更正。

​ 例如,当前热门模型如 Qwen3、Gemini 2.5、Claude 4.5 在 2025 年都被报道支持丰富的函数调用接口、结构化输出、甚至长上下文推理能力。在这样的背景下,传统的工作流式、脚本化智能体开发方式显得越来越不合时宜。

​ 此外,智能体开发框架也迎来新一轮迭代。以往依赖 “工具注册 + 模块调用 +结果拼接” 的体系,被更为“智能化”且具有内建 agent 控制能力的框架所替代。例如:

  • Agents SDK(OpenAI 出品)强调 Agent 自主决策能力;

    image-20251110202240087
  • ADK (Agent Development Kit)(谷歌推出)也将 ReAct 模式作为默认范式;

    image-20251110202255363
  • 而 LangChain 在 2025 年 9 月末发布的 1.0 版本也全面拥抱了 ReAct Agent 模式。

    image-20251028200951379

​ 在这一浪潮中,AgentScope 正是出生于这样一个时代背景——它作为一个以 构建 ReAct 智能体为核心 的开发框架,定位清晰:既适应了新一代大模型的能力释放,也为开发者提供了更高层次的抽象能力。相比传统方式,它将“Prompt → 工具调用 → 结果处理”封装为“Agent 自主思考并行动”的整体闭环,使智能体开发更加模块化、结构化且易于控制。

2. AgentsScope核心功能与技术定位

image-20251110152355295

2.1 项目基本情况

​ 自 2025 年 8 月起,AgentScope 正式向开源社区发布,由 Alibaba Tongyi Lab(阿里巴巴 “通义” 实验室)主导研发。根据其 GitHub 项目页面,该框架自版本 v1.0 起全面面向多智能体(Multi-Agent)开发范式,强调“开发者优先、可控、模块化”的设计理念。 ​ 在国内代理开发工具链尚在快速发展阶段的背景下,AgentScope 被视为“国产最强”的 Agent 开发框架之一,不仅功能完备,而且性能表现优异。其开发团队明确目标——打造国产版的 LangChain,将 “智能体开发” 从单纯的语言模型调用提升为一套系统化、工程化的解决方案。 ​ 因此,在这一课件中,我们将围绕 AgentScope 的核心定位与其丰富功能进行系统介绍,以便新人用户能够清晰理解该框架为何与众不同、以及它能为智能体开发带来哪些技术层面的提升。

2.2 核心功能亮点

下面分别从六大维度梳理 AgentScope 的技术特点,深度解析其背后的设计逻辑。

(1)完善的基座模型接入方法 AgentScope 支持多种大语言模型(LLM)作为 “智能体的大脑”,并采用“不同模型对应不同库 + 不同模型的格式化器”这种接入机制,从而实现消息与响应在不同模型之间的流程无缝转换。其 README 中提到:“Model-Agnostic: Programming once, run with all models.” 具体来说:开发者选择如 Qwen3、Claude 4.5、DeepSeek‑R1等主流模型后,只需配置相应的 ChatModel 类和对应 Formatter 类,即可让 AgentScope 在该模型之上快速运行。这样,模型切换的成本大幅降低,同时也为用户提供了高灵活性。 举例来说,若将模型替换为 Qwen3,则只需将 model = Qwen3ChatModel(...)formatter = Qwen3ChatFormatter(),而大部分业务逻辑(工具调用、对话管理、结构化输出等)无须改动。这种设计哲学使 AgentScope 成为一个“模型非绑定”的开发框架,有别于某些只能与特定模型绑定的工具库。这一点,对国内希望搭建“多个模型、多个场景、多智能体协作”系统的开发者而言,尤为关键。

image-20251110203351269

(2)支持多模态消息格式、完善记忆管理与跨 Agent 消息机制 AgentScope 对齐了 ADK 等前沿框架的思路,支持多模态(文本、图片、音频、视频)消息传递。根据其架构论文,AgentScope 实现了 “消息流 + 工具调用 + 多模态数据” 的统一机制,其中 Message 对象不仅包含 content 文本字段,还可包含 URL、metadata 等,用于引用外部多模态资源。

image-20251110203436616 在记忆管理方面,该框架同时支持“短期记忆(Short‐Term Memory)”和“长期记忆(Long-Term Memory)”两层结构,并兼容第三方记忆框架如 ReMe、mem0。其 GitHub README 明确指出:“Support agent-controlled long-term memory”。

image-20251110203517995 image-20251110203532267

​ 更进一步,在多智能体协作场景,AgentScope 提供统一的消息格式与 MsgHubpipeline 等机制,使得不同 Agent 之间的消息、工具调用结果、结构化输出可透明流转。以“九人狼人杀”示例为例,多名 Agent 轮流发言、投票、工具调用,全过程通过 AgentScope 管道化管理,这正体现了其“跨 Agent 消息管理”的能力。

(3)支持 ReAct 模式:工具并行/多步调用/自动调试/自定义 Agent ReAct(Reason + Act)是当前智能体开发的主流范式之一。AgentScope 在设计时充分拥抱这一范式,实现智能体能够:在一轮对话中自主决定是否调用工具、选择哪一个工具、是否并发调用多个工具、再基于工具结果进一步决策。其官方说明中指出 “Support parallel tool calls” 与 “Realtime steering and interruption” 等能力。

​ 举个典型场景:一个 Agent 在分析用户指令后,判断需要同时执行“网页搜索”与“数据库查询”,于是并行调用两个工具,待结果返回后再生成最终回复。与此同时,如发现当前流程偏差,该 Agent 也可通过 Hook 机制自动进入调试流程,修正思路并生成更精确输出。

image-20251110192334067

​ 此外,AgentScope 鼓励开发者自行定义 Agent 类型:不仅限于 ReActAgent 这一类,还支持继承扩展、插入自定义 Hook、控制生命周期。这使得无论你是构造简单对话机器人,还是复杂策略智能体,框架都能提供支撑。

(4)高性能 RAG 与多模态 RAG 支持

​ 对于需要外部知识支撑或多模态检索生成 (Retrieval-Augmented Generation, RAG) 的场景,AgentScope 提供完善的 API 支持。其 RAG 模块包括知识库构建(读取文档、切块、生成嵌入)、向量数据库接入(如 Qdrant)、多模态读取器(ImageReader、PDFReader 等),以及将其作为工具整合至 Agent 体系。

​ 开发者可以选择两种 RAG 集成方式:一是 Agentic 方式 — Agent 自主决定何时检索、检索什么;二是通用方式 — 在每次回复前统一检索再附加知识。这样设计既保障灵活性,也兼顾易用性。 值得一提的是,多模态 RAG 支持文本 + 图像 +其他形式输入,使 AgentScope 在“视觉-语言”融合任务中具有优势。这在国内多媒体智能体应用场景中尤具价值。

**(5)钩子函数机制与中间件支持 **

​ AgentScope 引入了丰富的中间件化机制,开发者可以在 Agent 执行流程的多个阶段(如 pre_reasoningpost_actingpre_reply)注册钩子函数,从而实现细粒度控制。例如:监控工具调用时长、捕捉异常结果、动态调整 prompt、日志追踪等。GitHub 文档中提及:“Support agent hooks”。

举例:在一个复杂 Agent 中,当工具返回结果但其语义置信度低时,可通过 `post_acting` 钩子自动触发“自我反省”子任务,要求 Agent 重写思路或再调用一次工具。如此,中间件的介入使智能体不仅仅自动运行,而且具备“自我校正”能力。
6073a4f2-3416-4aee-8917-b8c19e97898b

(6)可视化平台 AgentScope Studio 与 Agentic RL 支撑

​ 除了核心框架,AgentScope 还配备了一个前端平台 AgentScope Studio,用于实时对话展示、智能体追踪、工具调用可视化、日志与指标监控。据其网站介绍,该 Studio 支持消息流回放、结构化输出 查看、工具调用痕迹分析等。

ddff24be0cd65ca486fb621d24ca4181

​ 此外,在评测与强化学习(Reinforcement Learning, RL)方面,AgentScope 也有所布局:其 README 中提及“Agentic RL via integrating Trinity-RFT library”。这一功能允许智能体在模拟环境或多智能体对抗环境中,通过 RL 的方式优化其决策策略,实现“长期学习与优化”。例如,你可以构建多个 Agent 玩一局游戏(如狼人杀),然后利用 RL 回放其游戏轨迹、分析胜负、调整策略,从而逐代提升智能体表现。

image-20251110203840148

3. AgentScope和其他Agent开发框架综合对比

3.1 Agent 开发框架的整体格局

​ 自 2023 年至 2025 年,随着大模型的能力持续增强,智能体(Agent)框架从早期的单一任务执行器,逐步演化为多智能体协作、具备记忆、感知、推理、规划、执行、评估等完整能力的“操作系统级平台”。 目前主流的 Agent 开发框架大致可分为三类:

  1. 以工作流与工具链为核心的传统框架 —— 代表如 LangChain 0.x 系列HaystackFlowise。这些框架以模块化、可视化的方式搭建智能体流程,强调可复用性与稳定性,但智能性相对不足。
  2. 以 ReAct 范式为核心的新一代框架 —— 包括 AgentScopeOpenAI Agents SDKGoogle ADK (Agent Development Kit) 等。这类框架更强调大模型自身的推理能力,允许模型在执行过程中动态决策、调用工具、规划行动。
  3. 以 Graph 或 Agentic Runtime 为核心的图式框架 —— 代表如 LangChain 1.0 + LangGraphDeepAgents (来自 LangChain 官方 R&D)Parlant Runtime 等。这类框架引入状态机与图结构,专注于复杂多智能体控制、并发执行和条件跳转。

​ AgentScope 处于第二与第三类型之间的交汇点:既继承了 ReAct 范式的灵活性,又吸收了 LangGraph 式的图式控制思维,形成了兼具“模型智能”与“工程管控”的混合体系。

3.2 AgentScope vs LangChain 1.0

LangChain 1.0 的定位 是“通用 AI 工作流框架”,其重点在于提供一套统一抽象(如 Runnable、Tool、Memory、Retriever、Graph 等),使开发者能够组合组件搭建完整的 LLM 应用。 ​ 相比之下,AgentScope 的定位更加聚焦——它不是通用的 AI 编排框架,而是“专门用于构建 ReAct Agent 与 Multi-Agent 系统的核心引擎”。

对比维度LangChain 1.0AgentScope
核心范式图式 (Graph) 工作流 + Runnable 节点ReAct 智能体范式 + 管道式消息流
执行模式静态编排,依赖图结构控制节点执行动态决策,Agent 可在执行中主动规划与切换
模型适配性LangChain 官方以 OpenAI 生态为主支持 Qwen、DeepSeek、Gemini、Claude 等多源模型
消息结构Message 依然偏 text-only 或 metadata 轻量支持 content block 结构,可原生承载 text、image、audio、video 多模态内容
并发与协作LangGraph 支持并发节点执行,但配置复杂AgentScope 原生支持 Multi-Agent 并行协作与统一 MsgHub
可视化工具LangGraph Studio (需本地 Dev Server)AgentScope Studio (前后端一体,可追踪 Agent 内部消息流)
学习曲线概念多、接口分层复杂结构清晰,学习成本相对更低
适用场景企业级 RAG 系统、长流程 QA 与检索需要 Agent 决策、自主推理、多角色协作的任务,如 游戏、对话、策略执行

​ 从整体来看,LangChain 1.0 仍然是通用 LLM 应用的首选框架,尤其适合构建知识问答与检索增强系统。而 AgentScope 更适合以 “智能体决策与交互”为核心的项目,例如自动化客服、游戏 AI、企业 Agent 协同办公、智能助理等。

3.3 AgentScope vs OpenAI Agents SDK

​ OpenAI 在 2025 年正式推出 Agents SDK,其目标是将 ReAct Agent 机制标准化,并让开发者基于 OpenAI 生态快速构建 “带有工具、记忆、上下文”的 Agent”。

主要差异在于生态与开放性:

  • AgentScope 开源且生态中立:它既能对接 OpenAI 的 GPT-5 ,也能无缝调用 Qwen3、Gemini 2.5、DeepSeek-R1 等 API。
  • Agents SDK 生态锁定:其强项是与 OpenAI 自家 Responses API、File API、Vector Store 等组件紧密集成,但扩展到其他模型需额外封装。
  • 在多智能体协作方面,AgentScope 内置 MsgHub 和 pipeline 机制,可实现多 Agent 同步/异步协作,而 Agents SDK 更倾向于单 Agent + Tool 链路。
  • 在 RL (强化学习)与 评测支持上,AgentScope 具备 Agentic RL 功能,可让 Agent 在多局对战或任务中自我优化,而 OpenAI 生态目前尚未公开同类模块。

​ 因此,如果项目主要运行在 OpenAI 云端、模型固定为 GPT-5 系列、并依赖官方 API 体系,那么 Agents SDK 是效率最高的选择; 但若希望在本地或多模型环境中构建跨 Agent 协作、可视化与 RL 评测体系,则 AgentScope 无疑更具灵活性与控制力。

3.4 AgentScope vs Google ADK (Agent Development Kit)

Google ADK 是 Gemini 生态下的重要基础框架,定位为“多模态、可插拔、可编排的智能体开发套件”。

​ 两者在理念上有许多共通点:均支持多模态 message block、并行工具调用、长短期记忆与 hook 机制。但 ADK 更偏向 “服务化集成 + 低代码接口”,适合企业级应用,而 AgentScope 更强调“开发者可控 + 研究导向”。

对比维度Google ADKAgentScope
生态定位Gemini 生态核心组件中立开源框架,适配 Qwen / DeepSeek / Gemini / Claude 等
多模态能力原生支持文本、图像、音频、视频同样原生 content block 机制,可扩展自定义类型
执行方式API 服务化调用,自动规划任务流Python SDK 级别操作,允许开发者深度定制控制流
记忆系统长短期记忆统一管理(内建 Gemini Memory API)短期记忆 + 可接 mem0 / Re Me 等外部长期记忆
Agent 类型系统级 Agent(App、Service、Assistant)开发者自定义 Agent(ReActAgent、UserAgent 等)
可追踪性通过 Google AI Studio 可视化通过 AgentScope Studio 本地或私有部署追踪

​ 综上,如果团队主要在 Google Cloud 生态内部署, ADK 是天然选择;但若需要更多自定义、私有化部署、以及对模型与工具的精细控制, AgentScope 的开发灵活度更高。

3.5 AgentScope vs DeepAgents / Parlant Runtime

DeepAgents(LangChain 官方项目)Parlant Runtime(微软开源) 代表了另一种趋势:以 Agent 图与状态机为核心的多智能体运行时系统。 它们注重“可视化流程与节点控制”,为多 Agent 提供复杂条件分支、事件触发、并发执行等能力。

AgentScope 与其的差别在于:

  • DeepAgents / Parlant 更偏向编排层(orchestration layer),而 AgentScope 同时涵盖执行层(execution layer);
  • AgentScope 的设计更贴近 “模型直接驱动 Agent 行为”,而非单纯的流程调度。 换言之,AgentScope 将 “智能” 本身嵌入在 Agent 之中,而非在外层编排引擎中实现。 这使它特别适合需要动态决策、上下文强依赖的场景,如游戏 AI、对话 Agent 协同推理等。

3.6 典型场景选择建议

应用场景推荐框架说明
通用 RAG 系统 / 企业问答LangChain 1.0 + LangGraph成熟 Retriever + Vector API 体系,适合企业内部知识管理
单智能体 Tool Use 任务OpenAI Agents SDK工具集成便捷,适合固定模型环境
多智能体协作 / 游戏 / 对话体系统AgentScope原生 Multi-Agent 机制、MsgHub 支持
视觉 + 文本多模态 AgentGoogle ADK 或 AgentScope两者均具 content block 机制,后者可私有化
强化学习 Agent 实验与优化AgentScope内建 Agentic RL 接口,可回放并优化策略
企业级工作流 AI 编排DeepAgents 或 Parlant Runtime更适合流程复杂、需可视化监控的场景

二、AgentScope快速上手指南

1. AgentScope安装流程

image-20251110152355295

我们可以通过pip进行快速安装:

FENCE0

image-20251013163059797

安装完成后,打开Jupyter输入如下代码,即可查看是否安装成功以及对应的版本号:

FENCE1

image-20251110153024145

除此之外,作为最新一代的Agent开发框架,AgentScope还配置了一整套前端运行与运维监督框架,可以通过npm进行一键安装与调用:

FENCE2

image-20251013221150285

注,没有安装node.js的同学可以直接在官网下载软件包:https://nodejs.org/en

image-20251110172145204

也可以在网盘中进行下载和安装:

image-20251110172249640 a8a3a270d93e69abe955710b35c92383

然后输入如下命令即可运行:

FENCE3

image-20251013221229096

然后进入http://localhost:3000/ ,即可查看完整前端功能:

image-20251013221257980

同时,AgentScope Studio还自带了一个Friday的Agent,

image-20251110172425235

完成相关配置即可进行对话测试:

image-20251013221428193 image-20251013221534126 image-20251110172533330

注,本节公开课各项实验主要使用DashScope阿里百炼API,API获取地址:https://bailian.console.aliyun.com/

image-20251110172721994

获取后,建议将其设置为系统环境变量DASHSCOPE_API_KEY,方便后续进行调用:

image-20251110173015590

注:2-5部分在Jupyter课件中

image-20251110204138417 a8a3a270d93e69abe955710b35c92383

6. Agent Studio使用方法介绍

​ 在掌握了AgentScope基础API的使用方法之后,接下来让我们尝试将开发好的简易Agent使用AgentScope Studio进行调用和监控。

  • 创建.env文件
image-20251110195529533
  • 创建SimpleAgent.py核心代码文件

FENCE4

  • 完整项目源码领取
image-20251110195906242 a8a3a270d93e69abe955710b35c92383

然后输入即可开启运行(注意需要提前开启前端3000服务)

FENCE5

image-20251110194810818 image-20251110194830619

image-20251110194841491

  • 交互效果演示