Contents

AI Agent 团队实际交付了什么:7 个用例、21 篇博客、5 个智能合约

我一直在构建自主 AI Agent 团队,它们接收一个方向指令,然后将产品交付到生产环境。不是演示,不是玩具示例。而是包含已部署合约、上线前端、已发布研究报告和双语博客系列的完整产品。

以下是不同团队配置的实际产出。

/images/ai-agent-teams-showcase.svg


用例 1:全栈产品开发

团队: 11 个 Agent(Team Lead、PM、Architect、Frontend Dev、Backend Dev、Smart Contract Dev、QA、DevOps、Mobile Dev、Marketing、Content Publisher)

输入: “使用 LayerZero V2 构建跨链 ERC20 代币桥”

产出:

  • 5 个智能合约部署在 4 个测试网(Sepolia、Arbitrum Sepolia、Base Sepolia、Optimism Sepolia)
  • React 前端上线:bridge-app-erc.pages.dev
  • 12 条跨链桥接路径,全部无需信任,支持多 DVN 验证
  • 开源仓库:github.com/gnuser/brg-bridge
  • 9 篇博客文章,涵盖架构、消息生命周期、DVN 安全、OFT 代币桥接、组合消息和开发者踩坑指南

工作原理: Team Lead 接收产品方向,派发 PM 做市场调研、Architect 做技术调研,然后编排 6 个阶段 — 从规格编写到部署。Agent 通过邮箱文件通信,各自拥有特定目录,Team Lead 通过审批关卡把控进度。

关键洞察: 最难的部分不是写代码,而是 LayerZero V2 测试网行为与文档不一致。Agent 团队发现 Type 3 options 在未配置 ULN 的测试网上不可用,LZ Scan 不索引小型项目,必须通过链上提取 OFTSent 事件中的 GUID 来验证交付。所有经验都被持久化到 Agent 记忆文件中,供后续使用。


用例 2:协议与市场研究

团队: 4 个 Agent(Lead Researcher、Protocol Analyst、Market Analyst、Content Writer)

输入: ./launcher.sh "OpenClaw" — 研究一个开源 AI Agent 框架

产出:

  • 协议分析报告:架构、消息流、Agent 生命周期
  • 市场分析报告:竞争格局、采用指标、定位
  • 综合研究简报及执行摘要
  • 双语博客(EN + CN)发布至 cryptocj.org

工作原理: Lead Researcher 确定研究主题后,并行派发 Protocol Analyst 和 Market Analyst。每个 Analyst 写入各自拥有的输出文件。Lead 交叉审核两份报告,综合形成简报,触发审批关卡。审批通过后,Content Writer 生成双语博客。

关键洞察: Protocol 和 Market 分析师并行运行大幅缩短了研究时间。交叉审核环节能捕获矛盾 — 例如市场分析师将采用率评为"早期阶段",但协议分析师发现了 161 个生产级 gateway 文件,表明成熟度超出预期。


用例 3:深度代码分析

团队: 5 个 Agent(Lead Researcher、Architecture Analyst、Quality Analyst、Security Analyst、Content Writer)

输入: ./launcher.sh "openclaw/openclaw" — 深度分析一个 GitHub 仓库

产出:

  • 架构分析:模块图、设计模式、依赖分析、构建系统、API 表面
  • 质量分析:测试覆盖率、错误处理、代码异味、文档质量
  • 安全分析:漏洞扫描、认证模式、加密使用、供应链审查
  • 综合简报,按严重程度分级
  • 12 篇博客文章(2 个系列 × 3 部分 × 中英文)发布至 cryptocj.org
  • 2 个 SVG 架构图

工作原理: Stage 0 通过 gh repo clone 克隆仓库(自动处理认证)。Stage 1 并行派发 3 个分析师 — Architecture、Quality 和 Security — 每个都使用 ReadGlobGrep 阅读实际代码,运行 cloccargo audit/npm audit,检查 git 历史。Stage 2 综合。Stage 3 发布。

关键洞察: Security Analyst 发现 OpenClaw 实现了两阶段符号链接检测来防止 Docker 沙箱逃逸 — 这是大多数沙箱都跳过的。Architecture Analyst 映射了 8 层路由引擎。Quality Analyst 发现了 13 步 hook 管道。这些发现都无法通过表面分析获得。你需要真正阅读每个文件的 Agent。


用例 4:带架构图的技术研究

团队: ai-team 以 --research 模式运行(PM + Architect + Team Lead)

输入: ./launcher.sh --research "LayerZero V2"

产出:

  • 3 份研究报告(技术研究、市场研究、综合简报)
  • 6 个 SVG 架构图,覆盖整个协议
  • 7 篇博客文章(6 部分深度系列 + 中英文总结文章)

工作原理: --research 标志仅运行 Stage 0 — PM 做市场调研,Architect 做技术调研。Team Lead 综合简报,获得审批后,Content Publisher 编写博客系列。每个部分都有独立的 SVG 架构图。

关键洞察: 6 个 SVG 架构图是最有价值的产出。它们成为后续桥接开发的可复用参考。先研究后开发是一个强大的模式 — Agent 在编写第一行合约代码之前就发现了 LayerZero 的各种陷阱。


用例 5:Agent 团队脚手架

工具: agent-team CLI,仓库:github.com/gnuser/agent-team

输入: agent-team create my-project --preset fullstack-web3

产出: 一个完整的 Agent 团队项目,包含:

  • Agent 定义(.claude/agents/*.md
  • 角色专属技能(.claude/skills/roles/*.md
  • 通用技能(阶段感知、交接协议、团队通信)
  • 带 tmux 集成的启动脚本
  • 线程日志基础设施
  • 记忆系统(global.md + 按角色的记忆文件)

可用预设: fullstack-web3fullstack-webfullstack-noderesearchcode-researchmobileminimal

关键洞察: 本文描述的每个团队都是从模板生成的。脚手架工具捕获了有效的模式 — 阶段关卡、文件所有权、邮箱通信、线程日志 — 让新团队从经过实战检验的基础设施开始。


用例 6:核心流程追踪

团队: 4 个并行研究 Agent + Content Writer(临时组建)

输入: “深度分析 OpenClaw 的核心流程”

产出:

  • 3 部分"核心流程"博客系列(中英文 = 6 篇文章)
  • 逐函数的完整消息路径分析
  • SVG 图:gateway → 路由 → agent 循环 → 工具 → 记忆 → hooks

追踪的内容:

  1. WebSocket 握手 → chat.senddispatchInboundMessage()(Gateway)
  2. 8 层路由 → MsgContext 规范化 → 双重循环状态机(Agent 运行时)
  3. Docker 沙箱执行 → SSRF 防护 → 混合记忆搜索 → 13 步 hook 管道(工具与记忆)

关键洞察: 四个研究 Agent 并行运行,各自追踪不同子系统。Gateway Agent、路由 Agent、Agent 运行时 Agent、工具/记忆 Agent 同时阅读实际源代码。结果交叉引用后构建出连贯的端到端追踪 — 从 WhatsApp webhook 到 WebSocket 广播。


用例 7:开源仓库

产出: github.com/gnuser/brg-bridge

桥接项目从 ai-team 工作区提取为独立的开源仓库,附带架构图和清晰的文档。这证明了 Agent 构建的代码质量足以开源。


数据一览

指标 数量
已发布博客文章 21
SVG 架构图 19
研究报告 10
已部署智能合约 5
上线前端应用 1
Agent 定义数量 29
Agent 团队配置 4
博客语言 2(中/英)
部署测试网 4
开源仓库 2

为什么能行

阶段关卡。 每个团队按编号阶段推进,设有审批关卡。没有 Agent 可以跳过阶段。这防止了"AI 失控"的故障模式。

文件所有权。 每个 Agent 拥有特定的文件和目录。跨边界编辑需要显式协调。这防止了合并冲突,确保了责任明确。

并行执行。 研究 Agent、分析师和开发者在 tmux 窗格中同时运行。典型的研究运行并行派发 2-3 个 Agent,显著缩短实际耗时。

记忆持久化。 经验教训被写入 .claude/memory/ 文件。当 Agent 发现 LayerZero Type 3 options 在测试网不可用时,这个知识会跨会话保留。

线程日志。 每次 Agent 交互都以 JSONL 格式记录。出问题时,可以精确追踪发生了什么、每个 Agent 做了什么决定、以及为什么。


所有团队基于 Claude Code 和 agent-team 脚手架工具构建。源码:github.com/gnuser/agent-team。博客:cryptocj.org