🔥 一、背景:从 Deep Research 到 Super Agent Harness
DeerFlow(全称 Deep Exploration and Efficient Research Flow)是字节跳动开源的一款 Super Agent Harness,基于 LangGraph + LangChain 构建。最初它只是一个 Deep Research 框架,但社区迅速将它推向了更远的边界——数据流水线、演示文稿生成、Dashboard 搭建、自动化内容生产……开发者用它做的事情远远超出了"研究"范畴。
关键转折点: 字节跳动团队意识到 DeerFlow 不是一个"研究工具",而是一个真正能让 Agent "把事情做完" 的运行时基础设施。于是,2.0 版本被彻底重写,与 v1 没有共用一行代码。
核心数据:
🔥 2026年2月28日,DeerFlow 2.0 发布后当日登顶 GitHub Trending 第一名。
🚀 二、安装部署:两种方式,一键启动
前置要求
方式一:Docker(推荐)
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config # 生成配置文件
make docker-init # 拉取 sandbox 镜像
make docker-start # 启动服务访问 http://localhost:2026 即可使用。
方式二:本地开发
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config
make check # 检查依赖
make install # 安装前后端依赖
make dev # 启动开发模式配置模型
编辑 config.yaml,支持 OpenAI 兼容 API 的所有模型:
models:
name: gpt-4
use: langchain_openai:ChatOpenAI model: gpt-4 api_key: $OPENAI_API_KEY max_tokens: 4096 temperature: 0.7
推荐模型: 官方推荐使用 Doubao-Seed-2.0-Code、DeepSeek v3.2 和 Kimi 2.5
⚡ 三、核心功能特性详解
1️⃣ Skills 与 Tools —— 扩展能力的核心
Skills 是 DeerFlow 能做"几乎所有事情"的关键。它是一种结构化能力模块,本质上是一个 Markdown 文件,定义了工作流、最佳实践和参考资源。
内置 Skills 覆盖:
深度研究(Research)
报告生成(Report Generation)
演示文稿制作(Slide Creation)
网页生成(Web Page)
图像和视频生成(Image/Video Generation)
🔑 关键技术点: Skills 采用按需渐进加载,不会一次性塞满上下文。只有任务确实需要时才加载,对 token 敏感的模型非常友好。
自定义 Skill 结构:
/mnt/skills/public/
├── research/SKILL.md
├── report-generation/SKILL.md
├── slide-creation/SKILL.md
└── image-generation/SKILL.md
/mnt/skills/custom/
└── your-custom-skill/SKILL.md2️⃣ Claude Code 集成
通过 claude-to-deerflow skill,可以在 Claude Code 里直接与 DeerFlow 交互:
bash
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow支持的功能:
给 DeerFlow 发送消息并接收流式响应
选择执行模式:Flash(快速)/ Standard / Pro(规划模式)/ Ultra(Sub-Agent 模式)
检查健康状态、列出 Models/Skills/Agents
管理 Threads 和会话历史
上传文件做分析
3️⃣ Sub-Agents —— 多路并行的核心架构
复杂任务不可能一次完成,DeerFlow 的处理方式是先拆解,再并行执行。
Lead Agent 按需动态拉起 Sub-Agents,每个 Sub-Agent 有独立的上下文、工具和终止条件,并行运行,返回结构化结果,最后由 Lead Agent 汇总。
例如,一个研究任务可以拆成十几个 Sub-Agents,分别探索不同方向,最后合并成报告、网站或带视觉内容的演示文稿。
4️⃣ Sandbox 与文件系统
这是 DeerFlow 与普通聊天机器人最本质的区别。 每个任务运行在隔离的 Docker 容器中,拥有完整的文件系统:
/mnt/user-data/
├── uploads/ ← 用户文件
├── workspace/ ← Agent 工作目录
└── outputs/ ← 最终交付物✅ 可读写编辑文件 · 可执行 Bash 命令和代码 · 可查看图片 · 会话间完全隔离 · 可审计
5️⃣ 长期记忆
大多数 Agent 在对话结束后会忘掉一切,DeerFlow 不会。
跨 Session 使用时,DeerFlow 会逐步积累持久记忆:个人偏好、知识背景、工作习惯。用得越多,它越了解你的写作风格、技术栈和重复出现的工作流。记忆保存在本地,控制权始终在你手里。
6️⃣ 多 IM 渠道接入
DeerFlow 支持从 IM 应用直接接收任务,且都不需要公网 IP:
支持的命令交互:
7️⃣ 内嵌 Python Client
无需启动完整 HTTP 服务,DeerFlow 可以作为 Python 库直接使用:
from deerflow.client import DeerFlowClient
client = DeerFlowClient()
response = client.chat("分析这篇论文", thread_id="my-thread")
for event in client.stream("你好"):
if event.type == "messages-tuple" and event.data.get("type") == "ai":
print(event.data["content"])🔬 四、支持的大模型一览
DeerFlow 对模型没有强绑定,理论上所有 OpenAI 兼容 API 的 LLM 均可接入。
官方推荐模型
模型加分维度
配置灵活: 通过
config.yaml即可接入 OpenAI、OpenRouter、火山引擎等多种渠道。
🔥 五、亮点与独特优势
✨ 与竞品的核心差异
🏆 最亮眼的 5 大特性
Sub-Agent 并行编排:Lead Agent 动态拉起多个 Sub-Agent 并行工作,是目前开源 Agent 方案中极少数原生支持此架构的方案
隔离 Sandbox 执行:每个任务运行在独立 Docker 容器中,真正的"带电脑的 Agent"
5 大 IM 渠道直连:Telegram/Slack/飞书/企微/钉钉,无需公网 IP
持久记忆系统:跨 Session 积累用户画像,越用越懂你
内嵌 Python Client:无需 HTTP 服务即可作为库使用
⚠️ 六、局限性
已知问题
安全提醒
⚠️ DeerFlow 具备系统指令执行、资源操作、业务逻辑调用等高权限能力,默认设计为仅本机 127.0.0.1 回环访问。部署到公网时,必须配置 IP 白名单、前置身份验证和网络隔离措施。
🧭 七、同类竞品比较
开源 Agent 方案横向对比
DeerFlow 2.0 的独特定位: 它不是"One-Line 代理"也不是"纯编码工具",而是一个端到端的 Agent 运行时,更适合复杂、长周期、多步骤的任务场景。
📈 八、未来发展方向
可预见的演进路径
Sandbox 生态扩展:从 Docker 扩展到 K8s 原生支持,走向大规模部署
Skills 市场:社区共享 Skills 平台,类似 VSCode 扩展市场
多 Agent 协作升级:从 Lead → Sub 模式扩展到 Peer-to-Peer Agent 网络
WebUI 增强:桌面端应用(已有社区 Beta 版)和 IDE 插件
企业级安全加固:RBAC、审计日志、合规能力
火山引擎深度集成:作为字节云生态的核心 Agent 入口产品
社区生态
GitHub 70K+ Stars 且持续增长
已有第三方 Windows 原生适配版(52 Stars)
官方提供源码解析书籍(deerflow-book,555 Stars)
字节火山引擎 Coding Plan 官方合作支持
📌 总结
DeerFlow 2.0 代表了字节跳动在 AI Agent 基础设施领域的最高水平。它从一个 Deep Research 框架进化为一个完整的 Super Agent Harness,以 Sub-Agent 并行编排 + 隔离 Sandbox + 持久记忆 + 5 大 IM 渠道的组合,在开源 Agent 方案中形成了独特的竞争力。
对于需要处理复杂、长周期、多步骤任务的开发者来说,DeerFlow 是目前开源生态中最接近"AI 员工"形态的方案。它的局限性主要集中在资源消耗和安全配置上,但作为 MIT 开源项目,这些问题正在被社区快速解决。
🏆 一句话总结: 字节出品的 70K Star 级 Super Agent 运行时,Sub-Agent 并行 + Sandbox 隔离 + 飞书/钉钉直连,是当前开源 Agent 方案中最接近生产级"AI 员工"的存在。