返回列表
🧠 阿头学 · 💬 讨论题

DeepSwarm 2.0 并不是通用编排神器,而是一个偏 DeepSeek 生态的批处理并发脚手架

DeepSwarm 抓住了“高智力规划 + 低成本执行”的正确工程方向,但它把针对特定 API 限流环境的经验值包装成“任务无关、自动优化”的通用能力,这个宣传明显过头。
打开原文 ↗

2026-05-04 原文链接 ↗
阅读简报
双语对照
完整翻译
原文
讨论归档

核心观点

  • 分层委派思路成立 用更贵的 Pro 模型做少量规划、用更便宜的 Flash 模型做大量执行,这种“脑手分离”在大规模批处理里通常就是更优解,60%-70% 的降本幅度未必能普适复现,但方向本身没有问题。
  • 真正价值在并发工程,不在模型新意 这个仓库的核心不是提升单次任务质量,而是把批量 API 调用做成可并行、可控节奏、尽量不触发限流的生产流水线,这对真实落地比“提示词技巧”更有价值。
  • “任务无关”说法站不住脚 README 只展示了 generation、translation、summarization、classification 等典型任务,却直接上升到“任何批处理任务”,这明显是过度外推,因为不同任务的时延分布、失败模式、幂等要求根本不一样。
  • 自动优化论证过弱 号称通过“一次校准调用”就能确定最优 workers 和 stagger,这在统计上很脆弱;API 延迟和限流状态是波动的,单次样本几乎不可能代表后续几千次调用的真实运行环境。
  • 高成功率数据更像营销口径而非严格结论 99.95% 成功率、不同时长下的最优并发表、以及“8 workers + 5s stagger = 神奇公式”都缺少实验方法、测试条件和成功定义,如果成功只是“请求没报错”而不是“输出质量合格”,那这个数字就被夸大了。

跟我们的关联

  • 对 ATou 意味着什么、下一步怎么用 这说明 AI 产品的护城河越来越不在单模型能力,而在调度层与成本控制;下一步可以把“分层委派 + 并发节奏控制”当成设计原则,用在内容生产、批量摘要、批量分类等明确可拆分任务上。
  • 对 Neta 意味着什么、下一步怎么用 这给了一个很实用的系统化抽象:先区分“规划步骤”和“执行步骤”,再决定哪些调用值得用强模型;下一步可以把它沉淀为一套任务分层框架,而不是照搬 DeepSwarm 的参数表。
  • 对 Uota 意味着什么、下一步怎么用 这类项目提醒我们要警惕“工程经验被包装成普适规律”;下一步讨论时要追问成功率定义、重试次数、P95 延迟、供应商依赖,而不是只看 README 上的漂亮数字。
  • 对通用团队意味着什么、下一步怎么用 如果团队已经有大量重复 API 调用需求,这类脚手架值得参考,但不能直接当成生产真理;下一步应先做自己的基准测试,再建立按任务长度、失败率、配额等级分层的并发策略。

讨论引子

1. “一次校准调用”到底能不能支撑后续大规模并发配置,还是至少要做滑动窗口动态调参才靠谱? 2. 在 AI 基础设施里,真正可投资的护城河是“模型能力”还是“编排稳定性 + 成本控制”? 3. 如果把 DeepSeek 换成 OpenAI、Anthropic 或不同等级账户,这套“神奇公式”还剩多少可迁移性?

amanning3390/deepswarm

分支标签

文件夹和文件

| --- | --- | --- | --- | | ## 最新提交 ## 历史记录 4 次提交 4 次提交 | | references | references | | | | scripts | scripts | | | | templates | templates | | | | PLAN.md | PLAN.md | | | | README.md | README.md | | | | SKILL.md | SKILL.md | | | | architecture.html | architecture.html | | | | task.yaml | task.yaml | | |

仓库文件导航

DeepSwarm 2.0:任务无关的并行工作器编排

任何批处理任务启动 N 个并行 API 工作器。自动优化工作器数量与错峰间隔。分层模型委派:编排器负责规划(V4 Pro)→ 工作器负责执行(V4 Flash)。API 成功率 99.95%。

安装

undefinedshell hermes skills tap add amanning3390/deepswarm undefined

快速开始

undefinedshell

1. Define your task

cp task.yaml my_task.yaml

Edit: prompt_template, worker_model, max_tokens

2. Generate seeds

python3 scripts/seed.py --count 1000 --template "Generate {{seed}}" > seeds.jsonl

3. Launch (auto-optimizes everything)

export DEEPSEEK_API_KEY=sk-... python3 scripts/swarm.py --task my_task.yaml --total 1000 undefined

分层委派

undefinedyaml orchestrator_model: deepseek-v4-pro # Plans (few calls, frontier quality) worker_model: deepseek-v4-flash # Executes (many calls, cheaper) undefined

V4 Pro 的每 token 成本约为 V4 Flash 的 3 倍。对于需要数千次调用的批处理任务,分层委派可节省 60% 到 70% 的成本。

自动优化

调用时长 工作器 错峰间隔 成功率 吞吐量
<10s 16 1s 99.9% 约 5,760/小时
10-30s 12 2s 99.9% 约 1,440/小时
30-60s 8 5s 99.95% 约 440/小时
60-90s 6 10s 99.9% 约 240/小时

task.yaml 中省略 workersstagger,DeepSwarm 会运行一次校准调用,并选出最优值。

任务类型

内置类型:generationtranslationsummarizationclassificationcustom

对于多轮任务(工具调用、对话循环):

undefinedyaml multi_turn: true max_turns: 20 undefined

文件

deepswarm/
├── SKILL.md              # Hermes skill definition
├── README.md
├── task.yaml             # Sample task config
├── architecture.html     # Pipeline diagram
├── scripts/
│   ├── swarm.py          # Orchestrator (auto-optimize + launch)
│   └── worker.py         # Task-agnostic batch processor
├── templates/
│   └── prompts.py        # v2 prompt templates
└── references/
    ├── api-rate-limits.md
    └── generation-patterns.md

来源

基于 DeepSeek Hermes Reasoning Traces 项目构建:

  • 19,331 条轨迹 · 192K 次工具调用
  • 96 个工作器 · 31K 次 API 调用
  • 99.95% 成功率
  • 8 个工作器 + 5 秒错峰间隔 = 神奇公式

关于

未提供描述、网站或主题。

资源

Readme

哎呀!

加载时发生错误。请重新加载此页面

活动

Star

42 个 Star

关注者

0 人关注

Fork

3 个 Fork

举报仓库

发布版本

尚未发布任何版本

软件包 0

哎呀!

加载时发生错误。请重新加载此页面

贡献者

哎呀!

加载时发生错误。请重新加载此页面

语言

页脚

© 2026 GitHub,Inc.

页脚导航

你目前无法执行该操作。

DeepSwarm 2.0 — Task-Agnostic Parallel Worker Orchestration

amanning3390/deepswarm

Spawn N parallel API workers for any batch task. Auto-optimizes worker count + stagger. Tiered model delegation: orchestrator plans (V4 Pro) → workers execute (V4 Flash). 99.95% API success rate.

Install

文件夹和文件

| --- | --- | --- | --- | | ## 最新提交 ## 历史记录 4 次提交 4 次提交 | | references | references | | | | scripts | scripts | | | | templates | templates | | | | PLAN.md | PLAN.md | | | | README.md | README.md | | | | SKILL.md | SKILL.md | | | | architecture.html | architecture.html | | | | task.yaml | task.yaml | | |

undefinedshell hermes skills tap add amanning3390/deepswarm undefined

仓库文件导航

Quick Start

DeepSwarm 2.0:任务无关的并行工作器编排

undefinedshell

任何批处理任务启动 N 个并行 API 工作器。自动优化工作器数量与错峰间隔。分层模型委派:编排器负责规划(V4 Pro)→ 工作器负责执行(V4 Flash)。API 成功率 99.95%。

1. Define your task

安装

cp task.yaml my_task.yaml

Edit: prompt_template, worker_model, max_tokens

undefinedshell hermes skills tap add amanning3390/deepswarm undefined

2. Generate seeds

快速开始

python3 scripts/seed.py --count 1000 --template "Generate {{seed}}" > seeds.jsonl

3. Launch (auto-optimizes everything)

undefinedshell

export DEEPSEEK_API_KEY=sk-... python3 scripts/swarm.py --task my_task.yaml --total 1000 undefined

1. Define your task

Tiered Delegation

cp task.yaml my_task.yaml

Edit: prompt_template, worker_model, max_tokens

undefinedyaml orchestrator_model: deepseek-v4-pro # Plans (few calls, frontier quality) worker_model: deepseek-v4-flash # Executes (many calls, cheaper) undefined

2. Generate seeds

V4 Pro costs ~3× V4 Flash per token. For batch tasks with thousands of calls, tiered delegation saves 60-70%.

python3 scripts/seed.py --count 1000 --template "Generate {{seed}}" > seeds.jsonl

Auto-Optimization

3. Launch (auto-optimizes everything)

export DEEPSEEK_API_KEY=sk-... python3 scripts/swarm.py --task my_task.yaml --total 1000 undefined

Call Duration Workers Stagger Success Throughput
<10s 16 1s 99.9% ~5,760/hr
10-30s 12 2s 99.9% ~1,440/hr
30-60s 8 5s 99.95% ~440/hr
60-90s 6 10s 99.9% ~240/hr

分层委派

Omit workers and stagger in task.yaml — DeepSwarm runs a calibration call and picks optimal values.

Task Types

undefinedyaml orchestrator_model: deepseek-v4-pro # Plans (few calls, frontier quality) worker_model: deepseek-v4-flash # Executes (many calls, cheaper) undefined

V4 Pro 的每 token 成本约为 V4 Flash 的 3 倍。对于需要数千次调用的批处理任务,分层委派可节省 60% 到 70% 的成本。

Built-in: generation, translation, summarization, classification, custom

自动优化

For multi-turn tasks (tool calling, conversation loops):

undefinedyaml multi_turn: true max_turns: 20 undefined

调用时长 工作器 错峰间隔 成功率 吞吐量
<10s 16 1s 99.9% 约 5,760/小时
10-30s 12 2s 99.9% 约 1,440/小时
30-60s 8 5s 99.95% 约 440/小时
60-90s 6 10s 99.9% 约 240/小时

Files

task.yaml 中省略 workersstagger,DeepSwarm 会运行一次校准调用,并选出最优值。

任务类型

deepswarm/
├── SKILL.md              # Hermes skill definition
├── README.md
├── task.yaml             # Sample task config
├── architecture.html     # Pipeline diagram
├── scripts/
│   ├── swarm.py          # Orchestrator (auto-optimize + launch)
│   └── worker.py         # Task-agnostic batch processor
├── templates/
│   └── prompts.py        # v2 prompt templates
└── references/
    ├── api-rate-limits.md
    └── generation-patterns.md

Provenance

内置类型:generationtranslationsummarizationclassificationcustom

对于多轮任务(工具调用、对话循环):

Built from the DeepSeek Hermes Reasoning Traces project:

undefinedyaml multi_turn: true max_turns: 20 undefined

  • 19,331 traces · 192K tool calls
  • 96 workers · 31K API calls
  • 99.95% success rate
  • 8 workers + 5s stagger = the magic formula

文件

About

No description, website, or topics provided.

deepswarm/
├── SKILL.md              # Hermes skill definition
├── README.md
├── task.yaml             # Sample task config
├── architecture.html     # Pipeline diagram
├── scripts/
│   ├── swarm.py          # Orchestrator (auto-optimize + launch)
│   └── worker.py         # Task-agnostic batch processor
├── templates/
│   └── prompts.py        # v2 prompt templates
└── references/
    ├── api-rate-limits.md
    └── generation-patterns.md

Resources

来源

Uh oh!

基于 DeepSeek Hermes Reasoning Traces 项目构建:

There was an error while loading. Please reload this page.

  • 19,331 条轨迹 · 192K 次工具调用
  • 96 个工作器 · 31K 次 API 调用
  • 99.95% 成功率
  • 8 个工作器 + 5 秒错峰间隔 = 神奇公式

关于

Stars

未提供描述、网站或主题。

资源

Watchers

哎呀!

Forks

加载时发生错误。请重新加载此页面

No releases published

关注者

Uh oh!

Fork

There was an error while loading. Please reload this page.

Uh oh!

尚未发布任何版本

There was an error while loading. Please reload this page.

Languages

哎呀!

Footer

© 2026 GitHub,Inc.

  • *

Footer navigation

哎呀!

加载时发生错误。请重新加载此页面

You can’t perform that action at this time.

语言

页脚

© 2026 GitHub,Inc.

页脚导航

你目前无法执行该操作。

BranchesTags

Folders and files

Name Name Last commit message Last commit date
## Latest commit ## History 4 Commits 4 Commits
references references
scripts scripts
templates templates
PLAN.md PLAN.md
README.md README.md
SKILL.md SKILL.md
architecture.html architecture.html
task.yaml task.yaml

Repository files navigation

DeepSwarm 2.0 — Task-Agnostic Parallel Worker Orchestration

Spawn N parallel API workers for any batch task. Auto-optimizes worker count + stagger. Tiered model delegation: orchestrator plans (V4 Pro) → workers execute (V4 Flash). 99.95% API success rate.

Install

undefinedshell hermes skills tap add amanning3390/deepswarm undefined

Quick Start

undefinedshell

1. Define your task

cp task.yaml my_task.yaml

Edit: prompt_template, worker_model, max_tokens

2. Generate seeds

python3 scripts/seed.py --count 1000 --template "Generate {{seed}}" > seeds.jsonl

3. Launch (auto-optimizes everything)

export DEEPSEEK_API_KEY=sk-... python3 scripts/swarm.py --task my_task.yaml --total 1000 undefined

Tiered Delegation

undefinedyaml orchestrator_model: deepseek-v4-pro # Plans (few calls, frontier quality) worker_model: deepseek-v4-flash # Executes (many calls, cheaper) undefined

V4 Pro costs ~3× V4 Flash per token. For batch tasks with thousands of calls, tiered delegation saves 60-70%.

Auto-Optimization

Call Duration Workers Stagger Success Throughput
<10s 16 1s 99.9% ~5,760/hr
10-30s 12 2s 99.9% ~1,440/hr
30-60s 8 5s 99.95% ~440/hr
60-90s 6 10s 99.9% ~240/hr

Omit workers and stagger in task.yaml — DeepSwarm runs a calibration call and picks optimal values.

Task Types

Built-in: generation, translation, summarization, classification, custom

For multi-turn tasks (tool calling, conversation loops):

undefinedyaml multi_turn: true max_turns: 20 undefined

Files

deepswarm/
├── SKILL.md              # Hermes skill definition
├── README.md
├── task.yaml             # Sample task config
├── architecture.html     # Pipeline diagram
├── scripts/
│   ├── swarm.py          # Orchestrator (auto-optimize + launch)
│   └── worker.py         # Task-agnostic batch processor
├── templates/
│   └── prompts.py        # v2 prompt templates
└── references/
    ├── api-rate-limits.md
    └── generation-patterns.md

Provenance

Built from the DeepSeek Hermes Reasoning Traces project:

  • 19,331 traces · 192K tool calls
  • 96 workers · 31K API calls
  • 99.95% success rate
  • 8 workers + 5s stagger = the magic formula

About

No description, website, or topics provided.

Resources

Readme

Uh oh!

There was an error while loading. Please reload this page.

Activity

Stars

42 stars

Watchers

0 watching

Forks

3 forks

Report repository

Releases

No releases published

Packages 0

Uh oh!

There was an error while loading. Please reload this page.

Contributors

Uh oh!

There was an error while loading. Please reload this page.

Languages

Footer

© 2026 GitHub,Inc.

Footer navigation

You can’t perform that action at this time.

📋 讨论归档

讨论进行中…