Abstrakte Illustration einer Hirschsilhouette, verbunden mit isolierten Sandbox-Containern über leuchtende Flow-Linien

DeerFlow 2.0: ByteDances 68k-Sterne Super-Agent-Harness, der fertige Artefakte liefert

18. Mai 20264 min Lesezeit

TL;DR: „DeerFlow 2.0 ist ByteDances 68k-Sterne Open-Source-Super-Agent-Harness: progressiv geladene Skills, sandboxed Sub-Agents, persistentes Gedächtnis, sechs IM-Kanäle. Prompt rein, fertiges Deck, Report oder Video raus."

— Till Freitag

Der Harness ist jetzt das Produkt, nicht das Modell

Zwei Jahre lang ging es um Modelle. Wer hat das größte Kontextfenster, wer führt im MMLU, wessen Reasoning-Loop ist am engsten. Diese Diskussion ist weitgehend vorbei. Die interessante Arbeit ist eine Schicht nach oben gewandert: der Harness.

Ein Harness macht aus einem Modell etwas Brauchbares. Skill-Loading, Sub-Agent-Orchestrierung, Sandbox-Isolation, Memory, Channel-Routing, Artefakt-Übergabe. Die langweilige Infrastruktur, die darüber entscheidet, ob du einen Chatbot oder einen Mitarbeiter bekommst.

DeerFlow 2.0 ist gerade die vollständigste Open-Source-Antwort auf dieses Problem. ByteDance hat es geshipt, 68k GitHub-Sterne, und die Architektur lohnt sich zu verstehen – auch wenn du es nie selbst betreibst.

Was im Karton drin ist

Built-in Skills, progressiv geladen

DeerFlow bringt Skills für Research, Report-Generation, Slide-Decks, Web-Seiten, Bild- und Video-Generierung mit. Keiner davon lädt eager. Der Harness zieht Skill-Bundles on demand – das hält das aktive Kontextfenster schlank, selbst wenn die Skill-Registry riesig wird.

Das ist dieselbe architektonische Wette, die Anthropic letztes Quartal mit Agent Skills gemacht hat: Skills als Dateisystem, nicht als System-Prompt. Das Modell sieht nur das, was es gerade braucht.

Sub-Agents in isolierten Sandboxes

Jeder Sub-Agent läuft in seiner eigenen Sandbox mit Dateisystem-Zugriff und Bash. Nicht "Function Calls, die JSON zurückgeben" – echte Prozesse mit echten File-Handles. Das macht aus "bau mir ein Slide-Deck" einen echten Workflow statt einer Demo.

Die Isolation ist das Sicherheitsmodell. Ein Research-Sub-Agent, der aus dem Ruder läuft, kann das Arbeitsverzeichnis des Slide-Gen-Sub-Agents nicht anfassen. Genau diesen Teil bekommen die meisten Eigenbau-Agent-Stacks falsch hin – sie teilen State, dann teilen sie Blast Radius.

Memory, der über Sessions hinweg bleibt

Sessions resetten nicht. State trägt sich fort. Du kannst DeerFlow am Montag eine Aufgabe geben, am Mittwoch reinschauen, und es weiß noch, worum es geht. Klingt offensichtlich, bis du es selbst auf einer stateless API gebaut hast.

Sechs Kanäle rein, Artefakte raus

Tasks kommen aus einer Web-UI, sechs IM-Kanälen inklusive Slack und Telegram, oder Claude Code via dem claude-to-deerflow-Skill. Der letzte Punkt ist verräterisch: DeerFlow geht davon aus, dass du ohnehin schon einen Agent betreibst (Claude Code) und die langlaufenden, artefakt-produzierenden Tasks an einen anderen Harness delegieren willst, der die bessere Infrastruktur dafür hat.

Zurück kommt ein fertiges Artefakt. Kein Transkript, kein Tool-Call-Log – ein Deck, ein Report, ein Video.

Warum die Architektur zählt

Die meisten Agent-Frameworks 2026 verwechseln immer noch Modell und Produkt. Sie shippen einen Wrapper um einen API-Call und nennen das einen Agent. DeerFlow zieht die Linien richtig:

Schicht	Aufgabe	Wo die meisten Stacks scheitern
Channels	Tasks von Menschen oder anderen Agents empfangen	Hardcoden eine UI
Router	Skill + Sub-Agent auswählen	Routen zu einem Mega-Prompt
Skills	Prozedurales Wissen + Skripte	Stopfen alles in den System-Prompt
Sandboxes	Isolierte Ausführung pro Sub-Agent	Teilen Dateisystem, teilen Fehlerbilder
Memory	State über Sessions hinweg	Behandeln jeden Turn als neu
Artefakte	Etwas Brauchbares zurückgeben	Liefern ein Chat-Transkript

Jede einzelne dieser Schichten baust du an einem Wochenende. Alle sechs so zu bauen, dass sie zusammenspielen, ist die Arbeit – und genau das bezahlen die 68k Sterne.

Was das für Teams bedeutet

Wenn du Production-Agents betreibst, lohnt sich DeerFlow zu lesen, auch wenn du es nicht deployst:

Skill-als-Dateisystem ist das richtige Pattern. Wenn dein Agent-System-Prompt länger als eine Seite ist, machst du es falsch.
Sandbox pro Sub-Agent ist nicht verhandelbar für alles, was Dateien oder Shell anfasst. Das "Always Allow"-Permission-Model mancher kommerzieller Produkte ist kein Sicherheitsmodell.
Channels sind eine Integrations-Oberfläche, keine UI-Entscheidung. Wenn dein Agent nur aus einem Frontend funktioniert, ist er nicht deployed – er ist demonstriert.
Memory ist ein Produkt-Feature. Stateless Agents sind Spielzeug.

Für unsere Kunden, die interne Agent-Plattformen bauen, ist das die Referenzarchitektur-Diskussion. Du musst DeerFlow nicht nutzen – aber wenn dein Design von diesen sechs Schichten abweicht, solltest du wissen, warum.

Das größere Muster

Da draußen gibt es irgendwo ein Social-Graph-basiertes Agent-Harness-Startup, das in den nächsten fünf Jahren auf 1 Billion Dollar geht. Die Kategorie formt sich gerade so, wie sich Mobile-OS 2008 und Cloud-Plattformen 2012 geformt haben: ein paar opinionierte Stacks, schnelle Divergenz, dann Konsolidierung auf zwei oder drei.

DeerFlow ist der Open-Source-Pol. Anthropics Agent Skills + Dispatch ist der vertikal integrierte kommerzielle Pol. Die Mitte – LangGraph, CrewAI, jedes "Agent Framework", das eine Series A raised – wird in den nächsten zwölf Monaten viel Druck spüren.

Wähl den Pol, mit dem du leben kannst. Die Mitte ist der gefährliche Ort.

→ Unser Vergleich: Claude Managed Agents, LangGraph und CrewAI → Desktop-Agenten-Showdown: Dispatch, Manus, Perplexity Computer, DIY → Agent-Sandboxing-Ansätze im Vergleich

TeilenLinkedIn WhatsApp E-Mail

Verwandte Artikel

Railway-Plattform verbunden mit Claude Code – Deployment per Agent Skill

1. Mai 20263 min

Railway + Claude Code: Deployment per Prompt – wie die Integration funktioniert

Was ist Railway – und warum ist die Plattform plötzlich der heimliche Favorit für AI-First-Teams? Ein Blick auf das Clau…

19. September 20254 min

Agent Skills werden Industrie-Standard: Was Teams jetzt wissen müssen

Agent Skills sind wiederverwendbare Fähigkeiten für KI-Agenten – und werden zum neuen Standard. Was sie von MCP untersch…

19. Mai 20264 min

Lovable Skills: Wiederholungen werden zu wiederverwendbaren Playbooks

Lovable hat Skills ausgerollt – das Anthropic-Format für wiederverwendbare Agent-Anweisungen. Was Skills sind, wie sie s…

Abstrakte Illustration von KI-vernetzten Enterprise-Systemen

9. April 20263 min

superglue.ai – Die KI-native Integrationsplattform, die Enterprise-Systeme endlich verbindet

superglue.ai ersetzt brüchige SQL-Skripte und Cron-Jobs durch KI-gesteuerte Enterprise-Integrationen. Open Source, Y Com…

Claude Managed Agents Architektur – Gehirn verbunden mit mehreren Händen für Tools und Sandboxes

8. April 20265 min

Claude Managed Agents: Anthropics Griff nach der Agent-Runtime

Anthropic launcht Managed Agents in der Public Beta – eine gehostete Runtime, die das 'Gehirn' von den 'Händen' entkoppe…

Gemma 4 KI-Modell läuft auf kompaktem Mini-PC – Frontier-Intelligenz wird lokal

6. April 20264 min

Gemma 4: Frontier-Intelligenz auf dem Laptop – der Hype ist real

Googles Gemma 4 liefert GPT-4-Niveau in 14 GB. 85 Tokens pro Sekunde auf Consumer-Hardware, 256K Kontext, Function Calli…

Fünf aufsteigende Ebenen von Agentic Coding Tools – von Terminal-Multiplexern bis zu autonomen Agent-Teams

28. März 20264 min

Herding Cats: Die Agentic Coding Tools Landschaft (März 2026)

Nicht Cursor. Nicht Windsurf. Eine parallele Tooling-Ebene legt sich um headless CLI-Agents – Terminals, Session Manager…

5. März 20263 min

Claude Code ist kein Dev-Tool mehr – es ist ein GTM-Layer

Mit Opus 4.6 hat sich Claude Code fundamental verändert: Vom Entwickler-Werkzeug zum autonomen Go-To-Market-Layer. Was w…

Vergleichstabelle der Vibe-Coding-Tools Cursor Lovable Kiro Claude Code und Trae

Deep Dive

20. Februar 202611 min

Vibe Coding Tools im Vergleich: Cursor vs. Lovable vs. Kiro vs. Claude Code vs. Trae (2026)

Welches Vibe-Coding-Tool ist das richtige für dich? Wir vergleichen 15+ Tools in 7 Kategorien – von AI-IDEs über App-Bui…