Eine stilisierte Fünf aus Schmetterlingen – Visual zu Claude Fable 5

    Claude Fable 5 & Mythos 5: Wenn AI von Tasks zu Responsibilities wechselt

    9. Juni 20265 min Lesezeit
    Till Freitag

    TL;DR: „Anthropic hat Claude Fable 5 (allgemein verfügbar) und Mythos 5 (Project Glasswing) gelauncht – beides Mythos-Class-Modelle. Fable 5 ist SOTA auf nahezu allen Benchmarks, besonders bei langhorizontigen Agent-Tasks. Der eigentliche Paradigmenwechsel: AI bekommt nicht mehr einzelne Aufgaben, sondern dauerhafte Verantwortlichkeiten."

    — Till Freitag

    Was Anthropic heute gelauncht hat

    Am 9. Juni 2026 hat Anthropic Claude Fable 5 und Claude Mythos 5 angekündigt – zwei Konfigurationen desselben Mythos-Class-Modells.

    Modell Zugang Preis (In/Out pro 1M Token)
    Fable 5 Paid Plans, allgemein verfügbar $10 / $50
    Mythos 5 Project Glasswing (Cyberdefender, US-Government), Trusted-Access-Programm folgt $10 / $50

    Beide laufen auf demselben Underlying Model. Mythos 5 hat in bestimmten Bereichen weniger Safeguards – speziell für Cybersecurity-Defense-Workflows. Fable 5 routet bei sensiblen Topics auf Opus 4.8 als Fallback (trifft laut Anthropic in unter 5 % der Sessions zu).

    Preislich: weniger als die Hälfte von Claude Mythos Preview. Das ist der eigentlich aggressive Move.

    Die Zahlen (kurz)

    • SOTA auf nahezu allen getesteten Benchmarks – je länger und komplexer der Task, desto deutlicher der Vorsprung gegenüber Opus 4.8.
    • Stripe: Codebase-weite Migration in einer 50-Mio-Zeilen-Ruby-Codebase – ein Tag statt zwei Monate Team-Arbeit.
    • Cognition FrontierCode: Höchstwert unter allen Frontier-Modellen, auch bei "Medium Effort" (also tokenschonend).
    • Hebbia Finance Benchmark: Top-Score für Senior-Level-Reasoning bei Dokumenten, Charts, Problem Solving.
    • Vision: Schlägt Pokémon FireRed mit reinem Vision-Harness – ohne Karten, ohne Game-State-Helper.
    • Long-Context: Bleibt über Millionen Tokens fokussiert; persistent file-based memory verdreifacht die Performance gegenüber Opus 4.8 (gemessen an Slay the Spire).
    • Drug Design (Mythos 5): Interne Anthropic-Experten beschleunigten Aspekte des Drug-Design-Prozesses um ~10×. 9 von 14 Protein-Targets lieferten starke Drug-Kandidaten.
    • Genomics: Mythos 5 hat in einer Woche autonomer Arbeit ein ML-Modell trainiert, das ein in Science publiziertes Modell schlägt – bei 100× kleinerer Größe.

    Soweit die Pflichtkür. Spannender ist der Untertext.

    Der eigentliche Shift: Von Tasks zu Responsibilities

    Felix Rieseberg (Engineering Lead für Claude Code & Cowork) bringt es in einem LinkedIn-Post zum Launch auf den Punkt:

    "I no longer tell Claude to investigate a particular crash report. It runs in a loop, watching every crash report that comes in. Its job is no longer to help me fix a crash, it's to keep our apps from crashing."

    Das ist die dritte Ära, die laut Rieseberg "leise" beginnt:

    1. Era 1 – Answers: ChatGPT als bessere Suchmaschine, Code-Autocomplete.
    2. Era 2 – Tasks: Du gibst dem Modell ein konkretes Problem ("fix diesen Bug", "schreib dieses Dokument"). Mensch immer in der Schleife.
    3. Era 3 – Responsibilities: Du gibst dem Modell eine dauerhafte Verantwortung. Es entscheidet selbst, wann es aktiv wird, was es bearbeitet, wann es eskaliert.

    Dan Shipper – Gründer von Every und einer der profiliertesten Beobachter des AI-Produkt-Stacks – kommentierte den Launch ebenfalls aus der Perspektive eines Builders, der täglich mit diesen Tools arbeitet:

    Auch Dan Shipper kommentierte den Launch auf LinkedIn und betonte, dass Anthropic mit Fable 5 nicht nur ein schnelleres Modell liefert, sondern einen neuen Standard für Agentic AI setzt: Die Zeit zwischen "Idee" und "laufendem System" schrumpft für Productivity-Builder von Wochen auf Stunden.

    Das deckt sich exakt mit dem Bild, das wir vor zehn Wochen in From Chat to Workflow: Anthropics Operational AI gezeichnet haben – Dispatch, Computer Use, persistente Tasks. Fable 5 ist der Modell-Layer, der diese Architektur jetzt wirklich tragfähig macht.

    Warum das für Builder zählt

    Wenn AI nicht mehr "Aufgaben abarbeitet" sondern Zuständigkeiten besitzt, ändert sich der Produkt-Stack fundamental:

    Alt (Task-Modus) Neu (Responsibility-Modus)
    User klickt "Analyse starten" Agent läuft als Daemon, beobachtet Events
    Output landet in Chat-Fenster Output landet als PR, Ticket, Calendar-Event, Slack-Message
    Session-basiert (Kontext stirbt mit Tab) Persistent (file-based memory, Notes, Recall)
    Erfolg = "Antwort war hilfreich" Erfolg = "KPI hat sich verschoben" (Crashes ↓, Pipeline ↑)

    Das hat drei harte Konsequenzen für Produkte, die wir heute bauen:

    1. Observability wird Produkt-Layer. Wenn ein Agent dauerhaft läuft, brauchst du Audit-Logs, Replay, Cost-Caps – nicht erst ab Enterprise, sondern ab Tag 1.
    2. Permissions werden granular. "Claude darf Bug X fixen" ist nicht dasselbe wie "Claude ist verantwortlich für die Stabilität der App". Letzteres braucht klare Guardrails, Eskalationspfade und Rollback-Strategien.
    3. Der Tool-Layer schlägt den Model-Layer. Wer heute auf Cursor, Claude Code, Vibe oder ähnliche Agent-Frontends setzt, bekommt den Sprung von Fable 5 quasi geschenkt. Wer noch eigene Wrapper baut, muss in jeder neuen Generation den Integrations-Code anfassen (siehe unsere Analyse zum Agentic-Coding-Tool-Stack →).

    Was bedeutet "Mythos-Class"?

    Anthropic hat den Modellnamen-Stack still umgebaut. Bisher war "Opus" das Top-Tier. Mit Mythos Preview wurde ein neues Höhen-Tier eingeführt – jetzt veröffentlicht in zwei produktiven Varianten:

    • Fable 5 = Mythos-Class-Modell mit Safeguards für allgemeine Nutzung.
    • Mythos 5 = Mythos-Class-Modell mit gelockerten Safeguards für trusted Cyberdefender im Rahmen von Project Glasswing.
    • Opus 4.8 = Standard-Workhorse darunter, fängt sensitive Fable-5-Anfragen ab.

    Strategisch interessant: Anthropic spaltet das Tier nicht primär nach Power, sondern nach Safety-Posture und Zugangsmodell. Mythos ist für Defender und kritische Infrastruktur reserviert – ein Move, der das Argument der "Defender's Advantage" institutionalisiert.

    Was wir konkret tun

    Bei Till Freitag rollen wir Fable 5 ab heute in drei Kontexten aus:

    1. Claude Code als Standard-Engine für unsere internen Refactoring- und Migrations-Jobs. Stripe's Zahl (Monate → Tage) deckt sich grob mit dem, was wir bei größeren monday.com-Apps sehen.
    2. Long-running Agents auf Railway für CRM-Hygiene-Tasks (Lead-Deduplikation, Pipeline-Aufräumen, Activity-Summaries). Hier zählt die Long-Context-Verbesserung mehr als jeder Benchmark.
    3. Vision-First-Workflows für Screenshot-zu-Spec-Pipelines in unserer Vibe-Coding-Praxis – speziell für UI-Migrationen.

    Mythos 5 ist für uns aktuell nicht relevant – Project Glasswing ist auf Cyberdefense-Partner beschränkt. Für regulierte EU-Workloads bleibt unser bevorzugter Path weiter Mistral 3 / Medium 3.5.

    Was jetzt zu tun ist

    1. Wenn du Claude Code, Cursor oder Vibe nutzt: Update auf Fable 5 ist trivial – meist nur ein Model-Switch in den Settings. Lohnt sich besonders bei langen Tasks.
    2. Wenn du eigene Agents baust: Prüf, ob du den Sprung von "Task" auf "Responsibility" mitgehen willst. Das ist eine Architektur-Entscheidung, kein Prompt-Tuning.
    3. Wenn du in Pricing-Modellen denkst: $10 / $50 ist aggressiv. Wer aktuell auf Opus 4.5 / 4.8 läuft, sollte die Kosten neu rechnen – speziell bei agentischen Workloads mit hohem Output-Volumen.
    4. Wenn du in regulierten Branchen arbeitest: Warte auf das erweiterte Mythos-Trusted-Access-Programm – oder evaluiere parallel Mistral als EU-Alternative.

    Fazit

    Die SOTA-Zahlen werden in zwei Wochen relativiert sein – das ist 2026er-Realität. Was bleibt, ist der Architektur-Move: Anthropic baut den Modell- und Tool-Layer konsequent für dauerhafte Verantwortlichkeiten, nicht für einmalige Tasks.

    Wer 2027 ein AI-Produkt baut, das immer noch wie ein Chat-Fenster aussieht, wird das spüren. Wer jetzt anfängt, Workflows als Daemons statt als Prompts zu denken, bekommt einen mehrjährigen Vorsprung.

    Felix Rieseberg hat recht: Das war heute ein leiser Start einer dritten Ära.


    → Anthropics Operational AI: Von Chat zu Workflow → Mistral 3 & Vibe: Europas AI-Hoffnung zurück im Spiel → Railway + Claude Code: Deployment per Prompt → Unsere AI-Services bei Till Freitag

    TeilenLinkedInWhatsAppE-Mail

    Verwandte Artikel

    Claude Mythos & Project Glasswing: Wenn KI zu gut hackt, wird sie zur Waffe der Verteidiger
    11. April 20264 min

    Claude Mythos & Project Glasswing: Wenn KI zu gut hackt, wird sie zur Waffe der Verteidiger

    Anthropics neues Frontier-Modell Claude Mythos Preview ist so gut im Finden von Sicherheitslücken, dass es nicht öffentl…

    Weiterlesen
    OpenClaw Preisschock: So vermeidest du die $500-Rechnung
    5. April 20262 min

    OpenClaw Preisschock: So vermeidest du die $500-Rechnung

    Anthropic streicht die Third-Party-Tool-Abdeckung unter Claude-Abos. Wer OpenClaw ohne Vorbereitung betreibt, zahlt bald…

    Weiterlesen
    Von Chat zu Workflow: Wie Anthropic Claude zum digitalen Mitarbeiter macht
    30. März 20262 min

    Von Chat zu Workflow: Wie Anthropic Claude zum digitalen Mitarbeiter macht

    Dispatch, Computer Use, persistent Tasks – Anthropic schichtet Fähigkeiten in einer Reihenfolge, die kein Zufall ist. Ei…

    Weiterlesen
    Warum wir von ChatGPT auf Claude umgestiegen sind – und was wir dabei über LLMs gelernt haben
    20. Februar 20265 min

    Warum wir von ChatGPT auf Claude umgestiegen sind – und was wir dabei über LLMs gelernt haben

    Wir haben 18 Monate mit ChatGPT gearbeitet – und sind dann auf Claude umgestiegen. Hier ist der ehrliche Vergleich aller…

    Weiterlesen
    Visualisierung eines großen blassen Neural-Net-Spheres und eines kleineren, hellen Sphere mit Cyan/Gelb – die schrumpfende Frontier offener Modelle
    8. Juni 20265 min

    Nex-N2-Pro: Wie die Frontier der offenen Modelle in sechs Wochen um 75 % geschrumpft ist

    Vor sechs Wochen war DeepSeek-V4-Pro mit 1,6 Billionen Parametern das größte je veröffentlichte Open-Weight-Modell. Heut…

    Weiterlesen
    Warum 🦞 das Erkennungszeichen der Agentic-AI-Bewegung wurde
    19. Mai 20263 min

    Warum 🦞 das Erkennungszeichen der Agentic-AI-Bewegung wurde

    Wie ein Krustentier zum Stammes-Emoji der Agentic-AI-Szene wurde – von Anthropic-Memes bis zu Bio-Twitter-Profilen volle…

    Weiterlesen
    P9 AI Fluency Index: Wie Christoph Janz mit Claude ein Benchmark-Tool für AI-pilled Companies gebaut hat
    9. Mai 20264 min

    P9 AI Fluency Index: Wie Christoph Janz mit Claude ein Benchmark-Tool für AI-pilled Companies gebaut hat

    Point Nine Partner Christoph Janz hat mit Claude den P9 AI Fluency Index gebaut – ein Benchmark-Tool für Founders, das m…

    Weiterlesen
    Visualisierung von Kimi K2.6 Long-Horizon Agents: Halbmond als Moonshot-Symbol mit verteilten Sub-Agent-Knoten über einem KoordinationsrasterDeep Dive
    21. April 20268 min

    Kimi K2.6: Warum die spannendste KI-Optimierung 2026 nicht Intelligenz ist – sondern Dauer

    Moonshot AI hat gestern Kimi K2.6 open-sourced. 1 Billion Parameter, 300 Sub-Agents, 13 Stunden autonome Codeoptimierung…

    Weiterlesen
    Vergleich zwischen Claude Design und Lovable als KI-gestützte Builder
    18. April 20264 min

    Claude Design vs. Lovable – Mockup-Tool trifft App-Builder

    Anthropic hat Claude Design gelauncht – ein KI-Tool für Prototypen, Slides und Mockups. Wir vergleichen es direkt mit Lo…

    Weiterlesen