Drei Isolationsebenen für KI-Agenten: Container, WASM und Kernel

Agent Sandboxing: Container vs. WASM vs. Kernel – drei Wege, Agenten einzusperren

17. März 20265 min Lesezeit

TL;DR: „Container sind bewährt, aber schwer. WASM ist leicht, aber jung. Kernel-Level ist maximal sicher, aber komplex. Es gibt keinen Gewinner – nur Trade-offs."

— Till Freitag

In 30 Sekunden

KI-Agenten führen Code aus, rufen APIs auf und interagieren mit Dateisystemen. Ohne Isolation ist das ein Sicherheitsrisiko. Aktuell konkurrieren drei Ansätze: Container (NemoClaw), WASM Sandboxes (IronClaw) und Kernel-Level Isolation (nono). Jeder löst das Problem anders – mit unterschiedlichen Trade-offs bei Performance, Sicherheit und Komplexität.

Warum Agenten Sandboxing brauchen

Ein klassischer API-Call ist deterministisch: Input rein, Output raus. Ein Agent ist anders. Er entscheidet selbst, welche Tools er aufruft, in welcher Reihenfolge, und mit welchen Parametern. Das macht ihn mächtig – und gefährlich.

Ohne Sandboxing kann ein Agent:

Dateisysteme lesen/schreiben, die er nicht kennen sollte
Netzwerkzugriffe auf interne Services machen
Credentials aus Umgebungsvariablen lesen
Seiteneffekte auslösen, die nicht rückgängig zu machen sind

Die Frage ist nicht ob Isolation nötig ist, sondern welche Art von Isolation zum Use Case passt.

Die drei Ansätze im Überblick

	Container	WASM Sandbox	Kernel-Level
Projekt	NemoClaw	IronClaw	nono
Isolation	Prozess + Namespace	Linearer Speicher	Syscall-Filter
Startup	~100–500ms	~1–5ms	~10–50ms
Overhead	Mittel–Hoch	Minimal	Niedrig
Maturität	Produktionsreif	Early Stage	Experimentell
Skalierung	Tausende möglich, aber teuer	Zehntausende leichtgewichtig	Tausende mit geringem Overhead

Container: Der bewährte Weg (NemoClaw)

NemoClaw setzt auf Container – den gleichen Ansatz, den die Industrie seit einem Jahrzehnt für Microservices nutzt. Jeder Tool-Call eines Agenten läuft in einem eigenen Container mit definierten Ressourcen-Limits.

Stärken

Bewährt: Docker, OCI-Standards, breites Ökosystem
Vollständige Isolation: Eigenes Dateisystem, Netzwerk, Prozessraum
Tooling: Monitoring, Logging, Orchestrierung sind gelöste Probleme
GPU-Passthrough: Relevant für lokale Inferenz (Nemotron-Modelle)

Schwächen

Startup-Latenz: 100–500ms pro Container – bei tausenden parallelen Tool-Calls summiert sich das
Ressourcen-Overhead: Jeder Container braucht eigene Kernel-Namespaces, cgroups, Dateisystem-Layer
Skalierungsprobleme: Tausende kurzlebige Container pro Sekunde sind ein Orchestrierungs-Albtraum
Overkill für einfache Tools: Ein JSON-Parser braucht keinen eigenen Container

Wann Container sinnvoll sind

Container passen, wenn Tool-Calls komplex, langlebig und ressourcenintensiv sind. Beispiel: Ein Agent, der lokale Nemotron-Inferenz mit GPU-Zugriff braucht und dabei sensible Daten verarbeitet. Der Privacy Router von NemoClaw nutzt Container genau dafür.

WASM Sandboxes: Der leichtgewichtige Weg (IronClaw)

IronClaw verfolgt einen anderen Ansatz: Agent-Tools laufen als WebAssembly-Module in einer Sandbox. Keine Container, kein Kernel-Overhead – nur linearer Speicher mit definierten Grenzen.

Stärken

Startup in Mikrosekunden: WASM-Module starten in 1–5ms – Größenordnungen schneller als Container
Minimaler Overhead: Kein OS, kein Dateisystem, kein Netzwerk-Stack
Determinismus: WASM-Ausführung ist deterministisch – reproduzierbare Tool-Calls
Capability-basierte Security: Tools bekommen nur die Fähigkeiten, die explizit gewährt werden (WASI)

Schwächen

Eingeschränktes Ökosystem: Nicht jede Library ist als WASM verfügbar
Kein GPU-Zugriff: Lokale Inferenz in WASM ist (noch) nicht praktikabel
Speicherlimits: WASM-Module arbeiten mit linearem Speicher – komplexe Datenstrukturen werden schnell teuer
Netzwerkzugriff: Muss über Host-Funktionen proxied werden – zusätzliche Komplexität

Wann WASM sinnvoll ist

WASM-Sandboxes passen, wenn Tool-Calls leichtgewichtig, kurzlebig und hochfrequent sind. Beispiel: Ein Agent, der pro Sekunde hunderte kleine Transformationen ausführt – JSON parsen, Strings formatieren, Berechnungen durchführen. Hier wäre ein Container pro Call absurd.

Kernel-Level Isolation: Der radikale Weg (nono)

nono geht den härtesten Weg: Isolation auf Kernel-Ebene durch Syscall-Filtering (ähnlich seccomp-bpf), Namespace-Isolation und Capability-Dropping. Kein Container-Runtime, kein WASM-Runtime – direkte OS-Level-Kontrolle.

Stärken

Maximale Isolation: Direkter Syscall-Filter – kein Umweg über Container- oder WASM-Runtime
Niedriger Overhead: Näher am Bare-Metal als Container, weniger Abstraktion als WASM
Feine Granularität: Kontrolle auf Syscall-Ebene – welche Systemaufrufe darf ein Tool machen?
Kein Runtime-Lock-in: Funktioniert mit jeder Sprache, jedem Binary

Schwächen

Hohe Komplexität: Syscall-Policies manuell zu pflegen ist fehleranfällig
Linux-only: Kernel-Features wie seccomp, namespaces, cgroups sind Linux-spezifisch
Schwer zu debuggen: Wenn ein Syscall geblockt wird, ist die Fehlersuche aufwändig
Experimentell: nono ist kein produktionsreifes Projekt – es zeigt, was möglich ist

Wann Kernel-Level sinnvoll ist

Kernel-Level-Isolation passt für hochsensitive Umgebungen, in denen weder Container- noch WASM-Runtimes vertraut werden. Beispiel: Agenten in regulierten Branchen (Banken, Gesundheitswesen), die nachweisbar isoliert sein müssen.

Entscheidungsmatrix

Braucht der Tool-Call GPU-Zugriff?
  ├── Ja → Container (NemoClaw)
  └── Nein
       ├── Hochfrequent (>100 Calls/s)?
       │    └── Ja → WASM (IronClaw)
       └── Regulierte Umgebung?
            ├── Ja → Kernel-Level (nono)
            └── Nein → Container oder WASM nach Präferenz

Hybride Architektur: Der realistische Weg

In der Praxis wird sich kein einzelner Ansatz durchsetzen. Die wahrscheinlichste Architektur ist hybrid:

Container für komplexe, langlebige Tool-Calls mit GPU-Bedarf
WASM für leichtgewichtige, hochfrequente Transformationen
Kernel-Level als zusätzliche Härtungsschicht innerhalb von Containern

Das ergibt ein Schichtenmodell:

Agent Runtime
  └── Tool Router (entscheidet Sandbox-Typ)
       ├── Container Pool (NemoClaw-Stil)
       │    └── Kernel-Härtung (nono-Stil)
       └── WASM Pool (IronClaw-Stil)

Zusammenhang mit Privacy Routing

Die Sandbox-Frage hängt direkt mit dem Privacy Router zusammen. Wenn sensible Daten lokal verarbeitet werden müssen, braucht der lokale Pfad stärkere Isolation als der Cloud-Pfad – denn Cloud-Provider haben eigene Isolation.

Das bedeutet: Privacy Routing und Sandboxing sind keine unabhängigen Entscheidungen. Sie müssen zusammen gedacht werden:

Routing-Pfad	Empfohlene Isolation
Lokal + sensibel	Container + Kernel-Härtung
Lokal + unkritisch	WASM oder Container
Cloud	Provider-seitige Isolation

Offene Fragen

Startup-Latenz vs. Sicherheit: Wie viel Latenz ist akzeptabel für bessere Isolation?
WASM-GPU: Wird WebGPU in WASM-Sandboxes praktikabel für lokale Inferenz?
Standardisierung: Wird es einen Standard für Agent-Sandboxing geben, oder fragmentiert der Markt?
Attestierung: Wie weist man nach, dass die Isolation tatsächlich funktioniert hat?

Fazit

Es gibt keinen Gewinner im Agent-Sandboxing – nur Trade-offs. Container sind bewährt, aber schwer. WASM ist leicht, aber eingeschränkt. Kernel-Level ist maximal sicher, aber komplex. Die Zukunft liegt in hybriden Architekturen, die den richtigen Isolationsgrad pro Tool-Call wählen.

Drei Takeaways:

Container sind der sichere Default – aber nicht für alles die richtige Wahl
WASM wird für hochfrequente Calls unverzichtbar – die Startup-Latenz macht den Unterschied
Hybride Architekturen werden Standard – kein einzelner Ansatz löst alles

→ NemoClaw: Privacy Router erklärt → Die 5 Bausteine eines KI-Agenten → Agentic Engineering verstehen → Kontakt aufnehmen

TeilenLinkedIn WhatsApp E-Mail

Verwandte Artikel

Persönlicher KI-Agent als zentrale Schaltstelle, verbunden mit Mail, Kalender, Chat und Code – aufgesetzt auf einer sicheren Runtime-Schicht

23. April 20264 min

Globster: monday.com bringt persönliche KI-Agenten – auf NemoClaw von NVIDIA

monday agent labs hat mit Globster ein neues Produkt vorgestellt: persönliche KI-Agenten auf Basis von OpenClaw, abgesic…

Diagramm eines Privacy Routers: lokale Modelle für sensible Daten, Cloud-Modelle für alles andere

17. März 20263 min

NemoClaw: NVIDIAs Privacy Router und was er für die Agent-Architektur bedeutet

NVIDIA steigt mit NemoClaw in die Claw-Welt ein – und bringt ein Konzept mit, das die Agent-Architektur verändern könnte…

Architekturdiagramm eines Privacy Routers: Datenfluss aufgeteilt in lokalen und Cloud-Pfad

17. März 20266 min

Privacy Router mit OpenClaw bauen: Ein Praxis-Guide mit Code

Privacy Routing ist das Konzept – aber wie setzt man es um? Ein praktischer Guide mit OpenClaw, Policy-Engine und konkre…

Field-Journal mit handschriftlichen Notizen zu OpenClaw, daneben eine rote Hummer-Figur unter warmem Schreibtischlicht

29. Juni 20264 min

Ein halbes Jahr OpenClaw in Production – Field-Report aus dem Maschinenraum

Sechs Monate täglich OpenClaw in Production. Kein Marketing, kein Audit – ein ehrlicher Field-Report: was wir rausgeriss…

Minimalistische Illustration eines Entwicklers mit Ponytail und ovaler Brille, der skeptisch Code auf einem Bildschirm betrachtet

14. Juni 20265 min

Ponytail: Warum der beste Code der Code ist, den du nie geschrieben hast

Ein Dev hat Ponytail gebaut – weil seine AI-Agenten 500 Zeilen für ein 5-Zeilen-Problem schrieben. Das Ergebnis: 80-94% …

6. Juni 20263 min

monday.com öffnet die Türen für KI-Agenten: Was hinter agents-signup steckt

monday.com hat einen eigenen Signup-Flow für KI-Agenten gebaut – mit HATCHA, MCP und Instant API Key. Warum das mehr ist…

Enterprise-KI-Agenten verbinden sich sicher über den Gemini Enterprise Agent Marketplace

28. Mai 20263 min

Googles Agent Marketplace ist live – und monday.com ist von Tag eins dabei

Google öffnet Gemini Enterprise für Partner-AI-Agenten – und monday.com ist von Anfang an drin. Was das für Enterprise-W…

$Pipeline-Schema einer Dark Software Factory: ein JIRA-Ticket im Status \"Ready for Dev\" triggert parallele Claude-Code-Sub-Agents, die einen Draft-Pull-Request auf GitHub erzeugen, mit Human-Review-Gate vor dem Merge$

30. April 20265 min

AI Agentic First bei Groupon: Was Ales Drabeks Dark Software Factory uns lehrt

Ales Drabek, CTIO bei Groupon, hat zwei Patterns in Production: Dark Software Factory und Speedboats. Was das über AI Ag…

Architektur-Diagramm: zentraler Orchestrator-Agent verbindet drei spezialisierte Sub-Agents (Sales, CRM, Ops) über TOOLS.md-Schnittstellen mit operativen Enterprise-Systemen

30. April 20266 min

Enterprise-Grade Agentic Setup: Warum ein API-Key keine KI-Strategie ist

Ein API-Key in deiner Website ist Spielzeug. Ein agentisches Setup mit spezialisierten Sub-Agents, TOOLS.md, sauberen Sy…