
NemoClaw: NVIDIAs Privacy Router und was er für die Agent-Architektur bedeutet
TL;DR: „NVIDIA nennt es Privacy Router: Sensible Daten bleiben auf lokalen Modellen, alles andere geht in die Cloud. Policy-gesteuert, nicht vom Agenten entschieden. Für Europa ist das kein Nice-to-have – es ist Grundvoraussetzung."
— Till FreitagIn 30 Sekunden
NVIDIA ist jetzt offiziell im Claw-Geschäft. Auf der GTC wurde NemoClaw vorgestellt – Enterprise Security für OpenClaw-Agenten. Das spannendste Konzept: ein Privacy Router, der sensible Anfragen auf lokale Nemotron-Modelle leitet und den Rest an Cloud-Frontier-Modelle schickt. Dazu kommt die neue Nemotron-3-Modellfamilie mit einem Nano-Modell, das bei 3B aktiven Parametern ein 1M-Token-Kontextfenster bietet.
Warum Privacy Routing wichtig ist
Jeder produktive Router für KI-Agenten optimiert heute auf Kosten. Günstige Tasks an günstige Modelle, teure Analysen an leistungsfähigere. Das funktioniert – aber es fehlt eine zweite Achse: Datenschutz.
Die Idee: Agenten brauchen zwei Routing-Dimensionen:
| Achse | Entscheidung | Beispiel |
|---|---|---|
| Kosten | Welches Modell ist am effizientesten? | Triage → kleines Modell, Analyse → großes Modell |
| Datenschutz | Dürfen diese Daten die Infrastruktur verlassen? | Kundendaten → lokal, allgemeine Anfrage → Cloud |
Bisher hat niemand die Privacy-Achse in Produktion gebracht. Jeder Router optimiert nur auf Kosten. NVIDIAs Announcement ändert das – zumindest konzeptionell.
Was NemoClaw konkret macht
NemoClaw ist eine Sicherheitsschicht für OpenClaw-Agenten. Die Kernfunktionen:
Privacy Router
Sensible Queries werden an lokale Nemotron-Modelle geroutet, alles andere an Cloud-Frontier-Modelle. Entscheidend: Die Routing-Entscheidung trifft die Policy, nicht der Agent. Das ist ein fundamentaler Unterschied – der Agent entscheidet nicht selbst, ob Daten sensibel sind.
Anfrage → Policy Engine → Sensibilitätsprüfung
├── sensibel → lokales Nemotron-Modell
└── unkritisch → Cloud-Frontier-ModellSandboxing
NemoClaw setzt auf Containerisierung für Tool-Isolation. Das ist ein valider Ansatz, aber nicht der einzige:
| Ansatz | Projekt | Trade-off |
|---|---|---|
| Container | NemoClaw | Bewährt, aber Overhead |
| WASM Sandboxes | IronClaw | Leichtgewichtig, aber weniger isoliert |
| Kernel-Level | nono | Maximale Isolation, höhere Komplexität |
Der Markt ist noch dabei herauszufinden, wie Agent-Containment richtig aussieht. Container sind der konservative Weg – aber ob sie bei tausenden parallelen Tool-Calls noch skalieren, wird sich zeigen.
Nemotron 3: Das lokale Modell für den Privacy Router
Parallel zu NemoClaw hat NVIDIA die Nemotron-3-Modellfamilie vorgestellt. Die Architektur: Hybrid Mamba-Transformer mit Mixture-of-Experts (MoE).
Die Nano-Variante ist besonders interessant:
- 3B aktive Parameter (bei deutlich mehr Gesamtparametern durch MoE)
- 1M Token Kontextfenster
- Hybrid-Architektur für effiziente lokale Inferenz
Wenn die Benchmarks halten, was sie versprechen, ist das genau die Art von Modell, die auf der empfangenden Seite eines Privacy Routers sitzen sollte: klein genug für lokale Inferenz, groß genug für sinnvolle Verarbeitung, und mit einem Kontextfenster, das auch komplexe Dokumente abdeckt.
Noch keine eigenen Benchmarks – die Zahlen stammen aus NVIDIAs Präsentation. Einordnung folgt, sobald das Modell verfügbar ist.
Was das für die Agent-Architektur bedeutet
Privacy Routing ist kein neues Konzept. In der 5-Bausteine-Architektur für KI-Agenten taucht es als Cross-Cutting Concern auf: Model Routing nach Datensensitivität. Aber zwischen Konzept und Produkt liegen Welten.
Dass NVIDIA „Privacy Routing" in eine GTC-Keynote packt, gibt dem Konzept Legitimität. Das Signal an den Markt:
- Privacy-aware Routing wird Standard – nicht optional
- Policy-driven statt Agent-decided – der Agent darf nicht selbst einschätzen, was sensibel ist
- Lokale Modelle werden First-Class Citizens – nicht nur Fallback für Offline-Szenarien
Europa-Perspektive
Für die breite Adoption in Europa ist Privacy Routing kein Feature. Es ist Grundvoraussetzung. DSGVO, Schrems II, die KI-Verordnung – all das verlangt nachweisbare Kontrolle darüber, welche Daten wohin fließen. Ein Router, der diese Entscheidung automatisiert und policy-gesteuert trifft, löst ein echtes Compliance-Problem.
Offene Fragen
Die Implementierungsdetails sind noch dünn. Die Dokumentation beschreibt die Vision, aber die tatsächliche Routing-Konfiguration ist noch nicht öffentlich dokumentiert. Das ist bei Alpha-Software erwartbar. Trotzdem bleiben Fragen:
- Wie granular sind die Policies? Feld-Level, Dokument-Level oder Anfrage-Level?
- Wie wird Sensitivität klassifiziert? Automatisch, manuell, oder beides?
- Wie performt der lokale Pfad? Latenz-Unterschied zwischen lokalem Nemotron und Cloud-Frontier?
- Wie integriert sich das in bestehende OpenClaw-Deployments?
Fazit
NVIDIA hat mit NemoClaw kein fertiges Produkt vorgestellt, sondern ein Konzept validiert. Privacy Routing – die Trennung von Modell-Routing nach Kosten UND Datensensitivität – ist eine Idee, die seit Monaten in der Agent-Community diskutiert wird. Dass sie jetzt in einer GTC-Keynote landet, macht sie real.
Drei Takeaways:
- Privacy Router ≠ VPN – Es geht nicht um Verschlüsselung, sondern um Routing-Entscheidungen auf Policy-Ebene
- Nemotron 3 Nano könnte der lokale Baustein sein – 3B Parameter + 1M Context bei hybrider Architektur
- Für Europa nicht optional – Wer KI-Agenten in der EU deployen will, braucht nachweisbares Privacy Routing
→ Die 5 Bausteine eines KI-Agenten → Agentic Engineering verstehen → Kontakt aufnehmen






