Diagramm eines Privacy Routers: lokale Modelle für sensible Daten, Cloud-Modelle für alles andere

    NemoClaw: NVIDIAs Privacy Router und was er für die Agent-Architektur bedeutet

    17. März 20263 min read
    Till Freitag

    TL;DR: „NVIDIA nennt es Privacy Router: Sensible Daten bleiben auf lokalen Modellen, alles andere geht in die Cloud. Policy-gesteuert, nicht vom Agenten entschieden. Für Europa ist das kein Nice-to-have – es ist Grundvoraussetzung."

    — Till Freitag

    In 30 Sekunden

    NVIDIA ist jetzt offiziell im Claw-Geschäft. Auf der GTC wurde NemoClaw vorgestellt – Enterprise Security für OpenClaw-Agenten. Das spannendste Konzept: ein Privacy Router, der sensible Anfragen auf lokale Nemotron-Modelle leitet und den Rest an Cloud-Frontier-Modelle schickt. Dazu kommt die neue Nemotron-3-Modellfamilie mit einem Nano-Modell, das bei 3B aktiven Parametern ein 1M-Token-Kontextfenster bietet.

    Warum Privacy Routing wichtig ist

    Jeder produktive Router für KI-Agenten optimiert heute auf Kosten. Günstige Tasks an günstige Modelle, teure Analysen an leistungsfähigere. Das funktioniert – aber es fehlt eine zweite Achse: Datenschutz.

    Die Idee: Agenten brauchen zwei Routing-Dimensionen:

    Achse Entscheidung Beispiel
    Kosten Welches Modell ist am effizientesten? Triage → kleines Modell, Analyse → großes Modell
    Datenschutz Dürfen diese Daten die Infrastruktur verlassen? Kundendaten → lokal, allgemeine Anfrage → Cloud

    Bisher hat niemand die Privacy-Achse in Produktion gebracht. Jeder Router optimiert nur auf Kosten. NVIDIAs Announcement ändert das – zumindest konzeptionell.

    Was NemoClaw konkret macht

    NemoClaw ist eine Sicherheitsschicht für OpenClaw-Agenten. Die Kernfunktionen:

    Privacy Router

    Sensible Queries werden an lokale Nemotron-Modelle geroutet, alles andere an Cloud-Frontier-Modelle. Entscheidend: Die Routing-Entscheidung trifft die Policy, nicht der Agent. Das ist ein fundamentaler Unterschied – der Agent entscheidet nicht selbst, ob Daten sensibel sind.

    Anfrage → Policy Engine → Sensibilitätsprüfung
                                  ├── sensibel → lokales Nemotron-Modell
                                  └── unkritisch → Cloud-Frontier-Modell

    Sandboxing

    NemoClaw setzt auf Containerisierung für Tool-Isolation. Das ist ein valider Ansatz, aber nicht der einzige:

    Ansatz Projekt Trade-off
    Container NemoClaw Bewährt, aber Overhead
    WASM Sandboxes IronClaw Leichtgewichtig, aber weniger isoliert
    Kernel-Level nono Maximale Isolation, höhere Komplexität

    Der Markt ist noch dabei herauszufinden, wie Agent-Containment richtig aussieht. Container sind der konservative Weg – aber ob sie bei tausenden parallelen Tool-Calls noch skalieren, wird sich zeigen.

    Nemotron 3: Das lokale Modell für den Privacy Router

    Parallel zu NemoClaw hat NVIDIA die Nemotron-3-Modellfamilie vorgestellt. Die Architektur: Hybrid Mamba-Transformer mit Mixture-of-Experts (MoE).

    Die Nano-Variante ist besonders interessant:

    • 3B aktive Parameter (bei deutlich mehr Gesamtparametern durch MoE)
    • 1M Token Kontextfenster
    • Hybrid-Architektur für effiziente lokale Inferenz

    Wenn die Benchmarks halten, was sie versprechen, ist das genau die Art von Modell, die auf der empfangenden Seite eines Privacy Routers sitzen sollte: klein genug für lokale Inferenz, groß genug für sinnvolle Verarbeitung, und mit einem Kontextfenster, das auch komplexe Dokumente abdeckt.

    Noch keine eigenen Benchmarks – die Zahlen stammen aus NVIDIAs Präsentation. Einordnung folgt, sobald das Modell verfügbar ist.

    Was das für die Agent-Architektur bedeutet

    Privacy Routing ist kein neues Konzept. In der 5-Bausteine-Architektur für KI-Agenten taucht es als Cross-Cutting Concern auf: Model Routing nach Datensensitivität. Aber zwischen Konzept und Produkt liegen Welten.

    Dass NVIDIA „Privacy Routing" in eine GTC-Keynote packt, gibt dem Konzept Legitimität. Das Signal an den Markt:

    1. Privacy-aware Routing wird Standard – nicht optional
    2. Policy-driven statt Agent-decided – der Agent darf nicht selbst einschätzen, was sensibel ist
    3. Lokale Modelle werden First-Class Citizens – nicht nur Fallback für Offline-Szenarien

    Europa-Perspektive

    Für die breite Adoption in Europa ist Privacy Routing kein Feature. Es ist Grundvoraussetzung. DSGVO, Schrems II, die KI-Verordnung – all das verlangt nachweisbare Kontrolle darüber, welche Daten wohin fließen. Ein Router, der diese Entscheidung automatisiert und policy-gesteuert trifft, löst ein echtes Compliance-Problem.

    Offene Fragen

    Die Implementierungsdetails sind noch dünn. Die Dokumentation beschreibt die Vision, aber die tatsächliche Routing-Konfiguration ist noch nicht öffentlich dokumentiert. Das ist bei Alpha-Software erwartbar. Trotzdem bleiben Fragen:

    • Wie granular sind die Policies? Feld-Level, Dokument-Level oder Anfrage-Level?
    • Wie wird Sensitivität klassifiziert? Automatisch, manuell, oder beides?
    • Wie performt der lokale Pfad? Latenz-Unterschied zwischen lokalem Nemotron und Cloud-Frontier?
    • Wie integriert sich das in bestehende OpenClaw-Deployments?

    Fazit

    NVIDIA hat mit NemoClaw kein fertiges Produkt vorgestellt, sondern ein Konzept validiert. Privacy Routing – die Trennung von Modell-Routing nach Kosten UND Datensensitivität – ist eine Idee, die seit Monaten in der Agent-Community diskutiert wird. Dass sie jetzt in einer GTC-Keynote landet, macht sie real.

    Drei Takeaways:

    1. Privacy Router ≠ VPN – Es geht nicht um Verschlüsselung, sondern um Routing-Entscheidungen auf Policy-Ebene
    2. Nemotron 3 Nano könnte der lokale Baustein sein – 3B Parameter + 1M Context bei hybrider Architektur
    3. Für Europa nicht optional – Wer KI-Agenten in der EU deployen will, braucht nachweisbares Privacy Routing

    Die 5 Bausteine eines KI-AgentenAgentic Engineering verstehenKontakt aufnehmen

    TeilenLinkedInWhatsAppE-Mail

    Related Articles

    Architekturdiagramm eines Privacy Routers: Datenfluss aufgeteilt in lokalen und Cloud-Pfad
    March 17, 20266 min

    Privacy Router mit OpenClaw bauen: Ein Praxis-Guide mit Code

    Privacy Routing ist das Konzept – aber wie setzt man es um? Ein praktischer Guide mit OpenClaw, Policy-Engine und konkre…

    Read more
    Persönlicher KI-Agent als zentrale Schaltstelle, verbunden mit Mail, Kalender, Chat und Code – aufgesetzt auf einer sicheren Runtime-Schicht
    April 23, 20264 min

    Globster: monday.com bringt persönliche KI-Agenten – auf NemoClaw von NVIDIA

    monday agent labs hat mit Globster ein neues Produkt vorgestellt: persönliche KI-Agenten auf Basis von OpenClaw, abgesic…

    Read more
    Drei Isolationsebenen für KI-Agenten: Container, WASM und Kernel
    March 17, 20265 min

    Agent Sandboxing: Container vs. WASM vs. Kernel – drei Wege, Agenten einzusperren

    KI-Agenten brauchen Isolation. Aber welche? Container, WASM oder Kernel-Level – drei Ansätze im Vergleich, mit konkreten…

    Read more
    Pipeline-Schema einer Dark Software Factory: ein JIRA-Ticket im Status \"Ready for Dev\" triggert parallele Claude-Code-Sub-Agents, die einen Draft-Pull-Request auf GitHub erzeugen, mit Human-Review-Gate vor dem Merge
    April 30, 20265 min

    AI Agentic First bei Groupon: Was Ales Drabeks Dark Software Factory uns lehrt

    Ales Drabek, CTIO bei Groupon, hat zwei Patterns in Production: Dark Software Factory und Speedboats. Was das über AI Ag…

    Read more
    Architektur-Diagramm: zentraler Orchestrator-Agent verbindet drei spezialisierte Sub-Agents (Sales, CRM, Ops) über TOOLS.md-Schnittstellen mit operativen Enterprise-Systemen
    April 30, 20266 min

    Enterprise-Grade Agentic Setup: Warum ein API-Key keine KI-Strategie ist

    Ein API-Key in deiner Website ist Spielzeug. Ein agentisches Setup mit spezialisierten Sub-Agents, TOOLS.md, sauberen Sy…

    Read more
    April 28, 20263 min

    „Claude Code hat OpenClaw gekillt" – Warum dieser Vergleich kompletter Unsinn ist

    Auf LinkedIn liest man gerade öfter: „Claude Code hat OpenClaw gekillt." Das ist, als würde man Äpfel mit interstellaren…

    Read more
    April 28, 20266 min

    Paperclip: Wenn OpenClaw der Mitarbeiter ist, ist Paperclip die Firma

    Paperclip ist Open-Source-Infrastruktur, mit der du eine ganze KI-Firma führst – Org-Chart, Budgets, Approvals, Audit-Tr…

    Read more
    Gemma 4 KI-Modell läuft auf kompaktem Mini-PC – Frontier-Intelligenz wird lokal
    April 6, 20264 min

    Gemma 4: Frontier-Intelligenz auf dem Laptop – der Hype ist real

    Googles Gemma 4 liefert GPT-4-Niveau in 14 GB. 85 Tokens pro Sekunde auf Consumer-Hardware, 256K Kontext, Function Calli…

    Read more
    OpenClaw Preisschock: So vermeidest du die $500-Rechnung
    April 5, 20262 min

    OpenClaw Preisschock: So vermeidest du die $500-Rechnung

    Anthropic streicht die Third-Party-Tool-Abdeckung unter Claude-Abos. Wer OpenClaw ohne Vorbereitung betreibt, zahlt bald…

    Read more