Abstrakte Illustration eines zentralen Such-Hubs, der über glühende Linien mit vielen kleinen Such-Engine-Knoten verbunden ist

    SearXNG: Die unterschätzte Such-Infrastruktur für Agenten

    13. Juni 20263 min Lesezeit
    Till Freitag

    TL;DR: „SearXNG ist eine selbst-gehostete Metasuchmaschine, die als JSON-Endpoint für Agenten brauchbar ist. Ein Container, viele Engines, keine API-Keys, keine Quoten – aber AGPL-3.0 und Operations-Verantwortung gehören dazu."

    — Till Freitag

    Wenn Suche Teil des Systems wird

    In der ersten Welle der Agent-Stacks wurde Websuche per Default an einen kommerziellen Anbieter delegiert: Tavily, Serper, Exa, Brave Search API, Perplexity. Pro Query ein Cent, pro Agent ein API-Key, pro Kunde ein Rate-Limit, das du nicht kontrollierst.

    Das funktioniert, bis Suche nicht mehr eine Funktion deines Agents ist, sondern die meistgenutzte Funktion. Dann wird aus dem Cent pro Query eine Position in deinem Cost-of-Goods, und aus dem Rate-Limit ein Single Point of Failure.

    SearXNG ist die Antwort, die seit Jahren da war und gerade in Agent-Setups neu entdeckt wird. 31,8k GitHub-Sterne, AGPL-3.0, eine selbst-gehostete Metasuchmaschine, die über 200 Such-Engines unter einer einzigen JSON-API bündelt. Kein Tracking, keine Profile, kein Vendor-Lock.

    Was du tatsächlich bekommst

    • Ein Endpoint, viele Engines. Google, Bing, DuckDuckGo, Brave, Wikipedia, GitHub, Stack Overflow, arXiv, Reddit, YouTube, Mastodon – pro Query kombinierbar, pro Kategorie filterbar.
    • JSON-Output. format=json auf /search reicht. Ein Agent-Tool, das das parst, schreibt man in zehn Minuten.
    • Kategorien statt Engines. categories=science triggert die richtigen Quellen, ohne dass dein Agent eine Engine-Auswahl-Heuristik lernen muss.
    • Keine API-Keys, keine Quoten. Du betreibst die Instanz, du setzt die Limits. Das ist Feature und Verantwortung gleichzeitig.
    • Privacy-by-Design. Keine Logs per Default, keine Profile, keine Cookies. Für Agents, die Kundenfragen stellen, ist das relevant – nicht nur ideologisch.

    Setup ist ein Docker-Compose-File. Hinter Caddy oder Traefik, redis daneben, fertig.

    Warum es in Harnesses landet

    Ein Agent, der zehn Mal pro Konversation sucht, ist 2026 normal. Drei Verschiebungen machen SearXNG dafür interessant:

    1. Custom Harnesses werden Mainstream. Wer einen DeerFlow- oder Claude-Code-Style-Agent betreibt, kontrolliert das Tool-Layer selbst. Ein Search-Tool, das man docker compose up startet, passt da besser rein als ein weiterer SaaS-Vertrag.
    2. Cost per Query zählt. Bei hundert Agent-Sessions pro Tag mit zehn Suchen pro Session und 0,5 ct pro Query bei einem kommerziellen Anbieter bist du bei rund 150 EUR im Monat – nur für Suche. SearXNG auf einer 20-EUR-VM erledigt das Gleiche.
    3. Data Residency. EU-Kunden fragen, wo die Such-Querys landen. "Auf unserer Hetzner-VM in Falkenstein" ist eine bessere Antwort als "bei einem US-Anbieter mit DPA".

    Die ehrlichen Einschränkungen

    SearXNG ist nicht das bessere Tavily für jeden Use Case.

    • AGPL-3.0. Eigenständig betreiben ist unkritisch. SearXNG-Code in dein Produkt einbauen und das Produkt ausliefern ist ein Lizenzthema, das deine Rechtsabteilung lesen will. Für unsere Kunden: SearXNG läuft als Service hinter der API, nicht als Bibliothek im Codebase – damit ist die AGPL für die meisten Setups unproblematisch.
    • Rate-Limits der Upstream-Engines. Google blockt Scraping aggressiv. Eine SearXNG-Instanz, die ohne Tor- oder Proxy-Pool 1.000 Querys pro Stunde durch Google jagt, wird nach ein paar Stunden CAPTCHAs sehen. Brave Search ist als Engine deutlich freundlicher; viele Teams nutzen SearXNG mit einer Engine-Whitelist statt aller 200.
    • Kein "Answer", nur Links. SearXNG ist Metasuche, nicht Antwort-Generator. Wenn du Tavilys "raw_content"-Bequemlichkeit willst, brauchst du Crawl4AI oder Firecrawl daneben – beides standardmäßig in den Stacks, die SearXNG ohnehin einsetzen.
    • Operations gehören dazu. Ein Service, der ausfällt, fällt auf dich zurück. Health-Checks, Redis, Updates, Engine-Konfiguration – das ist überschaubar, aber nicht null.

    Wie wir es bauen würden

    Für ein internes Agent-Setup mit moderatem Volumen:

    SchichtKomponente
    Search-EndpointSearXNG in Docker, hinter Caddy mit Basic Auth
    CacheRedis, 24h TTL pro Query-Hash
    Engine-WhitelistBrave, DuckDuckGo, Wikipedia, GitHub, arXiv, Stack Overflow
    Content-FetchCrawl4AI als zweiter Container, von SearXNG-Links gefüttert
    Agent-Toolweb_search(query, category) → JSON, identische Signatur wie ein Tavily-Wrapper

    Damit kannst du jeden bestehenden Tavily- oder Serper-Aufruf in deinem Agent ohne Prompt-Änderung umstellen. Das ist der pragmatische Vorteil: kein Re-Engineering, nur ein Tool-Tausch.

    Wann SearXNG nicht die richtige Wahl ist

    • Volumen unter 10.000 Querys pro Monat – betreib lieber keinen Service, zahl die 5 EUR an Tavily.
    • Du brauchst hartes SLA für Suche, willst aber kein On-Call-Setup – kommerzielle API ist ehrlicher.
    • Dein Agent läuft on-device beim Endkunden – dort gibt es keine zentrale Instanz, die das hosten kann.

    Für alles dazwischen – also den größten Teil dessen, was wir gerade an Custom Agents bauen – gehört SearXNG mindestens auf die Shortlist.

    → DeerFlow 2.0: Super-Agent-Harness von ByteDance → Agent Runtime Vergleich: Claude, LangGraph, CrewAI → Agent-Sandboxing-Ansätze im Vergleich

    TeilenLinkedInWhatsAppE-Mail

    Verwandte Artikel

    Visualisierung eines großen blassen Neural-Net-Spheres und eines kleineren, hellen Sphere mit Cyan/Gelb – die schrumpfende Frontier offener Modelle
    8. Juni 20265 min

    Nex-N2-Pro: Wie die Frontier der offenen Modelle in sechs Wochen um 75 % geschrumpft ist

    Vor sechs Wochen war DeepSeek-V4-Pro mit 1,6 Billionen Parametern das größte je veröffentlichte Open-Weight-Modell. Heut…

    Weiterlesen
    Self-Hosted & Privacy-Layer 2026: Ontheia, Anything LLM & Privacy Router
    4. Juni 20263 min

    Self-Hosted & Privacy-Layer 2026: Ontheia, Anything LLM & Privacy Router

    Wer DSGVO ernst nimmt, kommt um Self-Hosting nicht herum. Ontheia, Anything LLM, NanoClaw und der Privacy Router im Verg…

    Weiterlesen
    Abstrakte Illustration einer Hirschsilhouette, verbunden mit isolierten Sandbox-Containern über leuchtende Flow-Linien
    18. Mai 20264 min

    DeerFlow 2.0: ByteDances 68k-Sterne Super-Agent-Harness, der fertige Artefakte liefert

    ByteDances Open-Source-Super-Agent-Harness bringt Skills für Research, Reports, Slides, Web-Seiten, Bild- und Video-Gen …

    Weiterlesen
    Vergleich dreier Agent-Runtime-Architekturen für Production Deployments
    9. April 20266 min

    Claude Managed Agents vs. LangGraph vs. CrewAI: Agent-Runtimes für Production im Vergleich

    Drei Wege, Production Agents zu deployen: Anthropics gehostete Runtime, LangGraphs Graph-Orchestrierung oder CrewAIs Rol…

    Weiterlesen
    Abstrakte Illustration von KI-vernetzten Enterprise-Systemen
    9. April 20263 min

    superglue.ai – Die KI-native Integrationsplattform, die Enterprise-Systeme endlich verbindet

    superglue.ai ersetzt brüchige SQL-Skripte und Cron-Jobs durch KI-gesteuerte Enterprise-Integrationen. Open Source, Y Com…

    Weiterlesen
    Claude Managed Agents Architektur – Gehirn verbunden mit mehreren Händen für Tools und Sandboxes
    8. April 20265 min

    Claude Managed Agents: Anthropics Griff nach der Agent-Runtime

    Anthropic launcht Managed Agents in der Public Beta – eine gehostete Runtime, die das 'Gehirn' von den 'Händen' entkoppe…

    Weiterlesen
    Gemma 4 KI-Modell läuft auf kompaktem Mini-PC – Frontier-Intelligenz wird lokal
    6. April 20264 min

    Gemma 4: Frontier-Intelligenz auf dem Laptop – der Hype ist real

    Googles Gemma 4 liefert GPT-4-Niveau in 14 GB. 85 Tokens pro Sekunde auf Consumer-Hardware, 256K Kontext, Function Calli…

    Weiterlesen
    n8n Best Practices – 10 Regeln für produktionsreife Workflows (2026)
    8. März 20264 min

    n8n Best Practices – 10 Regeln für produktionsreife Workflows (2026)

    n8n-Workflows bauen ist einfach – sie produktionsreif zu betreiben nicht. 10 erprobte Best Practices für Fehlerbehandlun…

    Weiterlesen
    Odysseus von PewDiePie – selbst hostbarer KI-Workspace mit Chat, Agenten und Dokumenten als Alternative zu ChatGPT und Claude
    13. Juni 20262 min

    Odysseus von PewDiePie: Warum die eigentliche Frage nicht KI-Souveränität, sondern der KI-Arbeitsplatz ist

    PewDiePies Open-Source-Projekt Odysseus hat in 48 Stunden über 30.000 GitHub Stars gesammelt. Spannender als die Reichwe…

    Weiterlesen