
SearXNG: Die unterschätzte Such-Infrastruktur für Agenten
TL;DR: „SearXNG ist eine selbst-gehostete Metasuchmaschine, die als JSON-Endpoint für Agenten brauchbar ist. Ein Container, viele Engines, keine API-Keys, keine Quoten – aber AGPL-3.0 und Operations-Verantwortung gehören dazu."
— Till FreitagWenn Suche Teil des Systems wird
In der ersten Welle der Agent-Stacks wurde Websuche per Default an einen kommerziellen Anbieter delegiert: Tavily, Serper, Exa, Brave Search API, Perplexity. Pro Query ein Cent, pro Agent ein API-Key, pro Kunde ein Rate-Limit, das du nicht kontrollierst.
Das funktioniert, bis Suche nicht mehr eine Funktion deines Agents ist, sondern die meistgenutzte Funktion. Dann wird aus dem Cent pro Query eine Position in deinem Cost-of-Goods, und aus dem Rate-Limit ein Single Point of Failure.
SearXNG ist die Antwort, die seit Jahren da war und gerade in Agent-Setups neu entdeckt wird. 31,8k GitHub-Sterne, AGPL-3.0, eine selbst-gehostete Metasuchmaschine, die über 200 Such-Engines unter einer einzigen JSON-API bündelt. Kein Tracking, keine Profile, kein Vendor-Lock.
Was du tatsächlich bekommst
- Ein Endpoint, viele Engines. Google, Bing, DuckDuckGo, Brave, Wikipedia, GitHub, Stack Overflow, arXiv, Reddit, YouTube, Mastodon – pro Query kombinierbar, pro Kategorie filterbar.
- JSON-Output.
format=jsonauf/searchreicht. Ein Agent-Tool, das das parst, schreibt man in zehn Minuten. - Kategorien statt Engines.
categories=sciencetriggert die richtigen Quellen, ohne dass dein Agent eine Engine-Auswahl-Heuristik lernen muss. - Keine API-Keys, keine Quoten. Du betreibst die Instanz, du setzt die Limits. Das ist Feature und Verantwortung gleichzeitig.
- Privacy-by-Design. Keine Logs per Default, keine Profile, keine Cookies. Für Agents, die Kundenfragen stellen, ist das relevant – nicht nur ideologisch.
Setup ist ein Docker-Compose-File. Hinter Caddy oder Traefik, redis daneben, fertig.
Warum es in Harnesses landet
Ein Agent, der zehn Mal pro Konversation sucht, ist 2026 normal. Drei Verschiebungen machen SearXNG dafür interessant:
- Custom Harnesses werden Mainstream. Wer einen DeerFlow- oder Claude-Code-Style-Agent betreibt, kontrolliert das Tool-Layer selbst. Ein Search-Tool, das man
docker compose upstartet, passt da besser rein als ein weiterer SaaS-Vertrag. - Cost per Query zählt. Bei hundert Agent-Sessions pro Tag mit zehn Suchen pro Session und 0,5 ct pro Query bei einem kommerziellen Anbieter bist du bei rund 150 EUR im Monat – nur für Suche. SearXNG auf einer 20-EUR-VM erledigt das Gleiche.
- Data Residency. EU-Kunden fragen, wo die Such-Querys landen. "Auf unserer Hetzner-VM in Falkenstein" ist eine bessere Antwort als "bei einem US-Anbieter mit DPA".
Die ehrlichen Einschränkungen
SearXNG ist nicht das bessere Tavily für jeden Use Case.
- AGPL-3.0. Eigenständig betreiben ist unkritisch. SearXNG-Code in dein Produkt einbauen und das Produkt ausliefern ist ein Lizenzthema, das deine Rechtsabteilung lesen will. Für unsere Kunden: SearXNG läuft als Service hinter der API, nicht als Bibliothek im Codebase – damit ist die AGPL für die meisten Setups unproblematisch.
- Rate-Limits der Upstream-Engines. Google blockt Scraping aggressiv. Eine SearXNG-Instanz, die ohne Tor- oder Proxy-Pool 1.000 Querys pro Stunde durch Google jagt, wird nach ein paar Stunden CAPTCHAs sehen. Brave Search ist als Engine deutlich freundlicher; viele Teams nutzen SearXNG mit einer Engine-Whitelist statt aller 200.
- Kein "Answer", nur Links. SearXNG ist Metasuche, nicht Antwort-Generator. Wenn du Tavilys "raw_content"-Bequemlichkeit willst, brauchst du Crawl4AI oder Firecrawl daneben – beides standardmäßig in den Stacks, die SearXNG ohnehin einsetzen.
- Operations gehören dazu. Ein Service, der ausfällt, fällt auf dich zurück. Health-Checks, Redis, Updates, Engine-Konfiguration – das ist überschaubar, aber nicht null.
Wie wir es bauen würden
Für ein internes Agent-Setup mit moderatem Volumen:
| Schicht | Komponente |
|---|---|
| Search-Endpoint | SearXNG in Docker, hinter Caddy mit Basic Auth |
| Cache | Redis, 24h TTL pro Query-Hash |
| Engine-Whitelist | Brave, DuckDuckGo, Wikipedia, GitHub, arXiv, Stack Overflow |
| Content-Fetch | Crawl4AI als zweiter Container, von SearXNG-Links gefüttert |
| Agent-Tool | web_search(query, category) → JSON, identische Signatur wie ein Tavily-Wrapper |
Damit kannst du jeden bestehenden Tavily- oder Serper-Aufruf in deinem Agent ohne Prompt-Änderung umstellen. Das ist der pragmatische Vorteil: kein Re-Engineering, nur ein Tool-Tausch.
Wann SearXNG nicht die richtige Wahl ist
- Volumen unter 10.000 Querys pro Monat – betreib lieber keinen Service, zahl die 5 EUR an Tavily.
- Du brauchst hartes SLA für Suche, willst aber kein On-Call-Setup – kommerzielle API ist ehrlicher.
- Dein Agent läuft on-device beim Endkunden – dort gibt es keine zentrale Instanz, die das hosten kann.
Für alles dazwischen – also den größten Teil dessen, was wir gerade an Custom Agents bauen – gehört SearXNG mindestens auf die Shortlist.
→ DeerFlow 2.0: Super-Agent-Harness von ByteDance → Agent Runtime Vergleich: Claude, LangGraph, CrewAI → Agent-Sandboxing-Ansätze im Vergleich








