Abstrakte Illustration eines zentralen Such-Hubs, der über glühende Linien mit vielen kleinen Such-Engine-Knoten verbunden ist

SearXNG: Die unterschätzte Such-Infrastruktur für Agenten

13. Juni 20263 min Lesezeit

TL;DR: „SearXNG ist eine selbst-gehostete Metasuchmaschine, die als JSON-Endpoint für Agenten brauchbar ist. Ein Container, viele Engines, keine API-Keys, keine Quoten – aber AGPL-3.0 und Operations-Verantwortung gehören dazu."

— Till Freitag

Wenn Suche Teil des Systems wird

In der ersten Welle der Agent-Stacks wurde Websuche per Default an einen kommerziellen Anbieter delegiert: Tavily, Serper, Exa, Brave Search API, Perplexity. Pro Query ein Cent, pro Agent ein API-Key, pro Kunde ein Rate-Limit, das du nicht kontrollierst.

Das funktioniert, bis Suche nicht mehr eine Funktion deines Agents ist, sondern die meistgenutzte Funktion. Dann wird aus dem Cent pro Query eine Position in deinem Cost-of-Goods, und aus dem Rate-Limit ein Single Point of Failure.

SearXNG ist die Antwort, die seit Jahren da war und gerade in Agent-Setups neu entdeckt wird. 31,8k GitHub-Sterne, AGPL-3.0, eine selbst-gehostete Metasuchmaschine, die über 200 Such-Engines unter einer einzigen JSON-API bündelt. Kein Tracking, keine Profile, kein Vendor-Lock.

Was du tatsächlich bekommst

Ein Endpoint, viele Engines. Google, Bing, DuckDuckGo, Brave, Wikipedia, GitHub, Stack Overflow, arXiv, Reddit, YouTube, Mastodon – pro Query kombinierbar, pro Kategorie filterbar.
JSON-Output. format=json auf /search reicht. Ein Agent-Tool, das das parst, schreibt man in zehn Minuten.
Kategorien statt Engines. categories=science triggert die richtigen Quellen, ohne dass dein Agent eine Engine-Auswahl-Heuristik lernen muss.
Keine API-Keys, keine Quoten. Du betreibst die Instanz, du setzt die Limits. Das ist Feature und Verantwortung gleichzeitig.
Privacy-by-Design. Keine Logs per Default, keine Profile, keine Cookies. Für Agents, die Kundenfragen stellen, ist das relevant – nicht nur ideologisch.

Setup ist ein Docker-Compose-File. Hinter Caddy oder Traefik, redis daneben, fertig.

Warum es in Harnesses landet

Ein Agent, der zehn Mal pro Konversation sucht, ist 2026 normal. Drei Verschiebungen machen SearXNG dafür interessant:

Custom Harnesses werden Mainstream. Wer einen DeerFlow- oder Claude-Code-Style-Agent betreibt, kontrolliert das Tool-Layer selbst. Ein Search-Tool, das man docker compose up startet, passt da besser rein als ein weiterer SaaS-Vertrag.
Cost per Query zählt. Bei hundert Agent-Sessions pro Tag mit zehn Suchen pro Session und 0,5 ct pro Query bei einem kommerziellen Anbieter bist du bei rund 150 EUR im Monat – nur für Suche. SearXNG auf einer 20-EUR-VM erledigt das Gleiche.
Data Residency. EU-Kunden fragen, wo die Such-Querys landen. "Auf unserer Hetzner-VM in Falkenstein" ist eine bessere Antwort als "bei einem US-Anbieter mit DPA".

Die ehrlichen Einschränkungen

SearXNG ist nicht das bessere Tavily für jeden Use Case.

AGPL-3.0. Eigenständig betreiben ist unkritisch. SearXNG-Code in dein Produkt einbauen und das Produkt ausliefern ist ein Lizenzthema, das deine Rechtsabteilung lesen will. Für unsere Kunden: SearXNG läuft als Service hinter der API, nicht als Bibliothek im Codebase – damit ist die AGPL für die meisten Setups unproblematisch.
Rate-Limits der Upstream-Engines. Google blockt Scraping aggressiv. Eine SearXNG-Instanz, die ohne Tor- oder Proxy-Pool 1.000 Querys pro Stunde durch Google jagt, wird nach ein paar Stunden CAPTCHAs sehen. Brave Search ist als Engine deutlich freundlicher; viele Teams nutzen SearXNG mit einer Engine-Whitelist statt aller 200.
Kein "Answer", nur Links. SearXNG ist Metasuche, nicht Antwort-Generator. Wenn du Tavilys "raw_content"-Bequemlichkeit willst, brauchst du Crawl4AI oder Firecrawl daneben – beides standardmäßig in den Stacks, die SearXNG ohnehin einsetzen.
Operations gehören dazu. Ein Service, der ausfällt, fällt auf dich zurück. Health-Checks, Redis, Updates, Engine-Konfiguration – das ist überschaubar, aber nicht null.

Wie wir es bauen würden

Für ein internes Agent-Setup mit moderatem Volumen:

Schicht	Komponente
Search-Endpoint	SearXNG in Docker, hinter Caddy mit Basic Auth
Cache	Redis, 24h TTL pro Query-Hash
Engine-Whitelist	Brave, DuckDuckGo, Wikipedia, GitHub, arXiv, Stack Overflow
Content-Fetch	Crawl4AI als zweiter Container, von SearXNG-Links gefüttert
Agent-Tool	`web_search(query, category)` → JSON, identische Signatur wie ein Tavily-Wrapper

Damit kannst du jeden bestehenden Tavily- oder Serper-Aufruf in deinem Agent ohne Prompt-Änderung umstellen. Das ist der pragmatische Vorteil: kein Re-Engineering, nur ein Tool-Tausch.

Wann SearXNG nicht die richtige Wahl ist

Volumen unter 10.000 Querys pro Monat – betreib lieber keinen Service, zahl die 5 EUR an Tavily.
Du brauchst hartes SLA für Suche, willst aber kein On-Call-Setup – kommerzielle API ist ehrlicher.
Dein Agent läuft on-device beim Endkunden – dort gibt es keine zentrale Instanz, die das hosten kann.

Für alles dazwischen – also den größten Teil dessen, was wir gerade an Custom Agents bauen – gehört SearXNG mindestens auf die Shortlist.

→ DeerFlow 2.0: Super-Agent-Harness von ByteDance → Agent Runtime Vergleich: Claude, LangGraph, CrewAI → Agent-Sandboxing-Ansätze im Vergleich

TeilenLinkedIn WhatsApp E-Mail

Verwandte Artikel

Visualisierung eines großen blassen Neural-Net-Spheres und eines kleineren, hellen Sphere mit Cyan/Gelb – die schrumpfende Frontier offener Modelle

8. Juni 20265 min

Nex-N2-Pro: Wie die Frontier der offenen Modelle in sechs Wochen um 75 % geschrumpft ist

Vor sechs Wochen war DeepSeek-V4-Pro mit 1,6 Billionen Parametern das größte je veröffentlichte Open-Weight-Modell. Heut…

4. Juni 20263 min

Self-Hosted & Privacy-Layer 2026: Ontheia, Anything LLM & Privacy Router

Wer DSGVO ernst nimmt, kommt um Self-Hosting nicht herum. Ontheia, Anything LLM, NanoClaw und der Privacy Router im Verg…

Gemma 4 12B Coder läuft lokal auf einem Entwickler-Laptop – Code-Symbole strömen aus einem 12B-Chip

15. Juni 20264 min

Gemma 4 12B Coder: Lokale Code-Generierung wird zum Default

Google bringt mit dem Gemma 4 12B Coder die spezialisierte Coding-Variante des Gemma-4-Stacks. 12B Parameter im GGUF-For…

Abstrakte Illustration einer Hirschsilhouette, verbunden mit isolierten Sandbox-Containern über leuchtende Flow-Linien

18. Mai 20264 min

DeerFlow 2.0: ByteDances 68k-Sterne Super-Agent-Harness, der fertige Artefakte liefert

ByteDances Open-Source-Super-Agent-Harness bringt Skills für Research, Reports, Slides, Web-Seiten, Bild- und Video-Gen …

Vergleich dreier Agent-Runtime-Architekturen für Production Deployments

9. April 20266 min

Claude Managed Agents vs. LangGraph vs. CrewAI: Agent-Runtimes für Production im Vergleich

Drei Wege, Production Agents zu deployen: Anthropics gehostete Runtime, LangGraphs Graph-Orchestrierung oder CrewAIs Rol…

Abstrakte Illustration von KI-vernetzten Enterprise-Systemen

9. April 20263 min

superglue.ai – Die KI-native Integrationsplattform, die Enterprise-Systeme endlich verbindet

superglue.ai ersetzt brüchige SQL-Skripte und Cron-Jobs durch KI-gesteuerte Enterprise-Integrationen. Open Source, Y Com…

Claude Managed Agents Architektur – Gehirn verbunden mit mehreren Händen für Tools und Sandboxes

8. April 20265 min

Claude Managed Agents: Anthropics Griff nach der Agent-Runtime

Anthropic launcht Managed Agents in der Public Beta – eine gehostete Runtime, die das 'Gehirn' von den 'Händen' entkoppe…

Gemma 4 KI-Modell läuft auf kompaktem Mini-PC – Frontier-Intelligenz wird lokal

6. April 20264 min

Gemma 4: Frontier-Intelligenz auf dem Laptop – der Hype ist real

Googles Gemma 4 liefert GPT-4-Niveau in 14 GB. 85 Tokens pro Sekunde auf Consumer-Hardware, 256K Kontext, Function Calli…

8. März 20264 min

n8n Best Practices – 10 Regeln für produktionsreife Workflows (2026)

n8n-Workflows bauen ist einfach – sie produktionsreif zu betreiben nicht. 10 erprobte Best Practices für Fehlerbehandlun…