
Die 5 Bausteine eines KI-Agenten – Was wirklich unter der Haube steckt
TL;DR: „Ein Agent ist kein Chatbot mit Plugins. Er besteht aus fünf Bausteinen: Runtime, Channels, Memory, Tools und Self-Scheduling. Wer diese versteht, baut bessere Systeme."
— Till FreitagIn 30 Sekunden
Anthropic, AWS, Google und Hugging Face haben alle ihre Blueprints für KI-Agenten veröffentlicht. Alle nützlich. Alle aus Enterprise- oder theoretischer Perspektive. Wer aber verstehen will, was einen Agenten wirklich ausmacht – oder selbst einen bauen will – braucht etwas Praxisnäheres.
Nach der Analyse von über 35 Projekten kristallisieren sich fünf Kern-Bausteine heraus, die jeden KI-Agenten definieren.
Warum nicht einfach ein Framework nehmen?
Frameworks wie LangChain, CrewAI oder AutoGen abstrahieren vieles weg. Das ist praktisch – bis es das nicht mehr ist. Wer die Bausteine darunter versteht, kann:
- Debugging beschleunigen, wenn der Agent sich unerwartet verhält
- Architekturentscheidungen treffen, die über Prototyp-Phase hinaus tragen
- Framework-unabhängig denken und das richtige Tool für den Job wählen
Die 5 Bausteine
1. Runtime (Das Gehirn)
Die Runtime ist die Reasoning-Schleife: Nachricht empfangen → Aktion entscheiden → Tools aufrufen → antworten. Aber die Schleife allein reicht nicht. Das Gehirn braucht auch eine persistente Identität: Persönlichkeit, Guardrails und Sicherheitsregeln.
| Aspekt | Einfach | Fortgeschritten |
|---|---|---|
| Modell | Ein einzelnes LLM | Multi-Model-Routing nach Aufgabentyp |
| Steuerung | Fester System-Prompt | Dynamische Prompt-Komposition |
| Ausführung | Sequentiell | Sub-Agenten mit paralleler Ausführung |
Praxis-Insight: Die meisten Projekte starten mit einem einzelnen Modell und einem guten System-Prompt. Multi-Model-Routing lohnt sich erst, wenn Kosten oder Latenz zum Problem werden – z. B. ein schnelles Modell für Triaging, ein starkes für komplexe Analysen.
2. Channels (Die Schnittstellen)
Channels bestimmen, wie du deinen Agenten erreichst und wie er zurückkommt. Discord, Telegram, Slack, WhatsApp, Voice – jede Plattform wird in ein einheitliches Nachrichtenformat übersetzt. Das Gehirn weiß nie, mit welcher Plattform es spricht.
Klingt minimal, aber die richtige Channel-Strategie entscheidet über die gesamte User Experience:
- Asynchrone Channels (E-Mail, Slack) erlauben lange Verarbeitungszeiten
- Synchrone Channels (Voice, Chat) erfordern Sub-Sekunden-Antworten
- Rich-Media-Channels (WhatsApp, Discord) ermöglichen Buttons, Karussells, Dateien
Der häufigste Fehler: Einen Agenten für Chat bauen und dann wundern, warum er über E-Mail oder Voice nicht funktioniert. Channel-Abstraktion von Anfang an einplanen.
3. Memory (Das Gedächtnis)
Memory hat mindestens zwei Schichten:
Langzeitgedächtnis speichert dauerhafte Fakten, Wissensgraphen und semantische Beziehungen über Gespräche hinweg. Kurzzeitgedächtnis ist der Konversationszustand – die Struktur einer einzelnen Interaktion über die Zeit.
Die entscheidende Unterscheidung ist nicht zwischen „hat Memory" und „hat kein Memory". Sie liegt zwischen:
| Level | Beschreibung |
|---|---|
| Speichern | Konversationen werden gespeichert und können abgerufen werden |
| Lernen | Quality Gates, Confidence Scoring, Soft-Archiving – der Agent wird mit jeder Interaktion besser |
Das „Personal" in „Personal AI" entsteht hier. Ein Agent, der sich an deine Präferenzen erinnert, dein Vokabular übernimmt und irrelevante Erinnerungen aussortiert, fühlt sich fundamental anders an als einer, der nur einen langen Chat-Verlauf hat.
4. Tools (Die Fähigkeiten)
Tools definieren, was der Agent tatsächlich tun kann. Hier gibt es zwei Denkschulen:
Minimalistisch: Der Agent bekommt Basis-Primitives und schreibt Code für alles andere. Weniger Tools = kleinerer Kontext = niedrigere Kosten pro Turn.
Kuratiert: Ein spezialisiertes Set an Fähigkeiten – APIs aufrufen, Web browsen, Kalender verwalten, E-Mails schreiben, Tasks an Sub-Agenten delegieren. Mehr Tools = schnellere Ausführung, weniger Workarounds.
Wenige Tools ←→ Viele Tools
├─ Kleinerer Kontext ├─ Schnellere Ausführung
├─ Niedrigere Kosten ├─ Weniger Workarounds
├─ Mehr Flexibilität ├─ Bessere Ergebnisse
└─ Höhere Latenz └─ Komplexeres RoutingPraxis-Insight: Starte mit 3–5 gut definierten Tools. Jedes Tool braucht eine kristallklare Beschreibung, damit das Modell weiß, wann es welches Tool einsetzen soll. Vage Tool-Beschreibungen sind die häufigste Ursache für schlechte Agent-Performance.
5. Self-Scheduling (Die Autonomie)
Self-Scheduling ist, was einen Chatbot von einem Assistenten trennt: Handeln ohne Aufforderung.
| Trigger-Typ | Beispiel |
|---|---|
| Feste Zeitpläne | Jeden Morgen eine Zusammenfassung der offenen Tasks |
| Heartbeats | Alle 15 Minuten auf neue E-Mails prüfen |
| Events | Bei neuem Slack-Thread automatisch Kontext sammeln |
| Workflow-Engines | Mehrstufige Prozesse mit Bedingungen und Branches |
Ohne Self-Scheduling ist ein Agent nur ein besserer Chatbot – er reagiert, aber er agiert nicht. Die Kombination aus proaktivem Handeln und der Fähigkeit, den richtigen Zeitpunkt abzuwarten, macht den Unterschied.
Cross-Cutting Concerns
Diese fünf Bausteine definieren, was ein Agent ist und was er kann. Aber es gibt Querschnittsthemen, die alle fünf Bausteine durchziehen:
- Sicherheit: Wie schütze ich den Agenten vor Prompt Injection und Missbrauch?
- Observability: Wie debugge ich, wenn der Agent falsch entscheidet?
- Deployment: Wie bringe ich den Agenten zuverlässig in Produktion?
- Model-Routing: Wie wähle ich das richtige Modell für die richtige Aufgabe?
- Kosten-Management: Wie halte ich die Token-Kosten im Griff?
Diese Themen sind kein sechster Baustein – sie sind die Infrastruktur, in der die fünf Bausteine leben.
Was bedeutet das für die Praxis?
Für Teams, die einen Agenten bauen wollen
Geht die fünf Bausteine einzeln durch und fragt euch:
- Runtime: Welches Modell? Ein Modell oder mehrere? Welche Guardrails?
- Channels: Wo leben unsere Nutzer? Welche Channels brauchen wir Day 1?
- Memory: Was muss der Agent sich merken? Wie wird er über Zeit besser?
- Tools: Was muss der Agent tun können? Minimal starten oder voll ausstatten?
- Self-Scheduling: Welche Aktionen soll der Agent proaktiv ausführen?
Für Entscheider
Die Bausteine helfen euch, Vendor-Angebote zu bewerten. Wenn ein Anbieter euch einen „KI-Agenten" verkauft, fragt: Wie lösen sie Runtime, Channels, Memory, Tools und Self-Scheduling? Jede Lücke ist ein Risiko.
Für Entwickler
Nutzt die Bausteine als Architektur-Checkliste. Egal ob ihr LangChain, CrewAI oder etwas Eigenes baut – die fünf Bausteine müssen abgedeckt sein. Die Implementierung kann variieren, die Konzepte nicht.
Fazit
Ein KI-Agent ist kein Chatbot mit Plugins. Er ist ein System aus fünf klar definierten Bausteinen, die zusammenspielen müssen. Wer diese Bausteine versteht, baut nicht nur bessere Agenten – sondern kann auch die Grenzen und Möglichkeiten bestehender Lösungen besser einschätzen.
Drei Dinge zum Mitnehmen:
- Runtime + Memory machen den Kern aus – hier entscheidet sich, wie „intelligent" der Agent wirkt
- Channels + Tools bestimmen den praktischen Nutzen – ein brillanter Agent ohne die richtigen Schnittstellen ist nutzlos
- Self-Scheduling ist das Differenzierungsmerkmal – ohne proaktives Handeln bleibt es ein Chatbot
→ Mehr über Agentic Engineering erfahren → Agentic Engineering Workshop buchen








