HyperAgent Rollen-Container mit Slack-Trigger, Budget-Gauge und Permission-Shield

    HyperAgent Field Notes #2: Vom Skill zur deploybaren Rolle

    Till FreitagTill Freitag27. April 20264 min Lesezeit
    Till Freitag

    TL;DR: „Skill ≠ Rolle. Eine Rolle hat einen Trigger, ein Budget, einen Permission-Scope und einen Owner. Erst wenn diese vier Dinge gesetzt sind, läuft ein Agent ohne ständige Babysitter-Mode in Produktion."

    — Till Freitag

    Field Notes Serie — Wir sind Teil der Closed Beta von HyperAgent. In Field Notes #1 haben wir den ersten Skill gebaut. Heute machen wir daraus eine deploybare Rolle.

    In 30 Sekunden

    • Ein Skill ist eine Fähigkeit. Eine Rolle ist ein Stellenprofil mit Trigger, Budget, Scope und Owner.
    • Slack-Trigger via Slash-Command war in 10 Minuten konfiguriert. Cron-Trigger noch schneller.
    • Budget-Limit ist nicht optional. Erster Lauf ohne Cap kostete uns 4× mehr als geplant.
    • Permission-Scope ist die wichtigste Sicherheits-Hebel: "darf lesen, darf nicht posten" ist ein anderer Agent als "darf alles".
    • Erste echte Rolle läuft jetzt 5× pro Woche autonom – mit Eval-Score 89 %.

    Wo wir stehen

    Aus Field Notes #1: Wir hatten einen Skill competitor-watchlist-scan. Lief manuell getriggert, lieferte saubere Outputs, Eval-Score bei 78 %.

    Heute machen wir daraus etwas, das ohne uns läuft. Das war für uns der eigentliche "Aha"-Moment mit HyperAgent: Skills sind die Kür, Rollen sind das Produkt.

    Die vier Bausteine einer Rolle

    HyperAgent zwingt dich, vier Dinge explizit zu definieren, bevor eine Rolle deploybar wird:

    1. Trigger – wann läuft die Rolle?

    Drei Trigger-Typen, die wir benutzt haben:

    • Cronevery Monday at 09:00. Klassisch, robust, langweilig (gut so).
    • Slack-Slash-Command/watchlist-scan mit optionalen Parametern. Praktisch für Ad-hoc-Runs.
    • Webhook – wenn ein externes System (z. B. CMS-Update) den Agenten triggert.

    Wir haben uns für eine Kombination entschieden: Cron als Default, Slash-Command für manuelle Re-Runs. Setup für beide zusammen ≈ 10 Minuten.

    2. Budget – wie viel darf die Rolle verbrauchen?

    Hier haben wir den ersten Fehler gemacht.

    Erster produktiver Run ohne Budget-Cap: Der Agent hat sich in einem CSS-getriebenen Loop verfangen (eine Domain hatte einen rotierenden Hash im DOM, den er fälschlicherweise als "echte Änderung" interpretiert hat) und ist 4× durch alle 8 Domains gelaufen, bevor er fertig war. Kosten: ca. 4× das geplante Budget.

    Konsequenz: Jede Rolle bekommt jetzt drei Budget-Grenzen:

    Grenze Was passiert beim Erreichen
    Soft-Limit (80 %) Slack-Notification an Owner
    Hard-Limit (100 %) Run wird abgebrochen, Owner wird informiert
    Daily-Cap (Σ pro Tag) Verhindert "viele kleine Runs" Overrun

    Klingt nach Boring-Engineering. Ist es auch. Aber es ist der Unterschied zwischen "läuft in Prod" und "darf nicht in Prod".

    3. Permission-Scope – was darf die Rolle?

    Der wichtigste Hebel für Trust. Wir haben für unsere Rolle:

    • Read auf 8 spezifische Domains (whitelist)
    • Read auf unseren internen Snapshot-Storage
    • Write in einen dedizierten Slack-Channel (#competitor-intel)
    • Kein Zugriff auf Email, CRM, andere Slack-Channels
    • Kein Zugriff auf "execute code" (auch wenn der Skill es theoretisch könnte)

    Das Schreiben dieses Scopes hat uns gezwungen, eine Frage zu beantworten, die wir bei "klassischen" Automations selten so klar stellen: Was wäre der maximale Schaden, wenn diese Rolle gehackt oder fehlerhaft ist?

    Antwort hier: ein Spam-Post in einem Channel. Akzeptables Risiko. Deploy.

    4. Owner – wer ist verantwortlich?

    Klingt trivial, ist es nicht. Eine Rolle ohne Owner ist ein Geist im System – läuft, funktioniert, aber niemand kümmert sich, wenn sie kippt.

    HyperAgent zwingt dich, einen Owner zu setzen. Der Owner bekommt:

    • Alle Soft/Hard-Limit Notifications
    • Wöchentliche Eval-Score-Reports
    • Failure-Alerts mit Trace-Link

    Bei uns: Eine Person aus dem Marketing-Team ist Owner, nicht jemand aus Engineering. Genau richtig. Die Rolle dient einem Marketing-Outcome – also gehört sie auch dorthin.

    Deploy: was tatsächlich passiert

    Mit den vier Bausteinen war der Deploy einfacher als erwartet:

    hyperagent deploy role competitor-watchlist
      --skill competitor-watchlist-scan
      --trigger cron:"0 9 * * MON" 
      --trigger slack-command:/watchlist-scan
      --budget soft=80% hard=100% daily=USD-15
      --scope from scope.yaml
      --owner marketing-team

    (Das CLI ist optional, im Studio macht man dasselbe per Click.)

    Nach dem Deploy: ein Dashboard-Card im Fleet-Overview mit Status, letztem Run-Score, Cost-Burndown und Permission-Audit-Log.

    Erster autonomer Lauf

    Montag 09:00, ohne dass jemand am Rechner saß:

    • Trigger feuert
    • Run startet, läuft 4 Min 12 Sek
    • Slack-Post kommt automatisch in #competitor-intel
    • Eval-Score: 89 % (vs. 78 % beim manuellen Run aus Field Notes #1)

    Warum besser? Weil wir zwischen Field Notes #1 und #2 zwei kleine Skill-Updates gemacht haben (Cookie-Banner-Handling + besserer "Real Change"-Filter), und das Eval-Rubric uns objektiv gezeigt hat, dass beide Updates positiv waren.

    Das ist der Loop, den wir in Field Notes #1 versprochen haben. Er funktioniert.

    Drei Erkenntnisse aus Tag 2

    1. Skill ohne Rolle ist eine Demo. Rolle ohne Skill geht nicht.

    Beides braucht's. Aber die echte Arbeit liegt im Skill, die echte Reife in der Rolle. Teams, die nur Skills bauen, haben am Ende eine Sammlung von beeindruckenden Demos. Teams, die Rollen bauen, haben eine Belegschaft.

    2. Budget-Limits sind kein Nice-to-have

    Wer ohne Hard-Cap deployed, lernt es irgendwann teuer. Lieber einmal den 4×-Schmerz gehabt und dann nie wieder.

    3. Owner-Frage entscheidet, ob eine Rolle überlebt

    Eine Rolle ohne klaren Owner wird in 6 Wochen entweder still abgeschaltet oder produziert Müll, den keiner liest. Owner = Überlebensgarantie.

    Was als Nächstes kommt

    In Field Notes #3 geht's um den Sprung von einer Rolle zu einem Fleet – also wie man mehrere Rollen so orchestriert, dass sie sich gegenseitig nicht in die Quere kommen. Spoiler: Dort wird das Concept "Agent-Swarm" plötzlich praktisch relevant.

    Field Notes #1: Setup & erster SkillField Notes #3: Von der Rolle zur FleetHyperAgent Tool-ÜbersichtHyperAgent Vollständiges ReviewAgent-Swarm-Architekturen im VergleichAgentic Engineering – wie wir Teams begleiten

    TeilenLinkedInWhatsAppE-Mail

    Verwandte Artikel

    HyperAgent Fleet-Dashboard mit Skill-Cards und Eval-Rubrics
    26. April 20263 min

    HyperAgent Field Notes #1: Setup, erster Skill und die Lektion aus Tag 1

    Wir sind Closed-Beta-Partner bei HyperAgent. Erste Notiz aus der Praxis: was in den ersten 60 Minuten passiert, welcher …

    Weiterlesen
    HyperAgent Fleet aus mehreren orchestrierten Agent-Rollen mit zentraler Koordination
    26. April 20266 min

    HyperAgent Field Notes #3: Von der einzelnen Rolle zur Fleet

    Aus einer produktiven Rolle werden drei. Und plötzlich ist die spannende Frage nicht mehr „funktioniert die Rolle?", son…

    Weiterlesen
    Wettbewerbslandschaft der Agent-Plattformen mit HyperAgent im Zentrum und Globster, Manus, Lindy und monday agent labs als MitspielerDeep Dive
    27. April 202613 min

    HyperAgent Competitors 2026: Wer spielt in derselben Liga – und warum Globster verdächtig ähnlich aussieht

    HyperAgent ist nicht alleine. Globster sieht im Interface verdächtig ähnlich aus, Manus geht den autonomen Solo-Weg, Lin…

    Weiterlesen
    HyperAgent AI Agent Fleet Management Dashboard mit autonomen Agenten
    10. März 20264 min

    HyperAgent Review 2026: Die Agent-Plattform für Teams, die KI skalieren wollen

    HyperAgent verspricht die komplette Plattform für AGI-level Agents – Skills, Fleet Management, A/B-Testing. Wie schlägt …

    Weiterlesen
    Gumloop Review 2026: KI-Agenten und Workflows ohne Code
    13. März 20264 min

    Gumloop Review 2026: KI-Agenten und Workflows ohne Code

    Gumloop kombiniert KI-Agenten mit visueller Workflow-Automatisierung – ganz ohne Code. Was die Plattform kann, was sie k…

    Weiterlesen
    Architektur-Diagramm der 5 Bausteine eines KI-Agenten: Runtime, Channels, Memory, Tools und Self-Scheduling
    10. März 20265 min

    Die 5 Bausteine eines KI-Agenten – Was wirklich unter der Haube steckt

    Anthropic, AWS und Google haben ihre Agent-Frameworks veröffentlicht. Aber was braucht ein KI-Agent wirklich? 5 Baustein…

    Weiterlesen
    Illustration zur Verschmelzung von Marketing und Software-Engineering mit Git-Versionskontrolle
    10. März 20265 min

    Git für Marketing-Teams – Warum euer AI-Stack Versionskontrolle braucht

    Euer Marketing-Team nutzt KI-Agenten, Prompts und Automatisierungen? Dann braucht ihr Git. Ein Praxis-Guide für den Umst…

    Weiterlesen
    Autonomer KI-Agent Manus AI orchestriert mehrere Aufgaben gleichzeitig
    7. März 20264 min

    Manus AI Review 2026: Was der autonome KI-Agent wirklich kann – und wo die Grenzen liegen

    Manus AI verspricht autonomes Arbeiten ohne Babysitting – Code schreiben, Web-Recherche, Datenanalyse. Wir haben den KI-…

    Weiterlesen
    KI-Agenten-Ökosystem mit vernetzten Knoten und holographischer Gehirn-Visualisierung
    7. März 20264 min

    Persönliche KI-Assistenten 2026 – Marktüberblick, Frameworks & was wirklich funktioniert

    Von Manus AI über Lindy bis Viktor – der Markt für persönliche KI-Agenten explodiert. Wir ordnen das Ökosystem in drei K…

    Weiterlesen