Skip to main content

Workforce-Betrieb

Runbook für das Task-Ops-Automatisierungspaket — Rollout-Wellen, Kill-Switch, Symptom→Aktion-Tabelle und wohin schauen, wenn die Agenten-Automatisierung klemmt.

2 min read

Die Operator-Seite der KI-Workforce-Automatisierung. Die Produkt-Oberflächen liegen in der App (Agenten → Workforce ist die operative Zentrale); diese Seite behandelt Rollout, Kill-Switch und Diagnose.

Rollout-Wellen

Das Paket wird pro Organisation mit klebrigen Opt-outs ausgerollt (Org-Änderungen gewinnen immer; ein erneuter Lauf reaktiviert keine von Admins deaktivierten Trigger):

  1. Welle 0 — Dogfood: für eine interne Organisation aktivieren (provisioning/provision_task_ops_pack mit Aktivierung), eine Woche die Workforce-Gesundheitsleiste beobachten. Exit: null unquittierte Automatisierungs-Fehler.
  2. Welle 1 — ausgerollt, aus: alle Organisationen erhalten das Paket inaktiv; Admins aktivieren selbst über den Workforce-Hauptschalter. Exit: Gesundheitsleiste 72 h sauber über die aktivierten Orgs.
  3. Welle 2 — standardmäßig an: Standard-Aktivierung für Organisationen, die nie umgeschaltet haben.

Der Kill-Switch

Zeit bis Ruhe: unter zwei Minuten. Den Hauptschalter auszuschalten (Agenten → Workforce, nur Admins, auditiert) — oder die Operation workflows/ops/disable_task_ops_pack auszuführen — bewirkt zweierlei: alle Pack-Trigger werden deaktiviert (der Scheduler scannt sie nicht mehr) und der Ausführungspfad selbst wird gesperrt (task_automation-Richtlinie), sodass auch bereits eingereihte Ereignisse keine Agenten-Arbeit mehr starten. Laufendes endet; Neues startet nicht.

Verifikation: die Workforce-Seite zeigt Automatisierung aus; neue Zuweisungen erzeugen keinen Bestätigungs-Kommentar; [TaskOpsKillSwitch] erscheint in den Backend-Logs.

Symptom → Aktion

SymptomWahrscheinliche UrsacheAktion
Agenten-Aufgaben tun nichtsAutomatisierung aus oder Pack-Trigger inaktivWorkforce-Schalter; Automatisierungen → tasks/…-Trigger prüfen
Arbeit hängt > 24 h In ArbeitAgenten-Lauf gestorben; Stale-Sweep rollt zurückLauf-Historie der Aufgabe prüfen; der stündliche Sweep stellt auf Zu erledigen zurück
Agent verweigert jeden LaufBudget-Pause oder SicherungWorkforce → Aufmerksamkeits-Warteschlangen; Budget erhöhen oder Status als Mensch ändern
Reviews stapeln sichReviewer übersehen den PosteingangReview-Erinnerungen eskalieren automatisch nach 4 h / 24 h; Posteingangs-Einstellungen prüfen
Externe Läufe scheitern stets mit runtime_offlineKein Daemon für den Adapter onlineEinstellungen → API → Runtimes: Daemon-Status; tale daemon status auf der Maschine
Digest meldet capped-ZahlenSehr aktiver Tag traf eine Scan-GrenzeZahlen sind Untergrenzen; keine Aktion nötig

Wohin schauen

  • Logs: stabile Klammer-Präfixe — [AgentTaskRun], [ExternalRuns], [WorkforceRollup], [TaskOpsKillSwitch], [RetentionCleanup] — mit key=value-Feldern. Prompt-Inhalte werden nie geloggt.
  • Spur pro Aufgabe: die Lauf-Historie im Aufgaben-Detail verlinkt jeden Lauf mit seiner Automatisierungs-Ausführung.
  • Datenlebenszyklus: Laufdaten folgen der Retention-Kategorie agentRuns (Standard 180 Tage, org-einstellbar 30–400); Aggregate werden fix nach 400 Tagen entfernt; Review-Entscheidungen überleben eine Betroffenen-Löschung pseudonymisiert.

© 2026 Tale by Ruler GmbH — ISO 27001 & SOC 2 certified.

Tale is MIT licensed — free to use, modify, and distribute.