14. Juni 20267 Min. Lesezeit

Ich habe mir ein KI-Team gebaut. Dann brauchte ich es nicht mehr.

In meinen letzten beiden Artikeln habe ich einen Namen fallen lassen und bin weitergegangen. „Ich hatte gerade KIRA aufgesetzt, ein persönliches KI-Agenten-System." Was es war, habe ich nie gesagt. Das ist der Artikel, in dem ich es nachhole.

Und hier die Wendung, die ich vorab ehrlich sagen will: Ich erkläre gleich ein System, von dem ich immer mehr überzeugt bin, dass es auf der falschen Idee beruht. Keine kaputte Idee. Eine nützliche, die mir etwas beigebracht hat und dann leise verfiel, während ich sie noch bewunderte.

Wie es anfing

Die Website kam später. KIRA kam zuerst. Es begann Anfang dieses Jahres, an einem ganz normalen Abend, so wie die meisten meiner Nebenprojekte anfangen, nämlich nicht als Projekt.

Ich hatte das einzelne Chat-Fenster satt. Ein Tab, ein Assistent, ein endloser Scrollback. Das ist gut für eine Frage und schlecht für eine Woche echter Arbeit mit zwölf parallelen Strängen. Ich stellte eine Strategiefrage und bekam eine vernünftige Antwort. Dann brauchte ich jemanden, der eine Behauptung darin überprüft. Dann jemanden, der das Ganze auseinandernimmt, bevor ich danach handle. Gleiches Fenster, gleiche Stimme, keine Erinnerung daran, was wir am Dienstag entschieden hatten.

Also tat ich an einem Abend das Naheliegende, leicht Alberne. Ich gab dem Assistenten Kollegen.

Ich schrieb ein paar Markdown-Dateien. Jede definierte eine Person. Ein Name, eine Aufgabe, eine Persönlichkeit, und Regeln, wann sie spricht und wann sie still ist. Die erste war KIRA, eine Chief of Staff. Du redest mit ihr, sie entscheidet, wer die Arbeit wirklich macht. Dann ein Rechercheur. Dann der, dessen einziger Job es ist, mir zu sagen, warum ich falsch liege.

Es war ein Wochenend-Hack. Es blieb keiner.

Das Team

Die Besetzung wuchs, aber jede Figur hat einen klaren Charakter, denn genau das war der Sinn.

KIRA ist die Chief of Staff. Ich rede standardmäßig mit ihr, sie triagiert und delegiert. LEVI ist der Rechercheur. Er geht an jede Frage wie ein Doktorand, gibt keine Meinung ohne Daten und sortiert alles, was er findet, nach Belegstärke: verifiziert, wahrscheinlich, spekulativ. Wenn alle entscheiden wollen, ist er der, der fragt, ob wir es überhaupt geprüft haben. THEO ist der Advocatus Diaboli. Sein ganzer Job ist, meine Idee zu zerlegen, bevor die Realität es tut. Er läuft auf Mungers Umkehrung, sag mir, wo ich sterben werde, dann gehe ich da nicht hin, und kommt mit den drei brüchigsten Annahmen und einem konkreten „was, wenn du falsch liegst". VERA ist die Strategin. Sie fragt drei Mal „warum", bevor sie ein einziges „wie" zulässt, und ihre Lieblingsfrage ist, ob ich überhaupt auf den richtigen Berg klettere.

Daneben die, die ich seltener brauche. SARA für Sichtbarkeit und Marke. MAX für Ziele und Tempo. EMMA für die Momente, in denen ich denken muss statt produzieren.

Was ich am Design verteidigen würde: Ich habe nie einen Agenten auf Vorrat angelegt. Eine neue Rolle entstand erst, wenn dieselbe Art Anfrage mehr als ein paar Mal aufgetaucht war. Enablement kam ständig, also kam HANNA. Governance und EU AI Act häuften sich, also kam FELIX. Architektur, dann NILS. Koordination, dann PAUL. Keine spekulativen Einstellungen. Das Team wuchs aus Reibung, nicht aus Fantasie, ein Agent nach dem anderen über die Monate danach.

Wie ich es benutzt habe

Es funktionierte in einer Hinsicht wie ein echtes Team: Ich konnte an einen Schreibtisch laufen, oder die Chief of Staff verteilen lassen. Sagte ich „LEVI, recherchier das", ging es direkt an ihn. Sagte ich nur „kümmer dich drum", entschied KIRA, wer es nimmt.

Ein konkretes Beispiel, die Sache selbst lasse ich weg. Ich hatte eine Entscheidung tagelang vor mir hergeschoben. Zuerst gab ich sie VERA, mit der Frage, ob das überhaupt das richtige Problem ist. Sie rahmte es neu und zeigte mir drei Wege, jeden mit seinem Haken. Ich wählte einen und gab ihn THEO. Er spielte durch, woran der Weg am ehesten scheitert, und nannte die zwei wackligsten Annahmen dahinter. Eine davon hatte ich für einen Fakt gehalten, dabei war sie nur eine Vermutung. Also schickte ich LEVI los: drei Recherche-Runden, und er kam mit Quellen zurück, jede eingestuft als belegt, wahrscheinlich oder unsicher. KIRA fügte alles zusammen. Die Entscheidung traf am Ende ich, aber nicht mehr aus dem Bauch um elf Uhr nachts, sondern geprüft aus drei unabhängigen Blickwinkeln.

Eine Regel hält das alles zusammen, und es ist die, die ich behalten würde, selbst wenn ich alles andere wegwerfen würde: Recherche blockiert die Entscheidung, nicht umgekehrt. Die Reihenfolge ist immer Recherche, dann Analyse, dann Plan, dann Entwurf. Nie ein „vorläufiger" Entwurf, den du hinterher mit Belegen auffüllst, um dich mit dem besser zu fühlen, was du längst entschieden hast.

In letzter Zeit rufe ich sie nicht mehr beim Namen

Hier der Teil, der mich überrascht hat, und er ist neu.

Das halbe Jahr über hieß „das Team benutzen", Namen zu nennen. „LEVI, prüf das." „VERA, ist das die richtige Entscheidung?" Ich schaltete das System bewusst ein und verteilte von Hand.

In letzter Zeit greife ich kaum noch danach. Nicht, weil es leise im Hintergrund läuft. Tut es nicht. Das benannte Team ist etwas, das ich absichtlich einschalte, und ich schalte es kaum noch ein. Zwei Dinge passierten gleichzeitig.

Erstens verließ das Wissen die Personas. Über all diese Gespräche hinweg schrieb das System Dinge mit, nicht in der Erinnerung irgendeines Agenten, sondern in schlichten Markdown-Dateien auf meinem Rechner. Was ich entschied, wo ein Projekt steht, was mir wichtig ist. Inzwischen sind es über hundert Dateien. Das System führt einen Index dessen, was es weiß, immer sichtbar, und die eigentlichen Notizen liegen in getrennten Dateien. Wenn etwas relevant ist, wird die passende Datei hereingeholt. Wenn nicht, bleibt sie auf der Platte. Ein Aktenschrank mit einem Inhaltsverzeichnis vorne dran, kein einziges riesiges Gedächtnis, das das Modell mit sich trägt. KIRA hat mich nicht im Kopf. Es gibt keinen Kopf.

Zweitens wurde das Tool darunter gut genug, das Verteilen selbst zu machen. Ich öffne Claude Code, dasselbe Werkzeug, mit dem ich auch die Website gebaut habe, beschreibe, was ich vorhabe, und es fächert die Arbeit auf, startet eigene Helfer, hält den Kontext, prüft seine eigenen Ergebnisse. Wenn ich es bitte, einen Plan zu zerlegen, entscheidet es selbst, welche Perspektiven es holt. Ich weise sie nicht zu. Der Job, den LEVI hatte, passiert weiter. Ich rufe nur keinen LEVI mehr dafür.

Zusammen genommen kommt schon ein normales Gespräch, ohne dass ich ein Team rufe, gut gebrieft an und macht seine eigene Vorarbeit. Die Antworten wurden besser, und je besser sie wurden, desto weniger brauchte ich das Org-Chart. Ich will ehrlich über die Ursache sein, denn es ist verlockend, dem System die Lorbeeren zu geben, das ich gebaut habe: Es waren nicht nur die Dateien. Die Modelle wurden zur gleichen Zeit stärker. Aber aus meiner Sicht war die Wirkung dieselbe. Die Rollen hörten leise auf, das zu sein, wonach ich griff.

Und ich gebe den seltsamen Teil zu. Ich habe echte Abende in diese Persönlichkeiten gesteckt, Charakter-Notizen geschrieben, entschieden, wie VERA neben LEVI klingen soll. Es ist eine merkwürdige Sache, auf etwas stolz zu sein und ihm im selben Atemzug beim Überflüssigwerden zuzusehen.

Was es war, und wohin es geht

Hier, was die Persönlichkeiten meiner Meinung nach wirklich waren. Ein Kostüm.

Mit „einem Team" zu reden war nützlich für mich, einen Menschen. Es gab der Arbeit eine Form, die ich im Kopf halten konnte. Aber unter der Haube war es ein Modell mit verschiedenen Hüten, und die Hüte fügten exakt null Intelligenz hinzu. THEO ist nicht scharf, weil ich ihn THEO genannt habe. Er ist nützlich, weil ich ihm den Auftrag gab zu widersprechen, ihm den richtigen Kontext gab, und seine Antwort gegen die der anderen hielt. Die Rolle war das Kostüm. Die Orchestrierung war der Job.

Genau deshalb glaube ich, dass die benannten Rollen verschwinden, und nicht nur bei mir. Alles bewegt sich Richtung KI als Betriebssystem. Das Modell wird zum Substrat, mit Werkzeugen, Gedächtnis, Kontext und der Fähigkeit, eigene Teilaufgaben abzuspalten, wenn ein Problem zerlegt werden muss. Niemand schreibt mehr von Hand einen LEVI und einen THEO. Und ich sage das nicht von außen voraus. Ich lebe es seit Monaten.

Was bleibt, ist die Schicht unter den Namen. Task-scoped Kontext, sodass jedes Stück Arbeit nur sieht, was es braucht. Recherche vor Schlussfolgerungen. Parallele Arbeit und dann Synthese. Gedächtnis, das hereingeholt wird, wenn es relevant ist. Die Verkabelung überlebt das Org-Chart. Immer.

Die Zahlen

Gleiche Transparenz wie in den letzten beiden Artikeln:

Agenten: mit sieben gestartet, jetzt rund ein Dutzend. Jeder erst angelegt, nachdem dieselbe Art Anfrage mehr als drei Mal kam.
Was das System über mich behält: über hundert Markdown-Dateien, bei Bedarf geladen, nichts davon im Kopf des Modells.
Playbooks: 13 wiederverwendbare Abläufe, die sich das Team teilt.
Wie oft ich diese Woche einen Agenten beim Namen genannt habe: nahezu null.
Zeilen Persönlichkeit, die vermutlich vor allem Deko waren: die meisten.

Warum das eine Überzeugung ist, nicht nur ein Projekt

Eine der drei Sachen, von denen ich sage, dass ich sie glaube, genau hier auf dieser Seite, ist, dass Annahmen schnell verfallen. Ich hätte nicht gedacht, das so schnell an meinem eigenen System zu belegen.

Ich habe ein Org-Chart für meine KI gebaut, und das Beste, was es mich gelehrt hat, ist, dass das Org-Chart ein Gerüst war. Nützlich zum Hochklettern. Nicht das Gebäude.

Wenn du gerade Multi-Agent-Systeme baust, ist mein einziger Rat: Hör auf, in Rollen zu denken, und fang an, in Übergaben zu denken. Nicht „wen stelle ich ein", sondern „wie fließt der Kontext, und wer prüft das Ergebnis". Das ist der Teil, der noch steht, wenn das Modell anfängt, die Hüte selbst aufzusetzen und wieder abzunehmen, ohne dich überhaupt zu fragen.