Arbeit mit KI-Agenten: Lass uns ein Skript erstellen!
Meine KI-Nutzung verlagert sich immer weiter weg von einer klassischen Chatbot-Oberfläche im Browser und hin zu Modellen, die gemeinhin als KI-Agenten bezeichnet werden – und wozu ich inzwischen zum Glück auch Wege gefunden habe, sie mit weniger direkter Plattform-Abhängigkeit zu nutzen.
Der wesentliche Unterschied bei KI-Agenten zu klassischen KI-Chatbots ist für mich, dass ich KI-Agenten direkten Zugriff auf Ordner und Anwendungen auf meinem Gerät geben kann – und auf diese Weise nicht innerhalb einer Chatbot-Oberfläche etwas erstellt und gestaltet wird, sondern direkt dort, wo ich es dann auch nutzen will. Für meine Arbeit bedeutet das, dass das KI-Tool weniger Sparringpartner in dem Sinne ist, dass ich einen ersten Output für einen konkreten Inhalt bekomme und dann immer weitere Vorschläge mache und dementsprechend nachprompte, sondern vielmehr ein meist umfangreicheres Projekt generiert wird, an dem ich dann innerhalb meiner üblichen Programme (z. B. einem Textverarbeitungsprogramm) weiterarbeite.
Bei der Gestaltung eines Moodle-Kurses für Ehrenamtliche, die in der Kirchenverwaltung in Bayern aktiv sind, ist mir nun bewusster geworden, dass und wie KI-Agenten auf sehr andere Art und Weise Inhalte erstellen, als wie ich das tue. Das hat Folgen für die Art und Weise einer sinnhaften und mündigen Nutzung. Der KI-Weg lässt sich zusammenfassen mit: „Ich erstelle da ein Skript dafür!“
Vom Chat zur Skripterstellung
Ein Skript ist ein Mini-Programm, das eine bestimmte Funktion ausführt. Also zum Beispiel:
Ich habe einen Ordner, und in diesem Ordner liegen 50 Bilder, die völlig zufällig und oft recht kompliziert benannt sind. Ich will diese Bilder nun für eine Website nutzen. Dafür möchte ich gerne einfache Namen verwenden können, also so etwas wie 1.jpg, 2.jpg usw.
Früher hätte ich mich an dieser Stelle hingesetzt und wäre einmal durch den ganzen Ordner gegangen und hätte manuell jedes einzelne Bild angeklickt und umbenannt. Ich denke, dass die meisten Menschen, die nicht programmieren können, so vorgehen oder zumindest vor dem Aufkommen von KI-Agenten so vorgegangen sind. Für Menschen, die programmieren können, war das wahrscheinlich schon immer anders. Ich erinnere mich an viele Zusammenarbeiten in eher nerdig-technisch geprägten Räumen, bei denen ich bei aufkommenden Herausforderungen oft und ganz genauso hörte: „Ich erstelle da schnell ein Skript dafür!“ Ich dachte dann meist: „Was für ein Aufwand; das lässt sich doch auch so schnell erledigen“ – vor allem, wenn es kompliziertere Sachen waren und ich den Eindruck hatte, dass die Skript-Erstellung so viel länger dauerte, als es direkt selbst zu machen. Zugleich fand ich es aber auch bewundernswert, denn wenn das Skript dann lief, war es natürlich super nützlich und ich kam damit sehr viel schneller voran.
Ein Kollege programmierte mir z. B. vor einiger Zeit ein Skript für meine Kartentausch-Anwendungen. Die Funktion ist hier, dass es x Aussagen zu einem Thema gibt – und daraus wird dann für jede Aussage eine statische HTML-Seite nach einem bestimmten Muster generiert. Gerade weil ich hier immer wieder weitere solcher Kartentausch-Websites nach dem gleichen Muster erstellen will, erspart mir solch ein Skript natürlich jede Menge Zeit.
In der Interaktion mit agentischer KI ist die Skript-Erstellung der Standard – und zwar, ohne dass ich das bewusst vorschlage. Deutlich wurde mir das bei der Erstellung des erwähnten Moodle-Kurses: Ich hatte mir hier sechs Kacheln überlegt, die jeweils eine andere Hauptfarbe haben sollten. Die Kacheln selbst sollten ein Tab-Format haben, wobei jede Seite (im Interesse von Übersichtlichkeit) identisch aufgebaut sein sollte: mit einem Header-Bereich, dazwischen die Inhalte, die jeweils anders sind, dann einer kurzen Zusammenfassung und unten Vorwärts-Buttons, um in die jeweils anderen Bereiche zu gelangen.

Meine Annahme war, dass das KI-Tool die dafür benötigten HTML-Codes einfach nacheinander generiert. In der Terminal-Oberfläche konnte ich aber nachverfolgen, dass stattdessen ein Skript erstellt wurde – und nachdem das Skript da war, waren dann auch sofort alle benötigten HTML-Dateien da. Zusätzlich erhielt ich den Hinweis, dass wir im Skript natürlich jederzeit Farben oder Design anpassen könnten, wenn es doch anders sein sollte. Dann wäre es möglich, direkt andere Dateien zu generieren.
Warum sollte ich wissen, was unter der Haube passiert?
Für den generierten Output macht diese Art der Generierung erst einmal natürlich keinen Unterschied. Am Ende sind die benötigten HTML-Dateien da, und ich kann damit weiter an dem Kurs arbeiten. Trotzdem habe ich noch weiter darüber nachgedacht. Ich kam zu dem Schluss, dass ich es hilfreich finde, zu wissen und zu verstehen, dass „unter der Haube“ von agentischer KI in der Regel Skripte erstellt werden, mit denen das Tool dann weiterarbeitet.
Drei Gründe finde ich dazu wichtig.
1. Entmystifizierung
Die Kenntnis dieser Funktionsweise trägt zur Entmystifizierung der Technologie bei. Denn mit der Erklärung eines „stochastischen Papageis“ kommt man bei solch einer Skript-Ausführung tatsächlich nicht mehr weiter. Stattdessen laufen neben der Wahrscheinlichkeitsberechnung auf Basis der trainierten Daten der Large Language Models eben dann auch andere Programme in einer KI-Oberfläche, die dann nichts mehr mit Wahrscheinlichkeitsberechnung zu tun haben, sondern bestimmte Anweisungen regelbasiert ausführen. Das Wissen darüber macht es nachvollziehbarer, wie ein bestimmter Output entsteht.
2. Gemeinwohlorientierung
Das Wissen über die Funktionsweise wirft zweitens die Frage nach dem Ursprung der Skripte auf. In vielen Fällen wird hier sicher ad hoc ein Skript erstellt. In vielen anderen Fällen werde ich aber auch nach einer Freigabe gefragt, um eine bestimmte Anwendung auf meinem Gerät zu installieren – z. B. ein Tool, das Text aus Bildern auslesen kann, wenn ich beim obigen Beispiel der Bilder-Umbenennung so prompte, dass die Bildernamen nicht 1–50 sein sollen, sondern jeweils der Begriff, der im Bild links oben in der Ecke steht …
Dieses Wissen bringt einen dann mitten in das Paradox, dass insbesondere Open-Source-Software mit dieser Art der Gestaltung in einem monopolisierten Plattform-KI-System angeeignet und ökonomisch verwertet wird, während die menschliche Arbeit, die dahinter steckt, unsichtbar bleibt und die bisherigen Credit- und auch Weiterentwicklungsmöglichkeiten (z. B. ein Spendenbutton beim Download, ein Repository, um Fehler zu melden und gemeinsam daran zu arbeiten …) wegfallen. Zugleich schimmert auch durch, dass es durchaus sehr cool sein könnte, wenn diese grundsätzliche Möglichkeit gemeinwohlorientiert genutzt würde – und so gestaltet wäre, dass unsere digitale Allmende nicht ausgebeutet, sondern genährt wird. Und es fordert einen heraus, sich zu überlegen, wo ein Skript und damit eine Automatisierung eben ganz bestimmt keine Lösung sein kann, weil wir es z.B. mit einer komplexen und lebendigen Herausforderung zu tun haben, die sozialen Austausch, Entwicklung und Lernen und nicht Automatisierung braucht.
3. Gezieltere Nutzung
Drittens ermöglicht das Wissen über die Funktionsweise natürlich eine sehr viel gezieltere Nutzung der Technologie. Denn ich kann dann nicht einfach nur beschreiben, was ich möchte, sondern – wenn ich mitdenke, wie es vermutlich umgesetzt wird – sehr viel präziser beschreiben und prompten. Und mir ist dann auch viel klarer, was sich gut automatisieren lässt und was eben gar nicht.
Im Kern geht es also auch hier um Mündigkeit: Ich bin weniger Konsumentin des Tools und füttere eine Black Box mit meinen Wünschen füttert und hoffe auf ein gutes Ergebnis. Stattdessen reflektiere ich, wann, wie und ob ich eine Aufgabe an das Tool delegiere – und ich behalte besser die Kontrolle über das, was dabei herauskommt.
Ein Beispiel: Beim Moodle-Kurs habe ich mich mit den fertigen HTML-Dateien zufriedengegeben können. Wenn ich nun aber verstanden habe, dass im Hintergrund ein Skript erzeugt wird, könnte nun noch ich gezielt nach genau diesem Skript fragen, es speichern und die Farben der sechs Kacheln später selbst anpassen – ohne für jede kleine Änderung erneut die KI bemühen zu müssen. Ich bin dann nicht mehr bei jedem Schritt vom Tool (und dem dahinterstehenden Anbieter) abhängig, sondern baue mir ein wiederverwendbares Werkzeug auf. Das eröffnet dann auch die Perspektive, nicht nur KI-generierten Output zu teilen, sondern vor allem auf solch einer Meta-Ebene auch zu teilen, was es ermöglicht, so etwas zu erstellen, also die generierten Skripte. (Bei kleineren Anwendungen kann das auch Quatsch sein, weil das wahrscheinlich besser direkt und spezifisch passend erstellt wird. In vielen weiteren Fällen erscheint es mir im Sinne einer achtsamen Ressourcennutzung stimmiger)
Fazit
Gerade bei agentischer KI finde ich es sehr lohnend und wichtig, Digitalisierung als Lerngegenstand aufzugreifen und in somit zu reflektieren, was unter der Haube passiert. Sowohl individuell als auch gesamtgesellschaftlich eröffnet das die Frage, welche Art der KI-Nutzung stimmig und sinnhaft ist für ein gutes Leben für alle und welche Regeln wir dazu entwickeln wollen. Und auch, wo technische Lösungen keine wünschenswerte Perspektive sind, sondern es soziales Lernen, statt immer mehr ungerichtete Effizienz, braucht.
#KünstlicheIntelligenzKI