Einführung und neue Automatisierungsphilosophie
Konnichiwa! Willkommen im AI Automation Dojo wo wir die harten Fragen stellen – zum Beispiel: Wenn KI so schlau ist, warum denkt Autokorrektur immer noch, dass „ducking“ eine brauchbare Alternative ist? Heute ziehen wir den Vorhang zurück bei UiPath Agents und UiPath Maestro (das dynamische Duo, das angeblich eure Roboterbelegschaft orchestriert oder dafür sorgt, dass eure digitalen Helfer keinen Aufstand planen).
Wir werfen einen Blick auf UiPath Agents: Sind sie wirklich unermüdliche digitale Mitarbeiter oder nur sehr sophisticated Tamagotchis, die man am Leben halten muss? UiPath Maestro – der große Dirigent des Roboterorchesters – oder eher wie ein gestresster Fluglotsen-Koordinator für Bits und Bytes?
Und die große Frage: Führt dieses Setup wirklich zu symphonischer Effizienz oder ist es nur ein Kakophonie mit einem schickeren Namen? Ich bin euer Gastgeber Andrzej Kinastowski, einer der Gründer von Office Samurai wo wir glauben, dass Bullshit keine Geschäftsstrategie ist – egal, wie viele Diagramme man dafür erstellt.
Wenn Sie jemals vermutet haben, dass Ihr intelligenter Agent dümmer als ein Haufen Steine ist, oder wenn Sie versuchen, den Maestro zu dirigieren, ohne dass die Puppe in eine Roboterrevolution ausbricht – dann sind Sie hier im richtigen Dojo gelandet. Ich muss sagen, als UiPath Ende letzten Jahres ankündigte, dass sie eigene Agenten haben werden, war ich ein wenig schockiert. Mein Begeisterungslevel (sagen wir mal so) schoss nicht gerade zum Mond. Aber dann wurden wir als einer der wenigen Partner für den Early Access ausgewählt. Natürlich haben wir einige unserer klügsten Samurai auf diese neuen Tools losgelassen, ihnen gesagt: „Lernt sie, bringt sie zum Absturz und berichtet zurück“. Ich muss sagen, ich bin im Allgemeinen angenehm (darf ich sagen) überrascht. Die Art, wie UiPath diese Agenten gestaltet und in den Rest ihrer Plattform integriert hat, ist wirklich sauber durchdacht, und ich verwende „sauber“ nicht leichtfertig.
Dabei geht es nicht nur darum, ein weiteres glänzendes Tool ins Technikarsenal zu stellen. Wir sprechen hier über eine ganze Automatisierungsphilosophie: eine gut geölte Maschine, in der AI-Agenten denken (bringen menschenähnliches Denken ein), Roboter und Integrationen handeln (führen Aufgaben mit dieser süßen, binären Präzision aus), Maestro orchestriert (wirkt wie ein Puppenspieler, der die Fäden zieht) und die Menschen führen, weil sie die finalen Entscheidungen treffen (irgendjemand muss der Erwachsene im Raum sein).
Erstellung von AI-Agenten in UiPath (Agent Builder)
Agenten-Funktionen: Prompts, Tools und Kontext
Schauen wir uns zuerst die Agenten an. Ein gutes Beispiel wäre ein Anti-Phishing-Agent, den man in vielen verschiedenen Automatisierungen einsetzen kann, wenn sie mit einer E-Mail beginnen. Im UiPath Agent Builder gibt es die Felder, die man beim Erstellen eines AI-Agenten erwartet: einen Namen, eine Beschreibung und ein langes System-Prompt. Dieses System-Prompt enthält viele Informationen, viele Regeln und kann von Ihnen selbst geschrieben werden, aber Sie können auch GenAI nutzen, um ein gutes Prompt zu erstellen. Es ist ziemlich interessant, wie KI uns bereits beim Programmieren anderer KIs unterstützt.
Wir haben ein User-Prompt, das dem Agenten sagt, welche Eingaben er erwarten kann, aber das wirklich agentische Element sind die Tools. In den Tools kann man viele verschiedene Dinge verbinden. UiPath stellt bereits vorbereitete Activities bereit, die man nutzen kann, um sich mit unterschiedlichen Diensten und Anwendungen zu verbinden. Außerdem gibt es Prozesse. Jeder Prozess, den Sie im Orchestrator veröffentlicht haben, kann vom Agenten aufgerufen werden. Wenn der Agent zusätzliche Informationen benötigt, kann er einen Prozess starten. Der Prozess wird ausgeführt, der Agent übergibt die Parameter, der Prozess läuft und gibt dann die Daten wieder an den Agenten zurück. Das bedeutet im Grunde, dass der Benutzer viele verschiedene Werkzeuge zur Verfügung hat, um Daten abzurufen oder in Systeme einzugeben.

Außerdem kann ein Agent einen anderen Agenten aufrufen. Man kann also eine Art Inception-Szenario erstellen, bei dem ein Agent einen anderen Agenten, der auf etwas anderes spezialisiert ist, eine Frage stellt und dann Feedback zurückbekommt. Die Möglichkeit, Tools zu einem AI-Agenten hinzuzufügen, ist bereits ein großer Gewinn. Wenn Sie bereits viele verschiedene Prozesse für Ihre Organisation erstellt haben – groß und klein, attended oder unattended – können Sie diese mit einem Agenten verbinden.
Natürlich gibt es auch Kontexte. Das ist das Wissen, das Sie in ein AI-Tool einbringen können. Sie legen einige Dokumente in einen Storage-Bucket in Ihrem Orchestrator und können diesen Storage-Bucket als Kontext für einen bestimmten Agenten festlegen. Das bedeutet, dass der Agent die Informationen aus diesen Dateien kennt und sie bei seiner Arbeit berücksichtigt.
Sicherheit und Eskalationen (Human-in-the-Loop)
Dann haben wir Eskalationen. Eine Eskalation bedeutet im Grunde, dass Sie Bedingungen festlegen, wann der Agent keine Entscheidung treffen, sondern stattdessen einen Menschen die finale Entscheidung treffen lassen soll. Bei einem Anti-Phishing-Agenten bedeutet das zum Beispiel: Wenn der Agent sich nicht sicher ist, ob eine E-Mail Phishing ist, fragt er wörtlich einen Menschen. Er erstellt eine Action im Action Center, und ein menschlicher Operator schaut sich die E-Mail an und entscheidet, ob es sich tatsächlich um Phishing handelt oder nicht. So wird ein Mensch in den Prozess eingebunden und wir behalten die Kontrolle darüber, was die Agenten tun.

Herausforderungen und Methodik zum Testen von Agenten
Wie üblich bei Agenten kann man den Agenten während des Aufbaus testen. Wir haben ein Fenster, in dem wir ein Prompt ausführen können. Wenn ich als Eingabe zum Beispiel den Text einer E-Mail eingebe: „Ich bin ein äthiopischer Prinz und möchte Ihnen 1 Million Dollar senden“, wird der Agent dies analysieren und mir sagen, dass es sich tatsächlich um Phishing handelt. Außerdem gibt er eine Variable aus, die angibt, dass wir diese E-Mail nicht weiterverarbeiten sollten.
Das Erstellen von Agent-Prompts ist relativ einfach und geht schnell. Die Herausforderung liegt jedoch immer im Testen, denn da diese Algorithmen nicht deterministisch sind, können sie verschiedene Ergebnisse liefern. Jedes Mal, wenn man etwas im Prompt ändert, kann das unvorhergesehene Konsequenzen haben. Wenn man manuell testet, hat man die Möglichkeit, diesen speziellen Fall in den Evaluationssatz aufzunehmen. Jedes Mal, wenn man etwas am Agenten ändert, kann man alle Tests ausführen, um zu überprüfen, ob die Ausgaben weiterhin den Erwartungen entsprechen.

LLM als Richter
Dieser Mechanismus nutzt das, was wir „LLM als Richter“ nennen. Wir brauchen das, weil die Ausgaben eines AI-Agenten nicht unbedingt etwas sind, das wir einfach schnell mit den erwarteten Ergebnissen vergleichen können. Häufig erhalten wir zum Beispiel einen E-Mail-Text, der zwar jedes Mal die gleichen Informationen enthält, aber anders formuliert ist. Man benötigt ein LLM, um tatsächlich ein Urteil zu fällen: Entspricht die Ausgabe im Inhalt der erwarteten Antwort, nicht, ob sie zeichenweise identisch ist.
Natürlich haben wir auch Traces. Für jeden Lauf eines Agenten können wir detaillierte Informationen einsehen: was hineingegangen ist, was herausgekommen ist, welche Parameter verwendet wurden und wie viel Zeit der Agent mit „Denken“ verbracht hat.
Agenten in der klassischen Automatisierung
Wir können diese Agenten innerhalb unserer normalen Automatisierungen verwenden. Häufig haben wir eine Automatisierung, die an einem bestimmten Punkt ein Urteil benötigt, das Logik verwendet, die sich nicht einfach in viele If-Bedingungen packen lässt. Ihre klassischen Automatisierungen können also einen Agenten aufrufen, ihm eine Informationsmenge übergeben und dann das Urteil vom Agenten zurückbekommen. Das kann etwas Einfaches sein, wie die richtigen Informationen aus einer E-Mail zu extrahieren, aber es kann auch wesentlich komplexer sein.
Man kann sich einen Agenten vorstellen, bei dem Ihre Automatisierung die Anfrage erhält, einen Kunden oder Lieferanten in Ihren Datenbanken anzulegen. Der Agent nutzt Tools, um die Informationen aus verschiedenen Systemen zu holen (viele davon außerhalb Ihres Unternehmens) und verwendet dann seine Urteilsfähigkeit, um uns zu sagen, ob es in Ordnung ist, mit diesem Unternehmen zu arbeiten, oder ob vielleicht ein Mensch einen Blick darauf werfen sollte, weil der Algorithmus Dinge erkennt, die irgendwie verdächtig wirken. Agenten in Ihre klassischen Automatisierungen einzubinden, könnte hier der richtige Weg sein.
Maestro: Orchestrierung langer und komplexer Prozesse
Die agentische Automatisierung von UiPath geht weit darüber hinaus. Am meisten beeindruckt hat mich der Teil, den sie früher Agentic Orchestration nannten (jetzt heißt es Maestro; UiPath, falls ihr zuhört, ich fand den alten Namen besser). UiPath Maestro ist im Grunde eine Methode, lange und komplexe Prozesse zu orchestrieren, die viele bewegliche Teile enthalten.
Wir haben lange und komplexe Prozesse immer in kleinere Automatisierungen aufgeteilt, aber sehr oft gab es zwischen diesen Automatisierungen einen Menschen, der etwas erledigte, was die Automatisierung nicht konnte. Es gibt bereits eine Möglichkeit, solche Prozesse innerhalb der UiPath-Plattform zu modellieren (es nennt sich Long-Running Workflows), aber die Akzeptanz war bisher nicht besonders hoch. Der Hauptgrund dafür ist, dass es ziemlich schwer zu lesen und zu verstehen ist, wie diese Workflows aufgebaut sind.

In Maestro haben wir ein BPMN-Diagramm. Dieses Diagramm zeigt klar, was unsere Automatisierung macht, und beim Ausführen sieht man deutlich, wo sie hingeht und welche Entscheidungen getroffen wurden. Ich denke, es löst viele Probleme, die bei Long-Running Workflows bestehen.
Fallstudie: Recruitment Helper in Maestro
Als wir als einer der UiPath-Partner Early Access zu den Agenten und Maestro erhielten, begannen wir sofort, einige Prototypen zu entwickeln. Eines der Beispiele, das wir erstellt haben, ist der Recruitment Helper. Der gesamte Prozess versucht, so viel Verwaltung wie möglich rund um den Rekrutierungsprozess zu automatisieren. Wir haben Agenten, Integrationen, Roboter und das Action Center eingesetzt und versucht, so viele verschiedene Elemente der Plattform wie möglich zu nutzen.
Der Recruitment-Flow Schritt für Schritt
Der Prozess beginnt, sobald eine E-Mail mit einem angehängten Lebenslauf eingeht.
- Phishing Guard: Zuerst haben wir den Phishing Guard Agent. Dieser Agent entscheidet, ob die E-Mail zur Verarbeitung geeignet ist oder nicht.
- Datenextraktion: Wenn der Agent eine positive Entscheidung trifft, speichern wir die Daten aus der E-Mail in der Datenbank innerhalb der UiPath-Plattform (Data Service). Gibt es einen Anhang, wird ein anderer Agent eingesetzt, der Informationen aus dem Lebenslauf extrahiert. Ein Lebenslauf ist unstrukturierte Daten, daher nutzen wir einen Agenten, um die genauen Datenpunkte, die wir benötigen, herauszufiltern.
- Parallele Agenten: Sobald diese Daten extrahiert sind, starten zwei weitere Agenten parallel.
🔸 Einer überprüft, ob alle benötigten Daten vorhanden sind (z. B. Sprachkenntnisse). Fehlt etwas, wissen wir, dass wir nachfragen müssen.
🔸 Der zweite ist ein Answer Generator. Dieser Agent hat als Kontext Informationen zur Stellenbeschreibung und einige grundlegende Unternehmensinformationen (ähnlich wie CyberOla, das ich in einer der vorherigen Episoden gezeigt habe). - E-Mail-Generierung und Human-in-the-Loop: Die Ausgaben dieser beiden Agenten werden an einen weiteren Agenten weitergeleitet, der die Informationen in eine gut formulierte E-Mail einfügt. Da wir nicht möchten, dass GenAI direkt mit Menschen kommuniziert (diese Technologien sind noch nicht ausgereift genug), wird immer das Action Center eingesetzt, als Punkt für Human-in-the-Loop-Interaktion.
- Überprüfung im Action Center: Der menschliche Operator sieht die Aufgabe im Action Center. Dort sieht er drei Dinge: eine Tabelle mit dem Kandidatenprofil (extrahierte CV-Daten), die ursprüngliche Kandidaten-E-Mail und einen vorgeschlagenen E-Mail-Text.
- Details zur generierten Antwort: Die E-Mail beantwortet Fragen (z. B. bestätigt, dass die Haustierregelung Hunde erlaubt, aber keine Katzen, da diese nicht geregelt sind). Außerdem werden fehlende Daten abgefragt, wie z. B. das Sprachniveau. Wenn alles in Ordnung ist, kann der menschliche Operator die E-Mail freigeben.

Zweite Iteration und Generierung komplexer Ergebnisse
Wenn der Kandidat antwortet (z. B. mit einem aktualisierten Lebenslauf), wird der Prozess erneut ausgeführt. Die Daten werden extrahiert und im Data Service aktualisiert. Der menschliche Operator sieht das Kandidatenprofil, erkennt, dass alle Felder ausgefüllt sind, und genehmigt eine standardmäßige „Danke“-E-Mail.
Der Prozess endet hier nicht. Wir nutzen auch Agenten, um z. B. mögliche Interviewfragen zu generieren. Der Agent versucht, Fragen zu entwickeln, die für die Person relevant sind, basierend auf der Stellenbeschreibung und den Informationen im Lebenslauf. Wenn beispielsweise die Stellenbeschreibung Flüssigkeit im Umgang mit UiPaths REFramework verlangt und der Kandidat keine Angaben dazu gemacht hat, könnte eine Frage lauten: „Welche Erfahrung haben Sie mit dem REFramework?“.
Ein weiteres Feature, das das Tool generiert, ist die Profil-Passung. Es erstellt eine grundlegende Einschätzung, wie gut der Lebenslauf mit der Stellenbeschreibung übereinstimmt. Wir wollen nicht, dass AI über die Rekrutierung entscheidet. Das Interview und die endgültige Entscheidung sollen von einem Menschen getroffen werden, aber wir möchten, dass AI uns bei der gesamten Verwaltung rund um den Rekrutierungsprozess unterstützt.
Breitere Anwendungsbereiche für Maestro-Orchestrierung
Wir können in Maestro ziemlich lange und komplexe Prozesse modellieren.
Stellen Sie sich einen Prozess vor, bei dem ein Kunde eine Bestellung sendet. Ein Agent liest die Bestellung, überprüft Kundenkredit und Verträge (über den Integration Service oder über Roboter) und trifft dann eine Entscheidung. Wenn etwas nicht stimmt, wird der Vorgang zur menschlichen Entscheidung eskaliert. Wenn alles in Ordnung ist, wird die Bestellung zur Verarbeitung gesendet und könnte sogar die Erfüllung überwachen.
Wenn man an Gehaltsabrechnung denkt: Große Unternehmen haben Teams von Mitarbeitern, die Fragen der Angestellten bearbeiten. Ein Satz von Agenten (basierend auf internen Prozessen, externen Vorschriften und unterstützt durch RPA-Roboter und Integrationen) könnte die meisten dieser Anfragen beantworten, sodass nur die wirklich komplexen Fälle an die Menschen weitergegeben werden.
Fazit: Der geheime Schlüssel zur Hyperautomation
Alles, worüber ich gerade gesprochen habe, ist frisch und neu. Generative AI selbst ist im Grunde noch ein Kleinkind, das versucht, ohne gegen die Möbel zu stoßen zu arbeiten. Die UiPath-Agenten und die ausgeklügelte Maestro-Orchestrierung (zum Zeitpunkt unserer Aufnahme) sind erst seit einigen Wochen öffentlich verfügbar. Wir fangen gerade erst an.
Dieses ganze AI-Agenten-Plus-Maestro-Orchestrierung auf Ihrem altbewährten RPA-Setup ist wie das Finden eines geheimen Schlüssels zu einer Reihe von Türen, von denen wir dachten, sie seien fest verschlossen. Wir entdecken diese prächtigen Prozess-Monster (wahre Goldgruben für Automatisierung), doch dann trifft uns die Realität: Dieser Prozess ist länger als die Director’s Cut von

Es geht nicht darum, Ihre bestehende RPA-Plattform aus dem Fenster zu werfen. Es geht darum, sie zu verstärken, ihr Superkräfte zu verleihen und ihre Horizonte zu erweitern. Wir verwenden den Begriff Hyperautomation schon seit Jahren. Ich glaube, wir sind endlich an einem Punkt angekommen, an dem es nicht nur ein Buzzword auf einer PowerPoint ist, um mehr Budget zu bekommen – es könnte wirklich passieren.
Damit ist unser Deep Dive in die wilde Welt der UiPath-Agenten und des Maestro, der angeblich alle Fäden zieht, abgeschlossen.
Abschluss
An alle, die eingeschaltet haben: Wir danken euch, dass ihr uns eure wertvolle Sendezeit geliehen habt. Ein riesiger Applaus (oder zumindest ein höflicher Gruß) geht an Anna Cubal, unsere Produzentin, die diesen Podcast mit mehr Finesse orchestriert als jede Software-Suite. Wie immer aufgenommen im legendären Wodzu Beats Studio. Bis zum nächsten Mal: Denkt daran, nicht jedes Problem benötigt eine AI-Lösung. Manchmal reicht es einfach, es aus- und wieder einzuschalten.