Wprowadzenie i nowa filozofia automatyzacji
Konnichiwa! Witamy w
Więc jeśli kiedykolwiek podejrzewałeś, że Twój inteligentny agent jest głupszy niż garść kamieni, albo jeśli to Ty próbujesz dyrygować Maestro tak, żeby lalka nie zamieniła się w bunt robotów – trafiłeś do właściwego dojo. Muszę przyznać, że gdy UiPath ogłosił pod koniec zeszłego roku, że będzie mieć własnych agentów, byłem nieco zszokowany. Poziom mojego entuzjazmu (powiedzmy sobie szczerze) nie sięgał księżyca. Ale potem zostaliśmy wybrani jako jeden z nielicznych partnerów z wczesnym dostępem, więc naturalnie wysłaliśmy kilku naszych najbystrzejszych Samurajów, żeby te nowe narzędzia poznali, rozłożyli na części i zdali raport. Muszę powiedzieć, że jestem ogólnie przyjemnie (a może nawet śmiało powiem – pozytywnie) zaskoczony. To, jak UiPath zaprojektował tych agentów i zintegrował ich z resztą swojej platformy, jest naprawdę dopracowane – a słowa „dopracowane” nie używam lekko.
Tu nie chodzi tylko o dodanie kolejnego błyszczącego gadżetu do technologicznego warsztatu. Mówimy tu o całej filozofii automatyzacji – o dobrze naoliwionej maszynie, w której agenci AI myślą (wnosząc do stołu ludzkopodobne rozumowanie), roboty i integracje działają (wykonując zadania z tą słodką, binarną precyzją), Maestro orkiestruje (działając jak lalkarz pociągający za sznurki), a ludzie przewodzą, bo to oni podejmują ostateczne decyzje (w końcu ktoś musi być dorosłym w tym pokoju).
Budowanie agentów AI w UiPath (Agent Builder)
Funkcje agentowe: prompty, narzędzia i kontekst
Najpierw przyjrzyjmy się samym agentom. Dobrym przykładem może być Agent Antyphishingowy – agent, którego można używać w wielu różnych automatyzacjach, jeśli zaczynają się one od e-maila. W UiPath Agent Builder znajdziesz pola, których można się spodziewać podczas tworzenia agenta AI: nazwę, opis oraz długi system prompt. Ten systemowy prompt zawiera wiele informacji i zasad – możesz napisać go samodzielnie, ale możesz też skorzystać z pomocy GenAI, aby stworzyć dobry prompt. To całkiem fascynujące, że sztuczna inteligencja już teraz pomaga nam programować inne sztuczne inteligencje.
Mamy prompt użytkownika, który informuje agenta, jakiego rodzaju dane wejściowe może otrzymać, ale to, co naprawdę czyni go „agentowym”, to narzędzia (tools). W sekcji narzędzi można połączyć wiele różnych elementów. Istnieją aktywności (activities) przygotowane przez UiPath, które pozwalają łączyć się z różnymi usługami i aplikacjami. Są też procesy – każdy proces opublikowany w Orchestratorze można wywołać z poziomu agenta. Jeśli agent potrzebuje dodatkowych informacji, może uruchomić proces – przekazuje mu parametry, proces się wykonuje i zwraca dane z powrotem agentowi. W praktyce oznacza to, że użytkownik ma do dyspozycji wiele różnych narzędzi, dzięki którym agent może zarówno pozyskiwać dane, jak i wprowadzać dane do systemów.

Agent może również wywołać innego agenta. Można więc stworzyć coś w rodzaju „inception” – jeden agent zadaje pytanie innemu, który specjalizuje się w czymś innym, a następnie otrzymuje od niego odpowiedź. Sama możliwość dodawania narzędzi do agenta AI to już ogromny krok naprzód. Jeśli w Twojej organizacji masz już wiele różnych procesów – dużych i małych, nadzorowanych i nienadzorowanych – możesz po prostu połączyć je z agentem.
Oczywiście mamy też konteksty. To wiedza, którą można wprowadzić do narzędzia AI. Wystarczy umieścić dokumenty w storage bucket w Orchestratorze, a następnie ustawić ten zasobnik jako kontekst dla konkretnego agenta. Oznacza to, że agent będzie znał informacje zawarte w tych plikach i podczas działania będzie je brał pod uwagę.
Bezpieczeństwo i eskalacje (człowiek w pętli)
Następnie mamy eskalacje. Eskalacja oznacza, że można ustawić warunki, w których agent nie powinien podejmować decyzji samodzielnie, lecz poprosić człowieka o podjęcie ostatecznej decyzji. Na przykład w przypadku Agenta Antyphishingowego, jeśli nie jest pewien, czy dany e-mail to phishing, dosłownie poprosi człowieka o sprawdzenie. Utworzy zadanie w Action Center, a operator przejrzy wiadomość i zdecyduje, czy faktycznie jest to próba phishingu. W ten sposób człowiek pozostaje w pętli i zachowujemy kontrolę nad tym, co robią agenci.

Wyzwania i metodologia testowania agentów
Jak to zwykle bywa z agentami, można je testować w trakcie tworzenia. Mamy okno, w którym można uruchomić prompt. Jeśli jako dane wejściowe wprowadzę treść e-maila w stylu „Jestem etiopskim księciem i chcę wysłać ci milion dolarów”, agent przeanalizuje to i poinformuje mnie, że to faktycznie phishing, a w wyniku zwróci zmienną mówiącą, że tego konkretnego e-maila nie należy dalej przetwarzać.
Pisanie promptów dla agentów jest dość proste i szybkie. Wyzwanie zawsze pojawia się przy testowaniu, ponieważ te algorytmy są niedeterministyczne – mogą zwracać różne wyniki. Każda zmiana w promptcie może prowadzić do nieprzewidzianych konsekwencji. Podczas testów manualnych można dodać dany przypadek do zestawu ewaluacyjnego (evaluation set). Za każdym razem, gdy wprowadzasz jakąś zmianę w agencie, możesz uruchomić wszystkie te testy i sprawdzić, czy wyniki nadal są zgodne z oczekiwaniami.

LLM jako sędzia
Ten mechanizm wykorzystuje podejście zwane LLM jako sędzia (LLM as a judge). Potrzebujemy go, ponieważ wyniki działania agenta AI nie zawsze da się po prostu szybko porównać z oczekiwanym rezultatem. Bardzo często otrzymujemy np. treść e-maila, która zawiera te same informacje, ale jest napisana w inny sposób, inaczej sformułowana. Dlatego potrzebny jest LLM, aby ocenił, czy wynik pod względem sensu i treści jest taki sam jak oczekiwana odpowiedź, a nie czy jest identyczny znak po znaku.
Oczywiście mamy też ślady (traces). Dla każdego uruchomienia agenta można zobaczyć szczegółowe informacje: co zostało wprowadzone, co zostało zwrócone, jakie były parametry oraz ile czasu agent spędził na „myśleniu”.
Agenci w klasycznej automatyzacji
Możemy korzystać z tych agentów w ramach naszych zwykłych automatyzacji. Często zdarza się, że automatyzacja w pewnym momencie potrzebuje oceny lub decyzji, której logiki nie da się wyrazić za pomocą wielu warunków „if”. Wtedy klasyczna automatyzacja może wywołać agenta, przekazać mu zestaw informacji, a następnie otrzymać jego ocenę lub wynik. Może to być coś prostego, jak wyodrębnienie odpowiednich danych z e-maila, ale też coś znacznie bardziej złożonego.
Można sobie wyobrazić agenta, który w ramach automatyzacji otrzymuje żądanie utworzenia klienta lub dostawcy w bazie danych. Agent, korzystając z narzędzi, pobiera informacje z różnych systemów (wielu spoza firmy), a następnie wykorzystuje swoją ocenę, by stwierdzić, czy z daną firmą można bezpiecznie współpracować, czy może należy poprosić człowieka o weryfikację, ponieważ algorytm zauważył coś podejrzanego. Włączenie agentów do klasycznych automatyzacji może być w tym przypadku właściwym kierunkiem.
Maestro: orkiestracja długich i złożonych procesów
Automatyzacja agentowa UiPath to znacznie więcej niż to. Część, która zrobiła na mnie największe wrażenie, to to, co wcześniej nazywano Agentic Orchestration (obecnie znane jako Maestro; UiPath, jeśli słuchacie – uważam, że stara nazwa była lepsza). UiPath Maestro to w zasadzie sposób na orkiestrowanie długich i złożonych procesów, które składają się z wielu ruchomych elementów.
Zawsze dzieliliśmy długie i złożone procesy na mniejsze automatyzacje, ale bardzo często pomiędzy tymi automatyzacjami pojawiał się człowiek, który wykonywał coś, czego automatyzacja nie była w stanie zrobić. Na platformie UiPath już istnieje sposób modelowania tego typu procesów – to tzw. Long-Running Workflows – jednak ich wykorzystanie do tej pory nie było zbyt powszechne. Głównym powodem jest to, że ich struktura jest dość trudna do odczytania i zrozumienia.

W Maestro mamy diagram BPMN. Ten diagram w przejrzysty sposób pokazuje, co robi nasza automatyzacja, a podczas jej działania można dokładnie zobaczyć, w którym miejscu się znajduje i jakie decyzje zostały podjęte. Myślę, że to rozwiązanie eliminuje wiele problemów, z którymi borykały się Long-Running Workflows.
Studium przypadku: asystent rekrutacji w Maestro
Gdy jako jeden z partnerów UiPath uzyskaliśmy wczesny dostęp do agentów i Maestro, natychmiast zaczęliśmy budować kilka prototypów. Jednym z przykładów, który stworzyliśmy, jest Asystent Rekrutacji (Recruitment Helper). Cały proces ma na celu zautomatyzowanie jak największej części administracji związanej z procesem rekrutacyjnym. Wykorzystaliśmy agentów, integracje, roboty oraz Action Center – staraliśmy się użyć jak najwięcej różnych elementów platformy.
Przebieg rekrutacji krok po kroku
Proces rozpoczyna się od otrzymania e-maila z załączonym CV.
- Phishing Guard: najpierw działa Agent Phishing Guard, który decyduje, czy e-mail nadaje się do dalszego przetwarzania, czy nie.
- Data Extraction: gdy decyzja jest pozytywna, dane z e-maila są zapisywane w bazie danych w ramach platformy UiPath (Data Service). Jeśli wiadomość zawiera załącznik, uruchamiany jest inny agent, który wyodrębnia informacje z CV. Ponieważ CV to dane niestrukturyzowane, wykorzystujemy agenta do wyciągnięcia dokładnie tych informacji, których potrzebujemy.
- Parallel Agents: gdy dane zostaną wyodrębnione, dwa inne agenty uruchamiają się równolegle.
🔸 Jeden sprawdza, czy dostępne są wszystkie wymagane dane (np. poziom znajomości języka), a jeśli czegoś brakuje, wiemy, że musimy o to poprosić.
🔸 Drugi to Answer Generator – agent, który jako kontekst wykorzystuje informacje o opisie stanowiska i podstawowe dane o firmie (trochę jak CyberOla, którą pokazywałem w jednym z poprzednich odcinków). - Email Generation and Human in the Loop: wyniki z tych dwóch agentów trafiają do innego agenta, który umieszcza informacje w ładnie sformułowanym e-mailu. Ponieważ nie chcemy, aby GenAI mógł komunikować się bezpośrednio z ludźmi (te technologie nie są jeszcze wystarczająco dojrzałe), zawsze dodajemy Action Center – punkt, w którym człowiek włącza się w proces.
- Przegląd w Action Center: operator widzi zadanie w Action Center. Widziane są trzy elementy: tabela z profilem kandydata (dane wyodrębnione z CV), oryginalny e-mail kandydata oraz sugerowana treść wiadomości e-mail.
- Generated Response Details: e-mail odpowiada na pytania (np. potwierdza, że polityka dotycząca zwierząt pozwala na psy, ale nie na koty, ponieważ nie są one uregulowane). Zawiera także prośbę o brakujące dane, takie jak poziom znajomości języka. Jeśli wszystko jest w porządku, operator może zatwierdzić e-mail.

Druga iteracja i generowanie złożonych wyników
Kiedy kandydat odpowiada (wysyłając zaktualizowane CV), proces uruchamia się ponownie. Dane są wyodrębniane i aktualizowane w Data Service. Operator widzi profil kandydata z informacją, że wszystkie pola zostały uzupełnione, i zatwierdza standardowy e-mail z podziękowaniem.
Na tym proces się nie kończy. Używamy również agentów do generowania takich rzeczy jak potencjalne pytania rekrutacyjne. Agent stara się wymyślić pytania odpowiednie dla danej osoby, na podstawie opisu stanowiska oraz informacji z CV. Na przykład, jeśli w opisie stanowiska wymagana jest znajomość UiPath REFramework, a kandydat nie podał informacji na ten temat, jedno z pytań może brzmieć: „Jakie masz doświadczenie w pracy z REFramework?”.
Kolejną rzeczą, którą generuje to narzędzie, jest dopasowanie profilu (profile fit). Tworzy ono podstawową ocenę tego, na ile dane CV jest zgodne z opisem stanowiska. Nie chcemy, aby AI podejmowało decyzje o tym, kogo zatrudnić – rozmowa kwalifikacyjna i ostateczna decyzja powinny zawsze należeć do człowieka. Chcemy jednak, aby AI pomagało nam we wszystkich czynnościach administracyjnych związanych z procesem rekrutacji.
Szersze zastosowania orkiestracji Maestro
W Maestro możemy modelować naprawdę długie i złożone procesy.
Wyobraź sobie proces, w którym klient wysyła zamówienie. Agent je odczytuje, sprawdza zdolność kredytową i umowy klienta (za pośrednictwem Integration Service lub robotów), a następnie podejmuje decyzję. Jeśli coś jest nie tak, eskaluje sprawę do człowieka, aby ten podjął decyzję. Jeśli wszystko jest w porządku, przekazuje zamówienie do realizacji, a nawet może monitorować jego wykonanie.
Jeśli pomyślisz o dziale płac, duże firmy mają całe zespoły ludzi zajmujących się pytaniami od pracowników. Zestaw agentów – opartych na wewnętrznych procedurach, zewnętrznych regulacjach i wspieranych przez roboty RPA oraz integracje – mógłby odpowiadać na większość z tych zapytań, pozostawiając ludziom jedynie naprawdę złożone przypadki.
Zakończenie: sekretny klucz do hiperautomatyzacji
Wszystko, o czym właśnie mówiłem, jest zupełnie świeże. Generatywna sztuczna inteligencja to w zasadzie jeszcze dziecko, które dopiero uczy się poruszać po pokoju, nie obijając się o meble. Agenci UiPath i ta efektowna orkiestracja Maestro (w momencie, gdy to nagrywamy) są dostępne „na wolności” dopiero od kilku tygodni. Dopiero zaczynamy.
Cała ta koncepcja agentów AI z orkiestracją Maestro na szczycie twojego starego, dobrego systemu RPA to jak znalezienie sekretnego klucza do mnóstwa drzwi, które wydawały się zaspawane na zawsze. Odkrywamy te wspaniałe bestie procesów (prawdziwe kopalnie złota dla automatyzacji), ale potem przychodzi rzeczywistość: to coś jest dłuższe niż wersja reżyserska „Titanica” i wymaga tak wyrafinowanego osądu, jaki zwykle spotyka się tylko u doświadczonego barmana. Dodajesz trochę agentów, szczyptę Maestro i nagle cała masa procesów z kategorii „nie, tego się nie da zrobić” zaczyna wyglądać zaskakująco wykonalnie.

Tu nie chodzi o wyrzucanie twojej istniejącej platformy RPA przez okno. Chodzi o jej wzmocnienie, nadanie jej supermocy, poszerzenie horyzontów. Od lat rzucamy hasłem „hiperautomatyzacja”. Myślę, że właśnie trafiliśmy na moment, w którym to przestaje być tylko modne słowo wrzucane do prezentacji PowerPoint, żeby dostać większy budżet – to naprawdę może się dziać.
I to by było na tyle, jeśli chodzi o nasze dogłębne zanurzenie w dzikim świecie agentów UiPath i Maestro, który rzekomo pociąga za wszystkie sznurki.
Outro
Dla wszystkich, którzy byli dziś z nami – dziękujemy, że poświęciliście nam kawałek swojego cennego czasu na antenie. Ogromne brawa (albo przynajmniej uprzejmy ukłon) dla jedynej w swoim rodzaju Anny Cubal, naszej producentki, która orkiestruje ten podcast z większym kunsztem niż jakiekolwiek oprogramowanie. Jak zawsze nagrywaliśmy w legendar studiu Wodzu Beats. Do następnego razu – pamiętajcie, nie każdy problem wymaga rozwiązania z pomocą AI. Czasem wystarczy po prostu wyłączyć i włączyć ponownie.