„Noch eine Nachricht und der Posteingang wird explodieren“. Hatten Sie jemals einen ähnlichen Gedanken? Befanden Sie sich in einer Situation, in der das Lesen aller eingehenden E-Mails für einen Menschen physisch unmöglich ist? Können wir Ray Tomlinson die Schuld dafür geben, dass er 1971 die erste E-Mail überhaupt verschickt hat?
Privat bereitet es Kopfschmerzen, beruflich hat es echte Auswirkungen auf das Geschäft. Die Ursache liegt in unserer Natur – wir kommunizieren mit Hilfe von gesprochener oder geschriebener (auch Zeichensprache) Sprache und eines kann man mit Sicherheit über Menschen sagen – Veränderungen sind schwierig.

Gibt es einen anderen Weg? Lesen Sie weiter.
Warum ist dies ein geschäftliches Problem?
Nichts prägt sich besser ein als ein Beispiel. Begrüßen Sie John Smith, Ihren treuesten E-Mail-Kollegen:

Es klingt wie eine einfache Fünf-Minuten-Aufgabe, und die Pflege guter Geschäftsbeziehungen zu John ist wichtig.
Nun multiplizieren Sie Mr. Smith mit Ihrem gesamten Kundenstamm und jedem kundenorientierten Prozess (einschließlich interner Prozesse wie Transaktionen zwischen Unternehmen). Plötzlich sind wir wieder bei dem vorherigen Punkt – der Posteingang explodiert. Rechnen wir mal nach: Etwa 80 dieser „schnellen“ 5-Minuten-Anfragen können einen ganzen Arbeitstag füllen (1 FTE, bei 6,5 Stunden produktiver Zeit).
Nach Jahren der transaktionalen Kommunikation haben wir einen Punkt erreicht, an dem es üblich und weltweit akzeptiert ist, unstrukturierte Informationen als Input zu erhalten, während wir uns auf Systeme verlassen, die streng strukturierte Daten verlangen.
Raten Sie mal, wer diese Daten umwandelt.
Sie könnten versuchen, dies zuerst zu beheben, und ich ermutige Sie aufrichtig, dies zu tun. Aber in den meisten Fällen werden Sie auf eine Mauer stoßen – Organisationsstrukturen, Verfahren, SLAs oder das klassische „Das haben wir schon immer so gemacht“.
Ab und zu sehen Sie ein Rettungsboot in Form von strukturierten Eingaben wie Formularen oder Ticketsystemen. Aber unserer Erfahrung nach sind diese selten – und selbst wenn es sie gibt, verlieren sie oft den Kampf gegen die gute alte, zuverlässige E-Mail oder beginnen, einer solchen zu ähneln, indem sie Freitextfelder anbieten.
Wie man den unfairen Kampf bekämpft
Bevor wir die Waffe unserer Wahl wählen, sollten wir das Schlachtfeld abstecken. Wir tauchen ein in die Verarbeitung natürlicher Sprache (NLP) – ein Bereich der künstlichen Intelligenz (KI) und ein großes, faszinierendes Thema, das es wert ist, über diesen Artikel hinaus erforscht zu werden. Im Moment erlebt es eine Renaissance, angetrieben durch den Aufstieg von Large Language Models (wie ChatGPT), aber es hat einen langen Weg gebraucht, um dorthin zu gelangen, wo wir jetzt sind.
Um auf unser Beispiel zurückzukommen, lassen Sie uns unsere Ziele definieren. Einfach ausgedrückt: Wir wollen:
- Finden Sie heraus, was John will – verstehen Sie die Absicht seiner Botschaft.
- Extrahieren Sie die wichtigen Teile – ziehen Sie die wichtigsten Daten aus dem Text heraus.
Warum diese beiden? Weil (Geschäfts-)Prozesse so funktionieren: Sie nehmen eine Eingabe, verarbeiten sie durch eine Reihe von Aktivitäten und erzeugen eine Ausgabe. Das Erkennen der Absicht (die Bezeichnung der Nachricht) hilft dabei, sie an den richtigen Prozess mit einem definierten Ergebnis weiterzuleiten, während die extrahierten Daten als Eingabe dienen. In diesem Fall könnten wir unseren Prozess als „Bestellabfrage“ definieren, wobei die Bestellnummer als Eingabe dient und die Ausgabe eine Aktualisierung des Bestellstatus als Antwort ist.

Wenn Sie tiefer eintauchen möchten, werden Sie feststellen, dass diese beiden Ziele mit bekannten NLP-Aufgaben übereinstimmen: Klassifizierung (Absichtserkennung) und Named Entity Recognition (NER) (Datenextraktion). Es gibt mehrere Möglichkeiten, diese Aufgaben anzugehen, wobei Sie jeweils aus einem Dutzend verschiedener Bibliotheken, Tools oder (neuerdings) LLMs wählen können. Ein traditionellerer Ansatz könnte sich auf reguläre Ausdrücke stützen (einen Blick wert!), die für einfache Fälle funktionieren. Aber wir haben es hier mit unterschiedlichen Nachrichten und einem großen Volumen zu tun – denken Sie an 5-15.000 E-Mails pro Monat – also brauchen wir etwas Robusteres.
Das Ziel ist es, dies in großem Umfang und auf wiederholbare Weise zu tun, so dass Mitarbeiter mit Kundenkontakt sich mit wichtigen Teilen der Kommunikation befassen können, bei denen KI versagt und menschliches Fachwissen immer noch notwendig ist oder wo es am wichtigsten ist: die Stärkung der Kundenbeziehungen, die Gewinnung neuer Kunden und die Bindung abwanderungsgefährdeter Kunden (Churn). Einige spekulieren, dass in naher Zukunft die Interaktion mit einem Menschen zu einem Premium-Service wird.
Sie haben die Wahl zwischen vielen Optionen, aber wir werden uns mit UiPath Communications Mining beschäftigen .
Das Grundrezept
Zur Einführung: Communications Mining ist ein Cloud-basierter KI/Machine Learning (ML)-Service innerhalb des UiPath-Ökosystems, der entwickelt wurde, um natürlichsprachliche Daten automatisch zu verstehen und zu verarbeiten. Auf der Plattform gibt es eine Menge zu entdecken. Wir werden das Wesentliche behandeln, aber wenn Sie mehr wissen möchten, empfehle ich Ihnen, die offizielle Dokumentation und die Kurse der UiPath Academy zu lesen, um tiefer einzutauchen.
Die meisten ML-Lebenszyklen folgen ein paar Schlüsselphasen: Planung, Schulung und Einsatz – genau so werden wir dieses Thema angehen.
Planung
Kommunikation ist in jedem Unternehmen unvermeidlich – fast jeder Prozess erfordert in irgendeiner Phase ein Gespräch. Aber anstatt alles auf einmal in Angriff zu nehmen, sollten Sie sich zunächst ein paar wichtige Fragen stellen:
- Wo ist die Kommunikation ein untrennbarer Teil des Prozesses, z.B.: dient sie als Input/Output für den gesamten Arbeitsablauf oder bestimmte Aktivitäten?
- Welche Kommunikationskanäle werden in der Organisation genutzt: E-Mails, Chats, CRMs, Ticketingsysteme, Collaboration-Apps usw.? (Datenquellen)
- Wer bearbeitet ein hohes Nachrichtenaufkommen? Welche Abteilungen oder Teams sind am meisten beteiligt?
- Gibt es wiederkehrende Muster oder strukturierte Elemente innerhalb dieser Geschäftskommunikation?
Und das Wichtigste, das oft vergessen wird: Warum tun Sie das überhaupt? Ist das Ziel Automatisierung, Analytik oder beides? Welche KPIs definieren den Erfolg? Bei KI-gesteuerten Lösungen reicht es nicht aus, einfach zu sagen „es funktioniert“ – dazu später mehr.
Bleiben wir bei unserem Beispiel: Das Team der Auftragsbearbeitung bearbeitet 5.000 E-Mails pro Monat, die meisten davon ähnlich wie die von John – neue Bestellungen, Änderungen, Stornierungen und Anfragen. Indem wir die richtigen Fragen stellen und die Prozesse in ihrem Umfang analysieren, können wir eine Taxonomie für unser Modell definieren.

Eine Taxonomie ist eine hierarchische Struktur von Intents/Kategorien (Etiketten), die verschachtelt werden können, und den damit verbundenen Datenpunkten. Einige Felder sind direkt mit bestimmten Labels verknüpft (Extraktionsfelder), während andere in jeder Nachricht erscheinen können (allgemeine Felder). Eine gut konzipierte Taxonomie sollte reale Kommunikationsmuster genau widerspiegeln, da sie als Grundlage für das Training und die Anwendung von Modellen dient.
Die Taxonomie kann zwar modifiziert werden, aber Änderungen haben Konsequenzen – Anpassungen können die Trainingszeit verlängern, und einige Änderungen sind unumkehrbar.
Ausbildung
Im Grunde geht es bei jedem ML-Training darum, der KI genügend Beispiele zu liefern, aus denen sie „lernen“ kann. Unter der Haube verwendet die KI mathematische und statistische Techniken, um Muster und Beziehungen in den Daten zu erkennen, so dass sie Vorhersagen über neue, noch nicht gesehene Fälle machen kann.

Wie viele Beispiele sind genug? Es gibt keine allgemeingültige Antwort, aber hier sind einige Richtlinien:
- Generell gilt: Mehr ist besser. Ihr Trainingsset sollte reale Daten so genau wie möglich widerspiegeln, um Zufälligkeiten zu reduzieren und die Zuverlässigkeit zu verbessern. Für einen Proof-of-Concept im Communications Mining sollten Sie mindestens 10.000 Nachrichten zur Verfügung stellen; für ein produktionsreifes Setup sollten Sie 60.000+ anstreben.
- Erfassen Sie Saisonalität. Berücksichtigen Sie Schwankungen wie monatliche Spitzenwerte, Abschwächungen am Jahresende oder andere zyklische Trends in Ihrem Datensatz.
- Balancieren Sie Ihren Datensatz. Im Idealfall sollte jede Kategorie (Bezeichnung) die gleiche Anzahl von Beispielen enthalten. Auch wenn die realen Geschäftsdaten selten diesem Ideal entsprechen, tun Sie Ihr Bestes, um größere Ungleichgewichte zu minimieren.
Das Erstellen und Trainieren eines maschinellen Lernmodells erfordert in der Regel Programmierkenntnisse, was eine hohe Einstiegshürde darstellt. Glücklicherweise können Sie mit Communications Mining den gesamten Prozess durchlaufen, ohne eine einzige Zeile Code schreiben zu müssen (dies ist optional). Kommunikationsdaten können über eine CSV-Datei (Comma Separated Values) oder vorgefertigte Integrationen mit Microsoft Exchange Server oder Salesforce hochgeladen werden.

Die Schulung ist eine super einfache und benutzerfreundliche Erfahrung, fast wie ein Malbuch. Mit nur wenigen Klicks weist der Geschäftsanwender (in der Regel ein Fachexperte) die richtigen Etiketten (eine oder mehrere) zu und hebt die relevanten Datenpunkte (Felder) im Nachrichtentext hervor.

Das war’s. Die Plattform erkennt die Änderungen automatisch und beginnt mit dem Training. Spülen und wiederholen Sie den Vorgang, bis Sie genügend Beispiele geliefert haben. Wie viele? Sie haben es richtig erraten – auch hier gibt es keine allgemeingültige Antwort, aber Communications Mining bietet einen geführten Trainingsmodus. Er gibt Ihnen klares, lehrreiches Feedback, damit Sie sich messbare Ziele setzen können. Als Faustregel gilt, dass Sie die Leistung des Modells maximieren und gleichzeitig den Zeitaufwand für das Training minimieren sollten (Arbeit, die Sie investieren müssen).

Wie bereits erwähnt, bewegt sich die betriebliche Effizienz von KI-gestützter Automatisierung auf einem Spektrum. Bei der klassischen Automatisierung, z. B. der robotergestützten Prozessautomatisierung (RPA), legen Sie strenge Anforderungen fest, und der Roboter folgt einem vorprogrammierten Pfad und behandelt Ausnahmen auf vorhersehbare, regelbasierte Weise. Bei Szenarien des maschinellen Lernens müssen Sie ein gewisses Maß an Ungewissheit in Kauf nehmen und akzeptieren.

Metriken zum maschinellen Lernen sind ein umfangreiches Thema, das den Rahmen dieses Artikels sprengen würde. Glücklicherweise stellt die Communications Mining-Oberfläche die wichtigsten Informationen auf intuitive, leicht verständliche Weise dar und bietet dabei dennoch ein ausreichendes Maß an Kontrolle. Dennoch müssen wir ein wesentliches Konzept des Vertrauens (Wert) behandeln, was uns zum nächsten Kapitel führt.

Einsatz
Lassen Sie uns alles zusammenführen. Unser Umfang und unsere Ziele spiegeln sich nun in der Taxonomie wider, und wir haben beschlossen, dass das Training des Modells abgeschlossen ist – zumindest für den Moment. Zeit für die KI, die schwere Arbeit zu übernehmen.
Wir leiten die ursprüngliche E-Mail von John an Communications Mining weiter und erhalten im Gegenzug die Vorhersage des Modells für diese Nachricht:

Die Plattform bietet zwei wichtige Automatisierungskomponenten, über die wir bereits gesprochen haben:
- Abgeleitete Bezeichnungen (eine oder mehrere), die bestimmen, welche Prozesse ausgeführt werden sollen.
- Extrahierte Felder, die als strukturierte Eingabe für diesen Prozess benötigt werden.
Beachten Sie, dass jede Vorhersage mit einem Konfidenzwert von 0% bis 100% versehen ist (dies gilt auch für Extraktionsfelder, ist in dieser Ansicht jedoch nicht sichtbar). Dieser Wert gibt an, wie sicher das Modell – basierend auf seinem Training – ist, dass eine bestimmte Bezeichnung auf diese Nachricht zutrifft. Es liegt an uns zu entscheiden, was wir mit diesen Informationen machen. Ein guter Ausgangspunkt ist die Festlegung eines Schwellenwerts als Cut-Off-Filter. Bevor wir weitere Schlussfolgerungen ziehen, lassen Sie uns ein paar hypothetische Szenarien untersuchen:
- Happy Path: Das Modell sagt mit 74%iger Sicherheit „Order Information Request > Delivery Status“ voraus und übertrifft damit einen Schwellenwert von 70%. Auch die Bestellnummer wird mit hoher Zuverlässigkeit extrahiert. Die Anfrage wird an eine Automatisierung weitergeleitet, die das ERP-System abfragt und den Lieferstatus zurückgibt. John erhält eine automatische E-Mail mit den angeforderten Informationen.
- Grenzfall: Diesmal reichen 74% Konfidenz nicht aus, da unser Schwellenwert auf 80% festgelegt ist. Entweder lassen wir einen Mitarbeiter den Fall vollständig manuell bearbeiten, oder wir implementieren einen Human-in-the-Loop-Mechanismus, der vor der Ausführung des Vorgangs eine menschliche Validierung anfordert.
- Unerwünschtes Ergebnis: Das Modell stuft die Anfrage fälschlicherweise als „Auftragsstornierung“ ein und seine Konfidenz überschreitet den Schwellenwert. Eine weitere Automatisierung storniert den Auftrag im ERP-System und benachrichtigt John, der nun verwirrt ist, warum seine Anfrage zu einer Auftragsstornierung führte.
Diese Szenarien sind vereinfacht (und das dritte ist übertrieben), aber sie verdeutlichen die Vielseitigkeit der KI-gesteuerten Automatisierung. Deshalb ist es wichtig, die Prozesse und die erwarteten Ergebnisse vor dem Einsatz sorgfältig zu analysieren.
Für Aktionen mit hohem Risiko, wie z.B. Auftragsstornierungen, sollten höhere Vertrauensschwellen, zusätzliche regelbasierte Prüfungen oder sogar eine obligatorische menschliche Validierung gelten. Dieser hybride Ansatz ist vielleicht nicht so schnell wie ein vollständig autonomes System, aber er stellt sicher, dass der menschliche Eingriff auf die Überprüfung von Ausnahmen beschränkt bleibt, während 90-99% der Fälle automatisch ablaufen.
Machen Sie das Beste aus beiden Welten
Ein weiterer großer Vorteil von Communications Mining sind seine Berichtsfunktionen. Stellen Sie sich vor, Sie könnten ein ganzes Jahr mit 60.000 E-Mails analysieren und Fakten aufdecken wie:
- Die 10 Kategorien mit dem höchsten Anfragevolumen.
- Diese Lieferstatusabfragen erreichen im Dezember ihren Höhepunkt.
- Dass John Smith häufig Produkte bestellt, die bald nicht mehr hergestellt werden – eine perfekte Gelegenheit, ihm eine Alternative anzubieten.
Dies sind nur einfache Beispiele für die endlosen Analysemöglichkeiten, die sich in der Unternehmenskommunikation verbergen, die nicht mehr nur aus Gigabytes unstrukturierter Daten besteht, sondern eine Goldmine wertvoller Erkenntnisse ist, die nur darauf warten, entdeckt zu werden.

All dies ist möglich, weil jede Nachricht, die auf die Plattform hochgeladen wird, eine Modellvorhersage erhält. Wenn Sie Metadaten (wie Absenderadresse, Domain, Zeitstempel usw.) mit abgeleiteten Kategorien und extrahierten Feldern kombinieren, erhalten Sie einen sehr leistungsstarken Datensatz. Ein einzelnes Element kann als Trainingsbeispiel oder zu verarbeitender Fall behandelt werden, aber wenn große Mengen im Spiel sind, beginnen die aggregierten Kommunikationsdaten Geschichten zu erzählen.
Eine weitere wichtige Erkenntnis, die sich in Kommunikationsdaten verbirgt, ist die Kundenzufriedenheit. Communications Mining bietet eine integrierte Stimmungsanalyse, die automatisch den Tonfall oder die Stimmung (positiv oder negativ) für jede Nachricht erkennt.
Darüber hinaus können Sie auf der Plattform einen gewichtungsbasierten Quality of Service (QoS)-Parameter konfigurieren, der jedem Label einen Wert von -10 bis 10 zuweist, um einen tieferen Kontext zu schaffen. Zum Beispiel könnte „Auftragsstornierung“ einen QoS-Wert von -5 haben, weil der Verlust eines Auftrags negative Auswirkungen auf das Geschäft hat – selbst wenn die Nachricht selbst positiv war.

Da die Plattform automatisch jede hochgeladene Nachricht sofort neu trainiert und vorhersagt, werden die Kommunikationsdaten kontinuierlich aktualisiert, was eine Überwachung in Echtzeit ermöglicht. Sie können sogar benutzerdefinierte Warnmeldungen einrichten, um wichtige Bedingungen zu verfolgen – wenn z. B. der QoS-Wert von John Smith unter einen bestimmten Schwellenwert fällt, kann das System sofort E-Mail-Warnungen an seinen Key Account Manager senden.
Was werden Sie bauen?
Ich hoffe, Ihnen hat diese kurze Einführung in die Verarbeitung natürlicher Sprache und das UiPath Communications Mining gefallen. Wir haben allerdings nur an der Oberfläche gekratzt. Es gibt noch viel mehr zu entdecken und zu lernen, also ermutige ich Sie, Dinge auszuprobieren und neugierig zu bleiben. Die Technologie schreitet in einem unglaublichen Tempo voran und macht das Unmögliche von gestern zur Realität von heute.
Wenden Sie sich an uns, wenn Sie Fragen haben, und viel Spaß beim Automatisieren!