{"id":20809,"date":"2025-11-06T07:27:05","date_gmt":"2025-11-06T06:27:05","guid":{"rendered":"https:\/\/office-samurai.com\/rage-against-the-digital-paper-idp-mit-uipath-document-understanding\/"},"modified":"2025-11-06T15:24:42","modified_gmt":"2025-11-06T14:24:42","slug":"rage-against-the-digital-paper-idp-mit-uipath-document-understanding","status":"publish","type":"post","link":"https:\/\/office-samurai.com\/de\/rage-against-the-digital-paper-idp-mit-uipath-document-understanding\/","title":{"rendered":"Rage Against the Digital Paper \u2013 IDP mit UiPath Document Understanding"},"content":{"rendered":"\n<p>Papierlos zu arbeiten ist eine gro\u00dfartige Idee, aber es steckt mehr dahinter, als nur nichts auszudrucken. Der Punkt ist, dass Dokumente f\u00fcr Menschen zum Lesen gedacht sind, w\u00e4hrend Computer Daten verarbeiten. In den meisten F\u00e4llen der Dokumentenverarbeitung haben wir physisches Papier in ein bin\u00e4res \u00c4quivalent umgewandelt (meistens als PDFs \u2013 Portable Document Format \u2013 bekannt), was f\u00fcr Dinge, die Menschen lesen \u2013 B\u00fccher, Zeitschriften, Brosch\u00fcren und \u00c4hnliches \u2013 v\u00f6llig in Ordnung ist. F\u00fcr automatisierte Workflows ist das jedoch schlecht.   <\/p>\n\n<p>Software-Roboter lesen nicht, sie laufen.<\/p>\n\n<p>Wir werden sehen, wie sie mit UiPath Document Understanding laufen.<\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Der_Schaden_ist_bereits_angerichtet\"><\/span>Der Schaden ist bereits angerichtet.<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Wenn du im B\u00fcro arbeitest, hast du wahrscheinlich schon mit digitalen Dokumenten zu tun gehabt. Man muss keine Statistiken w\u00e4lzen, um ihre Pr\u00e4senz zu sp\u00fcren, aber sehen wir uns an, was das Internet \u00fcber die Nutzung von PDFs sagt. <\/p>\n\n<figure class=\"wp-block-image size-full\"><img fetchpriority=\"high\" decoding=\"async\" width=\"752\" height=\"426\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_01.jpg\" alt=\"Diagramm, das die Beliebtheit des PDF-Formats zeigt &#x2013; Daten von Smallpdf\" class=\"wp-image-20713\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_01.jpg 752w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_01-300x170.jpg 300w\" sizes=\"(max-width: 752px) 100vw, 752px\" \/><figcaption class=\"wp-element-caption\"><em>PDF-Beliebtheit in Zahlen (laut Smallpdf)<\/em><\/figcaption><\/figure>\n\n<p>Diese Zahlen sind ziemlich abstrakt. Dieselbe Website berichtet, dass die Erstellung von PDFs seit 2020 j\u00e4hrlich um etwa 12 % zunimmt. Sie sind \u00fcberall, und dein Unternehmen erh\u00e4lt mit ziemlicher Sicherheit Rechnungen, Bestellungen oder Vertr\u00e4ge in diesem Format.   <\/p>\n\n<p>Wir sollten uns \u00fcber die Rettung von B\u00e4umen, weniger Abfall und ein standardisiertes Format (ISO 32000) freuen, aber aus Sicht der Gesch\u00e4ftsautomatisierung war das ein Eigentor. Die Zahlen deuten darauf hin, dass PDFs nicht verschwinden werden, aber anstatt passiven Widerstand zu leisten, sprechen wir dar\u00fcber, wie wir ihre Verarbeitung automatisieren k\u00f6nnen. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Was_ist_dein_Problem\"><\/span>Was ist dein Problem?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Kurz gesagt, wir haben das Format f\u00fcr menschliche Augen entworfen und erwarten nun, dass Computer es verarbeiten. F\u00fcr die ausf\u00fchrliche Version gehen wir ein typisches Beispiel durch: die Verarbeitung von Rechnungen als eingehende Dateien, z. B. als E-Mail-Anh\u00e4nge. <\/p>\n\n<figure class=\"wp-block-image aligncenter size-full is-resized\"><img decoding=\"async\" width=\"640\" height=\"828\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_02.png\" alt=\"Example of an invoice document &#x2013; illustrative graphic.\" class=\"wp-image-20718\" style=\"width:auto;height:600px\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_02.png 640w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_02-232x300.png 232w\" sizes=\"(max-width: 640px) 100vw, 640px\" \/><figcaption class=\"wp-element-caption\"><em>Rechnungsbeispiel aus Google Graphics<\/em><\/figcaption><\/figure>\n\n<p>Die menschliche Beteiligung ist klar definiert: Jemand im \u201eDesign Studio\u201c erstellt eine Rechnung \u2013 idealerweise mit einem ERP-System oder einer Anwendung \u2013 und sendet sie ab. Am anderen Ende empf\u00e4ngt jemand bei der \u201eABC Corporation\u201c die Datei und gibt die relevanten Daten manuell in das eigene ERP-System zur weiteren Verarbeitung ein. In der Regel ist es einfach, Schl\u00fcsselinformationen wie den Gesamtbetrag zu lesen.  <\/p>\n\n<p>Dennoch ist der Prozess repetitiv, fehleranf\u00e4llig und zeitaufwendig. Es w\u00e4re viel einfacher, wenn beide Seiten sich darauf einigen w\u00fcrden, strukturierte Daten \u00fcber eine geeignete Schnittstelle wie Electronic Data Interchange (EDI) auszutauschen. Leider ist das nach unserer Erfahrung eher die Ausnahme als die Regel.  <\/p>\n\n<p>Gr\u00f6\u00dfere Initiativen wie nationale E-Invoicing-Systeme sind ein Schritt in die richtige Richtung, aber Rechnungen sind nur die Spitze des Eisbergs. Unternehmen verlassen sich t\u00e4glich auf zahlreiche Dokumenttypen: Bestellungen, Lieferscheine, Frachtbriefe, CE-Zertifikate \u2026 die Liste lie\u00dfe sich fortsetzen. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Die_Suche_nach_der_Wunderwaffe\"><\/span>Die Suche nach der Wunderwaffe<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Aus der Perspektive von Software-Robotern wird es schnell kompliziert. Ein Computer versteht nicht, was ein \u201eRechnungsdatum\u201c (Label) bedeutet, und es sind einige zus\u00e4tzliche Schritte erforderlich, bevor wir diesen Wert tats\u00e4chlich nutzen k\u00f6nnen. <\/p>\n\n<p>Hier betreten wir die Welt des Intelligent Document Processing (IDP) \u2013 einer Technologie, die k\u00fcnstliche Intelligenz (KI) einsetzt, um die Klassifizierung, Extraktion und Verarbeitung von Daten aus verschiedenen Dokumenttypen zu automatisieren. Sie kombiniert Technologien wie Machine Learning, Natural Language Processing (NLP) und Optical Character Recognition (OCR). Welches Framework oder welcher L\u00f6sungsanbieter genutzt wird, ist Geschmackssache; in diesem Artikel konzentrieren wir uns jedoch auf UiPath Document Understanding\u2122 und zerlegen die Dokumentverarbeitungspipeline Schritt f\u00fcr Schritt.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"484\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-1024x484.png\" alt=\"Diagram showing the main steps of the UiPath Document Understanding framework.\" class=\"wp-image-20724\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-1024x484.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-300x142.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-768x363.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03.png 1442w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>UiPath Document Understanding\u2122 framework diagram (main steps)<\/em><\/figcaption><\/figure>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Sagen_Sie_mir_also_was_Sie_wollen\"><\/span>Sagen Sie mir also, was Sie wollen<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Eine ordnungsgem\u00e4\u00dfe Ausgangsanalyse ist f\u00fcr jede Automatisierung entscheidend, aber bei einem Projekt zur intelligenten Dokumentenverarbeitung ist sie absolut unerl\u00e4sslich.<\/p>\n\n<h3 class=\"wp-block-heading\">Beliebt aus gutem Grund<\/h3>\n\n<p>Zun\u00e4chst m\u00fcssen wir festlegen, welche Dokumenttypen in den Geltungsbereich fallen sollen. Technisch gesehen kann das jedes Dokument sein. Typische Rentabilit\u00e4tskennzahlen wie das verarbeitete Volumen, der Zeitaufwand (FTE) oder menschliche Fehler helfen sicherlich dabei, die Auswahl einzugrenzen. Dies sind solide Grundlagen, aber bei der Automatisierung von Dokumenten-Workflows gibt es noch mehr zu beachten.  <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"752\" height=\"426\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_04.jpg\" alt=\"Infografik mit den h&#xE4;ufigsten Anwendungsf&#xE4;llen des PDF-Formats - Daten von Smallpdf.\" class=\"wp-image-20729\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_04.jpg 752w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_04-300x170.jpg 300w\" sizes=\"(max-width: 752px) 100vw, 752px\" \/><figcaption class=\"wp-element-caption\"><em>H\u00e4ufigste PDF-Anwendungsf\u00e4lle (von Smallpdf)<\/em><\/figcaption><\/figure>\n\n<p>Die H\u00e4ufigkeit von Dokumenten ist ein guter Indikator. Nicht nur, dass die Inhalte gut definiert sind (z.B. k\u00f6nnen Informationen, die auf Rechnungen erforderlich sind, durch lokale Gesetze geregelt sein), einige Anbieter bieten auch bereits trainierte Modelle f\u00fcr maschinelles Lernen f\u00fcr die meisten g\u00e4ngigen Dokumenttypen an. Genau das ist bei dem UiPath Document Understanding\u2122 Framework und seinen <strong>Out-of-the-box-Paketen mit vortrainierten Modellen<\/strong> der Fall. Wenn es f\u00fcr Ihren Dokumententyp ein entsprechendes Paket gibt &#8211; verwenden Sie es. Es wird Ihr Projekt mit einer effizienten Basis f\u00fcr die Klassifizierung und Extraktion starten (mehr dazu sp\u00e4ter), ohne dass Sie Ihr eigenes maschinelles Lernmodell erstellen m\u00fcssen.   <\/p>\n\n<h3 class=\"wp-block-heading\">Verschiedene Schattierungen der Rechnung<\/h3>\n\n<p>Selbst wenn wir nur einige wenige Dokumenttypen haben, k\u00f6nnten wir mit mehreren <strong>Layouts<\/strong> konfrontiert sein. In unserem Beispiel kann jedes Unternehmen, das uns eine Rechnung stellt, seine eigene Formatierung, sein eigenes Tabellenschema, seine eigene Kopfzeile, seine eigene Fu\u00dfzeile (oder das Fehlen einer solchen) und so weiter haben. Dies bringt uns zu einer informellen Einteilung in 3 Gruppen: strukturierte, halbstrukturierte und unstrukturierte Dokumente.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"462\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-1024x462.png\" alt=\"Diagramm, das die Aufteilung der Dokumente nach Layouttyp zeigt: strukturiert, halbstrukturiert und unstrukturiert.\" class=\"wp-image-20733\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-1024x462.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-300x135.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-768x347.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05.png 1352w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Abteilung f\u00fcr allgemeine Layouts<\/em><\/figcaption><\/figure>\n\n<p>Die fr\u00fchere Generation von Dokumentverarbeitungsprogrammen war stark von Layouts abh\u00e4ngig, die im Grunde als Schablone hart kodiert waren, z.B.: Suchen Sie ein Wort und bewegen Sie es um eine Position nach rechts, um einen Wert zu erhalten. Dieser Ansatz ist sehr anf\u00e4llig f\u00fcr \u00c4nderungen und erfordert st\u00e4ndige \u00dcberwachung und Wartung. <\/p>\n\n<p>Die gute Nachricht ist, dass moderne Frameworks wie UiPath Document Understanding\u2122 layoutunabh\u00e4ngig sind. Wenn wir also ein bisher ungesehenes Dokument erhalten, sollte es mit \u00e4hnlicher Genauigkeit verarbeitet werden (ein paar Prozent Abweichung) und den Arbeitsablauf nicht unterbrechen. Dennoch sollten wir den Layouts gro\u00dfe Aufmerksamkeit schenken und sie sorgf\u00e4ltig analysieren, bevor wir eine Automatisierung der Dokumentenverarbeitung entwickeln. Layouts k\u00f6nnen sehr <em>kreativ<\/em> sein, was das menschliche Auge erfreuen mag, aber f\u00fcr einen Computer eine harte Nuss sein kann.  <\/p>\n\n<h3 class=\"wp-block-heading\">Die wichtigsten Informationen<\/h3>\n\n<p>Unter Ber\u00fccksichtigung des oben Beschriebenen ist es nun an der Zeit, <strong>Felder<\/strong> zu definieren. Das sind im Wesentlichen Informationen, die wir aus dem Dokument extrahieren m\u00f6chten. Auch hier gilt, dass die g\u00e4ngigsten Felder oft in vorgefertigten Paketen zu finden sind, und es lohnt sich, diese Basiseffizienz zu nutzen, aber Ihr Gesch\u00e4ftsfall wird die Zielmenge bestimmen. <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"480\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-1024x480.png\" alt=\"Screenshot des Bereichs &quot;Document Type Manager&quot; in UiPath Document Understanding.\" class=\"wp-image-20737\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-1024x480.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-300x141.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-768x360.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-1536x720.png 1536w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06.png 1804w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>UiPath Document Understanding\u2122<\/em><br\/><em> &#8211; Dokumenttyp-Manager<\/em><\/figcaption><\/figure>\n\n<p>In den meisten Szenarien geben wir zwei Gruppen von extrahierten Daten an. Erstens allgemeine Felder (auf Kopfebene), die in der Regel einmal auf einer Seite vorkommen und (nicht immer) einwertig sind, z.B.: Rechnungsnummer, Datum oder Gesamtbetrag. Dann enthalten viele Dokumente eine Zeilen- und Spaltenstruktur, die sich perfekt f\u00fcr Tabellenfelder eignet, bei denen wir die Kopfzeile erstellen und eine unbestimmte Anzahl von Zeilen erstellen k\u00f6nnen, die sich sogar \u00fcber mehrere Seiten erstrecken k\u00f6nnen. Die Arbeit mit Tabellen ist praktisch, aber (wieder) k\u00f6nnen Layouts durch sich \u00fcberschneidende Zellwerte, durch andere Inhalte getrennte Zeilen oder (Achtung!) verschachtelte Tabellen \u00fcberm\u00e4\u00dfig komplex werden &#8211; dies kann andere Ans\u00e4tze oder fortgeschrittenere Techniken erfordern.   <\/p>\n\n<p>Einige Frameworks k\u00f6nnen auch zus\u00e4tzliche Funktionen wie Nachbearbeitungsmethoden f\u00fcr Werte oder verschiedene Algorithmen f\u00fcr die Bewertung von \u00dcbereinstimmungen einf\u00fchren. Es ist erw\u00e4hnenswert, dass UiPath Document Understanding\u2122 zus\u00e4tzliche Klassifizierungsfelder einf\u00fchrt (nicht zu verwechseln mit dem Dokumententyp). Diese k\u00f6nnen n\u00fctzlich sein, wenn wir eine weitere Unterteilung einf\u00fchren und Dokumente auf der Grundlage von W\u00e4hrung, Sprache, Untertyp (z.B. Gutschrift) usw. kategorisieren m\u00f6chten.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"641\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-1024x641.png\" alt=\"Beispiel f&#xFC;r erweiterte Einstellungen f&#xFC;r ein einzelnes Taxonomiefeld im Dokumentverarbeitungs-Workflow.\" class=\"wp-image-20741\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-1024x641.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-300x188.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-768x481.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07.png 1042w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Erweiterte Einstellungen f\u00fcr ein einzelnes Taxonomiefeld<\/em><\/figcaption><\/figure>\n\n<p>All diese Schl\u00fcsselelemente: Dokumenttypen und Felder bestimmen unser Projekt zur Dokumentenverarbeitung und werden oft als <strong>Taxonomie<\/strong> bezeichnet. Bevor wir sie anwenden k\u00f6nnen, m\u00fcssen wir noch ein weiteres Problem zwischen Mensch und Computer angehen: das Sehen. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Lassen_Sie_es_sehen_was_Sie_sehen\"><\/span>Lassen Sie es sehen, was Sie sehen<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Computer kommen mit Text gut zurecht &#8211; <em>solange er tats\u00e4chlich vorhanden ist<\/em>. Ein aus Word oder Excel generiertes PDF enth\u00e4lt normalerweise echten, ausw\u00e4hlbaren Text. Aber nicht jedes Dokument ist so (oft als &#8222;nativ&#8220; bezeichnet). In vielen Gesch\u00e4ftsf\u00e4llen haben wir es immer noch mit gescannten Dokumenten zu tun, die im Grunde nur Bilder sind.   <\/p>\n\n<p>An dieser Stelle sollte das IDP-Rahmenwerk die <em>Digitalisierung von Akten<\/em> beinhalten. Dieser Prozess bedeutet normalerweise die Umwandlung von physischem Papier in ein elektronisches Format. Unsere eingehenden Dateien sind bereits digital, daher beziehen wir uns in diesem Zusammenhang auf die Extraktion von Text aus gescannten Dokumenten oder Bildern unter Verwendung der bereits erw\u00e4hnten Technologien zur optischen Zeichenerkennung.  <\/p>\n\n<p>Der Einfachheit halber wollen wir die Digitalisierung von Dateien als beide Aspekte betrachten. Die gute Nachricht ist, dass das Drucken und Scannen immer seltener wird und die heutigen OCR-Engines wesentlich effizienter sind als noch vor einigen Jahren. <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"937\" height=\"608\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08.png\" alt=\"Gescanntes Dokumentmuster, das als Eingabe f&#xFC;r den OCR-Prozess verwendet wird.\" class=\"wp-image-20745\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08.png 937w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08-300x195.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08-768x498.png 768w\" sizes=\"(max-width: 937px) 100vw, 937px\" \/><\/figure>\n\n<p>Achten Sie jedoch auf die Eingangsdaten, die Sie verarbeiten m\u00f6chten. Gescannte Dokumente von schlechter Qualit\u00e4t oder mit handschriftlichen Notizen k\u00f6nnen selbst f\u00fcr die leistungsst\u00e4rksten OCRs eine ernsthafte Herausforderung darstellen und Ihr Automatisierungsprojekt m\u00f6glicherweise zum Scheitern bringen, bevor es \u00fcberhaupt begonnen hat. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Dinge_in_Kisten_packen\"><\/span>Dinge in Kisten packen<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Ordnung zu halten war schon immer wichtig, egal ob es sich um physisches oder digitales Papier handelt. Die Sortierung der verschiedenen eingehenden Dokumenttypen mag trivial klingen, kann aber unsere Prozesse erheblich rationalisieren, insbesondere bei hohem Volumen. <\/p>\n\n<p>Im Bereich der intelligenten Dokumentenverarbeitung wird die Einteilung in Gruppen als <strong>Klassifizierung<\/strong> bezeichnet. Das Ziel ist einfach: der Computer soll erkennen, um welche Art von Dokument es sich handelt, aber die Mittel, um dies zu erreichen, sind ein interessantes Thema. <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"277\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-1024x277.png\" alt=\"Projektansicht in UiPath Document Understanding mit verschiedenen Dokumenttypen.\" class=\"wp-image-20749\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-1024x277.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-300x81.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-768x208.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09.png 1207w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Verschiedene Arten von Dokumenten in der Projektansicht (UiPath Document Understanding\u2122)<\/em><\/figcaption><\/figure>\n\n<p>Es gibt verschiedene Methoden, die unterschiedlich komplex sind. Der erste Gedanke f\u00fchrt uns normalerweise zu <strong>stichwortbasierten<\/strong> Ans\u00e4tzen. Wir suchen nach bestimmten und sich wiederholenden Phrasen, z.B. erwarten wir, dass das Wort &#8222;Rechnung&#8220; mindestens einmal oder sogar mehrmals in einem Dokument vorkommt. Diese Technik beschr\u00e4nkt sich nicht nur auf das Festschreiben von W\u00f6rtern, wir k\u00f6nnen auch nach Mustern suchen, z.B. nach konsistenten alphanumerischen Mustern, wobei <strong>regul\u00e4re Ausdr\u00fccke<\/strong> sehr n\u00fctzlich sind. Ich erkl\u00e4re diese nicht, da sie leicht einen eigenen Artikel f\u00fcllen k\u00f6nnten.    <\/p>\n\n<p>Reale F\u00e4lle sind in der Regel komplizierter. Schl\u00fcsselw\u00f6rter tauchen unregelm\u00e4\u00dfig auf oder \u00fcberschneiden sich zwischen verschiedenen Dokumenttypen, einige W\u00f6rter sind bedeutender als andere. Um diese Probleme zu l\u00f6sen, bietet das UiPath Document Understanding\u2122 Framework fortschrittliche Klassifikatoren, die mit k\u00fcnstlicher Intelligenz erweitert wurden.  <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"752\" height=\"426\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_10.jpg\" alt=\"Liste der verf&#xFC;gbaren Klassifizierungsaktivit&#xE4;ten in UiPath Studio.\" class=\"wp-image-20753\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_10.jpg 752w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_10-300x170.jpg 300w\" sizes=\"(max-width: 752px) 100vw, 752px\" \/><figcaption class=\"wp-element-caption\"><em>Verschiedene in UiPath Studio verf\u00fcgbare Klassifizierer (Aktivit\u00e4ten)<\/em><\/figcaption><\/figure>\n\n<p>Wir haben die M\u00f6glichkeit, einen eigenen Klassifizierer f\u00fcr maschinelles Lernen zu erstellen, der auf unseren Dokumenten <strong>trainiert<\/strong> wird. Die tats\u00e4chlichen Merkmale und die Architektur, die bei der Erstellung des Modells verwendet werden, sind nicht bekannt (geistiges Eigentum), aber kurz gesagt, der Algorithmus lernt bestimmte Muster aus den von uns bereitgestellten Beispielen. Document Understanding\u2122 vereinfacht das Training, auf das wir sp\u00e4ter in diesem Artikel eingehen werden.  <\/p>\n\n<p>Eine weitere Option ist der intelligente Schl\u00fcsselwortklassifikator, bei dem die Engine die W\u00f6rter selbst ausw\u00e4hlt und ihnen eine Gewichtung zuweist. Es handelt sich um eine einfach zu konfigurierende, aber gut abgerundete Option, die zudem <strong>mehrere in einer einzigen Datei zusammengefasste Dokumente aufteilen kann<\/strong>. <\/p>\n\n<p>Und schlie\u00dflich gibt es, wie beim derzeitigen genAI-Boom nicht anders zu erwarten, auch eine Option, um ein Large Language Model die schwere Arbeit machen zu lassen. Wir k\u00f6nnen aus einer Vielzahl von LLMs w\u00e4hlen und die Konfiguration l\u00e4uft darauf hinaus, effektive Klassifizierungsaufforderungen zu schreiben. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Informationen_extrahieren\"><\/span>Informationen extrahieren<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Die Taxonomie legt fest, welche Felder wir wollen, und nun ist es endlich an der Zeit, Daten zu extrahieren. <strong>Die Extraktoren<\/strong> des UiPath Document Understanding\u2122 Frameworks folgen einem \u00e4hnlichen Muster wie die Klassifikatoren: von der einfachen schlagwortbasierten Datenextraktion bis hin zu leistungsstarken Optionen f\u00fcr maschinelles Lernen und genAI. Die Konfiguration der Extraktion erfolgt fast nahtlos. Die Komponenten extrahieren die Informationen, die wir in der Taxonomie angegeben haben, und geben Werte zur\u00fcck, die den erstellten Variablen zugeordnet sind. Einfach.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"278\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-1024x278.png\" alt=\"Folie zur Visualisierung des Konzepts der Datenextraktion aus Dokumenten.\" class=\"wp-image-20757\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-1024x278.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-300x81.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-768x208.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11.png 1228w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Konzept der Extraktion auf einer Folie abgebildet<\/em><\/figcaption><\/figure>\n\n<p>Was etwas schwieriger sein k\u00f6nnte, ist die korrekte Vorhersage und Zuweisung von Datentypen zusammen mit zus\u00e4tzlichen Optionen, z.B. dass ein Feld mehrzeilig (z.B. Adressen) oder mehrwertig (z.B. E-Mail-Adressen) sein kann. Wir k\u00f6nnen jedes Feld als String-Typ festlegen, aber das Modell funktioniert vielleicht besser, wenn wir es nach &#8222;Geldmenge&#8220; suchen lassen und den Wert automatisch konvertieren. <\/p>\n\n<p>Auch Felddefinitionen spielen eine wichtige Rolle: Bestelldatum und Lieferdatum werden beide durch das Datumsformat dargestellt, aber sie repr\u00e4sentieren zwei unterschiedliche Informationen. Die zus\u00e4tzliche Zeit, die Sie in den sorgf\u00e4ltigen Aufbau Ihrer Taxonomie investieren, sollte sich durch eine effiziente und pr\u00e4zise Datenextraktion auszahlen. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Von_der_Vorhersage_zur_Validierung\"><\/span>Von der Vorhersage zur Validierung<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Inzwischen wissen wir \u00fcber Klassifizierung und Extraktion Bescheid und dass intelligente Dokumentenverarbeitung weder Magie noch R\u00e4tselraten ist.<\/p>\n\n<p>Dennoch machen auch die fortschrittlichsten und am besten trainierten Modelle Fehler.  <strong>Jede KI-gest\u00fctzte Automatisierung wird niemals zu 100 % korrekt sein, wenn die Teststichprobe gro\u00df genug ist, um das Gl\u00fcck aus der Gleichung zu nehmen.<\/strong>  Die Fehlerquote kann im Vergleich zur manuellen Verarbeitung immer noch niedriger sein (insbesondere bei gro\u00dfen Mengen), aber die Zielzahlen h\u00e4ngen vom jeweiligen Gesch\u00e4ftsfall ab.<\/p>\n\n<p>Der springende Punkt ist, <strong>wie <\/strong>man mit Modellfehlern umgeht. Das UiPath Document Understanding\u2122 Framework f\u00fchrt ein Konzept des <strong>Konfidenzniveaus<\/strong> ein, das durch einen Prozentwert angegeben wird. Er wird oft mit der Wahrscheinlichkeit verwechselt, stellt aber die Gewissheit des Modells dar, dass das zur\u00fcckgegebene Klassifizierungs- oder Extraktionsergebnis die richtige Antwort ist, unter Ber\u00fccksichtigung des gesamten Kontexts wie OCR-Effizienz, Standort, Felddefinition usw.  <\/p>\n\n<p>Da wir f\u00fcr jedes Klassifizierungs- und Extraktionsergebnis (jedes Feld einzeln) einen Wert von 0-100% zur Verf\u00fcgung haben, k\u00f6nnen wir uns leicht ein Szenario vorstellen, in dem wir akzeptable <strong>Schwellenwerte<\/strong> festlegen, z.B.: wir betrachten alles, was 90% und mehr betr\u00e4gt, als korrekt. Auch hier h\u00e4ngen die Werte stark vom jeweiligen Gesch\u00e4ftsfall ab, in dem die Auswirkungen von Fehlern eine wichtige Rolle spielen. Denken Sie daran, sich die Frage zu stellen, was passieren kann, wenn das Modell zu 90% sicher ist, aber die Daten tats\u00e4chlich falsch sind.  <\/p>\n\n<p>Was ist zu tun, wenn wir den Schwellenwert unterschreiten? Eine Strategie w\u00e4re die Einf\u00fchrung einer <strong>menschlichen Validierung<\/strong>. Wann immer die KI nicht sicher genug ist &#8211; was nicht bedeutet, dass sie falsch lag &#8211; lassen wir einen echten Menschen einspringen und die Ausgabe \u00fcberpr\u00fcfen. Document Understanding\u2122 bietet gebrauchsfertige integrierte Anwendungen (Actions und Apps), bei denen beide als <strong>Validierungsstation<\/strong> dienen k\u00f6nnen. Im Grunde l\u00e4uft die Funktionalit\u00e4t auf ein einfach zu bedienendes interaktives Formular hinaus, in dem die Benutzer das Dokument und die Ergebnisse der automatischen Dokumentenverarbeitung sehen. Durch das Absenden des Formulars werden die validierten Daten weiterverarbeitet.     <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"526\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-1024x526.jpeg\" alt=\"Ausschnitt eines UiPath Actions-Formulars, das f&#xFC;r den Arbeitsablauf Document Understanding entwickelt wurde.\" class=\"wp-image-20761\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-1024x526.jpeg 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-300x154.jpeg 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-768x394.jpeg 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-1536x789.jpeg 1536w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12.jpeg 1636w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>UiPath Actions &#8211; Ausschnitt eines Formulars f\u00fcr das Document Understanding\u2122 Framework<\/em><\/figcaption><\/figure>\n\n<p>Die Vertrauensebene ist eine \u00e4u\u00dferst n\u00fctzliche Funktion, mit der wir den Arbeitsablauf je nach Verarbeitungsbedingungen und Risikofaktor steuern k\u00f6nnen. Noch leistungsf\u00e4higer ist es jedoch, sie mit regelbasierten Validierungen zu kombinieren: Wenn extrahierte Daten eine Entsprechung in unseren Systemen haben, k\u00f6nnen wir die beiden Werte vergleichen und den Ablauf auf der Grundlage dieses Ergebnisses steuern. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Trainieren_Sie_das_Silikongehirn\"><\/span>Trainieren Sie das Silikongehirn<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Da wir all diese Arbeit in die \u00dcberpr\u00fcfung der Klassifizierung und die Validierung der extrahierten Daten gesteckt haben, w\u00e4re es schade, sie nicht zu nutzen. Einige Frameworks, darunter UiPath Document Understanding\u2122, bieten uns eine Methode, um die validierten Daten zu erfassen und als Trainingsbeispiele f\u00fcr weiteres Modelltraining wiederzuverwenden. Auf diese Weise kann unser Modell im Laufe der Zeit verbessert werden.  <\/p>\n\n<p>Es gibt auch eine andere Phase, in der wir ein Modell trainieren wollen oder sogar m\u00fcssen. Die vorgefertigten Pakete funktionieren recht gut, aber wenn wir die Effizienz der trainierten F\u00e4higkeit verbessern wollen, k\u00f6nnen wir ein Projekt sofort mit einer <strong>Etikettierungssitzung<\/strong> beginnen. Dasselbe gilt f\u00fcr benutzerdefinierte Dokumenttypen &#8211; es ist, als w\u00fcrden wir bei Null anfangen, also m\u00fcssen wir nicht nur eine spezifische Taxonomie definieren, sondern auch ein benutzerdefiniertes Modell trainieren.  <\/p>\n\n<p>Gl\u00fccklicherweise ist die Bereitstellung von Machine Learning-Modellen mit Beispielen super einfach. Die Oberfl\u00e4che ist sehr benutzerfreundlich und l\u00e4uft darauf hinaus, die richtigen Werte auf den Seiten gem\u00e4\u00df unserer Taxonomie zu best\u00e4tigen oder auszuw\u00e4hlen. Es ist wie ein Malbuch zum Zeigen und Anklicken.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"472\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-1024x472.png\" alt=\"Screenshot einer Modell-Trainingssitzung mit Datenbeschriftung in Document Manager.\" class=\"wp-image-20765\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-1024x472.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-300x138.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-768x354.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-1536x708.png 1536w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13.png 1819w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Training des Modells im Dokumentenmanager (Beschriftungssitzung)<\/em><\/figcaption><\/figure>\n\n<p>Um auf das menschliche Feedback zur\u00fcckzukommen, kann eine vollautomatische Umschulungsschleife erreicht werden, aber es gibt mindestens zwei Vorbehalte. Erstens gehen wir davon aus, dass die von der Validierungsstation ausgegebenen Daten tats\u00e4chlich korrekt sind. Fehler bei der Validierung der extrahierten Daten sind zwar weniger wahrscheinlich, aber dennoch m\u00f6glich. <strong>Zweitens<\/strong> <strong>muss bei der Validierungsstation nur ein Wert best\u00e4tigt werden, w\u00e4hrend die dem Modell gelieferten Trainingsbeispiele auf alle Vorkommen eines bestimmten Feldes hinweisen m\u00fcssen<\/strong>. In der Praxis bedeutet das, dass nur einseitige Dokumente unver\u00e4ndert als Trainingsbeispiele wiederverwendet werden k\u00f6nnen.   <\/p>\n\n<p>Im Allgemeinen empfiehlt es sich, das Muster immer zu \u00fcberpr\u00fcfen, bevor Sie es zum Training verwenden.<\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Hauptziel\"><\/span>Hauptziel<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Wir haben das Happy End erreicht &#8211; wir verarbeiten Dateien mit verschiedenen Dokumentstrukturen, klassifizieren mehrere Dokumenttypen und extrahieren Daten mit Validierung und Ausnahmebehandlung. Jetzt ist es endlich an der Zeit, die Ergebnisse im Zielprozess zu verwenden &#8211; alles in allem sind wir den ganzen Weg gekommen, um tats\u00e4chlich etwas mit den riesigen Mengen an Dokumenten zu tun, die wir erhalten. <\/p>\n\n<p>Mit dem UiPath Document Understanding\u2122 Framework gibt es nicht viel zu tun, au\u00dfer vorgefertigte Aktivit\u00e4ten zu verwenden, die uns die Daten auf dem Silbertablett servieren. F\u00fcr diejenigen, die Document Understanding\u2122-Modelle verwenden, aber den Rest der L\u00f6sung mit einer anderen Technologie aufbauen m\u00f6chten, steht eine freundliche API zur Verf\u00fcgung (mehr in der UiPath-Dokumentation). Die Klassifizierung und die Extraktion von Daten decken die meisten Szenarien der Dokumentenverarbeitung ab, die in jedem Unternehmen vorkommen k\u00f6nnen: Wenn Sie dar\u00fcber nachdenken, sind diese beiden Funktionen alles, was Sie brauchen.  <\/p>\n\n<p>Die Bearbeitung von Rechnungen ist nur ein Beispiel f\u00fcr einen einzelnen Workflow, bei dem das digitale Papier nur ein ungl\u00fccklicher Tr\u00e4ger der Informationen ist, die zwischen zwei Systemen \u00fcbertragen werden m\u00fcssen. Tools wie UiPath Document Understanding\u2122 eignen sich hervorragend zur L\u00f6sung des Problems der Automatisierung, bei der Daten in PDFs oder Scans gefangen sind. <\/p>\n\n<p>Wenn wir nur eine Alternative finden k\u00f6nnten, um uns solche Dateien gegenseitig zu schicken.<\/p>\n\n<p>Oh, warten Sie&#8230;<\/p>\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Papierlos zu arbeiten ist eine gro\u00dfartige Idee, aber es steckt mehr dahinter, als nur nichts auszudrucken.<\/p>\n","protected":false},"author":3,"featured_media":20709,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[141],"tags":[140],"class_list":["post-20809","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ai-agenten","tag-artikel"],"acf":[],"_links":{"self":[{"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/posts\/20809","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/comments?post=20809"}],"version-history":[{"count":0,"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/posts\/20809\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/media\/20709"}],"wp:attachment":[{"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/media?parent=20809"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/categories?post=20809"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/office-samurai.com\/de\/wp-json\/wp\/v2\/tags?post=20809"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}