{"id":20817,"date":"2025-11-06T07:27:05","date_gmt":"2025-11-06T06:27:05","guid":{"rendered":"https:\/\/office-samurai.com\/gniew-przeciwko-cyfrowemu-papierowi-idp-z-uipath-document-understanding\/"},"modified":"2025-11-14T12:57:58","modified_gmt":"2025-11-14T11:57:58","slug":"gniew-przeciwko-cyfrowemu-papierowi-idp-z-uipath-document-understanding","status":"publish","type":"post","link":"https:\/\/office-samurai.com\/pl\/gniew-przeciwko-cyfrowemu-papierowi-idp-z-uipath-document-understanding\/","title":{"rendered":"Gniew przeciwko cyfrowemu papierowi &#8211; IDP z UiPath Document Understanding"},"content":{"rendered":"\n<p>Przej\u015bcie na prac\u0119 bez papieru to \u015bwietny pomys\u0142, ale to co\u015b wi\u0119cej ni\u017c tylko rezygnacja z drukowania. Chodzi o to, \u017ce dokumenty s\u0105 przeznaczone do czytania przez <em>ludzi<\/em>, podczas gdy <em>komputery<\/em> przetwarzaj\u0105 dane. W wi\u0119kszo\u015bci scenariuszy przetwarzania dokument\u00f3w zamienili\u015bmy fizyczny papier na jego binarny odpowiednik (najcz\u0119\u015bciej w postaci plik\u00f3w PDF \u2013 Portable Document Format), co jest w porz\u0105dku w przypadku rzeczy czytanych przez ludzi: ksi\u0105\u017cek, magazyn\u00f3w, broszur i tym podobnych. Jednak\u017ce to z\u0142e rozwi\u0105zanie dla zautomatyzowanych przep\u0142yw\u00f3w pracy.   <\/p>\n\n<p>Roboty programowe nie <em>czytaj\u0105<\/em>, one dzia\u0142aj\u0105.<\/p>\n\n<p>Zobaczymy, jak dzia\u0142aj\u0105 z UiPath Document Understanding.<\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Szkody_juz_zostaly_wyrzadzone\"><\/span>Szkody ju\u017c zosta\u0142y wyrz\u0105dzone<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Je\u015bli pracujesz w biurze, jest du\u017ca szansa, \u017ce mia\u0142e\u015b ju\u017c do czynienia z dokumentami cyfrowymi. Nie trzeba zag\u0142\u0119bia\u0107 si\u0119 w statystyki, aby odczu\u0107 ich obecno\u015b\u0107, ale zobaczmy, co internet m\u00f3wi o korzystaniu z PDF-\u00f3w. <\/p>\n\n<figure class=\"wp-block-image size-full\"><img fetchpriority=\"high\" decoding=\"async\" width=\"752\" height=\"426\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_01.jpg\" alt=\"Wykres pokazuj&#x105;cy popularno&#x15B;&#x107; formatu PDF &#x2013; dane od Smallpdf\" class=\"wp-image-20713\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_01.jpg 752w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_01-300x170.jpg 300w\" sizes=\"(max-width: 752px) 100vw, 752px\" \/><figcaption class=\"wp-element-caption\"><em>Popularno\u015b\u0107 PDF w liczbach (wed\u0142ug Smallpdf)<\/em><\/figcaption><\/figure>\n\n<p>Te liczby s\u0105 do\u015b\u0107 abstrakcyjne. Ta sama strona podaje, \u017ce tworzenie plik\u00f3w PDF ro\u015bnie od 2020 roku o oko\u0142o 12% rocznie. S\u0105 wsz\u0119dzie, a Twoja firma niemal na pewno otrzymuje faktury, zam\u00f3wienia zakupu lub umowy w tym formacie.   <\/p>\n\n<p>Powinni\u015bmy si\u0119 cieszy\u0107 z oszcz\u0119dzania drzew, mniejszej ilo\u015bci odpad\u00f3w czy ze standaryzowanego formatu (ISO 32000), ale z punktu widzenia automatyzacji biznesu by\u0142 to troch\u0119 samob\u00f3j. Liczby sugeruj\u0105, \u017ce PDF-y nie znikn\u0105, ale zamiast biernego oporu porozmawiajmy o tym, jak zautomatyzowa\u0107 ich w\u0142asne tworzenie. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Jaki_jest_twoj_problem\"><\/span>Jaki jest tw\u00f3j problem?<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>W skr\u00f3cie: zaprojektowali\u015bmy format dla ludzkich oczu, a teraz oczekujemy, \u017ce komputery b\u0119d\u0105 go przetwarza\u0107. W d\u0142u\u017cszej wersji przejd\u017amy przez typowy przyk\u0142ad przetwarzania faktur jako plik\u00f3w przychodz\u0105cych, np. jako za\u0142\u0105cznik\u00f3w do e-maili. <\/p>\n\n<figure class=\"wp-block-image aligncenter size-full is-resized\"><img decoding=\"async\" width=\"640\" height=\"828\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_02.png\" alt=\"Przyk&#x142;ad dokumentu faktury &#x2013; grafika pogl&#x105;dowa.\" class=\"wp-image-20718\" style=\"width:auto;height:600px\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_02.png 640w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_02-232x300.png 232w\" sizes=\"(max-width: 640px) 100vw, 640px\" \/><figcaption class=\"wp-element-caption\"><em>Przyk\u0142ad faktury z Google Graphics<\/em><\/figcaption><\/figure>\n\n<p>Zaanga\u017cowanie cz\u0142owieka jest dobrze zdefiniowane: kto\u015b w \u201eDesign Studio\u201d tworzy faktur\u0119, najlepiej przy u\u017cyciu systemu ERP lub jakiej\u015b aplikacji, i wysy\u0142a j\u0105 dalej. Po drugiej stronie kto\u015b w \u201eABC Corporation\u201d odbiera plik i r\u0119cznie wprowadza odpowiednie dane do w\u0142asnego systemu ERP w celu dalszego przetwarzania. Zazwyczaj \u0142atwo jest odczyta\u0107 kluczowe informacje, takie jak kwota ca\u0142kowita.  <\/p>\n\n<p>Niemniej jednak proces ten jest powtarzalny, podatny na b\u0142\u0119dy i czasoch\u0142onny. By\u0142oby o wiele pro\u015bciej, gdyby obie strony zgodzi\u0142y si\u0119 wymienia\u0107 ustrukturyzowane dane poprzez w\u0142a\u015bciwy interfejs, taki jak Electronic Data Interchange (EDI). Niestety, z naszego do\u015bwiadczenia wynika, \u017ce to wci\u0105\u017c bardziej wyj\u0105tek ni\u017c regu\u0142a.  <\/p>\n\n<p>Wi\u0119ksze inicjatywy, takie jak krajowe systemy e-fakturowania, s\u0105 krokiem we w\u0142a\u015bciwym kierunku, ale faktury to tylko wierzcho\u0142ek g\u00f3ry lodowej. Firmy polegaj\u0105 na wielu typach dokument\u00f3w ka\u017cdego dnia: zam\u00f3wieniach zakupu, listach przewozowych, konosamentach, certyfikatach CE&#8230; lista jest d\u0142uga. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Znalezienie_srebrnej_kuli\"><\/span>Znalezienie srebrnej kuli<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Z perspektywy robot\u00f3w programowych sprawy szybko staj\u0105 si\u0119 skomplikowane. Komputer nie rozumie, co oznacza \u201einvoice date\u201d (etykieta), i zanim b\u0119dziemy mogli faktycznie wykorzysta\u0107 t\u0119 warto\u015b\u0107, konieczne s\u0105 dodatkowe kroki. <\/p>\n\n<p>W tym miejscu wkraczamy w \u015bwiat Intelligent Document Processing (IDP) \u2013 technologii, kt\u00f3ra wykorzystuje sztuczn\u0105 inteligencj\u0119 (AI) do automatyzacji klasyfikacji, ekstrakcji i przetwarzania danych z r\u00f3\u017cnych typ\u00f3w dokument\u00f3w. \u0141\u0105czy ona technologie takie jak uczenie maszynowe, przetwarzanie j\u0119zyka naturalnego (NLP) oraz optyczne rozpoznawanie znak\u00f3w (OCR). Konkretny framework lub dostawca rozwi\u0105zania jest kwesti\u0105 preferencji, ale na potrzeby tego artyku\u0142u przyjrzymy si\u0119 bli\u017cej UiPath Document Understanding\u2122 i roz\u0142o\u017cymy proces przetwarzania dokument\u00f3w krok po kroku.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img decoding=\"async\" width=\"1024\" height=\"484\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-1024x484.png\" alt=\"Diagram przedstawiaj&#x105;cy g&#x142;&#xF3;wne kroki frameworka UiPath Document Understanding.\" class=\"wp-image-20724\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-1024x484.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-300x142.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03-768x363.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_03.png 1442w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Schemat frameworka UiPath Document Understanding\u2122 (g\u0142\u00f3wne kroki)<\/em><\/figcaption><\/figure>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"A_wiec_powiedz_mi_czego_chcesz\"><\/span>A wi\u0119c powiedz mi, czego chcesz.<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Odpowiednia analiza wst\u0119pna ma kluczowe znaczenie dla ka\u017cdej automatyzacji, ale w projekcie inteligentnego przetwarzania dokument\u00f3w jest absolutnie niezb\u0119dna.<\/p>\n\n<h3 class=\"wp-block-heading\">Popularne z jakiego\u015b powodu<\/h3>\n\n<p>Najpierw musimy zdefiniowa\u0107, jakie typy dokument\u00f3w powinny znale\u017a\u0107 si\u0119 w zakresie. Technicznie rzecz bior\u0105c, mog\u0105 to by\u0107 dowolne typy, wi\u0119c typowe wska\u017aniki rentowno\u015bci, takie jak wolumen przetwarzanych dokument\u00f3w, po\u015bwi\u0119cony czas (FTE) czy liczba b\u0142\u0119d\u00f3w ludzkich, z pewno\u015bci\u0105 pomog\u0105 zaw\u0119zi\u0107 wyb\u00f3r. To solidne podstawy, ale przy automatyzacji przep\u0142yw\u00f3w dokument\u00f3w trzeba wzi\u0105\u0107 pod uwag\u0119 co\u015b wi\u0119cej.  <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"752\" height=\"426\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_04.jpg\" alt=\"Infografika przedstawiaj&#x105;ca najcz&#x119;stsze przypadki u&#x17C;ycia formatu PDF &#x2013; dane od Smallpdf.\" class=\"wp-image-20729\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_04.jpg 752w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_04-300x170.jpg 300w\" sizes=\"(max-width: 752px) 100vw, 752px\" \/><figcaption class=\"wp-element-caption\"><em>Najcz\u0119stsze przypadki u\u017cycia PDF (wed\u0142ug Smallpdf)<\/em><\/figcaption><\/figure>\n\n<p>Powszechno\u015b\u0107 dokument\u00f3w jest dobrym wska\u017anikiem. Nie tylko tre\u015b\u0107 jest dobrze zdefiniowana (np. informacje wymagane na fakturach mog\u0105 by\u0107 regulowane przez lokalne prawo), ale niekt\u00f3rzy dostawcy oferuj\u0105 wst\u0119pnie wytrenowane modele uczenia maszynowego dla najpopularniejszych typ\u00f3w dokument\u00f3w. Tak w\u0142a\u015bnie jest w przypadku frameworka UiPath Document Understanding\u2122 i <strong>jego gotowych, wst\u0119pnie wytrenowanych pakiet\u00f3w<\/strong>. Je\u015bli Tw\u00f3j typ dokumentu ma odpowiedni pakiet \u2013 u\u017cyj go \u2013 dzi\u0119ki temu Tw\u00f3j projekt wystartuje z podstawow\u0105 efektywno\u015bci\u0105 w zakresie klasyfikacji i ekstrakcji (wi\u0119cej na ten temat p\u00f3\u017aniej) bez konieczno\u015bci budowania w\u0142asnego modelu uczenia maszynowego.   <\/p>\n\n<h3 class=\"wp-block-heading\">R\u00f3\u017cne odcienie faktury<\/h3>\n\n<p>Nawet je\u015bli mamy tylko kilka typ\u00f3w dokument\u00f3w, mo\u017cemy spotka\u0107 si\u0119 z wieloma r\u00f3\u017cnymi <strong>uk\u0142adami.<\/strong> W naszym przyk\u0142adzie ka\u017cda organizacja wystawiaj\u0105ca nam faktur\u0119 mo\u017ce mie\u0107 w\u0142asne formatowanie, schemat tabeli, umiejscowienie nag\u0142\u00f3wka, stopki (lub jej brak) i tak dalej. To prowadzi nas do nieformalnego podzia\u0142u na 3 grupy: dokumenty ustrukturyzowane, cz\u0119\u015bciowo ustrukturyzowane oraz nieustrukturyzowane.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"462\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-1024x462.png\" alt=\"Diagram showing the division of documents by layout type: structured, semi-structured, and unstructured.\" class=\"wp-image-20733\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-1024x462.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-300x135.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05-768x347.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_05.png 1352w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Og\u00f3lny podzia\u0142 uk\u0142ad\u00f3w<\/em><\/figcaption><\/figure>\n\n<p>Poprzednia generacja narz\u0119dzi do przetwarzania dokument\u00f3w by\u0142a silnie uzale\u017cniona od uk\u0142ad\u00f3w, z kt\u00f3rych ka\u017cdy by\u0142 w zasadzie zakodowany na sztywno jako szablon, np.: zlokalizuj s\u0142owo i przesu\u0144 si\u0119 o jedn\u0105 pozycj\u0119 w prawo, aby uzyska\u0107 warto\u015b\u0107. Takie podej\u015bcie jest bardzo podatne na zmiany i wymaga ci\u0105g\u0142ego monitorowania oraz utrzymania. <\/p>\n\n<p>Dobra wiadomo\u015b\u0107 jest taka, \u017ce nowoczesne frameworki, takie jak UiPath Document Understanding\u2122, s\u0105 niezale\u017cne od uk\u0142adu, wi\u0119c gdy otrzymamy wcze\u015bniej niewidziany dokument, powinien on zosta\u0107 obs\u0142u\u017cony z podobn\u0105 dok\u0142adno\u015bci\u0105 (z odchyleniem o kilka procent) i nie powinien powodowa\u0107 awarii procesu. Niemniej jednak powinni\u015bmy zwraca\u0107 szczeg\u00f3ln\u0105 uwag\u0119 na uk\u0142ady i dok\u0142adnie je analizowa\u0107 przed zbudowaniem automatyzacji przetwarzania dokument\u00f3w. Uk\u0142ady potrafi\u0105 by\u0107 bardzo <em>kreatywne<\/em>, co mo\u017ce cieszy\u0107 ludzkie oko, ale dla komputera mo\u017ce stanowi\u0107 twardy orzech do zgryzienia.  <\/p>\n\n<h3 class=\"wp-block-heading\">Kluczowe informacje<\/h3>\n\n<p>Maj\u0105c na uwadze to, co zosta\u0142o opisane powy\u017cej, wreszcie nadchodzi czas na zdefiniowanie <strong>p\u00f3l<\/strong>, czyli zasadniczo fragment\u00f3w informacji, kt\u00f3re chcemy wyodr\u0119bni\u0107 z dokumentu. Ponownie, te najcz\u0119\u015bciej wyst\u0119puj\u0105ce mo\u017cna cz\u0119sto znale\u017a\u0107 w pakietach wst\u0119pnie wytrenowanych i warto korzysta\u0107 z tej bazowej efektywno\u015bci, lecz to Tw\u00f3j przypadek biznesowy okre\u015bli docelowy zestaw. <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"480\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-1024x480.png\" alt=\"Zrzut ekranu sekcji &#x201E;Document Type Manager&#x201D; w UiPath Document Understanding.\" class=\"wp-image-20737\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-1024x480.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-300x141.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-768x360.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06-1536x720.png 1536w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_06.png 1804w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>UiPath Document Understanding\u2122<\/em><br\/><em> &#8211; Document type manager<\/em><\/figcaption><\/figure>\n\n<p>W wi\u0119kszo\u015bci scenariuszy okre\u015blamy dwie grupy danych do wyodr\u0119bnienia. Po pierwsze, og\u00f3lne pola (na poziomie nag\u0142\u00f3wka), kt\u00f3re zazwyczaj pojawiaj\u0105 si\u0119 jednokrotnie na jednej stronie i maj\u0105 pojedyncz\u0105 warto\u015b\u0107 (cho\u0107 nie zawsze), na przyk\u0142ad: numer faktury, data czy kwota ca\u0142kowita. Nast\u0119pnie wiele dokument\u00f3w zawiera struktur\u0119 wierszy i kolumn, co idealnie nadaje si\u0119 do p\u00f3l tabelarycznych, gdzie tworzymy nag\u0142\u00f3wek i mo\u017cemy obs\u0142u\u017cy\u0107 dowoln\u0105 liczb\u0119 wierszy, nawet obejmuj\u0105cych wiele stron.<br\/>Tabele s\u0105 wygodne w pracy, ale (znowu) uk\u0142ady mog\u0105 by\u0107 nadmiernie z\u0142o\u017cone \u2014 z nak\u0142adaj\u0105cymi si\u0119 warto\u015bciami kom\u00f3rek, wierszami przedzielonymi inn\u0105 tre\u015bci\u0105 lub (uwaga!) zagnie\u017cd\u017conymi tabelami, kt\u00f3re mog\u0105 wymaga\u0107 innych podej\u015b\u0107 lub bardziej zaawansowanych technik.   <\/p>\n\n<p>Niekt\u00f3re frameworki mog\u0105 r\u00f3wnie\u017c wprowadza\u0107 dodatkowe funkcje, takie jak metody post-przetwarzania warto\u015bci lub r\u00f3\u017cne algorytmy oceny dopasowania. Warto wspomnie\u0107, \u017ce UiPath Document Understanding\u2122 udost\u0119pnia dodatkowe pola klasyfikacyjne (nie myli\u0107 z typem dokumentu). Mog\u0105 one by\u0107 przydatne, gdy chcemy wprowadzi\u0107 dalszy podzia\u0142 i kategoryzowa\u0107 dokumenty na podstawie waluty, j\u0119zyka, podtypu (np. nota kredytowa) itp.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"641\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-1024x641.png\" alt=\"Przyk&#x142;ad zaawansowanych ustawie&#x144; dla pojedynczego pola taksonomii w przep&#x142;ywie przetwarzania dokument&#xF3;w.\" class=\"wp-image-20741\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-1024x641.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-300x188.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07-768x481.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_07.png 1042w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Zaawansowane ustawienia dla pojedynczego pola taksonomii<\/em><\/figcaption><\/figure>\n\n<p>Wszystkie te kluczowe elementy \u2014 typy dokument\u00f3w i pola \u2014 okre\u015blaj\u0105 nasz projekt przetwarzania dokument\u00f3w i cz\u0119sto nazywane s\u0105 <strong>taksonomi\u0105<\/strong>. Zanim jednak zaczniemy z niej korzysta\u0107, musimy zmierzy\u0107 si\u0119 z jeszcze jednym problemem cz\u0142owiek kontra komputer: widzeniem. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Pozwol_mu_zobaczyc_to_co_Ty_widzisz\"><\/span>Pozw\u00f3l mu zobaczy\u0107 to, co Ty widzisz<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Komputery doskonale radz\u0105 sobie z tekstem \u2014 <em>o ile ten tekst faktycznie tam jest<\/em>. PDF wygenerowany z Worda lub Excela zazwyczaj zawiera prawdziwy, mo\u017cliwy do zaznaczenia tekst. Jednak nie ka\u017cdy dokument taki jest (cz\u0119sto nazywa si\u0119 je \u201enatywnymi\u201d). W wielu przypadkach biznesowych wci\u0105\u017c mamy do czynienia ze skanami dokument\u00f3w, kt\u00f3re s\u0105 w zasadzie tylko obrazami.   <\/p>\n\n<p>W tym miejscu framework IDP powinien obejmowa\u0107 <em>digitalizacj\u0119 plik\u00f3w.<\/em> Proces ten zazwyczaj oznacza konwersj\u0119 fizycznego papieru do formatu elektronicznego. Nasze pliki przychodz\u0105ce s\u0105 ju\u017c cyfrowe, wi\u0119c w tym kontek\u015bcie m\u00f3wimy o ekstrakcji tekstu ze skanowanych dokument\u00f3w lub obraz\u00f3w, z wykorzystaniem wspomnianych wcze\u015bniej technologii optycznego rozpoznawania znak\u00f3w.  <\/p>\n\n<p>Dla uproszczenia potraktujmy digitalizacj\u0119 plik\u00f3w jako obejmuj\u0105c\u0105 oba te aspekty. Dobr\u0105 wiadomo\u015bci\u0105 jest to, \u017ce drukowanie i skanowanie staje si\u0119 coraz rzadsze, a wsp\u00f3\u0142czesne silniki OCR s\u0105 znacznie bardziej wydajne ni\u017c kilka lat temu. <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"937\" height=\"608\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08.png\" alt=\"Przyk&#x142;adowy zeskanowany dokument u&#x17C;ywany jako dane wej&#x15B;ciowe w procesie OCR.\" class=\"wp-image-20745\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08.png 937w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08-300x195.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_08-768x498.png 768w\" sizes=\"(max-width: 937px) 100vw, 937px\" \/><\/figure>\n\n<p>Niemniej jednak zwracaj uwag\u0119 na dane wej\u015bciowe, kt\u00f3re zamierzasz przetwarza\u0107. Zeskanowane dokumenty z\u0142ej jako\u015bci lub pe\u0142ne odr\u0119cznych notatek mog\u0105 stanowi\u0107 powa\u017cne wyzwanie nawet dla najpot\u0119\u017cniejszych silnik\u00f3w OCR i potencjalnie pogrzeba\u0107 Tw\u00f3j projekt automatyzacji, zanim jeszcze wystartuje. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Ukladanie_rzeczy_w_pudelkach\"><\/span>Uk\u0142adanie rzeczy w pude\u0142kach<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Utrzymanie porz\u0105dku zawsze mia\u0142o znaczenie, niezale\u017cnie od tego, czy papier jest fizyczny, czy cyfrowy. Sortowanie r\u00f3\u017cnych typ\u00f3w nadchodz\u0105cych dokument\u00f3w mo\u017ce brzmie\u0107 banalnie, ale mo\u017ce znacznie usprawni\u0107 nasze procesy, zw\u0142aszcza te o du\u017cej skali. <\/p>\n\n<p>W obszarze inteligentnego przetwarzania dokument\u00f3w kategoryzowanie ich w grupy nazywa si\u0119 klasyfikacj\u0105. Cel jest prosty: sprawi\u0107, aby komputer rozpozna\u0142, jakiego typu jest dany dokument, ale sposoby osi\u0105gni\u0119cia tego celu s\u0105 ciekawym zagadnieniem. <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"277\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-1024x277.png\" alt=\"Widok projektu w UiPath Document Understanding przedstawiaj&#x105;cy r&#xF3;&#x17C;ne typy dokument&#xF3;w.\" class=\"wp-image-20749\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-1024x277.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-300x81.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09-768x208.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_09.png 1207w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>R\u00f3\u017cne typy dokument\u00f3w w widoku projektu (UiPath Document Understanding\u2122)<\/em><\/figcaption><\/figure>\n\n<p>Istnieje kilka metod o r\u00f3\u017cnym poziomie z\u0142o\u017cono\u015bci. Pierwsze skojarzenia prowadz\u0105 zwykle do podej\u015b\u0107 opartych na <strong>s\u0142owach kluczowych<\/strong>. Szukamy konkretnych i powtarzalnych fraz \u2014 na przyk\u0142ad oczekujemy, \u017ce s\u0142owo \u201einvoice\u201d pojawi si\u0119 na dokumencie co najmniej raz lub nawet wielokrotnie. Technika ta nie ogranicza si\u0119 do twardego kodowania s\u0142\u00f3w \u2014 mo\u017cemy r\u00f3wnie\u017c szuka\u0107 wzorc\u00f3w, takich jak sp\u00f3jne wzorce alfanumeryczne, gdzie przydatne staj\u0105 si\u0119 <strong>wyra\u017cenia regularne<\/strong>. Nie b\u0119d\u0119 ich tu wyja\u015bnia\u0107, poniewa\u017c z \u0142atwo\u015bci\u0105 mog\u0142yby wype\u0142ni\u0107 osobny artyku\u0142.    <\/p>\n\n<p>W rzeczywistych przypadkach bywa zwykle trudniej. S\u0142owa kluczowe pojawiaj\u0105 si\u0119 nieregularnie lub pokrywaj\u0105 si\u0119 mi\u0119dzy typami dokument\u00f3w, a niekt\u00f3re s\u0142owa maj\u0105 wi\u0119ksze znaczenie ni\u017c inne. Aby rozwi\u0105za\u0107 te problemy, framework UiPath Document Understanding\u2122 oferuje zaawansowane klasyfikatory wspierane sztuczn\u0105 inteligencj\u0105.  <\/p>\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"752\" height=\"426\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_10.jpg\" alt=\"Lista dost&#x119;pnych aktywno&#x15B;ci klasyfikacyjnych w UiPath Studio.\" class=\"wp-image-20753\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_10.jpg 752w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_10-300x170.jpg 300w\" sizes=\"(max-width: 752px) 100vw, 752px\" \/><figcaption class=\"wp-element-caption\"><em>R\u00f3\u017cne klasyfikatory (aktywno\u015bci) dost\u0119pne w UiPath Studio<\/em><\/figcaption><\/figure>\n\n<p>Mamy mo\u017cliwo\u015b\u0107 zbudowania w\u0142asnego, dedykowanego klasyfikatora opartego na uczeniu maszynowym, <strong>trenowanego<\/strong> na naszych dokumentach. Rzeczywiste cechy i architektura u\u017cywane przy budowaniu modelu s\u0105 nieznane (w\u0142asno\u015b\u0107 intelektualna), ale w skr\u00f3cie algorytm uczy si\u0119 charakterystycznych wzorc\u00f3w z podawanych przez nas przyk\u0142ad\u00f3w. Document Understanding\u2122 upraszcza proces treningu, kt\u00f3ry om\u00f3wimy p\u00f3\u017aniej w artykule.  <\/p>\n\n<p>Inn\u0105 opcj\u0105 jest inteligentny klasyfikator s\u0142\u00f3w kluczowych, w kt\u00f3rym silnik samodzielnie wybiera s\u0142owa i przypisuje im wagi. To proste w konfiguracji, a jednocze\u015bnie wszechstronne rozwi\u0105zanie, kt\u00f3re dodatkowo potrafi <strong>podzieli\u0107 wiele dokument\u00f3w po\u0142\u0105czonych w jeden plik.<\/strong> <\/p>\n\n<p>W ko\u0144cu, jak mo\u017cna si\u0119 spodziewa\u0107 po obecnym boomie na genAI, istnieje r\u00f3wnie\u017c opcja, aby ci\u0119\u017ck\u0105 prac\u0119 wykona\u0142 du\u017cy model j\u0119zykowy. Mo\u017cemy wybiera\u0107 spo\u015br\u00f3d r\u00f3\u017cnych LLM-\u00f3w, a konfiguracja sprowadza si\u0119 do napisania skutecznych prompt\u00f3w klasyfikacyjnych. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Wyodrebnianie_informacji\"><\/span>Wyodr\u0119bnianie informacji<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Taksonomia definiuje, kt\u00f3re pola chcemy uzyska\u0107, i teraz wreszcie nadchodzi czas na wyodr\u0119bnienie danych. <strong>Ekstraktory<\/strong> frameworka UiPath Document Understanding\u2122 pod\u0105\u017caj\u0105 podobnym schematem jak klasyfikatory: od prostej ekstrakcji danych opartej na s\u0142owach kluczowych, a\u017c po zaawansowane opcje oparte na uczeniu maszynowym i genAI. Konfiguracja ekstrakcji jest niemal bezproblemowa \u2014 komponenty wyodr\u0119bniaj\u0105 informacje, kt\u00f3re okre\u015blili\u015bmy w taksonomii, i zwracaj\u0105 warto\u015bci przypisane do utworzonych zmiennych. Proste.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"278\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-1024x278.png\" alt=\"Slajd obrazuj&#x105;cy koncepcj&#x119; ekstrakcji danych z dokument&#xF3;w.\" class=\"wp-image-20757\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-1024x278.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-300x81.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11-768x208.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_11.png 1228w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Koncepcja ekstrakcji przedstawiona na slajdzie<\/em><\/figcaption><\/figure>\n\n<p>To, co mo\u017ce by\u0107 nieco bardziej wymagaj\u0105ce, to poprawne przewidzenie i przypisanie typ\u00f3w danych wraz z dodatkowymi opcjami, takimi jak umo\u017cliwienie polu bycia wielowierszowym (np. adresy) lub wielowarto\u015bciowym (np. adresy e-mail). Mo\u017cemy ustawi\u0107 ka\u017cde pole jako typ string, ale model mo\u017ce dzia\u0142a\u0107 lepiej, je\u015bli pozwolimy mu szuka\u0107 \u201emonetary quantity\u201d i automatycznie konwertowa\u0107 warto\u015b\u0107. <\/p>\n\n<p>Definicje p\u00f3l r\u00f3wnie\u017c odgrywaj\u0105 kluczow\u0105 rol\u0119: order date i delivery date s\u0105 obydwa reprezentowane w formacie daty, ale oznaczaj\u0105 dwa r\u00f3\u017cne fragmenty informacji. Dodatkowy czas po\u015bwi\u0119cony na staranne zbudowanie taksonomii powinien zaowocowa\u0107 wydajn\u0105 i precyzyjn\u0105 ekstrakcj\u0105 danych. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Od_predykcji_do_walidacji\"><\/span>Od predykcji do walidacji<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Do tej pory wiemy ju\u017c o klasyfikacji i ekstrakcji oraz o tym, \u017ce inteligentne przetwarzanie dokument\u00f3w nie jest ani magi\u0105, ani zgadywank\u0105.<\/p>\n\n<p>Niemniej jednak nawet najbardziej zaawansowane i odpowiednio wytrenowane modele pope\u0142niaj\u0105 b\u0142\u0119dy. <strong>Ka\u017cda automatyzacja z elementami AI nigdy nie b\u0119dzie w 100% poprawna, gdy pr\u00f3bka testowa jest wystarczaj\u0105co du\u017ca, aby wykluczy\u0107 czynnik szcz\u0119\u015bcia.<\/strong> Wska\u017anik b\u0142\u0119d\u00f3w mo\u017ce by\u0107 nadal ni\u017cszy w por\u00f3wnaniu z przetwarzaniem r\u0119cznym (szczeg\u00f3lnie przy du\u017cych wolumenach), ale docelowe warto\u015bci b\u0119d\u0105 zale\u017ce\u0107 od konkretnego przypadku biznesowego.<\/p>\n\n<p>Przechodz\u0105c dalej, kluczow\u0105 kwesti\u0105 jest to, <strong>jak<\/strong> obs\u0142ugiwa\u0107 b\u0142\u0119dy modelu. Framework UiPath Document Understanding\u2122 wprowadza poj\u0119cie <strong>poziomu pewno\u015bci <\/strong>okre\u015blanego warto\u015bci\u0105 procentow\u0105. Cz\u0119sto bywa on mylony z prawdopodobie\u0144stwem, lecz reprezentuje stopie\u0144 przekonania modelu, \u017ce zwr\u00f3cony wynik klasyfikacji lub ekstrakcji jest poprawny, bior\u0105c pod uwag\u0119 ca\u0142y kontekst, taki jak efektywno\u015b\u0107 OCR, lokalizacja, definicja pola itp.  <\/p>\n\n<p>Dysponuj\u0105c warto\u015bci\u0105 0\u2013100% dla ka\u017cdego wyniku klasyfikacji i ekstrakcji (dla ka\u017cdego pola osobno), \u0142atwo wyobrazi\u0107 sobie scenariusz, w kt\u00f3rym ustawiamy akceptowalne <strong>progi<\/strong>, np.: uznajemy wszystko powy\u017cej 90% za poprawne. Ponownie, warto\u015bci b\u0119d\u0105 w du\u017cym stopniu zale\u017ca\u0142y od przypadku biznesowego, w kt\u00f3rym wp\u0142yw b\u0142\u0119du odgrywa istotn\u0105 rol\u0119. Pami\u0119taj, aby zada\u0107 sobie pytanie, co mo\u017ce si\u0119 sta\u0107, je\u015bli model jest pewny wyniku w 90%, ale dane w rzeczywisto\u015bci s\u0105 b\u0142\u0119dne.  <\/p>\n\n<p>Co zrobi\u0107, je\u015bli wynik znajdzie si\u0119 poni\u017cej progu? Jedn\u0105 ze strategii by\u0142oby wprowadzenie <strong>walidacji przez cz\u0142owieka<\/strong>. Kiedy AI nie jest wystarczaj\u0105co pewne \u2014 co nie oznacza, \u017ce si\u0119 myli \u2014 pozwalamy prawdziwej osobie wkroczy\u0107 i sprawdzi\u0107 wynik. Document Understanding\u2122 udost\u0119pnia gotowe, zintegrowane aplikacje (Actions i Apps), z kt\u00f3rych ka\u017cda mo\u017ce pe\u0142ni\u0107 rol\u0119 <strong>stacji walidacyjnej<\/strong>. W praktyce funkcjonalno\u015b\u0107 sprowadza si\u0119 do \u0142atwego w obs\u0142udze interaktywnego formularza, w kt\u00f3rym u\u017cytkownicy widz\u0105 dokument oraz wyniki automatycznego przetwarzania. Przes\u0142anie formularza kieruje zwalidowane dane dalej w proces.     <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"526\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-1024x526.jpeg\" alt=\"Fragment formularza UiPath Actions zaprojektowanego dla przep&#x142;ywu Document Understanding.\" class=\"wp-image-20761\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-1024x526.jpeg 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-300x154.jpeg 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-768x394.jpeg 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12-1536x789.jpeg 1536w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_12.jpeg 1636w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>UiPath Actions \u2013 fragment formularza dedykowanego frameworkowi Document Understanding\u2122<\/em><\/figcaption><\/figure>\n\n<p>Poziom pewno\u015bci to niezwykle przydatna funkcja, kt\u00f3ra pozwala nam kontrolowa\u0107 przep\u0142yw pracy w zale\u017cno\u015bci od okoliczno\u015bci przetwarzania i czynnika ryzyka. Jeszcze pot\u0119\u017cniejsze jest jednak po\u0142\u0105czenie go z walidacjami opartymi na regu\u0142ach: je\u015bli jakiekolwiek wyodr\u0119bnione dane maj\u0105 odpowiednik w naszych systemach, mo\u017cemy por\u00f3wna\u0107 obie warto\u015bci i sterowa\u0107 przep\u0142ywem w oparciu o ten rezultat. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Wytrenuj_silikonowy_mozg\"><\/span>Wytrenuj silikonowy m\u00f3zg<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Skoro w\u0142o\u017cyli\u015bmy tyle pracy w przegl\u0105d klasyfikacji i walidacj\u0119 wyodr\u0119bnionych danych, by\u0142oby szkoda tego nie wykorzysta\u0107. Niekt\u00f3re frameworki, w tym UiPath Document Understanding\u2122, oferuj\u0105 metod\u0119 przechwytywania zwalidowanych danych i ponownego u\u017cycia ich jako przyk\u0142ad\u00f3w treningowych do dalszego szkolenia modelu. W ten spos\u00f3b nasz model mo\u017ce z czasem si\u0119 doskonali\u0107.  <\/p>\n\n<p>Istnieje te\u017c inny etap, w kt\u00f3rym chcemy lub nawet musimy wytrenowa\u0107 model. Gotowe pakiety dzia\u0142aj\u0105 ca\u0142kiem dobrze, ale je\u015bli chcemy poprawi\u0107 efektywno\u015b\u0107 wst\u0119pnie wytrenowanej umiej\u0119tno\u015bci, mo\u017cemy od razu rozpocz\u0105\u0107 projekt od <strong>sesji etykietowania<\/strong>. To samo dotyczy niestandardowych typ\u00f3w dokument\u00f3w \u2014 to jak zaczynanie od zera, wi\u0119c opr\u00f3cz zdefiniowania konkretnej taksonomii musimy r\u00f3wnie\u017c wytrenowa\u0107 w\u0142asny model.  <\/p>\n\n<p>Na szcz\u0119\u015bcie dostarczanie modeli uczenia maszynowego przyk\u0142ad\u00f3w jest niezwykle proste. Interfejs jest bardzo przyjazny dla u\u017cytkownika i sprowadza si\u0119 do potwierdzania lub wybierania w\u0142a\u015bciwych warto\u015bci na stronach zgodnie z nasz\u0105 taksonomi\u0105. To jak kolorowanka typu point-and-click.  <\/p>\n\n<figure class=\"wp-block-image size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"472\" src=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-1024x472.png\" alt=\"Zrzut ekranu sesji trenowania modelu z etykietowaniem danych w Document Manager.\" class=\"wp-image-20765\" srcset=\"https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-1024x472.png 1024w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-300x138.png 300w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-768x354.png 768w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13-1536x708.png 1536w, https:\/\/office-samurai.com\/wp-content\/uploads\/2025\/11\/uipath-document-understanding_office_samurai_13.png 1819w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><figcaption class=\"wp-element-caption\"><em>Trenowanie modelu w Document Manager (sesja etykietowania)<\/em><\/figcaption><\/figure>\n\n<p>Wracaj\u0105c do wykorzystania informacji zwrotnej od cz\u0142owieka, mo\u017cna osi\u0105gn\u0105\u0107 w pe\u0142ni automatyczn\u0105 p\u0119tl\u0119 ponownego trenowania, ale istniej\u0105 co najmniej dwa zastrze\u017cenia. Po pierwsze, zak\u0142adamy, \u017ce dane wyj\u015bciowe z stacji walidacyjnej s\u0105 rzeczywi\u015bcie poprawne. B\u0142\u0119dy podczas walidacji wyodr\u0119bnionych danych s\u0105 mniej prawdopodobne, ale nadal mo\u017cliwe. <strong>Po drugie<\/strong>, <strong>stacja walidacyjna wymaga potwierdzenia tylko jednej warto\u015bci, podczas gdy przyk\u0142ady treningowe dostarczane do modelu musz\u0105 wskazywa\u0107 wszystkie wyst\u0105pienia danego pola<\/strong>. W praktyce oznacza to, \u017ce jedynie dokumenty jednostronicowe mo\u017cna ponownie wykorzysta\u0107 bez zmian jako przyk\u0142ady treningowe.   <\/p>\n\n<p>Og\u00f3lnie rzecz bior\u0105c, najlepsz\u0105 praktyk\u0105 jest zawsze przejrzenie pr\u00f3bki przed u\u017cyciem jej do treningu.<\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Glowny_cel\"><\/span>G\u0142\u00f3wny cel<span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p>Dotarli\u015bmy do szcz\u0119\u015bliwego fina\u0142u \u2013 przetwarzamy pliki o r\u00f3\u017cnych strukturach dokument\u00f3w, klasyfikujemy wiele typ\u00f3w dokument\u00f3w oraz wyodr\u0119bniamy dane z walidacj\u0105 i obs\u0142ug\u0105 wyj\u0105tk\u00f3w. Wreszcie nadszed\u0142 czas, aby wykorzysta\u0107 wyniki w docelowym procesie \u2013 w ko\u0144cu ca\u0142a ta droga mia\u0142a prowadzi\u0107 do tego, by faktycznie co\u015b zrobi\u0107 z ogromn\u0105 liczb\u0105 otrzymywanych dokument\u00f3w. <\/p>\n\n<p>W ramach UiPath Document Understanding\u2122 niewiele pozostaje do zrobienia poza u\u017cyciem gotowych aktywno\u015bci, kt\u00f3re podaj\u0105 nam dane na tacy. Dla tych, kt\u00f3rzy chcieliby korzysta\u0107 z modeli Document Understanding\u2122, ale budowa\u0107 reszt\u0119 rozwi\u0105zania w innej technologii, dost\u0119pne jest przyjazne API (wi\u0119cej w dokumentacji UiPath). Klasyfikacja i ekstrakcja danych obejmuj\u0105 wi\u0119kszo\u015b\u0107 scenariuszy przetwarzania dokument\u00f3w, jakie mo\u017cna znale\u017a\u0107 w operacjach biznesowych w dowolnej organizacji: kiedy si\u0119 nad tym zastanowi\u0107, te dwie funkcje to wszystko, czego potrzebujesz.  <\/p>\n\n<p>Przetwarzanie faktur to tylko jeden przyk\u0142ad pojedynczego przep\u0142ywu pracy, w kt\u00f3rym cyfrowy papier jest jedynie niefortunnym no\u015bnikiem informacji, kt\u00f3re musz\u0105 zosta\u0107 przeniesione pomi\u0119dzy dwoma systemami. Narz\u0119dzia takie jak UiPath Document Understanding\u2122 \u015bwietnie radz\u0105 sobie z problemem automatyzacji, kt\u00f3ra obejmuje dane uwi\u0119zione w plikach PDF lub skanach. <\/p>\n\n<p>Gdyby tylko uda\u0142o nam si\u0119 znale\u017a\u0107 alternatyw\u0119 dla przesy\u0142ania sobie takich plik\u00f3w.<\/p>\n\n<p>Och, czekaj\u2026<\/p>\n\n<p><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Przej\u015bcie na prac\u0119 bez papieru to \u015bwietny pomys\u0142, ale to co\u015b wi\u0119cej ni\u017c tylko rezygnacja z drukowania.<\/p>\n","protected":false},"author":3,"featured_media":20711,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[147],"tags":[138],"class_list":["post-20817","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-agenci-ai","tag-artykul"],"acf":[],"_links":{"self":[{"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/posts\/20817","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/comments?post=20817"}],"version-history":[{"count":0,"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/posts\/20817\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/media\/20711"}],"wp:attachment":[{"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/media?parent=20817"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/categories?post=20817"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/office-samurai.com\/pl\/wp-json\/wp\/v2\/tags?post=20817"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}