Problemos apibrėžimas: Rankinio duomenų įvedimo kaina
Konnichiwa, sveiki atvykę į Dirbtinio Intelekto Automatizacijos Dojo – laidą, kuri pažvelgia į kalnus popierizmo, palaidojančio jūsų verslą, ir sako: „Turi būti geresnis būdas nei tiesiog nusipirkti didesnį smulkintuvą.“ Šiandien pasinersime į temą, kuri skamba neįtikėtinai nuobodžiai, bet pažadu – iš tikrųjų tai yra slapta ginkluotė. Kalbėsime apie Išmanųjį Dokumentų Apdorojimą, arba IDP. Taip, žinau, dar viena trijų raidžių santrumpa, bet ši (ši tikrai to verta). Aš esu jūsų vedėjas Andrzej Kinastowski, vienas iš Office Samurai įkūrėjų – įmonės, kuri kovoje su neefektyvumu siekia būti paskutiniu išlikusiu samurajumi. Tad nesvarbu, ar esate verslo lyderis, technologijų entuziastas, ar tiesiog žmogus, praleidęs 45 minutes bandydamas pateikti išlaidų ataskaitą už 4 dolerių kavą – jūs esate tinkamoje vietoje.
Leiskite nupiešti jums paveikslą. Penktadienis, 15:00, jaučiate savaitgalio skonį, o tarp jūsų ir laisvės stovi tik viena paskutinė užduotis: pateikti savo savaitines sąskaitas faktūras. Atidarote pirmąjį PDF (tai skenavimas, jis kreivas, atrodo, tarsi būtų nufotografuotas bulve), primerkiate akis bandydami įskaityti skaičius ir pradedate juos ranka vesti į savo ERP sistemą (sąskaitos numeris, data, eilutės suma). Jaučiate, kaip maža jūsų sielos dalelė sunyksta ir virsta dulkėmis – jūs įžengėte į septintąjį korporatyvinio pragaro ratą (rankinį duomenų įvedimą). Tai lėtas, pasikartojantis procesas, linkęs į žmogiškas klaidas, ir jis nėra mastelis. Vienas neteisingai įvestas dešimtainis skaičius gali sukelti valandas derinimo darbo. Praleista sąskaita gali lemti pavėluotus mokėjimus ir pakenkti svarbiam santykiui su tiekėju. Tai ir yra rankinio duomenų įvedimo iššūkis. Tai kliūtis daugybėje verslo procesų – nuo finansų ir personalo iki pardavimų bei logistikos. Tas pats scenarijus kartojasi sutarties valdyme, žalų administravime, klientų įtraukties procesuose. Šis skaitmeninis trinties taškas kainuoja įmonėms milijonus prarasto produktyvumo ir veiklos rizikos. Kiekviena minutė, kurią darbuotojas praleidžia ranka perkeldamas duomenis, yra minutė, kurios jis neskiria analizei, strategijai ar klientų aptarnavimui. Tai klasikinis atvejis, kai protingi žmonės yra verčiami atlikti neprotingą darbą.
O kas, jei galėtume tai automatizuoti? Kas, jei galėtumėte tiesiog numesti tą skaitmeninio popieriaus krūvą mašinai ir pasakyti: „Tu išsiaiškink.“ Kas, jei galėtume išmokyti kompiuterius skaityti ir suprasti dokumentus taip, kaip tai daro žmonės, tik (žinote) greičiau, be skundų ir be kavos pertraukos kas 12 minučių? Tai yra pagrindinė Išmaniojo Dokumentų Apdorojimo (IDP) vertės pasiūlos esmė.
Kas yra IDP? Daugiau nei zoninis OCR
Aukštuoju lygiu IDP yra technologinis sprendimas, kuris naudoja dirbtinį intelektą automatiniam duomenų fiksavimui, ištraukimui, praturtinimui ir apdorojimui iš įvairių struktūrizuotų, pusiau struktūrizuotų ir nestruktūrizuotų dokumentų. Noriu tai labai aiškiai pasakyti: tai ne jūsų senelio skeneris iš 1998-ųjų. Čia ne kalbama tik apie popieriaus lapo pavertimą skaitmeniniu paveikslu (tai skaitmeninimas, tai pirmas žingsnis, jį darome jau dešimtmečius). IDP esmė – supratimas.
Tai, kuo IDP taip pat nėra, yra šablonais pagrįstas OCR, kurį turėjome dešimtmečius. Toks metodas (dažnai vadinamas zoniniu OCR) reikalavo sukurti fiksuotą šabloną kiekvienam dokumento išdėstymui, nustatant tikslias vietas puslapyje, kuriose tikimasi rasti duomenis. Jei tiekėjas net šiek tiek pakeisdavo savo sąskaitos dizainą (pavyzdžiui, perkeldavo datos laukelį iš viršutinio dešiniojo kampo į kairįjį), šablonas sugriūdavo ir procesas sustodavo, reikalaudamas rankinio įsikišimo. Tai buvo trapus sprendimas, kuris negalėjo būti mastelis dinamiškoje verslo aplinkoje, kur egzistuoja šimtai ar net tūkstančiai skirtingų dokumentų formatų.
Tuo tarpu IDP yra bešablonis. Jis naudoja dirbtinį intelektą dokumento turiniui ir kontekstui suprasti. Jis neieško duomenų fiksuotose vietose – jis mokosi atpažinti, kas yra, pavyzdžiui, sąskaitos data, nepriklausomai nuo to, kur ji puslapyje pateikta. IDP žengia toliau nei paprastas teksto atpažinimas – jis supranta semantinę duomenų prasmę dokumentuose. (Tai skirtumas tarp knygos prancūzų kalba nufotografavimo ir tikro gebėjimo ją skaityti bei suprasti prancūziškai.)

Kodėl turėtumėte tuo domėtis? Nauda
Kodėl turėtumėte domėtis IDP? Žinau, ką galvojate: „Puiku, dar vienas dirbtinio intelekto dalykas, kuris pažadės man pasaulį ir pateiks dar vieną informacinį skydelį, suteikiantį 15 naujų būdų vizualizuoti, kiek esu atsilikęs.“ Ir jūsų skepticizmas visiškai pagrįstas. Tačiau esmė čia žiauriai paprasta: laikas, pinigai ir sveikas protas. Arba, kaip pasakytų tikras konsultantas – operacinis efektyvumas, duomenų tikslumas ir išteklių paskirstymas.
Automatizuodamos rankinį duomenų įvedimą, įmonės gali sumažinti apdorojimo laiką ir išlaidas – daugelis organizacijų praneša apie iki 80 % sumažėjusias duomenų apdorojimo sąnaudas. Tai ne tik darbo kaštų optimizavimas – tai verslo ciklų sutrumpinimas, mažinant žmogiškojo įsikišimo poreikį. Duomenų įvedimo klaidų (kurios gali būti brangios ir pakenkti santykiams) ženkliai sumažėja, todėl žemyninėje grandinėje esančiose sistemose duomenų kokybė tampa geresnė. Tai sukuria grandininį efektą, pagerindamas viską – nuo finansinių prognozių ir atitikties ataskaitų iki klientų aptarnavimo. Aukštos kokybės duomenys yra kuras visoms kitoms skaitmeninės transformacijos pastangoms.
Svarbiausia, kad tai leidžia perkelti darbuotojus nuo mažos vertės, pasikartojančių užduočių prie didesnės vertės veiklų, kurios reikalauja kritinio mąstymo, bendravimo su klientais ir sudėtingų problemų sprendimo. Tai apie paties darbo pobūdžio pakėlimą į aukštesnį lygį ir darbuotojų pasitenkinimo didinimą, pašalinant pačias nuobodžiausias jų darbo dalis (tas, kurių visi labiausiai nemėgsta).
Skaitmeninė magija: technologijos, slypinčios už IDP
Kaip ši skaitmeninė magija iš tikrųjų veikia? Tai nėra magija – tai tiesiog kelių pagrindinių technologijų derinys, kurios pagaliau tapo pakankamai geros, kad būtų naudingos. Galite įsivaizduoti tai kaip dirbtinio intelekto Power Rangers komandą.

Pagrindiniai dirbtinio intelekto komponentai
1. Optinis simbolių atpažinimas (OCR): tai visos operacijos akys, pagrindinis sluoksnis, kuris paverčia vaizdo pikselius į mašinai skaitomus simbolių duomenis. Šiuolaikinės OCR sistemos (dažnai pačios paremtos giluminio mokymosi modeliais) pasiekė labai aukštą tikslumą ir gali apdoroti daugybę šriftų, kalbų, o tam tikru mastu net ir rankraštį. Jos ne tik atpažįsta simbolius, bet ir fiksuoja metaduomenis, tokius kaip šrifto dydis bei kiekvieno žodžio XY koordinatės – tai itin svarbu tolesniems dokumento išdėstymo supratimo etapams.
2. Kompiuterinė rega: tai svarbus, bet dažnai nuvertinamas komponentas. Kompiuterinės regos modeliai (ypač konvoliuciniai neuroniniai tinklai) analizuoja dokumento vizualinę struktūrą. Jie atpažįsta tokius elementus kaip lentelės, logotipai, parašai ir žymimieji langeliai. Šitaip sistema gali atskirti antraštę nuo eilutės elemento, net jei tekstas atrodo panašiai. Be to, kompiuterinė rega padeda identifikuoti patį dokumento tipą (pavyzdžiui, paso nuotraukos buvimas yra stiprus požymis, kad dokumentas yra tapatybės patvirtinimo forma).
3. Natūralios kalbos apdorojimas (NLP): tai smegenys – intelekto sluoksnis. Kai OCR pateikia neapdorotą tekstą, NLP taiko tokias technikas kaip pavadintųjų esybių atpažinimas (NER) (dar viena trijų raidžių santrumpa), kad identifikuotų ir suskirstytų pagrindinius duomenų elementus (pvz., asmens vardą, organizaciją, datą ar piniginę vertę). Jis naudoja pažangius kalbos modelius (paremtus transformerių architektūra), kad suprastų kalbinį kontekstą ir ryšius tarp žodžių. Būtent tai leidžia suprasti, kad „apmokėjimo terminas“ ir „mokėjimo sąlygos“ gali reikšti tą patį. NLP taip pat atlieka ryšių išgavimą, nustatydamas, kaip skirtingos esybės tarpusavyje susijusios (pavyzdžiui, susiedamas konkretaus eilutės elemento aprašymą su jo vieneto kaina ir kiekiu).
4. Mašininis ir giluminis mokymasis: tai mokymosi dalis – būtent tai leidžia sistemai prisitaikyti ir tobulėti. IDP platformos yra mokomos naudojant didelius, įvairius dokumentų duomenų rinkinius. Ši mokymosi geba leidžia sistemai tvarkytis su milžiniška dokumentų išdėstymo įvairove be iš anksto apibrėžtų šablonų (kaip reikėdavo senosiose OCR sistemose). Būtent čia sistema taip pat sugeneruoja pasitikėjimo įvertį kiekvienam ištrauktam laukui – tai itin svarbu žmogaus įsikišimo ciklo procese. Svarbiausia tai, kad nors sistema turi iš anksto apmokytus modelius tam tikriems dokumentų tipams, ji vis tiek gali mokytis. Jei žmogus ištaiso lauką, kurį sistema atpažino neteisingai, ji iš to mokosi ir daugiau tokios klaidos nekartos. Ji tampa protingesnė su kiekvienu naujai apdorotu dokumentu.
IDP darbo eiga: septyni pagrindiniai etapai
Tipinė IDP darbo eiga susideda iš septynių pagrindinių etapų, sudarančių tvirtą duomenų apdorojimo grandinę:
- Įkėlimas: įėjimo taškas. Sistema priima dokumentus iš įvairių šaltinių (el. pašto dėžutės, FTP serverio, internetinio portalo, debesijos saugyklos, API užklausos).
- Išankstinis apdorojimas: dokumentai yra optimizuojami dirbtiniam intelektui (kritinis žingsnis, tiesiogiai veikiantis tikslumą). Šis etapas apima automatizuotus procesus, tokius kaip vaizdo išlyginimas (pasukimo koregavimas), triukšmo šalinimas (taškelių pašalinimas) ir binarizacija (vaizdo pavertimas grynai juodai baltu). (Galite tai įsivaizduoti kaip fotoaparato objektyvo nuvalymą prieš darant nuotrauką.)
- Klasifikavimas: sistema turi nustatyti, koks tai dokumentas (sąskaita faktūra, sutartis, pirkimo užsakymas ar pasas). Tai itin svarbu, nes leidžia sistemai nukreipti dokumentus į tinkamą, konkrečiam tipui pritaikytą ištraukimo modelį.
- Duomenų ištraukimas: pagrindiniai dirbtinio intelekto modeliai išgauna iš anksto nustatytus duomenų laukus. Šiuolaikinės IDP sistemos naudoja hibridinį metodą – taisykles numatomiems duomenims ir sudėtingą mašininį mokymąsi tiems duomenų elementams, kurie gali pasirodyti bet kurioje dokumento vietoje.
- Patvirtinimas: išgauti duomenys automatiškai tikrinami pagal verslo taisyklių rinkinį ir išorines duomenų bazes (pvz., ar darbuotojas egzistuoja ERP sistemoje, ar PVM kodas galioja, ar eilutės sumos sutampa su bendra suma). Duomenys, kurie nepraeina patvirtinimo arba turi žemą pasitikėjimo įvertį, pažymimi kitam etapui.
- Žmogaus įsikišimas (peržiūra ir grįžtamasis ryšys): dokumentai, pažymėti patvirtinimo etape, nukreipiami žmogui operatoriui per specialią vartotojo sąsają. Operatorius gali greitai patvirtinti arba pataisyti duomenis. Svarbiausia – kiekvienas žmogaus atliktas pataisymas yra įrašomas ir perduodamas atgal į mašininio mokymosi modelį (tai vadinama aktyviuoju mokymusi), leidžiant dirbtiniam intelektui nuolat tobulinti savo tikslumą ir ilgainiui mažinti klaidų skaičių.
- Integracija: patvirtinti, sustruktūrinti duomenys eksportuojami tinkamu formatu (JSON arba XML). Tada šie duomenys per API ar kitus integracijos metodus perduodami į tolesnes verslo sistemas, tokias kaip ERP, CRM ar RPA platformos (kurios vėliau gali atlikti papildomus veiksmus, pavyzdžiui, įregistruoti sąskaitą faktūrą ar sukurti naują kliento įrašą).

Lūžio taškas: struktūruoti ir nestruktūruoti duomenys
Struktūruoti duomenys yra tvarkingi ir gražiai sudėti į dėžutę (pavyzdžiui, skaičiuoklėje ar duomenų bazėje). Nestruktūruoti duomenys – tai visa likusi visata (tie 80 % informacijos, kuria remiasi verslai, tokios kaip el. laiškų tekstai, teisinės sutartys ar gydytojų pastabos).
Pagrindinė IDP stiprybė yra jos gebėjimas apdoroti nestruktūruotus ir (dažniausiai) pusiau struktūruotus duomenis. Sąskaita faktūra yra puikus pusiau struktūruoto dokumento pavyzdys – joje yra numatoma informacija (data, bendra suma), tačiau išdėstymas ir kalba gali smarkiai skirtis. IDP sukurta taip, kad suvaldytų šį sudėtingumą ir įvestų nuoseklų, struktūruotą formatą į šiuos chaotiškus duomenis. Anksčiau turėjome didžiulių problemų vykdydami RPA procesus su nestruktūruotais ar pusiau struktūruotais įvesties duomenimis, o dabar, turėdami IDP, galime šiuos procesus automatizuoti.
Kur IDP keičia žaidimo taisykles (naudojimo atvejai)
Finansai ir apskaita (didžiausias skausmo taškas)
🔸 Sąskaitų faktūrų apdorojimas: pirkimo–apmokėjimo ciklo automatizavimas sutrumpina apdorojimo laiką nuo savaičių iki valandų. Pažangios sistemos gali atlikti trijų krypčių suderinimą (sąskaitos faktūros sutikrinimą su pradiniu pirkimo užsakymu ir prekių priėmimo aktu), taip sumažindamos permokų ir sukčiavimo riziką.
🔸 Pirkimo užsakymo kūrimas: IDP gali nuskaityti pirkimo paraiškas (kurios dažnai pateikiamos nestruktūrizuotu formatu, pvz., el. laiško tekste ar PDF formoje), ištraukti reikiamą informaciją (prekės aprašymą, kiekį) ir automatiškai užpildyti pirkimo užsakymą pirkimų sistemoje.
🔸 Išlaidų ataskaitos: darbuotojai nufotografuoja kvitą, o dirbtinis intelektas automatiškai ištraukia tiekėją, datą ir sumą.
🔸 Auditas ir atitiktis: IDP gali analizuoti 100 % išlaidų ataskaitų ar buhalterinių įrašų (vietoj rankinio imčių tikrinimo), sutikrindama kvitus su pateiktomis paraiškomis ir pažymėdama politikos pažeidimus, taip padidindama vidinio ir išorinio audito efektyvumą.
Žmogiškieji ištekliai (skęstantys popierizme)
🔸 Gyvenimo aprašymų (CV) tikrinimas: jei įmonė gauna 500 paraiškų dėl vienos darbo vietos, dirbtinis intelektas gali jas visas peržiūrėti per kelias minutes, ištraukti pagrindinę informaciją (darbo patirtį, įgūdžius) ir greitai sudaryti trumpąjį kandidatų sąrašą. Be to, jis gali ignoruoti demografinę informaciją, taip padėdamas užtikrinti sąžiningą įdarbinimo procesą.
🔸 Naujo darbuotojo įvedimas: IDP gali apdoroti naujų darbuotojų dokumentus (sutartis, mokesčių formas, tapatybės dokumentus) ir automatiškai perkelti duomenis į personalo valdymo, darbo užmokesčio bei IT sistemų kūrimo sistemas, taip užtikrindama sklandų ir greitą įdarbinimo procesą.

Specializuotos industrijos
🔸 Sveikatos apsauga: pacientų registracijos formų ir draudimo pretenzijų apdorojimas. Kritinių duomenų iš gydytojų užrašų ir laboratorinių ataskaitų ištraukimas, siekiant atnaujinti elektroninius sveikatos įrašus.
🔸 Draudimas: žalų administravimo proceso spartinimas (ištraukiant duomenis iš žalos, policijos ir medicininių ataskaitų). Naudojamas draudimo sutarčių sudarymo procese, kad rizikos būtų įvertintos greičiau. Analizuoja žalų modelius, kad nustatytų galimus sukčiavimo atvejus.
🔸 Teisinis sektorius: sutarčių gyvavimo ciklo valdymo (CLM) transformacija. Analizuoja tūkstančius sutarčių, kad ištrauktų konkrečias sąlygas, pagrindines datas ir atnaujinimo terminus. Neįkainojamas įrankis atliekant patikrinimus susijungimų ar įsigijimų metu.
🔸 Logistika ir tiekimo grandinė: sudėtingų transportavimo dokumentų (krovinio važtaraščių, pakavimo sąrašų ir muitinės deklaracijų) apdorojimo automatizavimas. Užtikrina duomenų tikslumą – tai itin svarbu norint išvengti brangių vėlavimų uostuose.
🔸 Bankininkystė ir finansinės paslaugos: itin svarbi paskolų kilmės procesuose (pvz., hipotekos dokumentų apdorojime, kai dalyvauja dešimtys dokumentų). Esminė KYC („Pažink savo klientą“) ir AML (kovos su pinigų plovimu) procesuose – automatizuoja tapatybės dokumentų (pasų, vairuotojo pažymėjimų) tikrinimą.
Bendradarbiavimas, o ne pakeitimas: žmogus procese
IDP nėra apie 100% visiškai autonominę automatizaciją (ir tai gerai). Išmaniausios įmonės naudoja vadinamąjį „žmogaus įsikišimo procesą“ (Human in the Loop, HITL). (Arba, kaip sako mūsų techninis vadovas, „žmogus kaip įrankis“).
Kai sistema susiduria su nauju dokumentu, neaiškiu rankraščiu arba duomenų lauku, kuriam ji turi žemą pasitikėjimo įvertį, ji pažymi tai kaip išimtį ir nukreipia žmogui operatoriui per specialią patvirtinimo sąsają. Šis grįžtamasis ryšys vėliau naudojamas procese, vadinamame aktyviuoju mokymusi, siekiant nuolat pertvarkyti ir tobulinti dirbtinio intelekto modelį. Taip sukuriamas galingas grįžtamojo ryšio ciklas.
Tai nėra apie pakeitimą – tai apie bendradarbiavimą. Tai apie žmonių pakėlimą nuo duomenų suvedimo operatorių iki dirbtinio intelekto trenerių ir išimčių tvarkytojų. Tai visiška priešingybė senosioms OCR sistemoms, kuriose kokybė laikui bėgant prastėdavo, jei šablonai nebūdavo nuolat prižiūrimi.

IDP tiekėjo pasirinkimas: platforma, specializuotas sprendimas ar debesijos paslauga
IDP rinka yra stipri ir brandi. Tinkamas pasirinkimas priklauso nuo jūsų įmonės strategijos.
- UiPath (integruota platforma): lyderis hiperautomatizacijos platformų srityje. Jo stiprybė slypi integracijoje. Jų IDP produktas Document Understanding yra giliai integruotas į visą automatizacijos ekosistemą. Tai leidžia sukurti vieningą, sklandžią darbo eigą, kurioje UiPath robotas stebi el. pašto dėžutę, perduoda dokumentą Document Understanding duomenų ištraukimui, o vėliau šiuos duomenis naudoja kitose sistemose, pavyzdžiui, SAP. „UiPath Document Understanding“ yra rekomenduojamas kaip pirmasis pasirinkimas.
- Abbyy (specializuotas sprendimas): dokumentų fiksavimo srities pradininkė ir ilgametė specialistė. Žinoma dėl savo didelio tikslumo apdorojant sudėtingus, daugiakalbius dokumentus ir dėl plačios iš anksto apmokytų modelių bibliotekos. Pagrindinė jos vertė – galia ir brandus pagrindinis IDP variklis. (Verta paminėti, kad nors įmonė perkėlė savo būstinę į JAV, ji turi rusiškas šaknis, kas dabartinėje geopolitinėje situacijoje daugeliui įmonių tampa stabdančiu veiksniu.)
- Debesijos paslaugų teikėjai (orientuoti į kūrėjus): AWS Textract, Google Cloud Document AI, Azure AI Document Intelligence. Jie siūlo galingas, itin mastelio požiūriu lanksčias, kūrėjams skirtas IDP paslaugas. Jų stiprybė slypi „mokėk pagal naudojimąsi“ kainodaroje ir milžiniškame mastelio pritaikomume. Tačiau tai nėra paruošti sprendimai „iš dėžutės“ – jie reikalauja dedikuotos kūrėjų komandos, kuri kurtų vartotojo sąsajas, verslo taisykles ir integracijas aplink šias sistemas. Dėl didelio poreikio individualiai plėtoti ir nuolat prižiūrėti sprendimą, nuosavybės kaštai gali būti žymiai didesni.
Veiklos rodikliai ir ateities tendencijos
Pagrindiniai veiklos rodikliai (KPI)
Norint įvertinti sėkmę ir pagrįsti investicijų grąžą (ROI), būtina stebėti pagrindinius rodiklius:
- Tiesioginio apdorojimo rodiklis (STP rodiklis): procentinė dokumentų dalis, kuri apdorojama nuo pradžios iki pabaigos be jokio žmogaus įsikišimo (tikrasis „šventasis gralis“).
- Tikslumo rodiklis: procentinė išgautų duomenų dalis, kuri yra teisinga – šis rodiklis padeda atskirti tikrus sprendimus nuo žaislinių.
- Apdorojimo laikas: laiko, reikalingo iki ir po sistemos įdiegimo, palyginimas (pvz., nuo trijų dienų iki trijų minučių).
Ateities IDP tendencijos
- Hiperautomatizacijos integracija: IDP laikoma esminiu įgūdžiu platesnėje skaitmeninės darbo jėgos ekosistemoje – ji sklandžiai integruojama į visapusiškas nuo pradžios iki pabaigos verslo procesų automatizavimo iniciatyvas, derinant ją su RPA, produktyvumo analizės ir kitomis dirbtinio intelekto technologijomis.
- Daugiamodalis IDP: modeliai mokomi suprasti dokumentus holistiškai – apdoroti ir susieti skirtingų tipų duomenis (pvz., automobilio avarijos nuotrauką, teksto aprašymą ir išlaidų lentelę), kad galėtų priimti labiau pagrįstus sprendimus.
- Generatyvusis dirbtinis intelektas, LLM ir RAG: šios technologijos transformuoja IDP galimybes, išplečiant jas už paprasto duomenų ištraukimo ribų – įtraukiant santraukų kūrimą, nuotaikos analizę ir interaktyvų bendravimą. Naudojant Retrieval Augmented Generation (RAG) metodą, didysis kalbos modelis (LLM) gali pasiekti ir interpretuoti faktinę IDP išgautą informaciją, perkeldamas dėmesį nuo duomenų ištraukimo prie žinių atradimo ir kūrimo.

Išvada: žmogaus įsikišimas (HITL), aktyvusis mokymasis ir baigiamosios mintys
IDP nėra apie 100% visiškai autonominę automatizaciją. Išmaniausios įmonės naudoja žmogaus įsikišimą (HITL) (arba „žmogus kaip įrankis“). Kai sistema pažymi išimtį (dėl žemo pasitikėjimo įvertio, naujo formato ar neaiškaus rankraščio), dokumentas nukreipiamas žmogui operatoriui. Šis grįžtamasis ryšys vėliau naudojamas procese, vadinamame aktyviuoju mokymusi, siekiant nuolat pertvarkyti ir tobulinti dirbtinio intelekto modelį.
Šis procesas yra apie bendradarbiavimą. Jis pakelia žmones nuo duomenų įvedimo operatorių iki dirbtinio intelekto trenerių ir išimčių tvarkytojų. Tai visiška priešingybė senosioms OCR sistemoms, kuriose kokybė laikui bėgant prastėdavo, jei šablonai nebuvo prižiūrimi.
Štai ir pabaiga šiam gilinamajam žvilgsniui į Išmanųjį Dokumentų Apdorojimą AI Automatizacijos Dojo. Epizodą prodiusavo ir režisavo Anna Cubal, įrašyta galinguose Wodzu Beats Studio patalpose. Iki kito karto – laikykite savo duomenis struktūruotus ir išimčių skaičių mažą.