„Dar viena žinutė ir pašto dėžutė sprogs”. Ar kada nors kilo panaši mintis? Atsidūrėte tokioje situacijoje, kai perskaityti visus gaunamus el. laiškus žmogui fiziškai neįmanoma? Ar galime tiesiog suversti kaltę Rėjui Tomlinsonui už tai, kad jis 1971 m. išsiuntė pirmąjį laišką istorijoje?
Asmeniškai tai galvos skausmas, o profesiniu požiūriu – realus poveikis verslui. Pagrindinė priežastis glūdi mūsų prigimtyje – bendraujame sakytine arba rašytine (taip pat ir gestų) kalba, o apie žmones galima pasakyti viena – keistis sunku.

Ar yra kitas būdas? Skaitykite toliau.
Kodėl tai yra verslo problema?
Niekas geriau neįsigyvena nei pavyzdys. Pasisveikinkite su Džonu Smithu, savo ištikimiausiu elektroninio pašto bičiuliu:

Skamba kaip paprasta penkių minučių užduotis, be to, svarbu palaikyti gerus verslo santykius su Džonu.
Dabar padauginkite poną Smithą iš visos savo klientų bazės ir visų su klientais susijusių procesų (įskaitant vidinius, pvz., tarpįmoninius sandorius). Staiga grįžtame prie ankstesnio punkto – sprogstančios gaunamųjų laiškų dėžutės. Paskaičiuokime: maždaug 80 tokių „greitų” 5 minučių trukmės įprastų verslo užklausų gali užpildyti visą darbo dieną (1 etatas, darant prielaidą, kad dirbama 6,5 val. produktyviai).
Po daugybės metų transakcinio bendravimo pasiekėme tašką, kai įprasta ir visuotinai priimtina kaip įvesties duomenis gauti nestruktūrizuotą informaciją, o pasikliauti sistemomis, kurios reikalauja griežtai struktūrizuotų duomenų.
Atspėkite, kas transformuoja šiuos duomenis.
Pirmiausia galite pabandyti tai ištaisyti ir nuoširdžiai raginu tai padaryti. Tačiau dažniausiai atsitrenksite į sieną – organizacinę struktūrą, procedūras, SLA arba klasikinį „mes visada darėme taip”.
Kartkartėmis pastebėsite gelbėjimosi valtį, kuri yra struktūrizuotų įvesties duomenų, pavyzdžiui, formų ar bilietų pardavimo sistemų, pavidalu. Tačiau iš mūsų patirties žinome, kad tokios įvestys pasitaiko retai, o jei ir pasitaiko, jos dažnai pralaimi kovą senam geram, patikimam el. paštui arba pradeda jį priminti, nes siūlo laisvo teksto laukus.
Kaip kovoti su nesąžininga kova
Prieš pasirinkdami ginklą, sukurkime mūšio lauką. Nersime į natūralios kalbos apdorojimą (NLP) – dirbtinio intelekto (DI) sritį ir didžiulę, įdomią temą, kurią verta nagrinėti ne tik šiame straipsnyje. Šiuo metu ši sritis išgyvena renesansą, kurį lemia didžiųjų kalbos modelių (pvz., „ChatGPT”) atsiradimas, tačiau prireikė ilgo kelio, kad pasiektume tai, ką turime dabar.
Grįžtant prie mūsų pavyzdžio, apibrėžkime savo tikslus. Paprastai tariant, norime:
- Išsiaiškinkite, ko Jonas nori, – supraskite jo žinutės tikslą.
- Ištraukite svarbius dalykus – iš teksto ištraukite pagrindinius duomenų taškus.
Kodėl šie du? Nes būtent taip veikia (verslo) procesai: imami įvesties duomenys, jie apdorojami atliekant tam tikrus veiksmus ir gaunamas rezultatas. Ketinimo (pranešimo etiketės) atpažinimas padeda nukreipti jį į reikiamą procesą su apibrėžtu rezultatu, o išgauti duomenys yra įvesties duomenys. Šiuo atveju savo procesą galėtume apibrėžti kaip „Užsakymo užklausą”, kurioje PO numeris yra įvesties elementas, o išvesties rezultatas – užsakymo būsenos atnaujinimas.

Jei norite giliau pasinerti, šie du tikslai sutampa su gerai žinomomis NLP užduotimis: klasifikavimu (ketinimų nustatymas) ir įvardytų esybių atpažinimu (NER) (duomenų išskyrimas). Yra daugybė būdų, kaip juos spręsti, ir kiekvienas iš jų turi tuziną skirtingų bibliotekų, įrankių ar (neseniai) LLM. Tradicinis požiūris gali remtis taisyklingomis išraiškomis (verta patikrinti!), kurios tinka paprastiems atvejams. Tačiau mes susiduriame su įvairiais pranešimais ir įmonės masto apimtimis – pagalvokite, 5-15 tūkst. el. laiškų per mėnesį, todėl mums reikia kažko patikimesnio.
Tikslas – tvarkyti tai masteliu, pakartojamu būdu, kad su klientais dirbantys darbuotojai galėtų užsiimti svarbiais bendravimo aspektais, kai dirbtinis intelektas nepadeda ir vis dar reikia žmogiškųjų žinių arba kai tai yra svarbiausia: stiprinti santykius su klientais, laimėti naujų klientų ir išlaikyti tuos, kuriems gresia pasitraukimas (angl. churn). Kai kas spėja, kad netolimoje ateityje bendravimas su žmogumi taps aukščiausios kokybės paslauga.
Galite rinktis iš daugybės variantų, tačiau nagrinėsime „UiPath Communications Mining”.
Pagrindinis receptas
Įžanga: „Communications Mining” – tai „UiPath” ekosistemai priklausanti debesų kompiuterijos ir mašininio mokymosi (ML) paslauga, sukurta siekiant automatiškai suprasti ir apdoroti natūralios kalbos duomenis. Šioje platformoje galima daug ką ištirti. Apžvelgsime pagrindinius dalykus, bet jei norite daugiau, rekomenduoju susipažinti su oficialia dokumentacija ir „UiPath” akademijos kursais, kad galėtumėte giliau pasinerti į šią sritį.
Dauguma ML gyvavimo ciklų susideda iš kelių pagrindinių etapų: planavimo, mokymo ir diegimo – būtent taip mes ir nagrinėsime šią temą.
Planavimas
Bendravimas yra neišvengiamas bet kuriame versle – beveik kiekviename procese tam tikru etapu reikia kalbėtis. Tačiau užuot viską sprendę iš karto, pradėkite nuo kelių pagrindinių klausimų:
- Kur komunikacija yra neatsiejama proceso dalis, pvz., naudojama kaip įvestis ir (arba) išvestis visai darbo eigai arba tam tikrai veiklai?
- Kokie bendravimo kanalai naudojami organizacijoje: el. laiškai, pokalbiai, CRM, bilietų išdavimo sistemos, bendradarbiavimo programos ir pan.? (duomenų šaltiniai)
- Kas tvarko didelius pranešimų kiekius? Kurie skyriai ar komandos dalyvauja dažniausiai?
- Ar šiuose verslo pranešimuose yra pasikartojančių modelių ar struktūrinių elementų?
Ir svarbiausias, dažnai pamirštamas klausimas – kodėl apskritai tai darote? Ar tikslas yra automatizavimas, analitika, ar abu? Kokie KPI apibrėžia sėkmę? Vien pasakyti „tai veikia” dirbtiniu intelektu pagrįstiems sprendimams nepakanka – apie tai vėliau.
Toliau sukasi aplink mūsų pavyzdį: užsakymų apdorojimo komanda per mėnesį apdoroja 5000 el. laiškų, kurių dauguma panašūs į Džono – nauji užsakymai, pakeitimai, atšaukimai ir užklausos. Užduodami tinkamus klausimus ir analizuodami apimties procesus, galėsime apibrėžti savo modelio taksonomiją.

Taksonomija – tai hierarchinė ketinimų ir (arba) kategorijų (etikečių), kurias galima įterpti, ir su jomis susijusių duomenų taškų struktūra. Kai kurie laukai yra tiesiogiai susiję su konkrečiomis etiketėmis (išskyrimo laukai), o kiti gali būti pateikiami bet kuriame pranešime (bendrieji laukai). Gerai sukurta taksonomija turėtų tiksliai atspindėti realius bendravimo modelius, nes ji yra modelio mokymo ir taikymo pagrindas.
Nors taksonomiją galima keisti, pakeitimai turi pasekmių – gali pailgėti mokymo laikas, o kai kurie pakeitimai yra negrįžtami.
Mokymas
Iš esmės bet koks ML mokymas yra susijęs su pakankamu skaičiavimo pavyzdžių skaičiumi, iš kurių jis gali „mokytis”. Po gaubtu dirbtinis intelektas naudoja matematinius ir statistinius metodus, kad aptiktų dėsningumus ir ryšius duomenyse – taip jis gali prognozuoti naujus, dar nematytus atvejus.

Kiek pavyzdžių pakanka? Universalaus atsakymo nėra, tačiau pateikiame keletą rekomendacijų:
- Paprastai daugiau yra geriau. Jūsų mokymo rinkinys turėtų kuo tiksliau atspindėti realaus pasaulio duomenis – sumažinti atsitiktinumą ir padidinti patikimumą. Norėdami atlikti komunikacijų gavybos koncepcijos bandymą, tikėkitės gauti bent 10 000 pranešimų; norėdami sukurti gamybinę konfigūraciją, siekite gauti daugiau nei 60 000 pranešimų.
- Užfiksuokite sezoniškumą. Į duomenų rinkinį įtraukite tokius pokyčius kaip mėnesio pikas, metų pabaigos sulėtėjimas ar kitos ciklinės tendencijos.
- Subalansuokite savo duomenų rinkinį. Idealiu atveju kiekvienai kategorijai (etiketei) turėtų būti priskiriamas vienodas pavyzdžių skaičius. Nors realūs verslo duomenys retai atitinka šį idealą, pasistenkite, kad jų būtų kuo mažiau.
Mašininio mokymosi modeliui sukurti ir mokyti paprastai reikia programavimo įgūdžių, o tai sudaro didelį pradinį barjerą. Laimei, „Communications Mining” leidžia atlikti visą procesą neparašius nė vienos kodo eilutės (tai neprivaloma). Ryšių duomenis galima įkelti per CSV (kableliais atskirtos vertės) failą arba iš anksto sukurtą integraciją su „Microsoft Exchange Server” arba „Salesforce”.

Mokymas yra labai paprastas ir patogus, beveik kaip spalvinimo knygelė. Vos keliais spustelėjimais verslo naudotojas (paprastai dalykinės srities ekspertas) priskiria teisingas etiketes (vieną arba kelias) ir pranešimo tekste paryškina atitinkamus duomenų taškus (laukus).

Štai ir viskas. Platforma automatiškai aptinka pokyčius ir pradeda mokymą. Skalaukite ir kartokite, kol pateiksite pakankamai pavyzdžių. Kiek? Atspėjote teisingai – čia taip pat nėra universalaus atsakymo, tačiau „Communications Mining” siūlo vadovaujamo mokymo režimą. Jis pateikia aiškų, pamokantį grįžtamąjį ryšį, kuris padeda nustatyti išmatuojamus tikslus. Taisyklė – maksimaliai padidinti modelio našumą, kartu sumažinant mokymui skiriamą laiką (darbą, kurį reikia įdėti).

Kaip minėta anksčiau, dirbtiniu intelektu paremto automatizavimo veiklos efektyvumo spektras yra įvairus. Klasikinio automatizavimo atveju, pavyzdžiui, robotų procesų automatizavimo (RPA) atveju, apibrėžiate griežtus reikalavimus, o robotas eina iš anksto užprogramuotu keliu, tvarkydamas išimtis nuspėjamu, taisyklėmis pagrįstu būdu. Mašininio mokymosi scenarijuose turite susidurti su tam tikru neapibrėžtumo lygiu ir jį priimti.

Mašininio mokymosi metrikos yra plati tema, kuri neįeina į šio straipsnio apimtį. Laimei, „Communications Mining” sąsajoje pagrindinė informacija pateikiama intuityviai ir lengvai suprantamai, kartu užtikrinant pakankamą valdymo lygį. Tačiau mums reikės aptarti vieną esminę sąvoką – pasitikėjimą (vertę), todėl pereisime prie kito skyriaus.

Įdiegimas
Sujunkime viską kartu. Mūsų taikymo sritis ir tikslai dabar atsispindi taksonomijoje, todėl nusprendėme, kad modelio mokymas baigtas – bent jau kol kas. Laikas dirbtiniam intelektui atlikti sunkų darbą.
Pirminį Jono el. laišką nukreipiame į „Communications Mining”, o mainais gauname to pranešimo modelio prognozę:

Platformoje yra du pagrindiniai automatizavimo komponentai, apie kuriuos kalbėjome:
- Išvestinės etiketės (viena arba kelios), pagal kurias nustatoma, kuriuos procesus paleisti.
- Išskirti laukai, kurie naudojami kaip tam procesui reikalingi struktūrizuoti įvesties duomenys.
Atkreipkite dėmesį, kad kiekvienai prognozei priskiriama patikimumo vertė nuo 0 % iki 100 % (tai taip pat taikoma gavybos laukams, nors šiame rodinyje ji nematoma). Ši reikšmė rodo, kiek modelis, remdamasis mokymu, yra tikras, kad tam tikra etiketė tinka šiam pranešimui. Mes patys sprendžiame, ką daryti su šia informacija. Geras pradinis taškas – nustatyti ribinę vertę kaip išjungimo filtrą. Prieš darydami tolesnes išvadas, panagrinėkime keletą hipotetinių scenarijų:
- Laimingas kelias: modelis prognozuoja „Užsakymo informacijos užklausa > Pristatymo būsena” su 74 % patikimumu, viršydamas 70 % ribą. PO numeris taip pat išskirtas su dideliu patikimumu. Užklausa nukreipiama į automatiką, kuri pateikia užklausą ERP sistemai ir grąžina pristatymo būseną. Džonas gauna automatizuotą el. laišką su prašoma informacija.
- Ribinis atvejis: šį kartą 74 % patikimumo nepakanka, nes mūsų riba yra 80 %. Leidžiame darbuotojui visiškai apdoroti atvejį rankiniu būdu arba įgyvendiname mechanizmą „žmogus cikle”, kuris prieš vykdydamas procesą paprašo žmogaus patvirtinimo.
- Nepageidaujamas rezultatas: modelis neteisingai klasifikuoja užklausą kaip „Užsakymo atšaukimas”, o jo patikimumas viršija ribą. Kitas automatizavimo veiksmas panaikina užsakymą ERP sistemoje ir praneša Jonui, kuris dabar yra sutrikęs, kodėl jo užklausa lėmė užsakymo atšaukimą.
Šie scenarijai yra supaprastinti (o trečiasis – perdėtas), tačiau jie išryškina įvairiapusį dirbtinio intelekto valdomos automatizacijos pobūdį. Štai kodėl prieš diegiant labai svarbu atidžiai išanalizuoti procesus ir laukiamus rezultatus.
Didelės rizikos veiksmams, pvz., užsakymo atšaukimui, turėtų būti taikomos aukštesnės patikimumo ribos, papildomos taisyklėmis pagrįstos patikros arba net privalomas žmogaus patvirtinimas. Šis hibridinis metodas gali būti ne toks greitas kaip visiškai autonominė sistema, tačiau jis užtikrina, kad žmogaus įsikišimas apsiribos išimčių peržiūra, o 90-99 proc. atvejų vyks automatiškai.
Pasinaudokite geriausiais abiejų pasaulių privalumais
Kitas svarbus „Communications Mining” privalumas – ataskaitų teikimo galimybės. Įsivaizduokite, kad galite išanalizuoti visus metus trukusius 60 000 el. laiškų ir atskleisti tokius faktus, kaip antai:
- 10 didžiausių prašymų kategorijų.
- Šios pristatymo būsenos užklausų pikas pasiektas gruodžio mėn.
- Džonas Smitas dažnai užsako produktus, kurių gamyba netrukus bus nutraukta – tai puiki proga pasiūlyti jam alternatyvą.
Tai tik paprasti pavyzdžiai, rodantys begalę analitinių galimybių, slypinčių įmonių komunikacijoje, kuri nebėra tik gigabaitai nestruktūrizuotų duomenų, bet aukso kasyklos, kuriose galima rasti vertingų įžvalgų.

Visa tai įmanoma, nes kiekvienas į platformą įkeltas pranešimas gauna modelio prognozę. Sujungus metaduomenis (pvz., siuntėjo adresą, domeną, laiko žymą ir pan.) su išvestinėmis kategorijomis ir išskirtomis sritimis, gaunamas labai galingas duomenų rinkinys. Pavienis elementas gali būti laikomas mokomuoju pavyzdžiu arba atveju, kurį reikia apdoroti, tačiau kai žaidžiama dideliais kiekiais, apibendrinti komunikacijos duomenys pradeda pasakoti istorijas.
Kita svarbi komunikacijos duomenyse slypinti įžvalga – klientų pasitenkinimas. „Communications Mining” siūlo integruotą nuotaikų analizę, automatiškai nustatančią kiekvieno pranešimo toną arba nuotaiką (teigiamą arba neigiamą).
Be to, platformoje galima konfigūruoti svoriu pagrįstą paslaugos kokybės (QoS) parametrą, kiekvienam žymeniui priskiriant balus nuo -10 iki 10, kad būtų galima geriau suprasti kontekstą. Pavyzdžiui, „Užsakymo atšaukimas” gali turėti QoS balą -5, nes užsakymo praradimas neigiamai veikia verslą, net jei pati žinutė buvo teigiama.

Kadangi platforma automatiškai iš naujo apmoko ir iš karto nuspėja kiekvieną įkeltą pranešimą, komunikacijos duomenys nuolat atnaujinami, todėl galima stebėti realiuoju laiku. Galite netgi nustatyti pasirinktinius įspėjimus, kad galėtumėte stebėti svarbiausias sąlygas, pavyzdžiui, jei Johno Smitho QoS rodiklis nukrenta žemiau tam tikros ribos, sistema gali nedelsiant išsiųsti įspėjimus el. paštu jo pagrindinių klientų vadybininkui.
Ką ketinate statyti?
Tikiuosi, kad jums patiko šis trumpas įvadas į natūralios kalbos apdorojimą ir „UiPath Communications Mining”. Tačiau vos praskleidėme paviršių, dar daug ką galima atrasti ir sužinoti, todėl raginu jus išbandyti ir išlikti smalsiems. Technologijos tobulėja neįtikėtinu greičiu, vakarykščius neįmanomus dalykus paversdamos šiandienos realybe.
Drąsiai kreipkitės į mus, jei turite kokių nors klausimų, ir laimingo automatizavimo!