{"id":22308,"date":"2026-02-12T12:03:21","date_gmt":"2026-02-12T11:03:21","guid":{"rendered":"https:\/\/office-samurai.com\/19-epizodas-di-karai-agentai-ir-rpa-pabaiga-kaip-genai-is-tikruju-pakeis-pasauli-artimiausiais-metais\/"},"modified":"2026-03-13T15:41:03","modified_gmt":"2026-03-13T14:41:03","slug":"19-epizodas-di-karai-agentai-ir-rpa-pabaiga-kaip-genai-is-tikruju-pakeis-pasauli-artimiausiais-metais","status":"publish","type":"post","link":"https:\/\/office-samurai.com\/lt\/19-epizodas-di-karai-agentai-ir-rpa-pabaiga-kaip-genai-is-tikruju-pakeis-pasauli-artimiausiais-metais\/","title":{"rendered":"19 epizodas | DI karai, agentai ir RPA pabaiga \u2013 kaip GenAI i\u0161 tikr\u0173j\u0173 pakeis pasaul\u012f artimiausiais metais?"},"content":{"rendered":"\n<div class=\"wp-block-buttons is-content-justification-center is-layout-flex wp-container-core-buttons-is-layout-a89b3969 wp-block-buttons-is-layout-flex\">\n<div class=\"wp-block-button is-style-outline is-style-outline--1\"><a class=\"wp-block-button__link has-black-color has-text-color has-link-color has-medium-font-size has-custom-font-size wp-element-button\" href=\"https:\/\/youtu.be\/VgDZWIUMeWE?si=CRM49RTIpkVDmLOA\" style=\"border-radius:0px\" target=\"_blank\" rel=\"noreferrer noopener\">&#8222;YouTube&#8221;<\/a><\/div>\n\n\n\n<div class=\"wp-block-button is-style-outline is-style-outline--2\"><a class=\"wp-block-button__link has-black-color has-text-color has-link-color has-medium-font-size has-custom-font-size wp-element-button\" href=\"https:\/\/open.spotify.com\/episode\/2I6569rjYPNfreW21LSzru?si=45-i6KS_RhybRDjv2fE9mA\" style=\"border-radius:0px\" target=\"_blank\" rel=\"noreferrer noopener\">&#8222;Spotify&#8221;<\/a><\/div>\n\n\n\n<div class=\"wp-block-button is-style-outline is-style-outline--3\"><a class=\"wp-block-button__link has-black-color has-text-color has-link-color has-medium-font-size has-custom-font-size wp-element-button\" href=\"https:\/\/podcasts.apple.com\/us\/podcast\/ai-wars-agents-and-end-of-rpa-how-genai-will\/id1814320637?i=1000749283677\" style=\"border-radius:0px\" target=\"_blank\" rel=\"noopener\">&#8222;Apple Podcasts<\/a><\/div>\n<\/div>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Programines_irangos_kurimo_bukle_ir_%E2%80%9Evibe_coding%E2%80%9C_era\"><\/span><strong>Programin\u0117s \u012frangos k\u016brimo b\u016bkl\u0117 ir \u201evibe coding\u201c era<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>AK:<\/strong> Konnichiwa, sveiki atvyk\u0119 \u012f <a href=\"https:\/\/youtube.com\/playlist?list=PLhXE_-WUIvq0-qsJPqg509l6s7vLhEOPs&amp;si=OLO01yrVaR3-USGb\" target=\"_blank\" rel=\"noopener\">AI Automation Dojo<\/a>. \u0160iandien kalb\u0117sime apie programin\u0117s \u012frangos k\u016brimo b\u016bkl\u0119 ir u\u017eduosime klausim\u0105: ar mes esame in\u017einieriai, ar tiesiog burtininkai, \u0161aukiantys u\u017ekeikimus \u012f juod\u0105j\u0105 d\u0117\u017e\u0119, kol ji padaro tai, ko norime?<br\/>\u0160iandien m\u016bs\u0173 sve\u010dias \u2013 Krzysztof Karaszewski. Labai seniai jis i\u0161 tikr\u0173j\u0173 mok\u0117 mane UiPath k\u016brimo, tod\u0117l jei manote, kad mano kodas prastas, na, techni\u0161kai tai jo kalt\u0117.<br\/>Kalb\u0117sime apie modeli\u0173 karus, galim\u0105 tradicini\u0173 bot\u0173 i\u0161nykim\u0105 ir apie tai, kas vadinama vibe coding, kas, ties\u0105 sakant, skamba kaip ka\u017ekas, k\u0105 daro Gen Z, ignoruodami j\u016bs\u0173 el. lai\u0161kus.     <\/p>\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe class=\"cky-consent-iframe\" data-consent=\"marketing\" data-cky-src=\"https:\/\/www.youtube.com\/embed\/VgDZWIUMeWE?feature=oembed\" data-cky-placeholder=\"1\" class=\"cky-consent-iframe\" data-consent=\"marketing\" data-cky- data-cky-placeholder=\"1\" title=\"AI wars, agents and end of RPA - how GenAI will really change the world in next years?\" width=\"800\" height=\"450\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n<p>J\u016bs\u0173 ved\u0117jas \u2013 Andrzej Kinastowski, vienas i\u0161 <a href=\"https:\/\/office-samurai.com\/lt\/verslo-procesu-automatizavimo-imone\/\">Office Samurai<\/a>, \u012fk\u016br\u0117j\u0173, kur tikime, kad vieninteliai, kurie tur\u0117t\u0173 haliucinuoti, esame mes per \u012fmon\u0117s vakar\u0117l\u012f. Tad pasiimkite savo m\u0117gstam\u0105 katan\u0105 arba kastuv\u0105 senoms technologij\u0173 akcijoms u\u017ekasti ir prad\u0117kime.<br\/>\u0160iandien su mumis \u2013 Krzysztof Karaszewski, automatizavimo ir dirbtinio intelekto ekspertas. Pirm\u0105 kart\u0105 Krzysztof sutikau ma\u017edaug prie\u0161 a\u0161tuonerius metus \u2013 tuo metu jis dirbo Symphony Solutions, o man pasisek\u0117 dalyvauti jo pa\u017eengusi\u0173j\u0173 UiPath RPA k\u016br\u0117j\u0173 mokymuose. Nuo tada jis nu\u0117jo ilg\u0105 keli\u0105 tiek automatizavimo, tiek dirbtinio intelekto srityse.<br\/>Krzysztof, sveikas atvyk\u0119s \u012f dojo.     <\/p>\n\n<p><strong>KK:<\/strong> A\u010di\u016b, kad pakviet\u0117te.<\/p>\n\n<p><strong>AK:<\/strong> Krzysztof, kas per pastaruosius metus tau pasirod\u0117 labiausiai priblo\u0161kiantis dalykas?<\/p>\n\n<p><strong>KK:<\/strong> Na, tikrai pa\u017eanga, padaryta LLM srityje. Prad\u0117jome nuo palyginti paprast\u0173 sistem\u0173, kurios i\u0161augo iki precedento neturin\u010dio masto. Metus prad\u0117jome su DI, kuris gal\u0117jo atlikti labai paprast\u0105 programavim\u0105, o metus baig\u0117me tur\u0117dami sistemas, kurios jau gali kurti kitas sistemas.  <\/p>\n\n<p><strong>AK:<\/strong> Taip, kalbant apie tai, pa\u017evelkime giliau \u012f 2025 metus. Met\u0173 prad\u017eioje atrod\u0117, kad ka\u017ek\u0105 suprantame, o dabar, atsigr\u0119\u017eus atgal, tai jau primena senov\u0117s civilizacij\u0105. Kai kuriose srityse vystymosi greitis buvo tiesiog absurdi\u0161kas. \u012erankiai, kuriuos prie\u0161 \u0161e\u0161is\u2013devynis m\u0117nesius taip i\u0161auk\u0161tinome, dabar jau atrodo beveik pasen\u0119. Pateik savoti\u0161k\u0105 skrodimo ataskait\u0105: kas i\u0161 tikr\u0173j\u0173 \u012fvyko rinkoje per pastaruosius metus ir kod\u0117l atrodo, kad viskas juda taip greitai?    <\/p>\n\n<p><strong>KK:<\/strong> D\u0117koju, kad tai pamin\u0117jai, nes \u012f 2025 metus \u012f\u017eeng\u0117me tur\u0117dami tam tikr\u0173 tvirt\u0173 \u012fsitikinim\u0173 ir ai\u0161ki\u0173 teigini\u0173. I\u0161 tikr\u0173j\u0173 viskas, kas \u012fvyko 2025-aisiais, buvo paruo\u0161ta dar labai v\u0117lai 2024 metais, kai buvo pristatyti nauji samprotavimo modeliai \u2013 pirmieji tokio tipo modeliai, pasirod\u0119 kaip o1.<br\/>Be to, daugelis man\u0117, kad LLM srityje jau atsitrenk\u0117me \u012f sien\u0105, ir net Ilya Sutskever patvirtino, kad norint toliau jud\u0117ti \u012f priek\u012f reik\u0117s naujos k\u016brybi\u0161kumo erdv\u0117s. Ta\u010diau 2025 met\u0173 pabaigoje supratome, kad tai neb\u016btinai tiesa \u2013 pana\u0161u, kad \u012f sien\u0105 vis d\u0117lto dar neatsitrenk\u0117me.   <\/p>\n\n<p>\u0160is 2024 met\u0173 pabaigos prover\u017eis leido mums \u012f 2025-uosius \u012f\u017eengti su naujo tipo samprotavimo modeliais, kuriuos galime vadinti \u201em\u0105stan\u010diais\u201c, nors pats procesas yra sud\u0117tingesnis. Samprotavimo modeliai generuoja \u017eetonus (tokens) ir papildomai yra treniruojami, kaip tie \u017eetonai tur\u0117t\u0173 b\u016bti generuojami, kad b\u016bt\u0173 padidintas j\u0173 na\u0161umas. Toks po\u017ei\u016bris turi tam tikr\u0173 apribojim\u0173 ir tr\u016bkum\u0173, ta\u010diau akivaizdu, kad intelekto pager\u0117jimas leid\u017eia tai kompensuoti.<br\/>\u012e metus \u012f\u017eeng\u0117me tvirtai tik\u0117dami, kad atsitrenk\u0117me \u012f sien\u0105 ir kad tik sustiprinamasis mokymasis (reinforcement learning) gal\u0117s mus past\u016bm\u0117ti \u012f priek\u012f, ta\u010diau v\u0117liau paai\u0161k\u0117jo, kad tai neb\u016btinai tiesa.<br\/>Pirmoji didel\u0117 2025 met\u0173 premjera buvo modelis R1 \u2013 samprotavimo modelis i\u0161 DeepSeek, kuris sukr\u0117t\u0117 vis\u0105 pasaul\u012f, nes buvo apmokytas u\u017e vos dal\u012f o1 kainos. Jis buvo tikrai geras, ma\u017edaug pana\u0161aus lygio, ta\u010diau a\u0161 asmeni\u0161kai gal\u0117jau pasteb\u0117ti toki\u0173 modeli\u0173 problemas, nes R1 \u201em\u0105st\u0117\u201c labai intensyviai ir labai ilgai. Tai nebuvo taip paprasta naudoti agentin\u0117se sistemose, kur anks\u010diau atsakymus gaudavome beveik akimirksniu. Ta\u010diau saus\u012f viskas pasikeit\u0117 \u2013 reik\u0117jo palaukti \u0161iek tiek ilgiau, bet u\u017e tai gaudavome daug geresn\u012f atsakym\u0105.      <\/p>\n\n<p><strong>AK:<\/strong> Taip, prisimenu, kok\u012f did\u017eiul\u012f triuk\u0161m\u0105 tai suk\u0117l\u0117, nes man\u0117me, kad amerikie\u010diai atsisak\u0117 parduoti lustus Kinijai ir kad jie nieko nepasieks. O tada, kaip sakei, u\u017e vos dal\u012f kainos jie suk\u016br\u0117 steb\u0117tinai ger\u0105 model\u012f. Daugeliu at\u017evilgi\u0173, \u017evelgiant i\u0161 kainos perspektyvos, tai sug\u0117dino visas kitas \u012fmones, kurios savo modeliams degino milijardus.<br\/>Kalbant apie modelius, \u017emon\u0117s da\u017enai mini modeli\u0173 karus \u2013 visi nori tur\u0117ti geriausi\u0105 model\u012f, t\u0105, kuris yra reiting\u0173 vir\u0161uje. Kaip dabar atrodyt\u0173 tavo galios reitingas? Kas \u0161iandien yra LLM i\u0161leistuvi\u0173 vakaro karalius, o kas, tavo nuomone, s\u0117di vienas valgykloje per pietus?     <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Modeliu_karai_ir_strateginiai_skirtumai_tarp_DI_laboratoriju\"><\/span><strong>Modeli\u0173 karai ir strateginiai skirtumai tarp DI laboratorij\u0173<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>KK:<\/strong> Manau, kad modeli\u0173 karai arba bandymas tur\u0117ti geriausi\u0105 model\u012f yra sp\u0105stai, ir tai ai\u0161kiai matyti kalbant apie OpenAI. OpenAI \u0161iuo metu tikrai turi geriausi\u0105 model\u012f \u2013 GPT-5.2 X High. Net pats pavadinimas yra \u0161iek tiek keistas, bet jie niekada nepasi\u017eym\u0117jo gerais pavadinimais.<br\/>Kita vertus, tai i\u0161 ties\u0173 puikus modelis; tikriausiai net negalime tiksliai \u012fvertinti, koks jis geras. Tai tiesiog labai galingas modelis, ta\u010diau tuo pa\u010diu jis ir labai brangus \u2013 du ar tris kartus brangesnis nei antras geriausias.<br\/>Kaip ir R1 atveju, jis daug \u201em\u0105sto\u201c ir generuoja daug i\u0161vesties \u017eeton\u0173 (output tokens), kurie paprastai yra keturis\u2013penkis kartus brangesni nei \u012fvesties \u017eetonai (input tokens). Mano nuomone, jis nelabai tinka agentin\u0117ms sistemoms, nes kiekvienas samprotavimo proceso \u017eingsnis ir kiekvienas veiksmas u\u017etrunka nema\u017eai laiko.      <\/p>\n\n<p>Taip, tai \u0161iuo metu tikrai geriausias modelis. Antras geriausias, saky\u010diau \u2013 ir tai taip pat parodo, kokias skirtingas strategijas turi \u0161ios \u012fmon\u0117s \u2013 turime OpenAI, Anthropic ir Google, kurios tarpusavyje konkuruoja. \u0160iuo metu Elono Musko xAI \u0161iek tiek atsilieka, bet pa\u017ei\u016br\u0117sime, k\u0105 atne\u0161 nauji modeliai, kuriuos jie i\u0161leis \u0161iais metais.<br\/>Kalbant apie \u0161ias tris did\u017ei\u0105sias DI laboratorijas, manau, kad OpenAI turi did\u017eiausi\u0105 atotr\u016bk\u012f tarp turim\u0173 modeli\u0173 ir produkto. J\u0173 produktas yra ChatGPT, kuriame dauguma \u017emoni\u0173 u\u017eduoda gana kvailus klausimus. B\u016bkime atviri \u2013 \u012f daugum\u0105 j\u0173 b\u016bt\u0173 galima greitai atsakyti tiesiog k\u0105 nors pagooglinus. Ta\u010diau modelis, kur\u012f jie turi, labai daug \u201em\u0105sto\u201c ir nesuteikia tokios geros naudotojo patirties, kai tenka labai ilgai laukti bet kokio atsakymo.      <\/p>\n\n<p>Yra labai didelis skirtumas tarp OpenAI \u0161io modelio nesamprotavimo versijos ir samprotavimo versijos. Kiekvienas samprotavimo modelis turi ir savo nesamprotavimo versij\u0105. Yra GPT-5.2 X High samprotavimo versija, ta\u010diau taip pat yra ir nesamprotavimo versija, ir \u0161i nesamprotavimo versija i\u0161 tikr\u0173j\u0173 n\u0117ra tokia gera \u2013 ji tiesiog sunkiai susitvarko. B\u016btent su ja da\u017eniausiai susiduria dauguma ChatGPT naudotoj\u0173, ypa\u010d nemokamos versijos vartotojai.<br\/>Tod\u0117l rugpj\u016bt\u012f susidar\u0117 situacija, kai \u017emon\u0117s nusivyl\u0117 GPT-5, nes jis pateikdavo prastesnius atsakymus nei GPT-4o. Sam Altman j\u012f labai i\u0161reklamavo, sakydamas, kad jis bus ne\u012ftik\u0117tinas, ta\u010diau kai \u017emon\u0117s j\u012f gavo, paai\u0161k\u0117jo, kad anks\u010diau jie tur\u0117jo prieig\u0105 prie GPT-4o, kuris buvo gana geras ir tur\u0117jo \u017emogi\u0161k\u0105 \u201evibe\u201c. O dabar jie gauna atsakymus i\u0161 gerokai ma\u017eesni\u0173 modeli\u0173, nebent moka u\u017e prieig\u0105.      <\/p>\n\n<p>Manau, kad OpenAI strategija n\u0117ra tokia gera ta prasme, kad jie turi puikius modelius, bet tik tuo atveju, jei u\u017e juos daug sumoki, tod\u0117l jie n\u0117ra skirti pla\u010diajai auditorijai.<br\/>Prie\u0161ingai nei jie, turime Anthropic, kuri turi fenomenali\u0105 strategij\u0105, nes koncentruojasi tik \u012f tai, kas veikia. Jie nebando pakeisti Holivudo savo Sora modeliu ir nesiekia sukurti dar vieno puikaus vaizd\u0173 generavimo modelio. Jie susitelkia tik \u012f agentin\u012f automatizavim\u0105 ir agentin\u012f programavim\u0105.<br\/>\u0160ioje srityje, nepaisant to, kad j\u0173 modeliai n\u0117ra reiting\u0173 vir\u0161uje \u2013 kai kuriuose konkre\u010diuose benchmarkuose jie net \u0161iek tiek atsilieka nuo Google modeli\u0173 \u2013 jie yra labiausiai naudojami ir geriausi, kai kalbama apie praktin\u012f pritaikomum\u0105.    <\/p>\n\n<p>Nedaug \u017emoni\u0173 pasteb\u0117jo, kad dabar Anthropic modelius galima naudoti Microsoft Copilot ir Copilot Studio aplinkoje. Microsoft daugel\u012f m\u0117nesi\u0173 r\u0117m\u0117 OpenAI ir investavo milijardus, ta\u010diau dabar supranta, kad j\u0173 \u012fmoni\u0173 klientams, kurie moka daugiausia, OpenAI nebus geriausias pasirinkimas. Galb\u016bt jie tiesiog suteikia \u0161iems klientams galimyb\u0119 prad\u0117ti naudoti Anthropic.<br\/>\u0160ioje srityje, nepaisant to, kad Opus 4.5 neu\u017eima pirm\u0173 viet\u0173 visuose reitinguose, tai tikriausiai \u0161iuo metu labiausiai prakti\u0161kai naudojamas modelis. Tai modelis, kur\u012f kasdien naudoju a\u0161 pats, nes jis \u012f mano u\u017eklausas atsako daug grei\u010diau ir pateikia labai gerus atsakymus. Jis yra absoliu\u010diai fenomenalus, kai kalbama apie agentin\u012f darb\u0105 \u2013 gali generuoti i\u0161tisas sistemas be \u017emogaus prie\u017ei\u016bros. Manau, kad tai vienas i\u0161 2025 met\u0173 prover\u017ei\u0173.      <\/p>\n\n<p>Ir turime Google. Google DeepMind turi labai stipri\u0105 komand\u0105, fenomenali\u0173 talent\u0173 ir daug i\u0161tekli\u0173, tikriausiai did\u017eiausius skai\u010diavimo paj\u0117gumus planetoje. Jie netreniruoja savo modelio vienoje vietoje \u2013 gali tai daryti skirtingose vietose, kai tik suma\u017e\u0117ja skai\u010diavimo i\u0161tekli\u0173 paklausa.<br\/>Jie turi model\u012f Gemini 3 Flash, kuris, ties\u0105 sakant, labiau tikt\u0173 ChatGPT tipo produktui, nes yra greitas, labai greitai atsako ir pateikia labai gerus atsakymus. Nuo auk\u0161\u010diausio lygio modeli\u0173 jis atsilieka tik keliais ta\u0161kais.<br\/>Tod\u0117l ir matome augant\u012f Gemini pokalbi\u0173 program\u0117li\u0173 skai\u010di\u0173, nes paprastiems vartotojams Gemini Flash yra prasmingesnis pasirinkimas \u2013 jis keturis kartus pigesnis nei GPT-5.2.     <\/p>\n\n<p><strong>AK:<\/strong> Taip, turiu pasakyti, kad Gemini tikriausiai buvo mano m\u0117gstamiausias 2025 met\u0173 modelis, nes Anthropic beveik neband\u017eiau. Tam tikru momentu nusivyliau ChatGPT ir per\u0117jau prie Gemini. Kartais jis mane nuvyl\u0117, bet apskritai patirtis buvo tikrai gera, ypa\u010d kai paprastoms u\u017eduotims persijungi \u012f greit\u0105 model\u012f, o jei nori giliau panagrin\u0117ti tem\u0105, pereini prie Pro modelio ir jis visk\u0105 tarsi i\u0161sprend\u017eia u\u017e tave.<br\/>Tai gana \u012fdomu, nes prisimenu, kad prie\u0161 trejus metus, kai tik atsirado LLM, visi sak\u0117, jog OpenAI turi tok\u012f didel\u012f prana\u0161um\u0105 prie\u0161 kitus, kad juos pasivyti bus labai sunku. Visi juok\u0117si i\u0161 Google, nes buvo manoma, kad jie tiesiog \u201epramiegojo\u201c ka\u017ek\u0105 didelio. O dabar atrodo, kad trej\u0173 met\u0173 pakanka pasivyti ir pakeisti situacij\u0105, jei turi pakankamai pinig\u0173.    <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Google_sugrizimas_ir_haliucinaciju_strategija\"><\/span><strong>Google sugr\u012f\u017eimas ir haliucinacij\u0173 strategija<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>KK:<\/strong> Taip, ir Google j\u0173 turi labai daug. Ties\u0105 sakant, a\u0161 niekada nenuvertinau Google; j\u0173 modelius naudojau nuo pat prad\u017ei\u0173. Prie\u017eastis, kod\u0117l Google kur\u012f laik\u0105 buvo \u0161iek tiek atsilikusi, yra ta, kad jie pri\u0117m\u0117 strategin\u012f sprendim\u0105 nei\u0161leisti LLM modeli\u0173, kol nei\u0161spr\u0119s haliucinacij\u0173 problemos.<br\/>Tai gana ironi\u0161ka, turint omenyje, kad dabar Demis Hassabis, vadovaujantis Google DeepMind, sako, jog tikriausiai mes niekada visi\u0161kai nei\u0161spr\u0119sime haliucinacij\u0173 problemos; tam tikras j\u0173 lygis visada bus \u0161i\u0173 modeli\u0173 dalis.<br\/>Kai jie pamat\u0117, kokie geri yra \u0161ie modeliai ir kad rinka tikisi j\u0173 i\u0161leidimo \u2013 o j\u0173 akcij\u0173 vert\u0117 tuo metu krito \u2013 jie nukreip\u0117 daugiau l\u0117\u0161\u0173 \u012f LLM srit\u012f.    <\/p>\n\n<p>Google daugel\u012f \u017emoni\u0173 nustebino 2025 metais. A\u0161 tai pasteb\u0117jau dar 2024 met\u0173 pabaigoje, kai jie i\u0161leido Gemini 2.0 Flash model\u012f. Jis buvo 12 ar net 15 kart\u0173 pigesnis nei GPT-4o, ta\u010diau veik\u0117 beveik tokiu pa\u010diu lygiu, o kai kuriose srityse net buvo geresnis. Be to, 1 milijono konteksto langas buvo ma\u017edaug 10 kart\u0173 didesnis nei tai, k\u0105 tuo metu gal\u0117jo analizuoti kiti modeliai vienu metu.<br\/>Netrukus po to, kai buvo i\u0161leistas DeepSeek R1, Google taip pat pristat\u0117 eksperimentin\u0119 Gemini Flash versij\u0105 su samprotavimo galimyb\u0117mis. Tai buvo \u201em\u0105stantis\u201c modelis ir jis i\u0161 tikr\u0173j\u0173 buvo puikus \u2013 atsakin\u0117jo labai greitai. B\u016btent tada pirm\u0105 kart\u0105 supratau, kad \u0161ie modeliai vis geriau tinka programavimui, nes Gemini 2 Flash Thinking gal\u0117jo, be joki\u0173 haliucinacij\u0173, sugeneruoti net 2\u20133 t\u016bkstan\u010dius kodo eilu\u010di\u0173.<br\/>Metus baig\u0117me su keliais \u0161imtais eilu\u010di\u0173, o per vos kelis m\u0117nesius pamat\u0117me de\u0161imteriop\u0105 \u0161uol\u012f. \u017dmon\u0117s suprato, kad Google tikrai spar\u010diai vejasi, o po Gemini 2.5 Pro i\u0161leidimo tapo ai\u0161ku, kad Google v\u0117l \u017eaidime.        <\/p>\n\n<p><strong>AK:<\/strong> Taip, dar noriu pereiti prie programavimo temos, bet pirmiausia turiu tav\u0119s paklausti apie haliucinacijas, nes tai mano m\u0117gstamiausia tema kalbant apie LLM. Jau\u010diuosi taip, lyg pastaruosius 10 met\u0173 Elon Musk sakyt\u0173, kad kitais metais Teslos bus visi\u0161kai autonomin\u0117s, o a\u0161 vis dar turiu ve\u017eti dukr\u0105 \u012f darb\u0105. Sam Altman pastaruosius trejus metus kartoja, kad kitais metais atsikratysime haliucinacij\u0173. Ar tikrai kada nors tai \u012fvyks? Kaip tu \u012f tai \u017ei\u016bri \u2013 ar tai \u012fmontuota pa\u010dioje technologijoje, ar yra bent menkiausia tikimyb\u0117, kad pasieksime tok\u012f lyg\u012f, kai nebereik\u0117s kurti mem\u0173 apie dalykus, kuriuos \u0161ie varikliai pateikia neteisingai?    <\/p>\n\n<p><strong>KK:<\/strong> Kol nerasime geresn\u0117s architekt\u016bros nei didieji kalbos modeliai, haliucinacijos tikriausiai niekada visi\u0161kai nei\u0161nyks. Modeliai visada haliucinuoja \u2013 tiesiog da\u017eniausiai haliucinuoja teisingai.<br\/>2025 met\u0173 prad\u017eioje Gemini modeli\u0173 haliucinacij\u0173 lygis buvo apie 0,5%, o tai buvo labai ma\u017eai. Kiti modeliai, tokie kaip o3, haliucinuodavo beveik 6% atvej\u0173, o tai yra mil\u017eini\u0161kas skirtumas. 6% n\u0117ra tinkama produkcijai \u2013 jei modelis klysta kas dvide\u0161imt\u0105 kart\u0105, rizikuoji daug pinig\u0173.<br\/>Tod\u0117l man labai patiko Gemini 2.0 Flash, nors, deja, v\u0117liau Google ir Gemini atsitrauk\u0117 nuo \u0161ios strategijos, ir dabar j\u0173 modeliai haliucinuoja net daugiau. \u0160iuo metu nerekomenduo\u010diau Gemini modeli\u0173 visiems produkciniams naudojimo scenarijams; gali b\u016bti prasmingiau naudoti Anthropic modelius, nes \u017einoma, kad Sonnet haliucinuoja gerokai re\u010diau.<br\/>Tod\u0117l agentin\u0117se sistemose verifikavimo mechanizmai yra tokie svarb\u016bs.       <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Vibe_coding_ir_inzinerijos_ateitis\"><\/span><strong>Vibe coding ir in\u017einerijos ateitis<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>AK:<\/strong> Gerai, pereikime prie programavimo, nes matau tavo \u012fra\u0161us LinkedIn ir \u017einau, kad tai tema, kuri tau labai \u012fdomi. Terminas \u201evibe coding\u201c tapo labai populiarus, ir jis tikrai skamba kaip ka\u017ekas, k\u0105 Gen Z daro klausydamiesi lo-fi muzikos. Matome, kad \u017emon\u0117s kuria programin\u0119 \u012frang\u0105 tiesiog kalb\u0117dami su DI.<br\/>Kai prad\u0117jome \u0161\u012f podcast\u0105, man reik\u0117jo prompterio programin\u0117s \u012frangos, bet tur\u0117jau labai konkre\u010dius reikalavimus, kaip ji turi veikti. Praleidau dvi valandas ie\u0161kodamas ir neradau nieko, kas b\u016bt\u0173 tiksliai tai, ko reikia. Tada praleidau 15 minu\u010di\u0173 su Google, ir jis tiesiog para\u0161\u0117 j\u0105 man \u2013 b\u016btent taip, kaip nor\u0117jau, tiksliai tai, ko reik\u0117jo, pagal pareikalavim\u0105.    <\/p>\n\n<p>Man tai labai patinka, bet tada kyla klausimas: kiek toli tai nueis? Ar visi programuotojai ir in\u017einieriai i\u0161nyks, nes programin\u0119 \u012frang\u0105 tiesiog \u201emagi\u0161kai\u201c kursime patys, ar tai tik \u012frankis, su kuriuo galima pa\u017eaisti ir sukurti ma\u017eus dalykus, bet d\u0117l pa\u010dios LLM prigimties niekada negal\u0117sime sukurti ka\u017eko didelio, kas realiai b\u016bt\u0173 paruo\u0161ta produkcijai? Kokia tavo nuomon\u0117?  <\/p>\n\n<p><strong>KK:<\/strong> Tikrai gal\u0117sime kurti produkcijai paruo\u0161tas sistemas, ir tai n\u0117ra tolima ateitis. A\u0161 pats jau dabar kuriu tokias sistemas, naudodamas \u012fvairius metodus. 2025 metai buvo samprotavimo modeli\u0173 metai, o prie\u017eastis, kod\u0117l tai veikia, yra papildomo mokymo mechanizmas, kai modeliui suteikiami \u201eapdovanojimai\u201c, kai jis pateikia teising\u0105 atsakym\u0105.<br\/>Kodas ir matematika gali b\u016bti greitai patikrinti \u2013 ar jie teisingi, ar ne. Galima lengvai patikrinti, kad 2 plius 2 yra 4, nereikia kito LLM modelio, kuris tai patikrint\u0173, nes ir tas modelis gali haliucinuoti. B\u016btent \u0161ioje srityje padaryta did\u017eiausia pa\u017eanga.     <\/p>\n\n<p>2025 metus prad\u0117jome su AI Frontier Math benchmarku, kuris yra itin sud\u0117tingas \u2013 u\u017eduotys paprastai u\u017etrukt\u0173 savaites net patyrusiems matematikams. Met\u0173 prad\u017eioje rezultatas buvo vos 2%, o dabar jau vir\u0161ijame 40%. Tai dvide\u0161imteriopas progresas. Visos matematin\u0117s u\u017eduotys i\u0161 Acme benchmarko buvo i\u0161spr\u0119stos LLM modeli\u0173.<br\/>Kodas turi tas pa\u010dias savybes \u2013 jis patikrinamas: arba susikompiliuoja, arba ne. D\u0117l to \u0161ie samprotavimo modeliai tampa nepaprastai geri programuojant. 2025 met\u0173 prad\u017eioje LLM modeliai geriausiu atveju gal\u0117jo para\u0161yti paprast\u0105 kod\u0105 i\u0161 keli\u0173 \u0161imt\u0173 eilu\u010di\u0173, o dabar DI jau gali generuoti i\u0161tisas sistemas, ypa\u010d jei j\u012f prijungi prie agentini\u0173 sprendim\u0173, toki\u0173 kaip Claude Code, kurie gali skaityti kod\u0105, analizuoti duomenis ir patikrinti, ar sprendimas juda teisinga kryptimi.      <\/p>\n\n<p>B\u016btent tai tikriausiai ir nustebino visus, kai Andrej Karpathy pavartojo termin\u0105 \u201evibe coding\u201c. Tai tapo memu, ta\u010diau nemanau, kad \u010dia yra i\u0161 ko juoktis. Opus 4.5 gali veikti valand\u0173 valandas ir atlikti daug programavimo darb\u0173 net jums miegant, be tiesiogin\u0117s prie\u017ei\u016bros.<br\/>Metodai ir \u012frankiai kiekvien\u0105 m\u0117nes\u012f tampa vis geresni ir lengviau prieinami. Claude Code pa\u010dioje prad\u017eioje buvo gana grubus \u012frankis, ta\u010diau dabar turime pl\u0117tinius ir funkcijas, d\u0117l kuri\u0173 \u0161is \u012frankis tampa ne tik geresnis, bet ir daug prieinamesnis paprastiems naudotojams.    <\/p>\n\n<p><strong>AK:<\/strong> Gerai, tai kokia programuotoj\u0173 ateitis? Jei esi vidutinio lygio programuotojas, pavyzd\u017eiui, dirbantis su C# ar pana\u0161ia kalba, k\u0105 tur\u0117tum daryti? R\u0117kti ir sl\u0117ptis, ar prad\u0117ti galvoti apie karjeros keitim\u0105? Kaip, tavo nuomone, reik\u0117t\u0173 reaguoti \u012f visk\u0105, kas dabar vyksta?   <\/p>\n\n<p><strong>KK:<\/strong> Sunku tai pasakyti, ir daug kas priklauso nuo to, kaip greitai organizacijos sugeb\u0117s priimti \u0161i\u0105 technologij\u0105 ir kiek jos bus pasirengusios rizikuoti po to, kai daugelis \u012fmoni\u0173 \u201enusidegino pir\u0161tus\u201c su haliucinacijomis ir agentin\u0117mis sistemomis, kurios ne visada veikia teisingai.<br\/>Mano nuomone, vis dar reikia mok\u0117ti programuoti, o su agentiniais modeliais to galima tiesiog i\u0161mokti daug grei\u010diau. Programavimo \u012fg\u016bdis niekur nedings, ypa\u010d tokios sritys kaip sistem\u0173 projektavimas, naudotojo patirtis ir verslo \u017einios, kurios reikalingos tam, kad gal\u0117tum tinkamai nukreipti modelius.<br\/>Ta\u010diau pats kodavimas \u2013 s\u0117d\u0117jimas prie kompiuterio ir kodo ra\u0161ymas valand\u0173 valandas \u2013 tikriausiai gana greitai i\u0161nyks. Kiekvienas programuotojas, su kuriuo kalbuosi, naudoja tam tikras agentinio programavimo priemones, kad greitai sukurt\u0173 pavyzd\u017eius klientams. Diskusijos tampa daug produktyvesn\u0117s, kai gali parodyti real\u0173 kodo fragment\u0105, o ne remtis vien PowerPoint skaidr\u0117mis.     <\/p>\n\n<p><strong>AK:<\/strong> Taip, tai i\u0161 ties\u0173 did\u017eiulis dalykas, nes galima labai greitai sukurti prototip\u0105 arba MVP ir parodyti \u017emon\u0117ms, kaip tai atrodys, u\u017euot dirbus su tuo savaites. A\u0161 d\u0117l to dar dvejoju. Programavau did\u017ei\u0105j\u0105 gyvenimo dal\u012f \u2013 kartais daugiau, kartais ma\u017eiau, kai tik atsirasdavo poreikis, bet nesu profesionalus programuotojas. Labai smalsu pamatyti, ar pavyks pakankamai suvaldyti haliucinacijas, kad gal\u0117tume pasitik\u0117ti kodu.<br\/>Kitas \u012fdomus dalykas tas, kad mums vis dar reikia patyrusi\u0173 vyresni\u0173j\u0173 architekt\u0173, kurie supranta vis\u0105 sistem\u0105, bet atrodo, kad jaunesni\u0173j\u0173 ir vidutinio lygio programuotoj\u0173 jau nebereikia. Ta\u010diau jei nenaudoji junior ir mid specialist\u0173, niekada neu\u017eauginsi nauj\u0173 senior. Tai tikras paradoksas.      <\/p>\n\n<p><strong>KK:<\/strong> Tai tikrai viena did\u017eiausi\u0173 rizik\u0173. Haliucinacijos kode n\u0117ra didel\u0117 problema, nes visada gali tai patikrinti ra\u0161ydamas testus. Prie\u0161 kelis m\u0117nesius LLM dar nebuvo geri ra\u0161ydami testus, ta\u010diau dabar tai jau pasikeit\u0117. Manau, kad i\u0161 tikr\u0173j\u0173 kursime daug daugiau kodo, tod\u0117l reik\u0117s daugiau \u017emoni\u0173. Programuotojo profesija niekur nedings, ta\u010diau jaunesniems specialistams gali atsirasti tam tikra stagnacija. Bet kuriam junior programuotojui patar\u010diau naudoti agentin\u012f programavim\u0105 ir LLM, kad mokyt\u0173si daug grei\u010diau ir tobulint\u0173 savo \u012fg\u016bd\u017eius. Jie n\u0117ra tokie kvaili, kaip daugelis mano \u2013 jie tikrai gali tave nukreipti ir daug ko i\u0161mokyti, net jei kartais ir klysta.      <\/p>\n\n<p><strong>AK:<\/strong> \u017dmon\u0117s, atrodo, tikisi, kad LLM atsakymai bus tobuli, ta\u010diau mums tereikia, kad jie b\u016bt\u0173 geresni u\u017e vidutin\u012f \u017emog\u0173. Vidutinis \u017emogus taip pat daro klaid\u0173 ir \u201ehaliucinuoja\u201c. I\u0161sivesk draugus alaus, ir po tre\u010dio bokalo prad\u0117kite kalb\u0117ti apie politik\u0105 \u2013 pamatysi, kiek daug dalyk\u0173 \u017emon\u0117s i\u0161galvoja vien tam, kad \u012frodyt\u0173 savo teisum\u0105. Svarbiausia, kad LLM neatlikt\u0173 darbo pras\u010diau nei \u017emogus. Bet tu turi tiesiogin\u0117s patirties kuriant sprendim\u0105 Google konkursui agentiniu b\u016bdu, kai pats nepara\u0161ei n\u0117 vienos kodo eilut\u0117s.    <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Atvejo_analize_25_000_kodo_eiluciu_be_zmogaus_prisilietimo\"><\/span><strong>Atvejo analiz\u0117: 25 000 kodo eilu\u010di\u0173 be \u017emogaus prisilietimo<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>KK:<\/strong> Taip, i\u0161 tikr\u0173j\u0173 gana pla\u010diai paplit\u0119s \u012fsitikinimas, kad DI negali kurti programin\u0117s \u012frangos, kuri dar niekada nebuvo sukurta. \u012erankis, kur\u012f tau parodysiu, yra naujo tipo programin\u0117 \u012franga. 25 000 kodo eilu\u010di\u0173, prie kuri\u0173 a\u0161 pats n\u0117 neprisilie\u010diau. Kai \u012fvairi\u0173 LLM paklausiau, kiek laiko u\u017etrukt\u0173 j\u0105 sukurti, jie \u012fvertino nuo 500 iki 1500 valand\u0173. Jei b\u016b\u010diau k\u016br\u0119s pats, tai tikriausiai b\u016bt\u0173 u\u017etruk\u0119 apie du m\u0117nesius, o jei b\u016b\u010diau samd\u0119s \u012fmon\u0119, tai lengvai b\u016bt\u0173 kainav\u0119 50 000 doleri\u0173. A\u0161 j\u0105 suk\u016briau per kelis vakarus. Tai tikrai dar n\u0117ra baigtas produktas, bet mielai tau j\u012f parodysiu.      <\/p>\n\n<p>Sistema paremta id\u0117ja, kuri\u0105 suk\u016briau prie\u0161 metus, kai laim\u0117jau Google apdovanojim\u0105. \u012ekeli proceso vaizdo \u012fra\u0161\u0105, o DI j\u012f i\u0161analizuoja ir i\u0161traukia \u012fvairi\u0105 informacij\u0105. Versija, kuri\u0105 suk\u016briau prie\u0161 metus, buvo labai primityvi, ta\u010diau sistema, kuri\u0105 dabar pristatau, i\u0161ple\u010dia funkcionalum\u0105. Ji paima ekrano kopijas i\u0161 vaizdo \u012fra\u0161o ir sukuria \u201ebounding boxes\u201c kiekvienam vartotojo naudotam UI elementui. Galite redaguoti \u0161ias \u201ebounding boxes\u201c, apkarpyti vaizd\u0105 ir naudoti DI jautriai informacijai aptikti bei j\u0105 u\u017emaskuoti, kad programuotojas jos nematyt\u0173 Process Definition Document (PDD).    <\/p>\n\n<p>Jei tr\u016bksta kokio nors \u017eingsnio, \u012frankyje yra \u012fmontuotas vaizdo redaktorius, kuriame galite paimti ekrano kopij\u0105 i\u0161 pasirinkto vaizdo kadro ir j\u0105 patys redaguoti. Visa tai bus konvertuota \u012f PDD. Sistema ne tik generuoja \u017eingsni\u0173 s\u0105ra\u0161\u0105, bet ir perkelia visus duomenis \u012f dokument\u0105. Taip pat yra srauto diagramos vaizdas ir \u017eingsni\u0173 s\u0105ra\u0161as. Visa duomen\u0173 baz\u0117 yra sujungta, ir a\u0161 galiu sekti kiekvieno API i\u0161kvietimo \u012f Gemini modelius ka\u0161tus. Tai daug funkcij\u0173 \u2013 ne paprasta HR sistema \u2013 joje yra visos \u0161ios agentin\u0117s galimyb\u0117s, o PDD kokyb\u0117 yra visai gera.     <\/p>\n\n<p><strong>AK:<\/strong> Tai tikrai \u012fsp\u016bdinga, ypa\u010d turint omenyje, kad tai suk\u016brei per kelis vakarus naudodamas LLM \u012frank\u012f. Ar manai, kad ilgainiui tai gal\u0117t\u0173 tapti tikru produktu, ar tai buvo labiau bandymas \u012frodyti tam tikr\u0105 id\u0117j\u0105? <\/p>\n\n<p><strong>KK:<\/strong> Ne, tikrai pavers\u010diau tai \u012frankiu. Dar svarstau, ar j\u012f komercializuoti, ar padaryti atvirojo kodo. Dalis \u0161i\u0173 duomen\u0173, pavyzd\u017eiui, \u012fra\u0161ai apie tai, k\u0105 dar\u0117 vartotojai, d\u0117l \u012fvairi\u0173 saugumo ir atitikties reikalavim\u0173 negali b\u016bti perkeliami \u012f debesij\u0105. Galb\u016bt padarysiu atvirojo kodo versij\u0105, skirt\u0105 vietiniam naudojimui, o kartu tur\u0117siu komercin\u0119 SaaS versij\u0105. I\u0161 \u0161io palyginti nedidelio projekto daug i\u0161mokau, nors pats neprisilie\u010diau n\u0117 prie vienos i\u0161 t\u0173 25 000 kodo eilu\u010di\u0173. Dirbau tik su Opus ir Gemini modeliais, nes jie yra puik\u016bs, kai kalbama apie UI dizain\u0105.     <\/p>\n\n<p>Grei\u010diausiai tam tikr\u0105 versij\u0105 i\u0161leisiu vasario prad\u017eioje. Did\u017eiausia agentinio programavimo vert\u0117 yra ta, kad galiu labai greitai patikrinti savo id\u0117j\u0105. Man nereikia finansavimo, savo pinig\u0173 ar bendrak\u016br\u0117j\u0173, kad gal\u0117\u010diau tiesiog prad\u0117ti. Galiu sukurti \u012frank\u012f, parodyti j\u012f vartotoj\u0173 grupei ir i\u0161 karto gauti patvirtinim\u0105, ar tai turi prasm\u0119. Tradiciniai programuotojai tame nemato tokios didel\u0117s vert\u0117s, ta\u010diau vien id\u0117j\u0173 validavimui tai turi mil\u017eini\u0161k\u0105 potencial\u0105 ir gali pad\u0117ti kurti geresn\u0119 programin\u0119 \u012frang\u0105.    <\/p>\n\n<p><strong>AK:<\/strong> Taip, kai kalbama apie id\u0117j\u0173 validavim\u0105, tai tikras i\u0161sigelb\u0117jimas. Office Samurai \u012fk\u016br\u0117 ir kelet\u0105 kit\u0173 \u012fmoni\u0173, ir vienoje i\u0161 j\u0173 praleidome metus kurdami programin\u0119 \u012frang\u0105, kuri galiausiai vartotojams visai netiko. Tai buvo gana traumuojanti patirtis, ir manau, kad jos gal\u0117jome i\u0161vengti, jei tuo metu b\u016bt\u0173 buv\u0119 \u012fmanoma naudoti tokius \u012frankius. Suprantu, kad \u0161is \u012frankis siun\u010dia vaizdo \u012fra\u0161o dalis Gemini modeliams.   <\/p>\n\n<p><strong>KK:<\/strong> Vienas i\u0161 Gemini modeli\u0173 privalum\u0173 yra tas, kad jie analizuoja vaizdo \u012fra\u0161\u0105 kaip visum\u0105. Net vartotojo pasakojimas, kuriame jis ai\u0161kina, kas rodoma ekrane, yra analizuojamas u\u017e palyginti nedidel\u0119 kain\u0105, nes naudojamas Gemini Flash. <\/p>\n\n<p><strong>AK:<\/strong> Tai mane tikrai stebina, ypa\u010d tai, k\u0105 \u0161ie modeliai gali padaryti su vaizdais ir tam tikru mastu su vaizdo \u012fra\u0161ais. 2025 metais pamat\u0117me tokius modelius kaip Nano Banana, kurie leid\u017eia i\u0161 tikr\u0173j\u0173 redaguoti tai, k\u0105 jau turime. Anks\u010diau sakydavai ChatGPT ar Google \u201esugeneruok man tokio tipo vaizd\u0105\u201c, o jei nor\u0117davai k\u0105 nors pakeisti, negal\u0117davai pasakyti \u201epadaryk kepur\u0119 \u017eali\u0105\u201c, nes sistema sugeneruodavo visi\u0161kai nauj\u0105 vaizd\u0105. Dabar galima redaguoti atskiras turimo vaizdo dalis, ir man tai buvo tiesiog priblo\u0161kiama. Su LLM, generuojan\u010diais vaizdus, dirbu nuo pat prad\u017ei\u0173 ir tikrai nemaniau, kad redagavimo galimyb\u0117s atsiras taip greitai.   <\/p>\n\n<p><strong>KK:<\/strong> Tai tiesiogiai susij\u0119 su haliucinacijomis. Negalite tur\u0117ti tokios sistemos, jei haliucinacij\u0173 lygis n\u0117ra labai ma\u017eas, nes ji turi pakeisti b\u016btent tai, ko norite, tik toje erdv\u0117je, kuri apibr\u0117\u017eta promte. Kaip sako Demis Hassabis, haliucinacijos tikriausiai niekada visi\u0161kai nei\u0161nyks, ta\u010diau galima naudoti verifikavimo mechanizmus arba papildom\u0105 LLM, kuris atlikt\u0173 kry\u017emin\u012f patikrinim\u0105. Yra daug mechanizm\u0173, kurie gali suma\u017einti \u0161\u012f haliucinacij\u0173 lyg\u012f.   <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Tikslumo_atotrukis_verslo_automatizavime\"><\/span><strong>Tikslumo atotr\u016bkis verslo automatizavime<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>AK:<\/strong> Man atrodo, kad daug \u0161i\u0173 diskusij\u0173 kyla b\u016btent i\u0161 to, nes yra dalyk\u0173, kuriuos LLM daro ne\u012ftik\u0117tinai gerai, pavyzd\u017eiui, generuoja kod\u0105, ta\u010diau yra ir kit\u0173 dalyk\u0173, kurie \u017emon\u0117ms atrodo trivial\u016bs, bet LLM \u2013 labai sud\u0117tingi.<br\/>I\u0161 automatizavimo perspektyvos dirbome su LLM, kad jie suprast\u0173 gaunam\u0105 komunikacij\u0105, pavyzd\u017eiui, el. lai\u0161kus ir u\u017eklaus\u0173 bilietus. Vienam klientui dirbome su projektu, kuriame jie gauna el. lai\u0161kus i\u0161 i\u0161or\u0117s, pavyzd\u017eiui: \u201eAr gavote mano s\u0105skait\u0105? Kada j\u0105 apmok\u0117site?\u201c. Kiekviena didel\u0117 \u012fmon\u0117 turi labai daug tokios komunikacijos.   <\/p>\n\n<p>Informacijos patikrinimas ERP sistemoje yra lengvoji dalis, ta\u010diau sud\u0117tingiausia visada buvo i\u0161gauti vis\u0105 informacij\u0105 i\u0161 el. lai\u0161ko ir jo pried\u0173. Pasteb\u0117jome, kad \u201ehappy path\u201c scenarijuose tai veikia puikiai, bet tada \u017emon\u0117s pradeda prisegti Excel failus, ERP ekrano kopijas ir ra\u0161o tuos lai\u0161kus labai keistais b\u016bdais.<br\/>\u0160iuo metu sistema turi apie 70% tikslum\u0105, tai rei\u0161kia, kad 70% atvej\u0173 ji visk\u0105 nustato visi\u0161kai teisingai \u2013 s\u0105skait\u0173 numerius ir pana\u0161iai. B\u016btent to \u017emon\u0117s tikisi automatizavimo pasaulyje; esame priprat\u0119 prie RPA, kur sistema arba veikia tobulai, arba neveikia visai. Kaip, tavo nuomone, tai vystysis toliau?    <\/p>\n\n<p><strong>KK:<\/strong> 70% vis tiek yra geras rezultatas. A\u0161 skatinu klientus kurti paprastus agentus, o ne visk\u0105 \u012fd\u0117ti \u012f deterministin\u012f workflow. Na\u0161umas pager\u0117ja, jei agentai savo vykdymo ciklo metu gali ra\u0161yti kod\u0105. Kai kas nors prideda ekrano kopij\u0105, LLM gali j\u0105 analizuoti ir \u0161iek tiek \u201ehaliucinuoti\u201c, ta\u010diau taip pat gali apkarpyti ar pasukti vaizd\u0105, kad gaut\u0173 daugiau informacijos ir geriau j\u012f suprast\u0173. Tokios sistemos tikrai pagerins t\u0105 ma\u017edaug 70% tikslumo lyg\u012f ir priart\u0117sime prie 90%.    <\/p>\n\n<p>Be to, manau, kad tai labiau susijusi su proces\u0173 problema, o ne su pa\u010diu DI. Iki \u0161i\u0173 met\u0173 pabaigos pamatysime daugiau sistem\u0173, kurios pa\u010dios kurs automatizacijas, remdamosi paprastu vaizdo \u012fra\u0161u arba PDD dokumentu. Tai padarys automatizavim\u0105 daug prieinamesn\u012f ma\u017eesn\u0117ms organizacijoms, kurios \u0161iuo metu susiduria su sunkumais bandydamos suprasti, kaip automatizuoti savo procesus.  <\/p>\n\n<p><strong>AK:<\/strong> \u012e\u0117jimo barjeras ma\u017e\u0117s. A\u0161 \u0161iek tiek prie\u0161tarauju LLM naudojimui selektoriams, nes jei nori sukurti stabil\u0173 ir efektyv\u0173 automatizavim\u0105, kuris kasdien apdoroja de\u0161imtis t\u016bkstan\u010di\u0173 element\u0173, n\u0117ra prasm\u0117s kiekvien\u0105 kart\u0105 klausti LLM, kur paspausti. Ta\u010diau tai, kad RPA yra low-code, dabar tampa tr\u016bkumu, nes LLM labai lengvai gali ra\u0161yti kod\u0105, bet sud\u0117lioti \u201ed\u0117\u017eutes\u201c tinkama tvarka ir jas sujungti yra daug sunkiau.  <\/p>\n\n<p><strong>KK:<\/strong> Naudojau Claude Code redaguoti UiPath XAML failus ir tai veik\u0117 visai neblogai. Ta\u010diau naudoti LLM vien tam, kad jie spaudin\u0117t\u0173 mygtukus vartotojo vietoje, visi\u0161kai neturi prasm\u0117s. Tai buvo pirmasis didelis projektas, kur\u012f suk\u016briau naudodamas UiPath \u2013 \u201eclicker\u012f\u201c, kuris vykd\u0117 procesus pagal \u017emogaus kalba pateikt\u0105 apra\u0161ym\u0105 \u2013 bet sustojau, nes jei atsiranda haliucinacija ir ji n\u0117ra aptikta, viskas sugri\u016bva.<br\/>RPA turi i\u0161imtis ir j\u0173 valdym\u0105 (exception handling), o tai n\u0117ra lengva \u012fgyvendinti LLM sistemose, nes LLM neturi i\u0161im\u010di\u0173 \u2013 jos tiesiog mano, kad yra teisios, net kai klysta. Tod\u0117l per\u0117jau \u012f srit\u012f, kur DI pats ra\u0161o automatizavimo programin\u0119 \u012frang\u0105. Low-code \u012frankiai naudoja sud\u0117tingas JSON ar XAML notacijas, kurias LLM sunkiau greitai suprasti ir redaguoti. Agile, ma\u017eesn\u0117s organizacijos gali pereiti prie vibe code tipo sprendim\u0173 interneto automatizavimui, kur DI pats ra\u0161o, vykdo ir orkestruoja automatizacijas.      <\/p>\n\n<p><strong>AK:<\/strong> I\u0161band\u017eiau vien\u0105 i\u0161 agentini\u0173 interneto nar\u0161ykli\u0173 ir buvau tiek nusivyl\u0119s, tiek maloniai nustebintas. Papra\u0161iau jos nueiti \u012f elektronin\u0117s prekybos svetain\u0119 ir palyginti produktus, ta\u010diau ji nerado visko, nors informacija ten buvo. Bet mane tikrai nustebino, kaip ji i\u0161sprend\u0117 kainos problem\u0105 \u2013 buvo ma\u017eesn\u0117 kaina klubo nariams ir sistema nesuprato, kuri\u0105 pasirinkti, tod\u0117l i\u0161 tikr\u0173j\u0173 \u012fd\u0117jo produkt\u0105 \u012f krep\u0161el\u012f, kad patikrint\u0173 galutin\u0119 kain\u0105. Man tai pasirod\u0117 visai gudru.   <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Lengvasis_AGI_ir_intelekto_kontinuumas\"><\/span><strong>Lengvasis AGI ir intelekto kontinuumas<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>AK:<\/strong> \u017dmon\u0117s kalba apie AGI, o Sam Altman jau \u017eada j\u012f kitais metais. \u017dinau, kad tave domina \u201elight AGI\u201c arba ma\u017eojo AGI tema. Kaip manai, kur link viskas juda \u2013 ar netrukus tur\u0117sime \u201eprotingus praktikantus\u201c, ar vis dar esame toli nuo ka\u017eko pana\u0161aus?  <\/p>\n\n<p><strong>KK:<\/strong> AGI labiau primena kontinuum\u0105. Yra daug tarpini\u0173 etap\u0173 tarp deterministin\u0117s sistemos ir AGI modelio. Minimaliojo AGI arba \u201elight AGI\u201c s\u0105voka rei\u0161kia sistem\u0105, kuri n\u0117ra tokia paj\u0117gi kaip geriausi \u017emon\u0117s, ta\u010diau gali patikimai atlikti verting\u0105 darb\u0105. Mano m\u0117gstamiausia Demis Hassabis pateikta definicija \u2013 tai DI sistemos geb\u0117jimas atkartoti bet kokias \u017emogaus kognityvines funkcijas, tai yra sistema, kuri gal\u0117t\u0173 i\u0161 paprasto duomen\u0173 rinkinio suformuluoti, pavyzd\u017eiui, Bendrosios reliatyvumo teorijos id\u0117j\u0105.   <\/p>\n\n<p>\u017dvelgiant i\u0161 \u0161ios perspektyvos, pilnas AGI gali b\u016bti u\u017e 5\u201310 met\u0173, ta\u010diau minimal\u0173 AGI \u2013 sistem\u0105, kuri patikimai gali atlikti intelektin\u012f darb\u0105 vidutinio \u017emogaus lygiu \u2013 galime pamatyti jau \u0161i\u0173 met\u0173 pabaigoje arba kitais metais. Jei sujungtume geriausi\u0173 DI modeli\u0173 geb\u0117jimus \u012f vien\u0105 supermodel\u012f, tai b\u016bt\u0173 labai arti minimalaus AGI. <\/p>\n\n<p>Opus Claude Code aplinkoje yra steb\u0117tinai i\u0161manus. T\u0105 program\u0105 suk\u016briau per 15 minu\u010di\u0173, nors vidutinis programuotojas b\u016bt\u0173 praleid\u0119s tiesiog dienas ai\u0161kindamasis, kaip j\u0105 sukurti. Tur\u0117tume pasiruo\u0161ti tam, kad galb\u016bt nebeb\u016bsime protingiausia r\u016b\u0161is planetoje; netrukus galime tur\u0117ti t\u016bkstan\u010dius genij\u0173, dirban\u010di\u0173 duomen\u0173 centre u\u017e labai ma\u017e\u0105 kain\u0105, palyginti su tuo, kiek kainuoja \u017emon\u0117s.  <\/p>\n\n<p><strong>AK:<\/strong> A\u0161 esu \u0161iek tiek skepti\u0161kesnis, bet jau esu klyd\u0119s d\u0117l to, kaip greitai mokosi LLM. Ar yra koks nors b\u016bdas pasiruo\u0161ti, i\u0161skyrus bunker\u012f ir sl\u0117pim\u0105si jame? <\/p>\n\n<p><strong>KK:<\/strong> Organizacijos tur\u0117t\u0173 mokytis dirbti su \u0161iomis naujomis sistemomis. A\u0161 pats 2025 met\u0173 prad\u017eioje buvau labai skepti\u0161kas, sekdamas Ilya Sutskever, kuris sak\u0117, kad atsitrenk\u0117me \u012f sien\u0105. Asmeni\u0161kai nenor\u0117\u010diau, kad AGI b\u016bt\u0173 sukurtas per mano gyvenim\u0105, nes tai labai transformuojanti ir pavojinga technologija. Ta\u010diau pamat\u0119s \u0161i\u0173 met\u0173 pa\u017eang\u0105, esu optimisti\u0161kesnis \u2013 atrodo, kad tai ar\u010diau, nei man\u0117me. Jokios sienos n\u0117ra; Gemini 3 Pro modelis tiesiog buvo treniruojamas ilgiau ir vis tiek parod\u0117 kokyb\u0117s pager\u0117jim\u0105. Minimalus AGI buvo prognozuojamas apie 2028 metus, o tai yra vos po dvej\u0173 met\u0173. Per m\u016bs\u0173 gyvenim\u0105 tikrai pamatysime AGI.      <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Rizikos_ir_%E2%80%9Esukciaujantis%E2%80%9C_DI\"><\/span><strong>Rizikos ir \u201esuk\u010diaujantis\u201c DI<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>AK:<\/strong> Kalbant apie saugum\u0105 ir galimyb\u0119, kad \u0161ie modeliai gali \u201enueiti \u012f \u0161on\u0105\u201c, \u012f k\u0105 tur\u0117tume labiausiai atkreipti d\u0117mes\u012f?<\/p>\n\n<p><strong>KK:<\/strong> Leisk man papasakoti vien\u0105 svarbi\u0105 istorij\u0105. Naudojau Claude Code su Opus ir daviau jam ne\u012fmanom\u0105 u\u017eduot\u012f: i\u0161spr\u0119sti RPA i\u0161\u0161\u016bk\u012f per ma\u017eiau nei 10 milisekund\u017ei\u0173. Nor\u0117jau pa\u017ei\u016br\u0117ti, kaip jis elgsis, ir galiausiai jis prad\u0117jo \u201elau\u017eti\u201c svetain\u0119. Jis perra\u0161in\u0117jo JavaScript funkcijas ir keit\u0117 jas savo kodu, kad pasiekt\u0173 t\u0105 10 milisekund\u017ei\u0173 rib\u0105.   <\/p>\n\n<p><strong>AK:<\/strong> Ma\u017eas suk\u010dius.<\/p>\n\n<p><strong>KK:<\/strong> Tai buvo protinga, bet tai buvo suk\u010diavimas. Dabar \u012fsivaizduokite didesnes sistemas su daugiau \u012franki\u0173 \u2013 tai jau n\u0117ra visi\u0161kai m\u016bs\u0173 kontrol\u0117je. Tod\u0117l \u017emon\u0117s palieka OpenAI ir pradeda koncentruotis \u012f saugumo aspektus, pavyzd\u017eiui, kaip Ilya Sutskever projektas Safe Superintelligence (SSI). Jei pasamdytum\u0117te DI \u201edarbuotoj\u0105\u201c ir jis tur\u0117t\u0173 netinkamus prieigos duomenis prie HR sistemos, jis gali tiesiog nuspr\u0119sti j\u0105 nulau\u017eti, kad atlikt\u0173 u\u017eduot\u012f. \u0160ios sistemos yra skatinamos spr\u0119sti problemas; jos neturi moralinio kodekso, tik tas ribas, kurias mes joms nustatome.    <\/p>\n\n<p><strong>AK:<\/strong> Jei esi programuotojas ir nerimauji d\u0117l savo darbo, DI saugumas ir patikimumas gali b\u016bti tinkama sritis, \u012f kuri\u0105 pereiti. \u0160iuo metu IT saugumas daugiausia d\u0117mesio skiria duomen\u0173 apsaugai, ta\u010diau dar nesikoncentruojame \u012f tai, kaip u\u017etikrinti, kad \u012frankiai atlikt\u0173 u\u017eduotis pagal \u012fstatymus, m\u016bs\u0173 vertybes ir etik\u0105. <\/p>\n\n<h2 class=\"wp-block-heading\"><span class=\"ez-toc-section\" id=\"Prognozes_2026_metams\"><\/span><strong>Prognoz\u0117s 2026 metams<\/strong><span class=\"ez-toc-section-end\"><\/span><\/h2>\n\n<p><strong>AK:<\/strong> Prie\u0161 paleid\u017eiant tave, kokias prognozes turi 2026 metams?<\/p>\n\n<p><strong>KK:<\/strong> 2025 metai pranoko visus mano l\u016bkes\u010dius. Kalbant apie atvirojo kodo sprendimus, Mistral 20B model\u012f galima paleisti ant vartotojams prieinamos \u012frangos, ir jis toks pat paj\u0117gus kaip geriausias pra\u0117jusi\u0173 met\u0173 modelis. Intelektas nebebus ribojamas duomen\u0173 centrais \u2013 j\u012f tur\u0117sime ir savo telefonuose.<br\/>Taip pat verta atkreipti d\u0117mes\u012f \u012f Google teksto difuzijos modelius. Jie veikia t\u016bkstan\u010diais \u017eeton\u0173 ir yra nepaprastai greiti. Gali b\u016bti, kad netrukus i\u0161spr\u0119stas bus ir nuolatinio mokymosi klausimas, kai modeliai mokosi i\u0161 savo klaid\u0173 ir realiu laiku kei\u010dia savo neuroninius tinklus.<br\/>Progreso tempas yra daug greitesnis, nei dauguma \u017emoni\u0173 mano; per vienerius metus ARC-AGI benchmarko sprendimo kaina nukrito 500 kart\u0173.      <\/p>\n\n<p><strong>AK:<\/strong> Na, manau, kad tur\u0117sime susitikti v\u0117l po met\u0173 ir pamatyti, kas pasikeit\u0117. Krzysztofai, labai a\u010di\u016b, kad pasidalinai savo patirtimi su mumis. <\/p>\n\n<p>KK: A\u010di\u016b.<\/p>\n\n<p><strong>AK:<\/strong> Ir \u0161tai, mes oficialiai \u201espaud\u0117me\u201c DI burbul\u0105, ir stebuklingai jis dar nesprogo mums prie\u0161 akis. Arigatou, kad klaus\u0117t\u0117s. \u017dinome, kad j\u016bs\u0173 laikas vertingas, nebent jau buvote pakeisti DI agento, tokiu atveju a\u010di\u016b, kad praleidote savo nedarb\u0105 su mumis. Didelis a\u010di\u016b mano buvusiam mokytojui Krzysztofui Karaszewskiui, kuris ved\u0117 mus per modeli\u0173 karus nepalikdamas gyv\u0173 prie\u0161inink\u0173, ir tikrajai operacijos intelektui \u2013 m\u016bs\u0173 prodiuserei Annai Cubal, kuri i\u0161pjauna visas dalis, kur a\u0161 pra\u0161au DI paai\u0161kinti mano pa\u010di\u0173 juokelius.<br\/>Kaip visada, \u012fra\u0161in\u0117jome bunkeryje, \u017einomame kaip Wodzu Beats Studio. Jei jums patiko, palikite penki\u0173 \u017evaig\u017edu\u010di\u0173 \u012fvertinim\u0105. Jei ne, tiesiog papra\u0161ykite LLM sugeneruoti jums geresn\u012f podcast\u0105. Iki kito karto \u2013 tegul j\u016bs\u0173 duomenys b\u016bna \u0161var\u016bs, o AGI draugi\u0161kas. Mata ne.        <\/p>\n\n<style>a.wp-block-button__link,\n  a.wp-block-button__link * {\n    text-decoration: none !important;\n    -webkit-text-decoration: none !important;\n  }\n<\/style>\n","protected":false},"excerpt":{"rendered":"<p>Pa\u017evelkime giliau \u012f 2025 metus. Met\u0173 prad\u017eioje atrod\u0117, kad ka\u017ek\u0105 suprantame, o dabar, atsigr\u0119\u017eus atgal, tai jau primena senov\u0117s civilizacij\u0105. Kai kuriose srityse vystymosi greitis buvo tiesiog absurdi\u0161kas. \u012erankiai, kuriuos prie\u0161 \u0161e\u0161is\u2013devynis m\u0117nesius taip i\u0161auk\u0161tinome, dabar jau atrodo beveik pasen\u0119. Pateikite mums savoti\u0161k\u0105 skrodimo ataskait\u0105: kas i\u0161 tikr\u0173j\u0173 \u012fvyko rinkoje per pastaruosius metus ir kod\u0117l atrodo, kad viskas juda taip greitai?    <\/p>\n","protected":false},"author":5,"featured_media":21798,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"footnotes":""},"categories":[144],"tags":[177],"class_list":["post-22308","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-dirbtinio-intelekto-agentai","tag-podcastas"],"acf":[],"_links":{"self":[{"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/posts\/22308","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/users\/5"}],"replies":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/comments?post=22308"}],"version-history":[{"count":0,"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/posts\/22308\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/media\/21798"}],"wp:attachment":[{"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/media?parent=22308"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/categories?post=22308"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/office-samurai.com\/lt\/wp-json\/wp\/v2\/tags?post=22308"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}