VDU mokslininkai kuria programinę įrangą, atpažįstančią lietuvių kalbą neribotai
Lietuvių kalbos puoselėjimui šalies mokslininkai pasitelkia moderniausias inovacijas – skaitmeninės humanitarikos ir dirbtinio intelekto technologijas. ES lėšomis finansuojamas Vytauto Didžiojo universiteto (VDU) tyrėjų projektas „Semantika 2“ siekia sudaryti sąlygas verslui, viešajam sektoriui ir visuomenei naudotis novatoriškomis kalbos technologijomis, tokiomis kaip automatinis šnekos pavertimas tekstu ir socialinių tinklų analizė.
Projekte „Semantika 2“ humanitarinių mokslų, informatikos ir teisės srities mokslininkai kuria sprendimus, kuriais siekiama išsaugoti lietuvių kalbos aktualumą technologijų taikyme, išvengti grėsmės, kad ją interneto erdvėje išstumtų anglų kalba. Vienas tokių sprendimų yra programinė įranga, kuri paverčia garso įrašą tekstu – kompiuterinė programa, atpažįstanti lietuvišką šneką ir ją užrašanti, taip leisdama ženkliai sutaupyti laiko, paprastai skiriamo perrašinėjimui.
„Ligoninėse operacijų protokolus dažnai rengia patys chirurgai, kurių darbo laikas brangiai apmokamas; tuo tarpu teisėje tokia programa labai praverstų transkribuojant teismo posėdžių fonogramas – advokatų kontorose per mėnesį jų sukaupiama iki 50 val.“, – programos praktiškumą iliustravo VDU Humanitarinių mokslų fakulteto Kompiuterinės lingvistikos centro mokslininkas, Informatikos fakulteto docentas dr. Darius Amilevičius.
Kita projekto naujovė – lietuviškų tekstų socialiniuose tinkluose automatinė analizė, kurios metu ištiriama „Facebook“, „Twitter“ ir kituose tinkluose naudojama kalba. Šis metodas turi platų pritaikymą – politiniuose, socialiniuose ir rinkodaros tyrimuose arba nagrinėjant elektroninį saugumą. Įmonėms socialiniai tinklai suteikia bene geriausią galimybę pažinti savo produktų ar paslaugų tikslinę auditoriją, potencialius klientus ir rinkos inovacijų galimybes.
Projektas rengiamas remiantis anksčiau sėkmingai įgyvendinto projekto „Semantika 1“ patirtimi, atsižvelgiant į naujus šalies ūkio, rinkos bei vartotojų poreikius. Projektą kūrė VDU Humanitarinių mokslų ir Informatikos fakultetų jungtinė mokslininkų komanda: prof. dr. Daiva Vitkutė-Adžgauskienė, prof. dr. Gailius Raškinis, doc. dr. Darius Amilevičius ir doc. dr. Andrius Utka. Projekto vykdymo metu teisininkams ir advokatams skirtas elektronines paslaugas įgyvendinti padės VDU Teisės fakulteto mokslininkai.
„VDU Lietuvoje užima lyderiaujančią poziciją skaitmeninės humanitarikos ir dirbtinio intelekto technologijų taikymo lietuvių kalbos technologijose srityse, ypač automatinėje lietuviškų tekstų analizėje, įskaitant didžiuosius duomenis, ir automatiniame ištisinės šnekos atpažinime. Šias kompetencijas ir patirtį Lietuvos Respublika jau pripažino, VDU patikėdama lyderio poziciją atstovaujant Lietuvai ES Bendrojoje kalbos išteklių ir technologijų infrastruktūroje CLARIN ERIC. Sprendimas finansuoti projektą „Semantika 2“ valstybės ir ES lėšomis yra jau antrasis universiteto pripažinimas už lyderystę šioje srityje“, – teigia doc. dr. D. Amilevičius.
Planuojama, kad projekto rezultatai ženkliai prisidės prie Informacinės visuomenės plėtros 2014–2020 metų programos „Lietuvos Respublikos skaitmeninė darbotvarkė“ tikslų bei uždavinių pasiekimo. Tačiau, pasak mokslininkų, pagrindinis „Semantika 2“ tikslas yra prisidėti prie lietuvių kalbos puoselėjimo bei įtvirtinimo elektroninėje erdvėje ir sudaryti sąlygas kuo platesniam verslo, viešojo sektoriaus bei individualių vartotojų ratui pasinaudoti jau esančiomis bei naujomis, inovatyviomis kalbos technologijų elektroninėmis paslaugomis ar produktais, kurie gali kurti pridėtinę vertę vartotojui.
Pagrindinio projekto tikslo bus siekiama modernizuojant ir vystant Vytauto Didžiojo universiteto valdomą valstybinę informacinę sistemą LKSSAIS, modernizuojant ir sukuriant naujas viešąsias paslaugas, susijusias su rašytinės kalbos technologijomis ir ištisinės šnekos automatiniu atpažinimu. Taip pat bus kuriamos elektroninės priemonės, informacinių technologijų sprendimai, kuriuos panaudoti galėtų inovatyvių elektroninių produktų ar paslaugų kūrėjai.
Numatoma, jog siekiant įvykdyti projekto uždavinius, LKSSAIS bus modernizuota ir perkelta į debesijos paslaugų tiekėjo infrastruktūrą. Taip pat bus sukurtos trys naujos pavyzdinės elektroninės viešosios paslaugos: automatinės fonogramų transkripcijos tekstu, automatinis santraukų sudarymas ir automatinė interneto socialinių tekstų analizė. Viena nauja pavyzdinė el. paslauga, automatinis rašybos klaidų tikrinimas, bus modernizuota, dar dvylika IT sprendimų bus skirta automatinei tekstų analizei ir automatiniam ištisinės šnekos atpažinimui.