Tehisaru eesti keele käekäik ei huvita, küll aga huvitab see ülikooli teadlasi.
FOTO: Royal Academy of Engineering / Pexels

Teadlased õpetavad keelemudelitele eesti keelt

Uudis

Suuri keelemudeleid kasutavate vestlusrobotite, sisukokkuvõtjate ja muude selliste rakenduste kvaliteetseks toimimiseks on vaja, et mudelid oskaksid hästi eesti keelt.

Tartu Ülikooli keeletehnoloogia kaasprofessor Kairit Sirts nentis, et tehisintellekti eesti keel kõlab tihti kunstliku ja puisena. Arvutiteaduse instituudi eestvedamisel hakatakse vabavaralisi keelemudeleid treenima senisest ladusamat eesti keelt kõnelema ja eesti kultuuri paremini mõistma.

„Mõned vabavaralised keelemudelid juba oskavad teatud määral eesti keelt, kuid meie soov on panna keelemudel kõnelema nii, nagu inimesed tegelikult räägivad. Ilukõne asemel on eestlastele pigem omane konkreetsus ja lakoonilisus. Saame treenida mudelit Eesti kultuurikonteksti arvesse võtma ja ka grammatikas parem olema,“ ütles Sirts.

Suurte tehnoloogiaettevõtete loodud keelemudelid on mõeldud massidele ja meil puudub nende üle kontroll. Nii ei saa näiteks OpenAI ChatGPT-d kasutada konfidentsiaalsust nõudvates valdkondades nagu riigikaitse või tervishoid.

Sirtsu sõnul on oluline hoida ja kasvatada meie teadlaskonnas suurte keelemudelite alast kompetentsi. Tehnoloogiaettevõtete jaoks ei ole eesti keele käekäik ega kultuuritaust tähtis, seega tuleb ise nende asjade eest hea seista. „Tänu uuele projektile saame täiendada ka inimeste oskusi ja teadmisi, et mitte jääda tehnoloogilise arengu juures pelgalt kõrvaltvaatajaks,“ sõnas ta.

Nüüd arendavadki Eesti teadlased vabavaralisi keelemudeleid ise edasi, et tulevikus oleks võimalik luua eesti keelt oskavaid ja konteksti mõistvaid turvalisi ja kvaliteetseid tehisintellektirakendusi.

Alanud projektis „Eesti keele toetus suurtes generatiivsetes vabavaralistes keelemudelites“ saavad kokku valdkonna Eesti tipud. Tartu Ülikoolist osalevad Kairit Sirts ja keeletehnoloogia professor Mark Fišel koos üliõpilastega, Tallinna Tehnikaülikoolist lööb kaasa kõnetehnoloogia kaasprofessor Tanel Alumäe koos tudengitega, Eesti Keele Instituudist juhib tööd keeletehnoloog Eleri Aedmaa.

Kaks aastat kestvat projekti rahastatakse riiklikust programmist „Eesti keeletehnoloogia 2018–2027“. Keelemudeleid hakatakse treenima Soomes asuvas Põhja-Euroopa võimsaimas superarvutis LUMI. Esimeste tulemusteni eesti keelele kohandatud mudelitega loodetakse jõuda 2025. aasta juuniks.

Universitas Tartuensis

Jaga artiklit