2024. gada decembrī noslēdzās Valsts pētījumu programmas “Letonika latviskas un eiropeiskas sabiedrības attīstībai” projekts "Mūsdienu latviešu valodas izpēte un valodas tehnoloģiju attīstība".
 

Projekta mērķis bija veikt mūsdienu latviešu valodas fonētiskās, gramatiskās, leksiskās sistēmas, kā arī latviešu zīmju valodas izpēti, izmantojot datos balstītas metodes un attīstī ilgtspējīgus latviešu valodas resursus un rīkus. Projekta laikā tika attīstīta digitālā infrastruktūra valodas pētniecībai, izveidoti jauni un papildināti esošie valodas resursi: latviešu valodas runas korpuss, latviešu zīmju valodas paraugkorpuss, leksiskā datubāze Tēzaurs.lv un “Mūsdienu latviešu valodas vārdnīca”.  Šie un citi projekta laikā izveidotie un pilnveidotie resursi  iekļauti CLARIN-LV repozitorijāProjekta rezultāti un valodas resursi ir noderīgi pētniekiem, studentiem un ikvienam, kurš interesējas par latviešu valodas digitālajiem resursiem un rīkiem.

 

No 15. līdz 17. oktobrim Barselonā notika ikgadējā CLARIN konference.

 

Šogad konferencē piedalījās vairāk nekā 200 klātienes dalībnieku un gandrīz 150 tiešsaistes dalībnieku. Konferencē Latvija tika pārstāvēta ar vairākiem referātiem. Valodu tehnoloģiju iniciatīvas projekta konsorcijs konferencē uzstājās ar referātu "Language Technology Initiative - Bridging the Gap between Research and Education" , bet Anda Baklāne (LNB) ar stenda referātu "Text collections as data at the National Library of Latvia". Doktorantu sesijā šogad piedalījās LU HZF doktorante Ieva Auziņa ar stenda referātu"Grammatical relations and semantics of Latvian prepositions, adverbs and prefixes in connection with verb". Pēc konference sekoja darbseminārs "Comparable and Interoperable Corpora", kurā Roberts Darģis iepazīstināja ar CLARIN–LV repozitorijā ieļauto promocijas darbu kopsavilkumu korpusu Disertācijas. CLARIN 2024 konferences tēžu krājums atrodams šeit.

 

2024. gada 12. un 13. jūnijā Utrehtā notika ikgadējā CLARIN centru sanāksme. Šogad CLARIN-LV pārstāvēja Roberts Darģis un Eduards Lasmanis. Centru sanāksmes materiāli atrodami šeit.

No  22. līdz 26. jūlijam Rīgā norisinājās 6. Baltijas digitālo hiumanitāro zinātņu vasaras skola (BSSDH 2024) "Lielie valodas modeļi un mazās valodas", pulcējot vairāk nekā 80 dalībnieku no 18 valstīm. Image

Normunds Grūzītis un Artūrs Znotiņš (CLATRIN-LV), vadot darbsemināru  "Daudzvalodu salīdzināmo korpusu izveide un analīze"

 

Ar CLARIN ERIC atbalstu semināra dalbniekiem bija iespēja noklausīties Norvēģijas Nacionālās bibliotēkas Mākslīgā intelekta laboratorijas pētnieka Havjera de la Rosa lekciju par lielajiem valodu modeļiem un mākslīgo intelektu Norvēģijas Nacionālajā bibliotēkā. Lekcijā tika demonstrēti inovatīvi mākslīgā intelekta lietojumi Norvēģijas nacionālajā zināšanu un kultūras mantojuma krātuvē.

Vasaras skolā CLARIN-LV  vadīja darbsemināru "Daudzvalodu salīdzināma teksta korpusa izveide un analīze". Semināra  dalībnieki apguva metodes un darbplūsmas, kas ļauj nestrukturētu tekstu kopu pārveidot par marķētu teksta korpusu. Seminārā tika uzsvērta universālo atkarību nozīme, veidojot vienotu marķējumu  un atvieglojot lingvistisko analīzi daudzvalodu korpusos, piemēram, ParlaMint.

 

 

25. un 26. aprīlī Rigā norisinājās Baltijas Digitālo humanitāro zinātņu forums. Forums sākās ar paneļdiskusiju "Veidojot rītdienu: Eiropas humanitāro zinātņu pētniecības infrastruktūras un nacionālās politikas loma" (Shaping Tomorrow: European Research Infrastructures in Humanities and the Role of National Policies).

Paneļdiskusijā piedalījās CLARIN Nacionālo koordanatoru vadītājs Kristers Lindens no Helsinku universitātes, kurš iepazīstināja ar CLARIN ERIC un tā  lomu Digitālajās humanitārajās zinātnēs.

Kristers Lindens iepazīstina ar CLARIN ERIC (Fotogrāfijas: Jānis Brencis)

Konferences otrā diena iesākās ar paneļdiskusiju par valodu tehnoloģiju lomu un vietu izglītībā, kam sekoja divas stendu referātu sesijas. Stendu referātu plakāti atrodami šeit