Marta sākumā Igaunijā norisinājās divas nozīmīgas reģionālās konferences - Nodalida/ Baltic HLT 2025 un DHNB 2025.
Nodalida/ Baltic HLT 2025 konference norisinājās Tallinā no 1. marta līdz 5. martam. Konferences mērķis ir apvienot datorlingvistikas un valodu tehnoloģiju kopienas no Ziemeļvalstu un Baltijas reģioniem, lai apspriestu jaunākos sasniegumus valodas tehnoloģiju, datorlingvistikas, runas atpazīšanas un sintēzes jomās, tostarp valodas resursu un citās cieši saistītas disciplīnās, kas ir būtiskas runas un valodas tehnoloģiju attīstībai. Konferencē Gunta Nešpore-Bērzkalne un Ilze Lokmane (LU MII) iepazīstināja ar semantisko atvasinājumu vārdnīcas izveidi, savukārt Andra Kalnača un Kristīne Levāne Petrova (LU HZF) iepazīstināja ar morfēmu datubāzi. Savukārt Inguna Skadiņa (LU MII) konferences seminārā ResourceFull 2025 analizēja lielo valodas modeļu valodas sapratnes spējām latviešu valodā.
DHNB 2025 konference norisinājās no 5. marta līdz 7. martam Tartu. DHNB konferencēs galvenā uzmanība tiek pievērsta pētniecībai, izglītībai un komunikācijai digitālo humanitāro zinātņu jomā Ziemeļvalstu un Baltijas valstu reģionos. Konference pulcē pētniekus, studentus un profesionāļus ar interesi par digitālo metožu lietošanu pētniecībā, kas saistīta ar humanitārajām, sociālajām zinātnēm un mākslu. Konferencē ar ziņojumiem piedalījās vairākii LU LFMI pārstāvji (Sandis Laime, Jānis Daugavietis, Haralds Matulis, Dāvis Enģelis, Ilze Ļaksa-Timinska, Ieva Vīvere), kas iepazīstināja ar DHELI projekta pētījumiem. Anda Baklāne (LNB) iepazīstināja ar pētījumu par semantiski saistītu jēdzienu izgūšanu no latviešu romānu korpusa, bet Gunta Nešpore-Bērzkalne (LU MII) piedalījās ar prezentāciju par modernizēto Mīlenbaha-Endzelīna vārdnīcu.
No 4. februāra līdz 6. februārim Lēvenē, Beļģijā notika CLARIN Stratēgijas dienas un Ģenerālās Asamblejas sanāksme.
Stratēģijas dienu laikā nacionālie koordinatori vienojās par soļiem, kas veicinātu CLARIN resursu un rīku lietojumu pētniecībā un izglītībā, kā arī sekmētu digitālo humanitāro zinātņu pētnieku zinātību par lielajiem valodu modeļiem.
Pēc Stratēģijas dienām sekoja CLARIN Ģenerālās Asamblejas sanāksme, kurā tās dalībnieki tika iepazīstināti ar CLARIN ERIC jaunumiem, pārrunāti aktuālie administratīvie jautājumi un atvēlēts laiks sarunām starp delegātiem.
No 15. līdz 17. oktobrim Barselonā notika ikgadējā CLARIN konference.
Šogad konferencē piedalījās vairāk nekā 200 klātienes dalībnieku un gandrīz 150 tiešsaistes dalībnieku. Konferencē Latvija tika pārstāvēta ar vairākiem referātiem. Valodu tehnoloģiju iniciatīvas projekta konsorcijs konferencē uzstājās ar referātu "Language Technology Initiative - Bridging the Gap between Research and Education" , bet Anda Baklāne (LNB) ar stenda referātu "Text collections as data at the National Library of Latvia". Doktorantu sesijā šogad piedalījās LU HZF doktorante Ieva Auziņa ar stenda referātu"Grammatical relations and semantics of Latvian prepositions, adverbs and prefixes in connection with verb". Pēc konference sekoja darbseminārs "Comparable and Interoperable Corpora", kurā Roberts Darģis iepazīstināja ar CLARIN–LV repozitorijā ieļauto promocijas darbu kopsavilkumu korpusu Disertācijas. CLARIN 2024 konferences tēžu krājums atrodams šeit.
2024. gada decembrī noslēdzās Valsts pētījumu programmas “Letonika latviskas un eiropeiskas sabiedrības attīstībai” projekts "Mūsdienu latviešu valodas izpēte un valodas tehnoloģiju attīstība".
Projekta mērķis bija veikt mūsdienu latviešu valodas fonētiskās, gramatiskās, leksiskās sistēmas, kā arī latviešu zīmju valodas izpēti, izmantojot datos balstītas metodes un attīstī ilgtspējīgus latviešu valodas resursus un rīkus. Projekta laikā tika attīstīta digitālā infrastruktūra valodas pētniecībai, izveidoti jauni un papildināti esošie valodas resursi: latviešu valodas runas korpuss, latviešu zīmju valodas paraugkorpuss, leksiskā datubāze Tēzaurs.lv un “Mūsdienu latviešu valodas vārdnīca”. Šie un citi projekta laikā izveidotie un pilnveidotie resursi iekļauti CLARIN-LV repozitorijā. Projekta rezultāti un valodas resursi ir noderīgi pētniekiem, studentiem un ikvienam, kurš interesējas par latviešu valodas digitālajiem resursiem un rīkiem.
No 22. līdz 26. jūlijam Rīgā norisinājās 6. Baltijas digitālo hiumanitāro zinātņu vasaras skola (BSSDH 2024) "Lielie valodas modeļi un mazās valodas", pulcējot vairāk nekā 80 dalībnieku no 18 valstīm.
Normunds Grūzītis un Artūrs Znotiņš (CLATRIN-LV), vadot darbsemināru "Daudzvalodu salīdzināmo korpusu izveide un analīze"
Ar CLARIN ERIC atbalstu semināra dalbniekiem bija iespēja noklausīties Norvēģijas Nacionālās bibliotēkas Mākslīgā intelekta laboratorijas pētnieka Havjera de la Rosa lekciju par lielajiem valodu modeļiem un mākslīgo intelektu Norvēģijas Nacionālajā bibliotēkā. Lekcijā tika demonstrēti inovatīvi mākslīgā intelekta lietojumi Norvēģijas nacionālajā zināšanu un kultūras mantojuma krātuvē.
Vasaras skolā CLARIN-LV vadīja darbsemināru "Daudzvalodu salīdzināma teksta korpusa izveide un analīze". Semināra dalībnieki apguva metodes un darbplūsmas, kas ļauj nestrukturētu tekstu kopu pārveidot par marķētu teksta korpusu. Seminārā tika uzsvērta universālo atkarību nozīme, veidojot vienotu marķējumu un atvieglojot lingvistisko analīzi daudzvalodu korpusos, piemēram, ParlaMint.
1 lapa no 15