Centrs sniedz konsultācijas par dažādiem lielo valodas modeļu (LLM) lietojumiem valodu datu apstrādē un par LLM paplašināšanu un pielāgošanu humanitāro un sociālo zinātņu pētnieku vajadzībām un uzdevumiem. Centrs arī piedāvās palīdzību pētnieku vajadzībām atbilstošu LLM atrašanā un atlasē, atbalstīs lietotāju piekļuvi skaitļošanas resursiem (Centra dalībnieku rīcībā esošo resursu robežās), kā arī apkopos un dalīsies ar zināšanām par esošajiem LLM. Papildu informācija par centru.
Marta sākumā Igaunijā norisinājās divas nozīmīgas reģionālās konferences - Nodalida/ Baltic HLT 2025 un DHNB 2025.
Nodalida/ Baltic HLT 2025 konference norisinājās Tallinā no 1. marta līdz 5. martam. Konferences mērķis ir apvienot datorlingvistikas un valodu tehnoloģiju kopienas no Ziemeļvalstu un Baltijas reģioniem, lai apspriestu jaunākos sasniegumus valodas tehnoloģiju, datorlingvistikas, runas atpazīšanas un sintēzes jomās, tostarp valodas resursu un citās cieši saistītas disciplīnās, kas ir būtiskas runas un valodas tehnoloģiju attīstībai. Konferencē Gunta Nešpore-Bērzkalne un Ilze Lokmane (LU MII) iepazīstināja ar semantisko atvasinājumu vārdnīcas izveidi, savukārt Andra Kalnača un Kristīne Levāne Petrova (LU HZF) iepazīstināja ar morfēmu datubāzi. Savukārt Inguna Skadiņa (LU MII) konferences seminārā ResourceFull 2025 analizēja lielo valodas modeļu valodas sapratnes spējām latviešu valodā.
DHNB 2025 konference norisinājās no 5. marta līdz 7. martam Tartu. DHNB konferencēs galvenā uzmanība tiek pievērsta pētniecībai, izglītībai un komunikācijai digitālo humanitāro zinātņu jomā Ziemeļvalstu un Baltijas valstu reģionos. Konference pulcē pētniekus, studentus un profesionāļus ar interesi par digitālo metožu lietošanu pētniecībā, kas saistīta ar humanitārajām, sociālajām zinātnēm un mākslu. Konferencē ar ziņojumiem piedalījās vairākii LU LFMI pārstāvji (Sandis Laime, Jānis Daugavietis, Haralds Matulis, Dāvis Enģelis, Ilze Ļaksa-Timinska, Ieva Vīvere), kas iepazīstināja ar DHELI projekta pētījumiem. Anda Baklāne (LNB) iepazīstināja ar pētījumu par semantiski saistītu jēdzienu izgūšanu no latviešu romānu korpusa, bet Gunta Nešpore-Bērzkalne (LU MII) piedalījās ar prezentāciju par modernizēto Mīlenbaha-Endzelīna vārdnīcu.
2024. gada decembrī noslēdzās Valsts pētījumu programmas “Letonika latviskas un eiropeiskas sabiedrības attīstībai” projekts "Mūsdienu latviešu valodas izpēte un valodas tehnoloģiju attīstība".
Projekta mērķis bija veikt mūsdienu latviešu valodas fonētiskās, gramatiskās, leksiskās sistēmas, kā arī latviešu zīmju valodas izpēti, izmantojot datos balstītas metodes un attīstī ilgtspējīgus latviešu valodas resursus un rīkus. Projekta laikā tika attīstīta digitālā infrastruktūra valodas pētniecībai, izveidoti jauni un papildināti esošie valodas resursi: latviešu valodas runas korpuss, latviešu zīmju valodas paraugkorpuss, leksiskā datubāze Tēzaurs.lv un “Mūsdienu latviešu valodas vārdnīca”. Šie un citi projekta laikā izveidotie un pilnveidotie resursi iekļauti CLARIN-LV repozitorijā. Projekta rezultāti un valodas resursi ir noderīgi pētniekiem, studentiem un ikvienam, kurš interesējas par latviešu valodas digitālajiem resursiem un rīkiem.
No 4. februāra līdz 6. februārim Lēvenē, Beļģijā notika CLARIN Stratēgijas dienas un Ģenerālās Asamblejas sanāksme.
Stratēģijas dienu laikā nacionālie koordinatori vienojās par soļiem, kas veicinātu CLARIN resursu un rīku lietojumu pētniecībā un izglītībā, kā arī sekmētu digitālo humanitāro zinātņu pētnieku zinātību par lielajiem valodu modeļiem.
Pēc Stratēģijas dienām sekoja CLARIN Ģenerālās Asamblejas sanāksme, kurā tās dalībnieki tika iepazīstināti ar CLARIN ERIC jaunumiem, pārrunāti aktuālie administratīvie jautājumi un atvēlēts laiks sarunām starp delegātiem.
No 15. līdz 17. oktobrim Barselonā notika ikgadējā CLARIN konference.
Šogad konferencē piedalījās vairāk nekā 200 klātienes dalībnieku un gandrīz 150 tiešsaistes dalībnieku. Konferencē Latvija tika pārstāvēta ar vairākiem referātiem. Valodu tehnoloģiju iniciatīvas projekta konsorcijs konferencē uzstājās ar referātu "Language Technology Initiative - Bridging the Gap between Research and Education" , bet Anda Baklāne (LNB) ar stenda referātu "Text collections as data at the National Library of Latvia". Doktorantu sesijā šogad piedalījās LU HZF doktorante Ieva Auziņa ar stenda referātu"Grammatical relations and semantics of Latvian prepositions, adverbs and prefixes in connection with verb". Pēc konference sekoja darbseminārs "Comparable and Interoperable Corpora", kurā Roberts Darģis iepazīstināja ar CLARIN–LV repozitorijā ieļauto promocijas darbu kopsavilkumu korpusu Disertācijas. CLARIN 2024 konferences tēžu krājums atrodams šeit.
1 lapa no 15