CLARIN (Common Language Resources and Technology Infrastructure –Vienota valodas resursu un tehnoloģiju infrastruktūra) ir dalīta Eiropas pētniecības infrastruktūra (ERIC), kurā integrētas zināšanas, valodas resursi un rīki, repozitoriji un servisi, ko piedāvā daudzie CLARIN centri un nacionālie konsorciji.

CLARIN mērķis ir novērst sadrumstalotību valodas resursu jomā un padarīt valodas resursus pieejamus visu jomu, it īpaši humanitāro un sociālo zinātņu zinātniekiem un studentiem. Lai to īstenotu, izveidota kopīga izkliedēta infrastruktūra, kurā integrēti valodas resursi un rīki no visas Eiropas. CLARIN piedāvā ilgtermiņa risinājumus un servisus digitālo valodas datu un rīku izvietošanai, savienošanai un analīzei. 

Latvija CLARIN iniciatīvā piedalās kopš tās pirmsākumiem. 2008. gadā LU MII kļūst par CLARIN sagatavošanas posma projekta konsorcija dalībnieku, būtisku finansiālu atbalstu dalībai projektā sniedz Izglītības un zinātnes ministrija. 2016. gada 1. jūnijā Latvija pievienojas CLARIN ERIC. Izglītības un zinātnes ministrija uzticējusi LU Matemātikas un informātikas institūtam pārstāvēt Latviju CLARIN ERIC un vadīt Latvijas CLARIN konsorciju2019. gadā CLARIN-LV pievienojas CLARIN zināšanu centram morfoloģiski bagātām valodām SAFMORIL. 2020. gada martā tiek izveidots CLARIN-LV repozitorijs, kurā tiek reģistrēti latviešu valodas resursi un rīki. Esot CLARIN ERIC konsorcijā, CLARIN-LV ir apņēmusies ilgstoši rūpēties un saglabāt repozitorijā deponētos digitālos valodas resursus un rīkus. CLARIN-LV īsteno CLARIN ERIC misiju Latvijā, vācot, dokumentējot, kurējot un nodrošinot ilgtermiņa piekļuvi digitālajiem latviešu valodas resursiem un rīkiem. 2022. gada janvārī, konsorcijā apvienojoties septiņiem partneriem, tiek noslēgts CLARIN nacionālā konsorcija līgums, kurā CLARIN-LV konsorcijs vienojas par CLARIN-LV darbību un turpmāku attīstību. 2023.gada janvāri CLARIN-LV repozitorijs iegūst B-centra statusu un saņem CoreTrustSeal sertifikātu kā uzticams datu repozitorijs. 

CLARIN-LV piedalās trīs zināšanu centros (K-centros): SAFMORIL (zināšanu centrs morfoloģiski bagātām valodām ), ELEXIS (leksikogrāfijas zināšanu centrs) un LLMs4SSH (zināšanu centrs par lielajiem valodas modeļiem humanitārajām un sociālajām zinātnēm). CLARIN-LV regulāri rīko konferences un seminārus, kuros iepazīstina ar dažādiem valodas resursiem un rīkiem un to lietojumu pētniecībā un valodu tehnoloģiju izveidē. Latvijā paveiktais apkopots  vairākās publikācijās

CLARIN Latvija darbību atbalstījis ERAF projekts  “Latvijas Universitāte un institūti Eiropas pētniecības telpā - ekselence, aktivitāte, mobilitāte, kapacitāte” (2018.-2022), Valsts pētījumu programmas "Humanitāro zinātņu digitālie resursi" projekts "Humanitāro zinātņu digitālie resursi: integrācija un attīstība" (5.10.2020-5.10.2022) un Valsts pētījumu programmas “Letonika latviskas un eiropeiskas sabiedrības attīstībai” projekts "Mūsdienu latviešu valodas izpēte un valodas tehnoloģiju attīstība" (20.12.2022-19.12.2024) . Pašlaik CLARIN-LV darbība tiek finansēta no bāzes finasējuma, kā arī Valsts pētījumu programmas “Digitālās humanitārās zinātnes” projektā “Atvērtas un FAIR principiem atbilstīgas digitālo humanitāro zinātņu ekosistēmas attīstība Latvijā” (kopš 2022. gada decembra) un Eiropas Savienības Atveseļošanas un noturības mehānisma investīciju projekts  "Valodu tehnoloģiju iniciatīva" (kopš 2023. gada).

 

  

CLARIN-LV pievienojas lielo valodas modeļu zināšanu centram LLMs4SSH

Centrs sniedz konsultācijas par dažādiem lielo valodas modeļu (LLM) lietojumiem valodu datu apstrādē un par LLM paplašināšanu un pielāgošanu humanitāro un sociālo zinātņu pētnieku vajadzībām un uzdevumiem. Centrs arī piedāvās palīdzību pētnieku vajadzībām atbilstošu LLM atrašanā un atlasē, atbalstīs lietotāju piekļuvi skaitļošanas resursiem (Centra dalībnieku rīcībā esošo resursu robežās), kā arī apkopos un dalīsies ar zināšanām par esošajiem LLM. Papildu informācija par centru.