Keeleressursside registreerimine ja arhiveerimine

Teenused

Digitaalsete keeleandmestike ja -kogude (laiemalt, keelt sisaldavate teadusandmestike) ja keele töötlemise vahendite 

  1. meta-andmete registreerimine (Meta-Share kaudu, kaasa arvatud DataCite DOI omistamine)
  2. arhiveerimine repositooriumisse (Entu või Gitlab (koodi, ka dokkeri koodi puhul))

Keeleressursside register META-SHARE

EKRK keeleressursside register META-SHARE koondab infot keeleandmestike (korpused, leksikonid, keelemudelid) ja keeletarkvara (veebiteenused, tarkvarapaketid, tarkvara) meta-andmete kohta: tüüp, nimi, omanik, kasutustingimused (s.h litsents), maht, kirjeldus jms. Register haldab allalaadimisvõimalust, loendab ressursi vaatamisi ja allalaadimisi. On automaatselt liidestatud suhtlema DataCitega (http://datacite.ut.ee/services.php ), mille kaudu saavad kõik registreeritud ressursid teadusandmete DOI-identifikaatori, mille abil  andmekogule või tarkvarale teadusüllitistes viidata ning seeläbi muuta teaduslikult usaldusväärsemaks nii oma andmestik kui võimaldada koguda paremini andmeid oma keelekogu kasutatavusest teadustegevuse andmestikuna.

DataCite MetaData otsingus leiad meie keeleressursid paremini märksõnaga 'Estonian Language' või märksõnaga ESTDOI.KEEL

Kõik registreeritud meta-andmed on avatud andmed (Open Data) ja edastatakse automaatselt CLARIN Virtual Language Observatory (https://vlo.clarin.eu/) veebiteenusesse ehk suuremasse ülemaailmsesse keeleandmestike kataloogi. Kogu EKRK Meta-Share võrgustikusõlme lisatud info edastatakse ka võrgustiku kesksõlmedele - näiteks ELDA Meta-Share'i sõlm - kust võib leida oluliselt rohkem ressursse kogu Euroopast.

Kasutajad pääsevad sisse logimata keeleressursside meta-andmeid vaatama ja vabakasutuses keeleressursse alla laadima, sisselogimine (TAATi kaudu või eraldi kasutajakonto kaudu) on vajalik meta-andmete lisamiseks ja muutmiseks ning piiratud ligipääsuga andmete allalaadimiseks.

Kontaktisik (kelle poole pöörduda teenuse kasutamisel tekkivate probleemide korral): Neeme Kahusk, See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.

Keeleressursside repositoorium Entu

Repositooriumis hoitakse nii arhiveeritavaid dokumente jm EKRK materjale kui ka registreeritud ressursside andmefaile nii arhiveerimiseks kui kasutamiseks. Saab üles ja alla laadida faile ja jagada ligipääsuõigusi neile. Õiguste omamine Entus tähendab võimalust näha Entu mitteavalikku osa, sealhulgas redigeerida oma Panustajaga üles laetud ressursse või hoiustada ressursse otse Entusse. Entusse pääseb ligi nii TAATi, Google’i kui ka ID-kaardi ja mobiil-ID kaudu.  Keeleliini kasutajate haldus käib samuti Entu kaudu.

Panustaja (e. Uploader) - kasutaja arvutisse paigaldatav abiprogramm ressursside üleslaadimiseks Entusse. Hõlbustab laadimist siis, kui tegu on paljude failidega ja erinevate kataloogidega.

Kontaktisik (kelle poole pöörduda teenuse kasutamisel tekkivate probleemide korral): Krista Liin, See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.

Koodihoidla GitLab

Mõeldud koodiarenduseks ja koodi säilitamiseks (eelkõige Eesti keeletehnoloogia riikliku programmi projektidele). Sisselogimine TAATi (Shibboleth)  kaudu.

Kontaktisik (kelle poole pöörduda teenuse kasutamisel tekkivate probleemide korral): Sander Kuusemets, See e-posti aadress on spämmirobotite eest kaitstud. Selle nägemiseks peab su veebilehitsejas olema JavaSkript sisse lülitatud.