-
Tartu Ülikooli liivi keele korpus
Tartu Ülikooli liivi keele korpus on liivi keele näiteid koondav elektrooniline andmekogu. Esindatud on nii idaliivi, lääneliivi kui ka Īra keelekasutus. Suurem osa korpusesse... -
Etalon 1.0
Etalon is a manually annotated corpus of contemporary Czech. The corpus contains 1,885,589 words (2,265,722 tokens) and is annotated in the same way as SYN2020 of the Czech... -
Copenhagen Dependency Treebanks versions 1-3
Parallel treebanks with annotation of syntax, discourse, coreference, morphology, and semantics. Version 3 also includes the Danish Dependency Treebank (version 1) and the... -
Eesti murrete korpus
Eesti murrete korpus on kõiki eesti murdeid hõlmav elektrooniline andmekogu. Korpus koosneb helisalvestistest, foneetilises transkriptsioonis murdetekstidest, lihtsustatud...