-
Nimeüksuste korpus Estonian NER corpus
Corpus containing morphologically analyzed articles with named entity annotations (persons, organizations, locations) in BOI format. -
Eesti murdekorpus Estonian Dialect Corpus
korpus More info at https://murre.ut.ee/ The dialect corpus consists of: 1) Dialect recordings. The corpus is based on dialect recordings which have mainly been made in the... -
Sagedussõnastik Estonian Frequency Dictionary
Sagedusloendid, mis on tehtud 0,5 miljoni sõnaga ilukirjanduse korpuse baasil (aastatest 1992-1998) ja 0,5 miljoni sõnaga ajakirjanduse korpuse baasil (1995-1999). Kolm... -
Eesti keele spontaanse kõne foneetiline korpus v.1.0.0 Phonetic Corpus of Es...
The aim of the corpus is to compile a large amount of quality recordings of spontaneous Estonian and segment it phonetically on different levels. The project started in autumn... -
Segakorpus: Doktoritööd Corpus of Estonian scientific texts
Korpus sisaldab 5 miljonit sõna eestikeelset teaduskirjandust: doktoritööd (2,3 miljonit sõna) ja teadusartiklid. TEI P5 XML märgendus, UTF8 kodeering. More info at... -
Pindsüntaktiliselt analüüsitud korpus Estonian corpus with shallow syntactic...
This corpus is a monolingual corpus with Constraint Grammar-style shallow syntactic annotations. -
Eesti ilukirjanduse korpus Corpus of Estonian fiction
Eesti ilukirjanduse korpus alates 1990. Kokku 5,6 miljonit sõna. More info at http://www.cl.ut.ee/korpused/segakorpus/eesti_ilukirjandus_1990 A text corpus containing Estonian... -
Segakorpus: Riigikogu Corpus of the Proceedings of Estonian Parliament
Riigikogu korpus. TEI P5 XML märgendus, UTF8 kodeering. More info at http://www.cl.ut.ee/korpused/segakorpus/riigikogu Corpus of the Proceedings of Estonian Parliament. Contains... -
Eesti emotsionaalse kõne korpus Estonian Emotional Speech Corpus
Korpus sisaldab 1234 eestikeelset viha-, rõõmu- ja kurbuse emotsiooniga lauset ning neutraalset lauset. Naishääl, 44.1 KHz, 16Bit, Mono; wav, textgrid:... -
Eesti ajakirjanduse korpus Corpus of Estonian newspaper texts
Korpus sisaldab eesti ajalehti, 182 miljonit sõna. TEI P5 XML märgendus, UTF8 kodeering. More info at http://www.cl.ut.ee/korpused/ Corpus of Estonian newspaper texts, 182... -
Eesti puudepanga korpus Estonian Treebank
Estonian Treebank is available both in the VISL and TigerXML format. Esttre consists of ca 1400 manually annotated sentences (10600 tokens), the text classes represented in the... -
Eesti-inglise paralleelkorpus Estonian-English parallel corpus
Eesti-inglise paralleelkorpus. More info at http://www.cl.ut.ee/korpused/paralleel Annotated and sentence-aligned parallel text corpus; contains: 1. Estonian laws and their... -
Eesti avatud paralleelkorpus Estonian Open Parallel Corpus
Projekti „Eesti avatud paralleelkorpus” eesmärk on luua oluline kogus keeleressursse statistiliste masintõlkesüsteemide parendamiseks. Projekt aitab kaasa olukorra saavutamisele... -
Morfoloogiliselt ühestatud korpus Corpus of morphologically disambiguated Es...
Käsitis morfoloogiliselt ühestatud korpus Manually annotated corpus. Available for download and via Korp query. -
Eesti Keele Instituudi reeglipõhise morfoloogia tööriistad Tools of the IEL ...
Eesti Keele Instituudi reeglipõhine morfoloogiatööriistade komplekt sisaldab endas eraldi kasutatavaid mooduleid silbitamise, tüübituvastuse, morfoloogilise analüüsi ja sünteesi... -
Suulise keele korpus Corpus of Spoken Estonian
The Department of Estonian Language initiated the corpus of spoken Estonian in 1997. The corpus is compiled by the research group of Spoken Estonian (Tiit Hennoste, Airi... -
Mulgi sõnaraamat
Mulgi suur veebisõnaraamat esitab Mulgi murdesõnu kõigist viiest Mulgimaa kihelkonnast: Hallistest, Helmest, Karksist, Paistust ning Tarvastust. Sõnaraamatus on üle 20 000... -
Sõnaveeb 2025. EKI keeleportaal Language portal Sõnaveeb 2025
Sõnaveeb on Eesti Keele Instituudi uus sõnastikuportaal, kuhu on koondatud keeleinfo instituudi paljudest sõnakogudest ja andmebaasidest. More info at https://sonaveeb.ee/... -
Ekilex 2025. EKI sõnastiku- ja terminibaasisüsteem
Eesti Keele Instituudi sõnastiku- ja terminibaasisüsteem Ekilex on loodud sõnastike ja terminibaaside koostamiseks ja ajakohastamiseks leksikograafidele, terminoloogidele ning... -
EKI veamärgendatud E2 õppijakorpus (versioon 2) EKI error-annotated Estonian...
Veamärgendatud korpuse materjalid põhinevad EMMA õppijakeelekorpusel, sisaldades andmeid Haridus- ja Noorteameti tasemetöödest (7. klass, 504 teksti), põhikooli lõpueksamitest...
