Suuline eesti keel arvudes. Sagedusandmestikud

DOI

Siin repositooriumis on projekti "Suuline eesti keel arvudes" raames koostatud sagedusandmestikud, mis kirjeldavad suulist eesti keelt. Andmestikud põhinevad Eesti keele spontaanse kõne korpusel, Teismeliste Keel Eestis korpusel ning käesoleva projekti raames kogutud ERR-i ja taskuhäälingu korpustel. Esitatud on sõna- ja lemmasagedusi ning n-gramme ja häälikute ja silpide sagedusi. // This repository contains frequency data collected within the project "Basic statistics of spoken Estonian" The datasets are based on four spoken corpora: Phonetic Corpus of Estonian Spontaneous Speech, Estonian Teen Language Corpus, ERR broadcasts and podcasts corpus. The tables present frequency counts of words, lemmas, phonemes and syllables.

Identifier
DOI https://datadoi.ee/handle/33/606
Metadata Access https://datadoi.ee/oai/request?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:datadoi.ee:33/606
Provenance
Creator Lippus, Pärtel; Lõo, Kaidi; Malmi, Anton; Pilvik, Maarja-Liisa
Publisher Tartu Ülikool, eesti ja üldkeeleteaduse instituut
Publication Year 2024
Rights info:eu-repo/semantics/openAccess; Attribution 4.0 International; http://creativecommons.org/licenses/by/4.0/
OpenAccess true
Contact Tartu Ülikool, eesti ja üldkeeleteaduse instituut
Representation
Language Estonian
Resource Type info:eu-repo/semantics/dataset
Format CSV; text/plain; text/csv; application/zip
Discipline Other