Uuema eesti ilukirjanduse mitmikute loendid

DOI

Alates 01.01.2017 jõustus autoriõiguse seaduse muudatus, mis võimaldab digitaalse objekti töötlemist teksti- ja andmekaeve eesmärkidel tingimusel, et selline kasutamine ei taotle ärilisi eesmärke (AutÕS § 19 lg 31). Samal ajal hakkas kehtima ka säilituseksemplari seadus, mille järgi on kirjastustel kohustus loovutada raamatukogudele lisaks füüsilistele ka digitaalsed teosed. Seega on uus olukord laiendanud uuema ja mitmekesisema uurimismaterjali kättesaadavust.

Käesolev töö on esimene katse seda materjali kasutades luua teadlaste ja arendajate jaoks vabalt kättesaadav ressurss.

This dataset consists of different types of n-grams (uni-, bi- and trigrams) generated from the newer fiction texts in Estonian. N-grams are presented in token format, i.e. as they appear in the text. The lemma n-grams of the same data are available as well.

Identifier
DOI https://doi.org/10.15155/re-8
Metadata Access https://datadoi.ee/oai/request?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:datadoi.ee:33/41
Provenance
Creator Raudvere, Uku; Uiboaed, Kristel
Publisher University of Tartu
Publication Year 2018
Rights Attribution 4.0 International (CC BY 4.0); info:eu-repo/semantics/openAccess; https://creativecommons.org/licenses/by/4.0/
OpenAccess true
Representation
Resource Type Text; info:eu-repo/semantics/dataset
Format application/octet-stream; application/vnd.openxmlformats-officedocument.spreadsheetml.sheet; application/pdf
Discipline Humanities; Linguistics