The Hamburg MapTask Corpus (HAMATAC)

DOI

Audio recordings of map tasks with adult L2 users of German. The speakers´ L1 and their L2 proficiencies vary. The maps used for the tasks are available.

Audioaufnahmen von Map-Task-Aufgaben bei Erwachsenen mit Deutsch als Zweitsprache. Die Kompetenzen der Sprecher in Erst- und Zweitsprache variieren. Die in dieser Aufgabe benutzten Karten sind verfügbar.

The Hamburg MapTask Corpus (HAMATAC) is a spoken language corpus documenting the performance of 24 L2 learners of German in a map task. HAMATAC was recorded and transcribed in project Z2 at the Research Centre on Multilingualism. The current version 1.0.0 contains additional fine-grained manually corrected part-of-speech annotation and lemmas based on the the STTS 2.0. tagset (Westpfahl et al 2017, urn:nbn:de:bsz:mh39-60634) as well as the resources known from the previous version, e.g. orthographic transcriptions of the recordings, manual annotation of disfluencies.

CLARIN Metadata summary for The Hamburg MapTask Corpus (HAMATAC) (CMDI-based)

Title: The Hamburg MapTask Corpus (HAMATAC) Description: Audio recordings of map tasks with adult L2 users of German. The speakers´ L1 and their L2 proficiencies vary. The maps used for the tasks are available.; Audioaufnahmen von Map-Task-Aufgaben bei Erwachsenen mit Deutsch als Zweitsprache. Die Kompetenzen der Sprecher in Erst- und Zweitsprache variieren. Die in dieser Aufgabe benutzten Karten sind verfügbar. Publication date: 2010-09-16 Data owner: Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de Contributors: Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (depositor), Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (compiler), Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (compiler), Yael Dilger (data_inputter), Fideniz Ercan (data_inputter), Maria Görlich (data_inputter), Kim Chi Hamze (data_inputter), Karolina Kaminska (data_inputter), Seçil Yusun, Maria Görlich, Viktor Köhlich (data_inputter), Hamburger Zentrum für Sprachkorpora, Max-Brauer-Allee 60 / D-22765 Hamburg, corpora@uni-hamburg.de (developer), Hanna Hedeland, hanna.hedeland@uni-hamburg.de (researcher), Timm Lehmberg, timm.lehmberg@uni-hamburg.de (researcher), Thomas Schmidt, thomas.schmidt@uni-hamburg.de (researcher), Kai Wörner, kai.woerner@uni-hamburg.de (researcher), Deutsche Forschungsgemeinschaft (DFG) (sponsor) Project: Z2 "Computer Assisted Methods for the creation and analysis of multilingual data", Deutsche Forschungsgemeinschaft (DFG) Keywords: adult L2 acquisition, learner corpus, task-oriented communication, successive bilingualism, L2 data, adult bilingualism, simultaneous bilingualism, map task, Zweitspracherwerb Erwachsener, Lernerkorpus, aufgabenorientierte Kommunikation, sukszessiver Zweitspracherwerb, L2-Daten, Zweisprachigkeit bei Erwachsenen, Bilingualer Erstspracherwerb, Map-Task Language: German (deu) Size: 26 speakers (14 female, 12 male), 24 communications, 3.3 hours, 198 minutes, 24 recordings, 24 transcriptions, 21433 words Annotation types: transcription (manual): orthographic transcription/simplified HIAT, disfluency: manual annotation of disfluency phenomena, pho: manual annotation of phonetic phenomena, pos: Fine-grained part of speech tagging using TreeTagger and the STTS tagset., pos-sup: superordinate part of Speech (manual, STTS tagset), lemma: lemma (TreeTagger) Temporal Coverage: 2009-10-28/2010-04-28 Spatial Coverage: Hamburg, DE Genre: discourse Modality: spoken

Identifier
DOI https://doi.org/10.25592/uhhfdm.1481
Related Identifier https://doi.org/10.25592/uhhfdm.1479
Metadata Access https://www.fdr.uni-hamburg.de/oai2d?verb=GetRecord&metadataPrefix=oai_datacite&identifier=oai:fdr.uni-hamburg.de:1481
Provenance
Creator Hamburger Zentrum für Sprachkorpora
Publisher Universität Hamburg
Publication Year 2019
Rights Restricted Access; info:eu-repo/semantics/restrictedAccess
OpenAccess false
Representation
Resource Type Dataset
Version 1.0
Discipline Humanities; Linguistics