Media-Analyse: Pressemedien - Langfristdaten Media-Analyse: Pressemedien - Langfristdaten

DOI

Bei der Aufbereitung des MLFZ-Datensatzes „MA Pressemedien“ von 1954 bis 2009 für die Fortführung der Datenreihe bis 2015 erfolgte durch die HHU eine Überprüfung und anschließende Vereinheitlichung der Variablennamen, -labels und -stämme. Diese dienen zum einen der einheitlichen Darstellung und der daraus resultierenden Übersichtlichkeit für den zukünftigen Umgang mit den Daten, zum anderen der Bereitstellung von zusätzlichen Informationen, die bereits aus den Labels der Variablen hervorgehen sollen. Das datorium-Projekt beinhaltet folglich den MLFZ-Datensatz „MA Pressemedien“ von 1954 bis 2009 im SPSS-Speicherformat sowie die SPSS-Syntaxen, die zur Aufbereitung dieses Datensatzes für die Fortführung der Datenreihe bis 2015 durch die Heinrich-Heine-Universität (HHU) erstellt wurden. Um die Arbeit der HHU replizieren zu können ist der MLFZ-Datensatz der MA Pressemedien-Daten 1954-2009 ebenfalls Teil der Forschungsdaten. Zu Beachten gilt, dass die hinterlegten SPSS-Syntaxen in der richtigen Reihenfolge (aufsteigende Nummern: 0.1_Korrektur, 0.2_Korrektur, etc.) durchgeführt werden sollten.

Die Darstellung der Variablen- und Wertelabels der Zeitschriften-Variablen wurde demnach vereinheitlicht: Groß- und Kleinschreibung wurden angepasst, Werte geordnet und rekodiert, sowie Umlaute (ä, ö, ü wurden zu ae, oe, ue) geändert, da diese im Englischen sowie durch das Programm CharmStats u.a. nicht zuverlässig dargestellt werden können. Dies dient der Nutzerfreundlichkeit und der besseren Wirksamkeit möglicher Suchen in den Daten. Aus dem gleichen Grund wurden Rechtschreibfehler verbessert und die Variablennamen von Zeitschriften- und Zeitungsvariablen angepasst, damit sich diese visuell zu dem jeweiligen Typ des Pressemediums zuordnen lassen: Am Anfang des jeweiligen Variablennamens wurde entweder ein „Z_“ für Zeitschriften oder ein „TZ_“ für Tageszeitungen hinzugefügt. Um eine konsistente Ordnung der durch das MLFZ aktualisierten Variablen zu schaffen, wurden einige soziodemografische Variablen umbenannt und in eine einheitliche Reihenfolge gebracht (z.B. Variablen „bund1“, „bund2“, „bund5“, „bund6“, „bund7“ und „bund8“ wurden zu „bund1“, „bund2“, „bund3“, „bund4“, „bund5“ und „bund6“).

Um den Nutzern weitere Informationen bereits in den Variablenlabels bereitzustellen, wurden die Abfragezeiträume von Zeitschriften- und Zeitungsvariablen ins Label aufgenommen. So wurden die Labels nach dem gleichen Schema umbenannt; für den kleinen Zeitfilter (_kzf) gilt somit: „Kleiner Zeitfilter; Name der Zeitschrift; (Abfragezeitraum)“, für die Nutzungswahrscheinlichkeiten der Zeitschriften bzw. Tageszeitungen (_nw) dementsprechend: „Nutzungswahrscheinlichkeiten; Name der Zeitschrift/Tageszeitung; (Abfragezeitraum)“ usw. Lediglich die Labels der Lesehäufigkeiten (_lhx, _lhy und _lhz) von Zeitschriften wurden nach einem anderen Schema benannt; hier wurde die Information des jeweiligen Erhebungszeitraums des Filters beigelegt anstelle des Abfragezeitraums der jeweiligen Zeitschrift (Lesehäufigkeiten; Name der Zeitschrift; (Filterzeitraum Zeitraum). Auch bei den Variablen des Freizeitverhaltens wurde der Zeitraum der Abfrage im Label hinterlegt, um die Informationen direkt ersichtlich offenzulegen.

Außerdem wurden zum einen die Variablen aus dem Datensatz gelöscht, bei denen kein Label vorhanden war, da diese anhand des Variablennamens nicht eindeutig zugeordnet werden konnten. Zum anderen wurden Variablen aus dem Datensatz entfernt, welche mehrfach vorhanden waren, jedoch die gleichen Informationen aufwiesen. Soziodemografische Variablen zu nicht relevanten Altersgruppen wurden durch die HHU nicht übernommen. Zusätzliche Summen- und soziodemografische Variablen mit den gleichen Ausprägungen bereits vorhandener Variablen, die sich lediglich durch die Codierung unterschieden, wurden aus dem Datensatz gelöscht. Variablen der Soziodemografie, die nur in einem Jahr erhoben wurden, hat die HHU ebenfalls entfernt. Bei einer vom MLFZ erstellten Variable traten Fallzahlprobleme auf, weshalb auch diese aus dem Datensatz gelöscht wurde. Ebenfalls vom MLFZ erstellte Hilfsvariablen zur Mediennutzung wurden aus dem Datensatz entfernt. Zeitschriften-Variablen, welche erst ab 2010 (der Generalfilter erschien erst wieder im Jahr 2012) abgefragt wurden, wurden durch die HHU entsprechend neu erstellt. Das Format der Z_-Variablen wurde durch die Anpassung der Dezimalstellen verändert.

Zusätzlich erfolgte durch die HHU eine variablenspezifische Vergabe und Ergänzung der fehlenden Werte. Dies dient einem vereinfachten Umgang mit den Daten und der Einheitlichkeit der Variablen-Eigenschaften. Man einigte sich auf Folgendes: Grundsätzlich wurden die Werte -9 „keine Angabe“ (sofern diese Kategorie vorlag) und -7 „nicht erhoben“ für alle Variablen als Missing-Werte vergeben. Um dieses Ziel zu erreichen wurden verschiedene Vorarbeiten durchgeführt: 1) Der Abfragezeitraum jeder Variable wurde – u.a. durch Kreuztabellierungen – ermittelt.

2) Für alle Jahre, in denen die Variable nicht abgefragt oder im Datennsatz erfasst wurde, wurde der Wert -7 „nicht erhoben“ bestimmt. Bei durch die ag.ma oder das MLFZ generierte (Summen-) Variablen wurde für den Missing-Wert -7 das Label „nicht erstellt“ anstelle von „nicht erhoben“ definiert, da es sich eben um erstellte statt erhobene Variablen handelt. Dies trifft auf Variablen der Nutzungswahrscheinlichkeiten und Gewichte – erstellt durch die ag.ma – sowie der Leseintensität – erstellt durch das MLFZ – zu. Außerdem wurde der Generalfilter zwischen den Jahren 2004 und 2012 nicht abgefragt, weshalb den Zeitschriften-Variablen auch in diesem Zeitraum ein fehlender Wert von -7 „nicht erhoben“ zugeschrieben wurde.

3) Daraufhin erfolgte die Vergabe des neuen Missing-Werts -9 „keine Angabe“ sofern diese Kategorie für eine Variable vordefiniert war. Sprich bereits vordefinierte „keine Angabe“-Kategorien wurden zu -9 „keine Angabe“ rekodiert.

4) Da bei einigen Variablenarten zusätzlich Besonderheiten beim Definieren der Missing-Kategorien auftraten, wurde der Missing-Wert -8 für weitere inhaltliche Missing-Kategorien eingeführt: - Bei einigen Variablen der Soziodemografie wurde der Wert 98 zu -8 - Aktualisierte Variablen zum Einkommen der/des Befragten (z.B. eink1): „Haushaltsvorstand ist nicht Befragter“ - Aktualisierte Variablen zum Einkommen der/des Befragten (z.B. eink2): „Befragter ist nicht vollberufstätig“ - Aktualisierte Variablen zum Einkommen des Haushaltsvorstandes (z.B. einkhv1): „siehe Variable Einkommen der/des Befragten“ - Aktualisierte Variablen zum Einkommen des Haushaltsvorstandes (z.B. einkhv5): „Befragter ist nicht Haushaltsvorstand“ - Aktualisierte Variablen zur Anzahl an Personen im Haushalt ab 14 Jahre (z.B. persb1): „Berechnung nicht möglich“ - Aktualisierte Variablen zum Haushaltseinkommen (z.B. hheink1): „verweigert“ - Für die Lesehäufigkeit der Zeitschriften wurde 98 zu -8 „Nicht WHK“ geändert.

5) Nach dem variablenspezifischen Hinzufügen der Missing-Werte -7 „nicht erhoben“ bzw. „nicht ermittelt“, -9 „keine Angabe“ und -8 bei weiteren inhaltlichen Missing-Kategorien, wurden bei allen Variablen noch bestehende Systemmissings zu dem Missing-Wert -6 „von MLFZ generierte Systemmissings“ rekodiert.

6) Abschließend wurden die Werte für den Bereich -9 bis -6 als Missings definiert. Bei der Aufbereitung des MLFZ-Datensatzes „MA Pressemedien“ von 1954 bis 2009 für die Fortführung der Datenreihe bis 2015 erfolgte durch die HHU eine Überprüfung und anschließende Vereinheitlichung der Variablennamen, -labels und -stämme. Diese dienen zum einen der einheitlichen Darstellung und der daraus resultierenden Übersichtlichkeit für den zukünftigen Umgang mit den Daten, zum anderen der Bereitstellung von zusätzlichen Informationen, die bereits aus den Labels der Variablen hervorgehen sollen. Das datorium-Projekt beinhaltet folglich den MLFZ-Datensatz „MA Pressemedien“ von 1954 bis 2009 im SPSS-Speicherformat sowie die SPSS-Syntaxen, die zur Aufbereitung dieses Datensatzes für die Fortführung der Datenreihe bis 2015 durch die Heinrich-Heine-Universität (HHU) erstellt wurden. Um die Arbeit der HHU replizieren zu können ist der MLFZ-Datensatz der MA Pressemedien-Daten 1954-2009 ebenfalls Teil der Forschungsdaten. Zu Beachten gilt, dass die hinterlegten SPSS-Syntaxen in der richtigen Reihenfolge (aufsteigende Nummern: 0.1_Korrektur, 0.2_Korrektur, etc.) durchgeführt werden sollten.

Die Darstellung der Variablen- und Wertelabels der Zeitschriften-Variablen wurde demnach vereinheitlicht: Groß- und Kleinschreibung wurden angepasst, Werte geordnet und rekodiert, sowie Umlaute (ä, ö, ü wurden zu ae, oe, ue) geändert, da diese im Englischen sowie durch das Programm CharmStats u.a. nicht zuverlässig dargestellt werden können. Dies dient der Nutzerfreundlichkeit und der besseren Wirksamkeit möglicher Suchen in den Daten. Aus dem gleichen Grund wurden Rechtschreibfehler verbessert und die Variablennamen von Zeitschriften- und Zeitungsvariablen angepasst, damit sich diese visuell zu dem jeweiligen Typ des Pressemediums zuordnen lassen: Am Anfang des jeweiligen Variablennamens wurde entweder ein „Z_“ für Zeitschriften oder ein „TZ_“ für Tageszeitungen hinzugefügt. Um eine konsistente Ordnung der durch das MLFZ aktualisierten Variablen zu schaffen, wurden einige soziodemografische Variablen umbenannt und in eine einheitliche Reihenfolge gebracht (z.B. Variablen „bund1“, „bund2“, „bund5“, „bund6“, „bund7“ und „bund8“ wurden zu „bund1“, „bund2“, „bund3“, „bund4“, „bund5“ und „bund6“).

Um den Nutzern weitere Informationen bereits in den Variablenlabels bereitzustellen, wurden die Abfragezeiträume von Zeitschriften- und Zeitungsvariablen ins Label aufgenommen. So wurden die Labels nach dem gleichen Schema umbenannt; für den kleinen Zeitfilter (_kzf) gilt somit: „Kleiner Zeitfilter; Name der Zeitschrift; (Abfragezeitraum)“, für die Nutzungswahrscheinlichkeiten der Zeitschriften bzw. Tageszeitungen (_nw) dementsprechend: „Nutzungswahrscheinlichkeiten; Name der Zeitschrift/Tageszeitung; (Abfragezeitraum)“ usw. Lediglich die Labels der Lesehäufigkeiten (_lhx, _lhy und _lhz) von Zeitschriften wurden nach einem anderen Schema benannt; hier wurde die Information des jeweiligen Erhebungszeitraums des Filters beigelegt anstelle des Abfragezeitraums der jeweiligen Zeitschrift (Lesehäufigkeiten; Name der Zeitschrift; (Filterzeitraum Zeitraum). Auch bei den Variablen des Freizeitverhaltens wurde der Zeitraum der Abfrage im Label hinterlegt, um die Informationen direkt ersichtlich offenzulegen.

Außerdem wurden zum einen die Variablen aus dem Datensatz gelöscht, bei denen kein Label vorhanden war, da diese anhand des Variablennamens nicht eindeutig zugeordnet werden konnten. Zum anderen wurden Variablen aus dem Datensatz entfernt, welche mehrfach vorhanden waren, jedoch die gleichen Informationen aufwiesen. Soziodemografische Variablen zu nicht relevanten Altersgruppen wurden durch die HHU nicht übernommen. Zusätzliche Summen- und soziodemografische Variablen mit den gleichen Ausprägungen bereits vorhandener Variablen, die sich lediglich durch die Codierung unterschieden, wurden aus dem Datensatz gelöscht. Variablen der Soziodemografie, die nur in einem Jahr erhoben wurden, hat die HHU ebenfalls entfernt. Bei einer vom MLFZ erstellten Variable traten Fallzahlprobleme auf, weshalb auch diese aus dem Datensatz gelöscht wurde. Ebenfalls vom MLFZ erstellte Hilfsvariablen zur Mediennutzung wurden aus dem Datensatz entfernt. Zeitschriften-Variablen, welche erst ab 2010 (der Generalfilter erschien erst wieder im Jahr 2012) abgefragt wurden, wurden durch die HHU entsprechend neu erstellt. Das Format der Z_-Variablen wurde durch die Anpassung der Dezimalstellen verändert.

Zusätzlich erfolgte durch die HHU eine variablenspezifische Vergabe und Ergänzung der fehlenden Werte. Dies dient einem vereinfachten Umgang mit den Daten und der Einheitlichkeit der Variablen-Eigenschaften. Man einigte sich auf Folgendes: Grundsätzlich wurden die Werte -9 „keine Angabe“ (sofern diese Kategorie vorlag) und -7 „nicht erhoben“ für alle Variablen als Missing-Werte vergeben. Um dieses Ziel zu erreichen wurden verschiedene Vorarbeiten durchgeführt: 1) Der Abfragezeitraum jeder Variable wurde – u.a. durch Kreuztabellierungen – ermittelt.

2) Für alle Jahre, in denen die Variable nicht abgefragt oder im Datennsatz erfasst wurde, wurde der Wert -7 „nicht erhoben“ bestimmt. Bei durch die ag.ma oder das MLFZ generierte (Summen-) Variablen wurde für den Missing-Wert -7 das Label „nicht erstellt“ anstelle von „nicht erhoben“ definiert, da es sich eben um erstellte statt erhobene Variablen handelt. Dies trifft auf Variablen der Nutzungswahrscheinlichkeiten und Gewichte – erstellt durch die ag.ma – sowie der Leseintensität – erstellt durch das MLFZ – zu. Außerdem wurde der Generalfilter zwischen den Jahren 2004 und 2012 nicht abgefragt, weshalb den Zeitschriften-Variablen auch in diesem Zeitraum ein fehlender Wert von -7 „nicht erhoben“ zugeschrieben wurde.

3) Daraufhin erfolgte die Vergabe des neuen Missing-Werts -9 „keine Angabe“ sofern diese Kategorie für eine Variable vordefiniert war. Sprich bereits vordefinierte „keine Angabe“-Kategorien wurden zu -9 „keine Angabe“ rekodiert.

4) Da bei einigen Variablenarten zusätzlich Besonderheiten beim Definieren der Missing-Kategorien auftraten, wurde der Missing-Wert -8 für weitere inhaltliche Missing-Kategorien eingeführt: - Bei einigen Variablen der Soziodemografie wurde der Wert 98 zu -8 - Aktualisierte Variablen zum Einkommen der/des Befragten (z.B. eink1): „Haushaltsvorstand ist nicht Befragter“ - Aktualisierte Variablen zum Einkommen der/des Befragten (z.B. eink2): „Befragter ist nicht vollberufstätig“ - Aktualisierte Variablen zum Einkommen des Haushaltsvorstandes (z.B. einkhv1): „siehe Variable Einkommen der/des Befragten“ - Aktualisierte Variablen zum Einkommen des Haushaltsvorstandes (z.B. einkhv5): „Befragter ist nicht Haushaltsvorstand“ - Aktualisierte Variablen zur Anzahl an Personen im Haushalt ab 14 Jahre (z.B. persb1): „Berechnung nicht möglich“ - Aktualisierte Variablen zum Haushaltseinkommen (z.B. hheink1): „verweigert“ - Für die Lesehäufigkeit der Zeitschriften wurde 98 zu -8 „Nicht WHK“ geändert.

5) Nach dem variablenspezifischen Hinzufügen der Missing-Werte -7 „nicht erhoben“ bzw. „nicht ermittelt“, -9 „keine Angabe“ und -8 bei weiteren inhaltlichen Missing-Kategorien, wurden bei allen Variablen noch bestehende Systemmissings zu dem Missing-Wert -6 „von MLFZ generierte Systemmissings“ rekodiert.

6) Abschließend wurden die Werte für den Bereich -9 bis -6 als Missings definiert. Gesamtbevölkerung der BRD ab 14 Jahren und teilweise (MMC Kinderstudie) auch unter 14 Jahren Gesamtbevölkerung der BRD ab 14 Jahren und teilweise (MMC Kinderstudie) auch unter 14 Jahren repräsentative Zufallsauswahl (für nähere Information siehe https://www.agma-mmc.de/media-analyse/ma-radio/datenerhebung/) repräsentative Zufallsauswahl (für nähere Information siehe https://www.agma-mmc.de/media-analyse/ma-radio/datenerhebung/) Quelle: Hagenah, Jörg; Meulemann, Heiner (Hrsg.). 2011: Gesamtdatensatz Media-Analyse für Preseemedien von 1954 bis 2009 (MA-PM). Medienwissenschaftliches Lehr- und Forschungszentrum (MLFZ), Köln. http://www.mlfz.uni-koeln.de/index.php?id=48. Source: Hagenah, Jörg; Meulemann, Heiner (Hrsg.). 2011: Gesamtdatensatz Media-Analyse für Preseemedien von 1954 bis 2009 (MA-PM). Medienwissenschaftliches Lehr- und Forschungszentrum (MLFZ), Köln. http://www.mlfz.uni-koeln.de/index.php?id=48. CATI (Computerunterstützte telefonische Befragung) - Telefonisches InterviewPersönliches Interview Telephone interview: CATIFace-to-face interview

Identifier
DOI http://dx.doi.org/doi:10.7802/1631
Metadata Access https://www.da-ra.de/oaip/oai?verb=GetRecord&metadataPrefix=oai_dc&identifier=oai:oai.da-ra.de:646605
Provenance
Creator Brentel, Inga;Prof Dr Jandura, Olaf
Publisher GESIS Data Archive
Publication Year 2018
Rights CC BY-SA 4.0;CC BY-SA 4.0;Download;Freier Zugang (mit Registrierung);Free Access (with Registration)
Contact GESIS Data Archive
Representation
Resource Type Dataset
Format application/zip;text/x-spss-syntax
Coverage
Discipline Not stated
Spatial Coverage {"Deutschland / DE","Germany / DE",1977}
Temporal Coverage {"Deutschland / DE","Germany / DE",1977}