invisible header

Dies ist das Dokument ohne Lösungen

Klick hier, um die Musterlösungen einzublenden.

 

Zur Vorbereitung

Erster Schritt: ESS-Daten der Welle 8 (2016) im Stata-Format (.dta) einlesen. Bei Mac usern kann es zu einer Fehlermeldung kommen, dann einfach die Daten im SPSS-Format (.sav) einlesen…

# Working directory setzen (z.B. "c:\daten")
setwd("mein_laufwerk/mein_datenverzeichnis")
# Daten einlesen
library(haven)
ess <- read_dta("ESS8e02_2.dta")

Ein neues Übungsskript erstellen…

# Statistik 1: R Tutorat
# Übungsskript zum Datenmanagement
# Datum: 26.10.2023
# AutorIn: XXX

Installation und Aktivierung der Packages tidyverse

#install.packages("tidyverse")
library(tidyverse)

 

I. Daten bereinigen (rekodieren)

1. Recherchiere den Begriff ES-ISCED. Worum handelt es sich?

2. Bei der Variable eisced gibt es eine Ausprägung, die als Missing verstanden werden könnte. Finde zuerst mit attributes() und summary() heraus, um welche Ausprägung es sich handelt und codiere diese anschliessend in das für R verständliche Missing-Format. Warum und in welchen analytischen Kontexten könnte diese Rekodierungsoperation wichtig sein?

3. Finde mit attributes(), look_for() oder dem Codebook heraus, um was für eine Variable es sich bei clmchng handelt und wie diese codiert ist.

4. Wann wäre es sinnvoll, die Variable clmchng (Einstellung zum Klimawandel) zu rekodieren?

5. Generiere nun, basierend auf Aufgabe 4, eine dichotome Variable names clmchng_d, die definitive Leugner vom Rest abgrenzt - die also lediglich unterscheidet, ob es sich um einen kategorischen Leugner handelt oder nicht.

 

II. Teildatensätze (selektieren und umbenennen)

6. Erstelle einen Teildatensatz, den du ‘soziooekon’ nennst. Dieser soll lediglich die zentralen sozioökonomischen und demografischen Variablen enthalten: Alter, Geschlecht, Land, Beruf, höchster Bildungsabschluss, höchster Bildungsabschluss der Eltern.

7. Gib den Variablen im Datensatz ‘soziooekon’ folgende neue Namen: agea –> neu: ‘age’; gndr –> neu: ‘gender’; cntry –> neu: ‘country’.

 

III. Daten auswählen - Teilgruppenvergleich

8. Suche im ESS die Variable heraus, die
(a) sich auf das Land (bzw. das Ländersample) bezieht
(b) die emotionale Bindung der Befragten zu diesem Land misst
(c) mit dem Namen brncntr bezeichnet ist
Beschränke den Datensatz auf diese Variablen.

# Erstelle Codebook
library(labelled)
varlist <- look_for(ess)

9. Generiere zwei separate Teildatensätze (‘ess_ch’ und ‘ess_de’), welche jeweils ausschliesslich Befragte aus der Schweiz und aus Deutschland enthalten.

10. Generiere einen weiteren Teildatensatz (‘ess_scand’) mit Personen aus den skandinavischen Staaten Finnland, Schweden, Norwegen, Island.

11. Vergleiche die durchschnittliche emotionale Bindung von Befragten aus Deutschland, der Schweiz und den skandinavischen Staaten. Was fällt auf?

12. Erstelle einen Teildatensatz mit Befragten der Schweiz (Zusatzaufgabe: und/oder Deutschland bzw. Schweden). Vergleiche nun die emotionale Bindung der beiden Kategorien der Variable brncntr. Welche Gruppe hat eine stärkere emotionale Bindung an das Land - Personen, die seit Geburt im Land leben oder zugezogene? (Zusatzaufgabe: Unterscheidet sich diese Differenz zwischen Deutschland, der Schweiz und Schweden?)

 

logo.knit

Conforti, E., Siefart, F., De Min, N., Dürr, R., Moos, M., Senn, S., Strassmann-Rocha, D., Giesselmann, M. (2022): “R für das Soziologiestudium an der UZH”