invisible header

Dies ist das Dokument ohne Lösungen

Klick hier, um die Musterlösungen einzublenden.

 

Vorbereitung

Einlesen der ESS-Daten der Welle 8 (2016) im Stata-Format:

# Working directory setzen (z.B. "c:\daten" oder "~/daten")
setwd("mein_laufwerk/mein_datenverzeichnis")
# Daten einlesen
library(haven)
ess <- read_dta("ESS8e02_2.dta")
# oder
ess <- read_sav("ESS8e02_2.sav")

Ein neues Übungsskript erstellen.

# Statistik 1: R Tutorat
# Übungsskript zur Tabellenanalyse
# Datum: 06.12.2021
# AutorIn: XXX

Installation und Aktivierung der Packages tidyverse, sjPlot und ggplot2.

#install.packages("tidyverse")
library(tidyverse)
# install.packages("sjPlot")
library(sjPlot)
#install.packages("ggplot2")
library(ggplot2)

 

I. Datenmanagement

In den folgenden zwei Anwendungen untersuchen wir in einem Dreiländervergleich, ob sich Personen in Deutschland, der Schweiz und Österreich durch unterschiedlich Einschätzungen der Wichtigkeit des (a) Befolgens von Traditionen und Bräuchen und (b) Verfolgens von Dingen, die Freude bereiten auszeichnen.

1. Erstellt auf Grundlage der cntry Variable einen Teildatensatz, in dem nur noch die Befragungspersonen aus Deutschland, Österreich und der Schweiz enthalten sind. Anschliessend erstellt ihr auf dieser Datenbasis einen Teildatensatz “ess_werte”, der ausschliesslich die cntry Variable, sowie die zwei Variablen zur Messung der Wichtigkeit der beiden Lebensideale (imptrad und impfun) enthält.

2. Verschafft euch mit attributes(), table() und/oder summary() eine Übersicht zu den Verteilungen der drei Variablen und den zugrunde liegenden Messungen. Und: Gibt es Werte, welche als NAs rekodiert werden können/sollten?

3. Wir wollen die Fallzahl über beide Analysen konstant halten. Da wir den Datensatz bereits auf alle analyserelevanten Merkmale begrenzt haben, dürfen wir dazu mit der “Brechstange” na.omit() alle Personen mit NAs in mindestens einer der beteiligten Variablen ausschliessen (ohne dabei unbotmässig die Stichprobe zu reduzieren). Positiver Nebeneffekt: Wir müssen dann später nicht mehr für die ggplot-Anwendungen spezifische Teildatensätze ohne NAs bilden.

4. Rekodiert die beiden Variablen imptrad und impfun von ihrer Ausgangsform (quasimetrisch) in Variablen mit jeweils drei Ausprägungen und faktorisiert alle drei Variablen. Nutzt zudem den Befehl factor(,levels = c()), um die Reihenfolge der Ausprägungen festzulegen (und so für gute Zugänglichkeit der in den weiteren Arbeitsschritten erstellten Tabellen und Visualisierungen zu sorgen).

 

II. Anwendung 1: Wichtigkeit von Tradtionen

5.1. Formuliert eine Hypothese zu den Länderunterschieden in den Einschätzungen zur Wichtigkeit des Befolgens von Traditionen und Bräuchen.

5.2 Erstellt mit tab_xtab() aus dem sjPlot-Package eine Kreuztabelle, welche die Verteilung der beiden Variablen tabellarisch darstellt.

6.1 Wertet die Tabelle unter sinnvollem Einsatz von Prozentsatzdifferenzen aus

6.2 Berechnet und interpretiert das Assoziationsmass Lambda

6.3 Berechnet und interpretiert das Assoziationsmass Cramers V (bzw. bildet dieses rechnerisch auf Basis des Chi^2 Wertes nach).

6.4 Interpretiert das Assoziationsmass Chi^2, bezieht euch dabei auf den ausgegebenen p-Wert.

7.1 Visualisiert die Kreuztabelle bzw. den bivariaten Zusammenhang

7.2 Interpretiert euer Balkendiagramm inhaltlich. Greift dabei auch auf eure Kreuztabelle zurück. Entsprechen die Ergebnisse eurer Vermutung?

 

III. Anwendung 2: Wichtigkeit von Spass und Freude

8.1 Formuliert eine Hypothese zum Länderunterschied in den Einschätzungen zur Wichtigkeit des Verfolgens von Spass und Freude.

8.2 Erstellt mit tab_xtab() eine Kreuztabelle, welche die Verteilung der beiden Variablen tabellarisch darstellt.

9.1 Wertet die Tabelle unter sinnvollem Einsatz von Prozentsatzdifferenzen inhaltlich aus.

9.2 Berechnet und interpretiert das Assoziationsmass Lambda

9.3 Berechnet und interpretiert das Assoziationsmass Cramers V; bildet dieses rechnerisch auf Basis des Chi^2 Wertes nach.

9.4 Interpretiert das Assoziationsmass Chi^2, bezieht euch dabei auf den ausgegebenen p-Wert.

10.1 Visualisiert die Kreuztabelle bzw. den bivariaten Zusammenhang (z.B.

10.2 Interpretiert euer Balkendiagramm inhaltlich. Greift dabei auch auf eure Kreuztabelle zurück.

11. Welcher der beiden untersuchten Zusammenhänge ist stärker?

 

logo.knit

Conforti, E., De Min, N., Dürr, R., Siefart, F., Strassmann-Rocha, D., Giesselmann, M. (2020): “R für das Soziologiestudium an der UZH”
unter Mitarbeit von Mara Moos und Sebastian Senn