Anhang D — Checkliste zur Klausurvorbereitung
Schlüsselwörter
Statistik, Prognose, Modellierung, R, Datenanalyse, Regression
Hinweis
Bitte beachten Sie, dass Ihr Dozent für Ihre Klausur zusätzliche Hinweise gegeben haben kann.
D.1 Vorbereitung
D.2 Inhaltliche Kernthemen
D.2.1 Daten & R-Grundlagen
D.2.2 Daten einlesen & umformen
-
filter()– Zeilen auswählen (Bedingungen mit&/|)select()– Spalten auswählenmutate()– neue Spalten berechnen, bestehende erhaltensummarise()– eine Kennzahl berechnen (reduziert Zeilen)arrange()– sortierencount()– Häufigkeiten zählen (sinnvoll bei nominalen Variablen)group_by()– Gruppierung für nachfolgende Operationen
D.2.3 Daten verbildlichen
-
- Verteilung einer metrischen Variable → Histogramm
- Gruppenvergleich metrisch → Boxplot
- Zusammenhang zweier metrischer Variablen → Scatterplot
- Häufigkeiten nominal → Balkendiagramm
D.2.4 Punktmodelle & Modellgüte
D.2.5 Zusammenhänge & Korrelation
-
- r < 0: gegensinniger Zusammenhang
- r = 0: kein linearer Zusammenhang
- r > 0: gleichsinniger Zusammenhang
D.2.6 Geradenmodelle (Regression)
D.3 Umgang mit MC-Fragen
D.4 Häufige Fehler
| Fehler | Richtig |
|---|---|
summarise() für neue Spalten |
→ mutate() verwenden |
filter() mit = statt == |
→ == für Vergleiche |
& und \| verwechseln |
→ & = beide Bedingungen, \| = eine reicht |
mean() gibt NA, obwohl Zahlen da sind |
→ ein NA im Vektor reicht; na.rm = TRUE setzen |
| Kovarianz und Korrelation gleichsetzen | → Kovarianz ist skalenabhängig, r nicht |
| MAE-Berechnung ohne Absolutbetrag | → negative Fehler müssen betragsmäßig eingehen |
| SD bevorzugen, weil robuster | → IQR ist robuster; SD ist nur interpretierbar in Originaleinheit |
| Geradenmodell verbessert immer | → nur wenn r ≠ 0; sonst gleich wie Nullmodell |