Statistik1 - 11 Abschluss

11.1 Lernsteuerung

11.1.1 Standort im Lernpfad

Abb. Abbildung 1.2 den Standort dieses Kapitels im Lernpfad und gibt damit einen Überblick über das Thema dieses Kapitels im Kontext aller Kapitel.

11.1.2 Lernziele

kein neuer Stoff

Ziel dieses Kapitels ist es, den Stoff des Moduls zu wiederholen und zu konsolidieren.

11.1.3 Benötigte R-Pakete

library(tidyverse)
library(easystats)

11.1.4 Benötigte Daten


data(mtcars)

11.2 Herzlichen Glückwünsch!

Herzlichen Glückwunsch - Sie haben diesen Kurs abgeschlossen! Es sei denn, Sie haben nur ein bisschen durchgeschaut. Dann war es hoffentlich zumindest interessant. 😄

11.3 Wie geht’s weiter?

Es gibt viele weiterführende Bücher und Kurse. Ein logischer nächster Schritt ist es, sich mit Inferenzstatistik zu beschäftigen. Dazu bietet sich z.B. der Kurs Start:Bayes! an, zufälligerweise aus der Feder des gleichen Autors…

Wenn Sie sich breiter (nicht tiefer) mit Data Literacy beschäftigen wollen, bietet sich der Online-Kurs des KI-Campus an. Es gibt viele Online-Kurse, die sich anbieten, wenn Sie im Thema moderne Datenanalyse fit werden wollen. Schauen Sie doch mal z.B. bei Coursera oder ähnlichen Anbietern vorbei.

11.4 Aufgabensammlungen

Auf dem Datenwerk finden Sie reichlich Aufgaben zur Prüfungsvorbereitung.

U.a. folgende Tags sind für diesen Kurs relevant:

11.5 Quizze

Hier geht’s zu einem Quiz zur deskriptiven Statistik (Maße der zentralen Tendenz, Variabilität, Verteilungsformen, Normalverteilung, Korrelation).

Hier geht’s zu einem Quiz zum Thema Verteilungen.

11.6 Fallstudien

Wichtig

Wenn Sie mit Aufgaben “in der Wildnis” der freien Datenanalyse zu tun haben, wird es immer wieder passieren, dass Sie auf bisher unbekannte Probleme, Methoden und Lösungen stoßen. Das kann weh tun, weil man das Gefühl hat, man kennt sich nicht gut aus. Aber lassen Sie sich nicht ins Boxhorn jagen! Auf etwas Unbekanntes zu stoßen, bedeutet nichts anderes als der Beweis, dass man lernt! Es ist also eine gute Nachricht. Denn vergessen Sie nicht: Sie machen die Fallstudien nur aus einem Grund – um zu lernen, um ihre Grenzen zu erweitern, zu wachsen, schlauer zu werden, ein Handwerk zu lernen, ihre Persönlichkeit zu entfalten. Let’s grow! \(\square\)

11.6.1 Datenvisualisierung

Fallstudien – NUR Datenvisualisierung

11.6.2 Explorative Datenanalyse

In diesem Abschnitt sind Fallstudien, die Methoden der deskriptiven Statistik verwenden, aufgeführt. Datenvisualisierung und Datenjudo spielt dabei auch eine (zum Teil wichtige) Rolle.

FALLSTUDIEN - NUR EXPLORATIVE DATENANALYSE

11.6.3 Lineare Modelle

FALLSTUDIEN - NUR LINEARE MODELLE

Beispiel für Prognosemodellierung 1, grundlegender Anspruch, Video
Beispiel für Ihre Prognosemodellierung 2, mittlerer Anspruch
Beispiel für Ihre Prognosemodellierung 3, hoher Anspruch
Fallstudie: Modellierung von Flugverspätungen
Modelling movie successes: linear regression
Movies
Fallstudie Einfache lineare Regression in Base-R, Anfängerniveau, Kaggle-Competition TMDB
Fallstudie Sprit sparen
Fallstudie zum Beitrag verschiedener Werbeformate zum Umsatz; eine Fallstudie in Python, aber mit etwas Erfahrung wird man den Code einfach in R umsetzen können (wenn man nicht in Python schreiben will)
Practical Linear Regression with R: A case study on diamond prices
Case Study: Italian restaurants in NYC
Vorhersage-Modellierung des Preises von Diamanten
Modellierung Diamantenpreis 2

11.7 FAQ

Werfen Sie auch einen Blick in typische R-Fragen.

11.7.1 SD berechnen

FRAGE: Macht es einen Unterschied, ob man dafür den Befehlt summary() oder den Befehl sd() verwendet? Bei mir kommen da nämlich unterschiedliche Zahlen raus.

ANTWORT: summary() gibt nicht SD aus, sondern nur den IQR (IQR = Q3-Q3).

data(mtcars)
sd(mtcars$mpg)
## [1] 6.026948
summary(mtcars$mpg)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   10.40   15.43   19.20   20.09   22.80   33.90

11.7.2 count vs. filter

FRAGE: Wann benutzt man count() und wann filter()?

ANTWORT: Mit filter plus dem Zählen der übrig gebliebenen Zeilen erreicht man etwas Ähnliches wie mit count:

mtcars |> 
  filter(am == 0) |> 
  nrow()
## [1] 19

mtcars |> 
  count(am)

11.7.3 1000

FRAGE: gibt es einen Unterschied zwischen 10^3 und 1e3? Es kommen nämlich unterschiedliche Ergebnisse raus.

ANTWORT: Nein, beide Schreibweisen meinen das Gleiche, nämlich die Zahl 1000.

10^3 == 1000 
## [1] TRUE
1e3 == 1000
## [1] TRUE

11.8 Literaturhinweise

Diese Literaturliste empfiehlt Ihnen Lehrbücher zu grundlegenden Themen der Datenanalyse (mit R).