Abschluss

Schlüsselwörter

Statistik, Prognose, Modellierung, R, Datenanalyse, Regression

Einstieg

Standort im Lernpfad

Abb. den Standort dieses Kapitels im Lernpfad und gibt damit einen Überblick über das Thema dieses Kapitels im Kontext aller Kapitel.

Lernziele

kein neuer Stoff

Ziel dieses Kapitels ist es, den Stoff des Moduls zu wiederholen und zu konsolidieren.

Benötigte R-Pakete

Benötigte Daten

data(mtcars)

Herzlichen Glückwünsch!

Herzlichen Glückwunsch - Sie haben diesen Kurs abgeschlossen! Es sei denn, Sie haben nur ein bisschen durchgeschaut. Dann war es hoffentlich zumindest interessant. 😄

Wie geht’s weiter?

Es gibt viele weiterführende Bücher und Kurse. Ein logischer nächster Schritt ist es, sich mit Inferenzstatistik zu beschäftigen. Dazu bietet sich z.B. der Kurs Start:Bayes! an, zufälligerweise aus der Feder des gleichen Autors…

Wenn Sie sich breiter (nicht tiefer) mit Data Literacy beschäftigen wollen, bietet sich der Online-Kurs des KI-Campus an. Es gibt viele Online-Kurse, die sich anbieten, wenn Sie im Thema moderne Datenanalyse fit werden wollen. Schauen Sie doch mal z.B. bei Anbietern wie Coursera oder ähnlichen Anbietern vorbei.

Aufgabensammlungen

Auf dem Datenwerk finden Sie reichlich Aufgaben zur Prüfungsvorbereitung.

U.a. folgende Tags sind für diesen Kurs relevant:

Quizze

Hier geht’s zu einem Quiz zur deskriptiven Statistik (Maße der zentralen Tendenz, Variabilität, Verteilungsformen, Normalverteilung, Korrelation).

Hier geht’s zu einem Quiz zum Thema Verteilungen.

Fallstudien

Wichtig

Wenn Sie mit Aufgaben “in der Wildnis” der freien Datenanalyse zu tun haben, wird es immer wieder passieren, dass Sie auf bisher unbekannte Probleme, Methoden und Lösungen stoßen. Das kann weh tun, weil man das Gefühl hat, man kennt sich nicht gut aus. Aber lassen Sie sich nicht ins Boxhorn jagen! Auf etwas Unbekanntes zu stoßen, bedeutet nichts anderes als der Beweis, dass man lernt! Es ist also eine gute Nachricht. Denn vergessen Sie nicht: Sie machen die Fallstudien nur aus einem Grund – um zu lernen, um ihre Grenzen zu erweitern, zu wachsen, schlauer zu werden, ein Handwerk zu lernen, ihre Persönlichkeit zu entfalten. Let’s grow!

Datenvisualisierung

Explorative Datenanalyse

In diesem Abschnitt sind Fallstudien, die Methoden der deskriptiven Statistik verwenden, aufgeführt. Datenvisualisierung und Datenjudo spielt dabei auch eine (zum Teil wichtige) Rolle.

Lineare Modelle

FAQ

Werfen Sie auch einen Blick in typische R-Fragen.

SD berechnen

FRAGE: Macht es einen Unterschied, ob man dafür den Befehlt summary() oder den Befehl sd() verwendet? Bei mir kommen da nämlich unterschiedliche Zahlen raus.

ANTWORT: summary() gibt nicht SD aus, sondern nur den IQR (IQR = Q3-Q1).

data(mtcars)
sd(mtcars$mpg)
summary(mtcars$mpg)
## [1] 6
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##      10      15      19      20      23      34

count vs. filter

FRAGE: Wann benutzt man count() und wann filter()?

ANTWORT: Mit filter plus dem Zählen der übrig gebliebenen Zeilen erreicht man etwas Ähnliches wie mit count:

mtcars |> 
  filter(am == 0) |> 
  nrow()
## [1] 19
mtcars |> 
  count(am)
ABCDEFGHIJ0123456789
am
<dbl>
n
<int>
019
113

1000

FRAGE: gibt es einen Unterschied zwischen 10^3 und 1e3? Es kommen nämlich unterschiedliche Ergebnisse raus.

ANTWORT: Nein, beide Schreibweisen meinen das Gleiche, nämlich die Zahl 1000.

10^3 == 1000 
1e3 == 1000
## [1] TRUE
## [1] TRUE

Literaturhinweise

Diese Literaturliste empfiehlt Ihnen Lehrbücher zu grundlegenden Themen der Datenanalyse (mit R).


  1. https://learn.ki-campus.org/courses/dali-basis-THK2021↩︎

  2. https://www.coursera.org/specializations/data-science↩︎

  3. https://sebastiansauer.github.io/Datenwerk/↩︎

  4. https://forms.gle/w7eTW3ftKy8Hv3nw8↩︎

  5. Datenwerk: Verteilungen-Quiz↩︎

  6. https://www.zotero.org/groups/4583286/intro-stats/library↩︎