📊

Einführung in die deskriptive Statistik

Sep 11, 2024

Notizen zur deskriptiven Statistik

Einführung in die deskriptive Statistik

  • Ziel des Videos: Verständnis der absoluten und relativen Häufigkeit sowie erste Formen der grafischen Datenaufbereitung.
  • Unterscheidung:
    • Deskriptive Statistik: Beschreibt, was gemessen wurde, ohne Schlussfolgerungen über die Population.
    • Inferenzstatistik: Macht Aussagen über die Population.

Wichtige Begriffe

  • Absolute Häufigkeit: Anzahl der Vorkommen einer bestimmten Merkmalsausprägung.
  • Relative Häufigkeit: Anteil einer bestimmten Merkmalsausprägung an der Gesamtzahl der Vorkommen.

Grafische Darstellungen

  1. Balkendiagramm (Bar Chart)

    • Darstellung kategorialer Daten.
    • Anordnung der Kategorien ist willkürlich.
    • Y-Achse zeigt die absoluten Häufigkeiten.
  2. Histogramm

    • Für metrische, kontinuierliche Daten.
    • Die Balken berühren sich, was Kontinuität anzeigt.
    • X-Achse ist eine numerisch bedeutsame Achse.

Elemente der deskriptiven Statistik

  • Häufigkeiten: Klassifizierung und Zählung von Merkmalsausprägungen.
  • Tabellarische Darstellungen: Organisation der Daten in Form von Urlisten und Tabellen.
    • Beispiel: Urliste von Persönlichkeitsstörungen.

Maße der zentralen Tendenz

  • Zentrale Tendenz: Wo liegt der „Schwerpunkt“ eines Merkmals?
    • Mittelwert, Median und Modus.
  • Streuungsmaße:
    • Maße zur Beschreibung der Variabilität innerhalb der Daten (z.B. Varianz, Standardabweichung).

Histogramm und Binning

  • Bei stetigen Merkmalen:
    • Werte müssen in Klassen (Bins) zusammengefasst werden.
    • Binning: Aggregation der Werte in Kategorien.
  • Faustregel für Histogramme:
    • Anzahl der Bins (Q) kann durch die Wurzel aus der Anzahl der Werte (K) oder K/4 ermittelt werden.

Anwendungsbeispiele

  • Beispiel: E-Mail-Inbox – Analyse der Häufigkeit von E-Mails durch verschiedene Absender.
  • Beispiel: Messung von Wartezeiten in Minuten.

Wichtige Zusammenfassungen

  • Summe der absoluten Häufigkeiten = n
  • Summe der relativen Häufigkeiten = 1 (oder 100%).

Schlussfolgerung

  • Ein gutes Verständnis der deskriptiven Statistik ist entscheidend für die Analyse von Daten.
  • Vorschlag zur Vertiefung: Kapitel 6 im Buch von Eid und Golgatha Schmidt lesen.