Datenanalyse (Vorlesung von Prof. Filzmoser)


Verwendete Libraries findet man hier unter Packages.

1 Stichprobendesign: vom Problem zur statistischen Lösung
       1.1 Einleitung
       1.2 Grundbegriffe
       1.3 Planung der statistischen Datenerhebung
       1.4 Statistische Datenerhebung
       1.5 Statistische Datenaufbereitung
       1.6 Statistische Datenanalyse
       1.7 Interpretation der Ergebnisse
2 Darstellung eindimensionaler Daten
       2.1 Eindimensionale Streudiagramme (Scatterplots)
             2.1.1 Mehrfachpunkte
             2.1.2 Darstellungsarten quantitativer Information in Grafiken
             2.1.3 Ausreißer
       2.2 Histogramme
             2.2.1 Wahl der Intervalllänge
             2.2.2 Verschobene Histogramme
       2.3 Rootogramme
       2.4 Frequenzpolygone
       2.5 Dichteschätzung
       2.6 Auswahl eines diskreten Wahrscheinlichkeitsmodells
             2.6.1 Verfahren von Ord
             2.6.2 Verfahren von Hoaglin 1960
       2.7 Empirische Verteilungsfunktion und Wahrscheinlichkeitsnetz
             2.7.1 Empirische Verteilungsfunktion
             2.7.2 Wahrscheinlichkeitsnetz
       2.8 Quantile-Quantile Plots
             2.8.1 Abweichungen von der Geradenform
             2.8.2 Streuung in Q-Q Plots
             2.8.3 Prüfung auf Symmetrie einer Verteilung durch Q-Q Plots
       2.9 Boxplots
3 Robuste univariate Schätzer
       3.1 Robuste Schätzung von Lokation und Streuung
       3.2 Eindimensionale Ausreiss ererkennung
4 Darstellung zweidimensionaler Daten
       4.1 Streuungsdiagramme (Scatterplots)
       4.2 Streifen-Boxplots
       4.3 Dichteschätzung in zwei Dimensionen
5 Robuste Schätzung linearer Trends
       5.1 Robuste Gerade nach Tukey
       5.2 Robuste Gerade nach Theil
       5.3 Robuste Gerade nach Siegel (Repeated Median Line)
       5.4 Least Median of Squares (LMS) Regression
       5.5 Least Trimmed Squares (LTS) Regression
6 Glättung und Schätzung nichtlinearer Trends
       6.1 Nichtlineare Glätter für äquidistante (Zeit-)Punkte
       6.2 LOWESS
             6.2.1 Upper and Lower Smoothing
             6.2.2 Pairs of Middle Smoothing
7 Zeitreihenanalyse -- eine Einführung
       7.1 Zerlegung der Zeitreihe in Komponenten
       7.2 Regressionsmodelle für Zeitreihen
             7.2.1 Lineares Modell
             7.2.2 Regression mit quadratischem Term
             7.2.3 Regression mit Fourier Koeffizienten
       7.3 Exponentielles Glätten (exponential smoothing)
       7.4 Modellierung von Zeitreihen
             7.4.1 Kenngröss en
             7.4.2 Grundlegende Zeitreihenmodelle
             7.4.3 Schätzung der Parameter
             7.4.4 Diagnostik von Zeitreihenmodellen
             7.4.5 Prognose
8 Multivariate Grafiken
       8.1 Streudiagramme
       8.2 Profile, Sterne, Segmente, Chernoff Faces
             8.2.1 Profile
             8.2.2 Sterne
             8.2.3 Segmente
             8.2.4 Chernoff Faces
             8.2.5 Quader (Boxes)
       8.3 Bäume (Trees)
       8.4 Burgen (Castles)
       8.5 Plot mit parallelen Koordinaten
9 Parameterschätzung im Mehrdimensionalen
       9.1 Kovarianz und Korrelation
             9.1.1 Robustere Schätzung der Kovarianz und Korrelation
       9.2 Distanz und Ähnlichkeit
       9.3 Multivariate Ausreiss ererkennung
10 Projektionen mehrdimensionaler Daten
       10.1 Linearkombinationen von Variablen
       10.2 Hauptkomponenten
             10.2.1 Definition der Hauptkomponenten
             10.2.2 Algorithmus zur Bestimmung der Hauptkomponenten
             10.2.3 Anzahl der relevanten Hauptkomponenten
             10.2.4 Zentrieren und Skalieren der Daten
             10.2.5 Normalverteilung und Ausreiss er
             10.2.6 Darstellung der Ergebnisse, Biplot
       10.3 Projection Pursuit
             10.3.1 Projektionsindex
             10.3.2 Berechnung des Projektionsindex
             10.3.3 Strukturelimination
11 Weitere multivariate statistische Methoden -- ein Überblick
       11.1 Clusteranalyse
             11.1.1 Partitionierungsmethoden
             11.1.2 Hierarchische Clustermethoden
             11.1.3 Fuzzy Clustering
             11.1.4 Modellbasierte Clusterung
             11.1.5 Gütemass e
       11.2 Diskriminanzanalyse
             11.2.1 Lineare Diskriminanzanalyse (LDA)
             11.2.2 Quadratische Diskriminanzanalyse (QDA)