Datenanalyse (Vorlesung von Prof. Filzmoser)
Verwendete Libraries findet man hier unter Packages.
1
Stichprobendesign: vom Problem zur statistischen Lösung
1.1
Einleitung
1.2
Grundbegriffe
1.3
Planung der statistischen Datenerhebung
1.4
Statistische Datenerhebung
1.5
Statistische Datenaufbereitung
1.6
Statistische Datenanalyse
1.7
Interpretation der Ergebnisse
2
Darstellung eindimensionaler Daten
2.1
Eindimensionale Streudiagramme (Scatterplots)
2.1.1
Mehrfachpunkte
2.1.2
Darstellungsarten quantitativer Information in Grafiken
2.1.3
Ausreißer
2.2
Histogramme
2.2.1
Wahl der Intervalllänge
2.2.2
Verschobene Histogramme
2.3
Rootogramme
2.4
Frequenzpolygone
2.5
Dichteschätzung
2.6
Auswahl eines diskreten Wahrscheinlichkeitsmodells
2.6.1
Verfahren von Ord
2.6.2
Verfahren von Hoaglin 1960
2.7
Empirische Verteilungsfunktion und Wahrscheinlichkeitsnetz
2.7.1
Empirische Verteilungsfunktion
2.7.2
Wahrscheinlichkeitsnetz
2.8
Quantile-Quantile Plots
2.8.1
Abweichungen von der Geradenform
2.8.2
Streuung in Q-Q Plots
2.8.3
Prüfung auf Symmetrie einer Verteilung durch Q-Q Plots
2.9
Boxplots
3
Robuste univariate Schätzer
3.1
Robuste Schätzung von Lokation und Streuung
3.2
Eindimensionale Ausreiss ererkennung
4
Darstellung zweidimensionaler Daten
4.1
Streuungsdiagramme (Scatterplots)
4.2
Streifen-Boxplots
4.3
Dichteschätzung in zwei Dimensionen
5
Robuste Schätzung linearer Trends
5.1
Robuste Gerade nach Tukey
5.2
Robuste Gerade nach Theil
5.3
Robuste Gerade nach Siegel (Repeated Median Line)
5.4
Least Median of Squares (LMS) Regression
5.5
Least Trimmed Squares (LTS) Regression
6
Glättung und Schätzung nichtlinearer Trends
6.1
Nichtlineare Glätter für äquidistante (Zeit-)Punkte
6.2
LOWESS
6.2.1
Upper and Lower Smoothing
6.2.2
Pairs of Middle Smoothing
7
Zeitreihenanalyse -- eine Einführung
7.1
Zerlegung der Zeitreihe in Komponenten
7.2
Regressionsmodelle für Zeitreihen
7.2.1
Lineares Modell
7.2.2
Regression mit quadratischem Term
7.2.3
Regression mit Fourier Koeffizienten
7.3
Exponentielles Glätten (exponential smoothing)
7.4
Modellierung von Zeitreihen
7.4.1
Kenngröss en
7.4.2
Grundlegende Zeitreihenmodelle
7.4.3
Schätzung der Parameter
7.4.4
Diagnostik von Zeitreihenmodellen
7.4.5
Prognose
8
Multivariate Grafiken
8.1
Streudiagramme
8.2
Profile, Sterne, Segmente, Chernoff Faces
8.2.1
Profile
8.2.2
Sterne
8.2.3
Segmente
8.2.4
Chernoff Faces
8.2.5
Quader (Boxes)
8.3
Bäume (Trees)
8.4
Burgen (Castles)
8.5
Plot mit parallelen Koordinaten
9
Parameterschätzung im Mehrdimensionalen
9.1
Kovarianz und Korrelation
9.1.1
Robustere Schätzung der Kovarianz und Korrelation
9.2
Distanz und Ähnlichkeit
9.3
Multivariate Ausreiss ererkennung
10
Projektionen mehrdimensionaler Daten
10.1
Linearkombinationen von Variablen
10.2
Hauptkomponenten
10.2.1
Definition der Hauptkomponenten
10.2.2
Algorithmus zur Bestimmung der Hauptkomponenten
10.2.3
Anzahl der relevanten Hauptkomponenten
10.2.4
Zentrieren und Skalieren der Daten
10.2.5
Normalverteilung und Ausreiss er
10.2.6
Darstellung der Ergebnisse, Biplot
10.3
Projection Pursuit
10.3.1
Projektionsindex
10.3.2
Berechnung des Projektionsindex
10.3.3
Strukturelimination
11
Weitere multivariate statistische Methoden -- ein Überblick
11.1
Clusteranalyse
11.1.1
Partitionierungsmethoden
11.1.2
Hierarchische Clustermethoden
11.1.3
Fuzzy Clustering
11.1.4
Modellbasierte Clusterung
11.1.5
Gütemass e
11.2
Diskriminanzanalyse
11.2.1
Lineare Diskriminanzanalyse (LDA)
11.2.2
Quadratische Diskriminanzanalyse (QDA)