Clusteranalyse
Seminar
In Wien (Australien), Hamburg, Frankfurt Am Main und an 7 weiteren Standorten

Beschreibung
-
Kursart
Intensivseminar berufsbegleitend
-
Niveau
Anfänger
-
Ort
-
Unterrichtsstunden
15h
-
Dauer
2 Tage
Statistik - Clusteranalyse
Standorte und Zeitplan
Lage
Beginn
Beginn
Beginn
Beginn
Beginn
Beginn
Beginn
Beginn
Beginn
Beginn
Beginn
Meinungen
Themen
- Ähnlichkeit und Unähnlichkeit
- Nächste-Nachbarn- und Mittelwertverfahren
- K-Means-Verfahren
- Latente Profilanalyse
- Latent-Gold-Ansatz
Inhalte
Einsteiger
Zielgruppe:
Datenanalysten
Voraussetzungen:
Grundlagen der Statistik
Methode:
Vortrag mit Beispielen und Übungen.
Seminarziele:
Unter Clusteranalyse versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die gefundenen Ähnlichkeitsgruppen können hierarchisch oder agglomerativ sein, also Untergruppen oder Teilgruppen in Gruppen kennzeichnen. Die Clusteranalyse ist eine wichtige Disziplin des Data-Mining, dem Analyseschritt des Knowledge Discovery in Databases Prozesses. Die zahlreichen Algorithmen unterscheiden sich vor allem in ihrem Ähnlichkeits- und Gruppenbegriff, ihrem Cluster-Modell, ihrem algorithmischen Vorgehen und der Toleranz gegenüber Störungen in den Daten. Dieses Seminar stellt gängige Cluster-Techniken theoretisch und mit Hilfe von praktischen Übungen ausführlich dar. Sie werden dadurch in die Lage versetzt, die Eigenschaften und damit auch Vor- und Nachteile verschiedener Verfahren zu kennen und selbstständig eine Cluster-Analyse durchzuführen.
Themen:
A. Unvollständige Clusteranalyse
Dauer:0.5 Tage
Modell der multiplen Korrespondenzanalyse: Zusammenhangsmatrix, Berechnung von Eigenwerten, Faktorladungen und Koordinatenwerten, Modellprüfgrößen - Nichtmetrische und mehrdimensionale Skalierung: Aufgabenstellung und Ähnlichkeitsmessung, Schätzalgorithmus, Dimensionszahl - Hauptkomponenten- und Faktorenanalyse
B. Ähnlichkeit und Unähnlichkeit
Dauer:0.25 Tage
Dichotome Variablen - Nominale Variablen - Ordinale Variablen - Metrische Variablen
C. Nächste-Nachbarn- und Mittelwertverfahren
Dauer:0.5 Tage
Complete Linkage: Der hierarchisch-agglomerative Algorithmus, Hierarchische Darstellung von Ähnlichkeitsbeziehungen, Clusterzahl, Beurteilung und Güteprüfung - Single-Linkage - Verallgemeinerung
D. K-Means-Verfahren
Dauer:0.25 Tage
Modellansatz - Clusteranzahl - Ausreißer - Validitätsprüfung - Alternative Startwerte - Gemischtes Missniveau
E. Latente Profilanalyse
Dauer:0.25 Tage
Modellansatz - Prüfgrößen - Klassenzahl - Überlappung - Latente Klassen für unterschiedliche Skalen
F. Latent-Gold-Ansatz
Dauer:0.25 Tage
Modellansatz der Latent-Cluster-Analyse - Erweiterung mit Kovariaten - Parameterschätzungen - Statistiken und Tests zur Modellanpassung
Unsere dozenten
Unser Statistik- und Data-Mining-Trainer Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken und als Business Intelligence-Berater. Zu seinen Kunden zählen Marktforschungsunternehmen oder Behörden wie der Deutsche Bundesrat sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung.
Veröffentlichungen:
- "Grundlagen empirische Sozialforschung" (Comelio Medien, ISBN 978-3-939701-23-1)
- "System und Systematik von Fragebögen" (Comelio Medien, ISBN 978-3-939701-26-2)
- "Oracle SQL" (Comelio Medien, ISBN 978-3-939701-41-5)
- "SQL Server 2012: Data Mining und multivariate Verfahren" (Comelio Medien, ISBN 978-3-939701-85-9)
- "SQL und relationale Datenbanken" (Comelio Medien, ISBN 978-3-939701-52-1)
Projekte: Als Berater und Projektleiter konzipiert Herr Skulschus Business Intelligence-Systeme auf Basis von OLAP und Data Warehouse-Technologien mit MS SQL Server und Oracle mit Berichtskomponenten im Intranet oder MS Excel, statistische Analysen und Data Mining-Modulen. Je nach Aufgabe setzt er R, IBM SPSS oder Minitab ein.
Forschung: Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.
Zertifizierung:
Marco Skulschus ist zertifiziert als "Microsoft Certified Trainer" und "Oracle Certified Associate" und hat die ComptiaCTT+ Prüfung absolviert.
Webseite:
- http://www.marco-skulschus.de
- http://de.wikipedia.org/wiki/Marco_Skulschus
Referenzkurse:
- Statistik - Deskriptive und Induktive Statistik
Zusätzliche Informationen
Clusteranalyse