Clusteranalyse

Comelio GmbH
In München, Hamburg, Frankfurt Am Main und an 7 weiteren Standorten

1.550 
Möchten Sie den Bildungsanbieter lieber direkt anrufen?
030 8... Mehr ansehen

Wichtige informationen

  • Intensivseminar berufsbegleitend
  • Anfänger
  • An 10 Standorten
  • 15 Lehrstunden
  • Dauer:
    2 Tage
Beschreibung

Statistik - Clusteranalyse                                                      

Wichtige informationen
Veranstaltungsort(e)

Wo und wann

Beginn Lage
auf Anfrage
Berlin
Goethestr. 34, 13086, Berlin, Deutschland
Plan ansehen
auf Anfrage
Dresden
Rosenstraße 36, 01067, Sachsen, Deutschland
Plan ansehen
auf Anfrage
Düsseldorf
Stadttor 1, Nordrhein-Westfalen, NRW, Deutschland
Plan ansehen
auf Anfrage
Frankfurt Am Main
Mainzer Landstraße 50, 60325, Hessen, Deutschland
Plan ansehen
auf Anfrage
Hamburg
Stadthausbrücke 1-3, 20355, Hamburg, Deutschland
Plan ansehen
Alle ansehen (10)

Meinungen

Zu diesem Kurs gibt es noch keine Meinungen

Was lernen Sie in diesem Kurs?

Grundlagen der StatistikUnvollständige Clusteranalyse
Ähnlichkeit und Unähnlichkeit
Nächste-Nachbarn- und Mittelwertverfahren
K-Means-Verfahren
Latente Profilanalyse
Latent-Gold-Ansatz

Themenkreis

Kurslevel:
Einsteiger

Zielgruppe:
Datenanalysten

Voraussetzungen:
Grundlagen der Statistik

Methode:
Vortrag mit Beispielen und Übungen.

Seminarziele:
Unter Clusteranalyse versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die gefundenen Ähnlichkeitsgruppen können hierarchisch oder agglomerativ sein, also Untergruppen oder Teilgruppen in Gruppen kennzeichnen. Die Clusteranalyse ist eine wichtige Disziplin des Data-Mining, dem Analyseschritt des Knowledge Discovery in Databases Prozesses. Die zahlreichen Algorithmen unterscheiden sich vor allem in ihrem Ähnlichkeits- und Gruppenbegriff, ihrem Cluster-Modell, ihrem algorithmischen Vorgehen und der Toleranz gegenüber Störungen in den Daten. Dieses Seminar stellt gängige Cluster-Techniken theoretisch und mit Hilfe von praktischen Übungen ausführlich dar. Sie werden dadurch in die Lage versetzt, die Eigenschaften und damit auch Vor- und Nachteile verschiedener Verfahren zu kennen und selbstständig eine Cluster-Analyse durchzuführen.

Themen:
A. Unvollständige Clusteranalyse
Dauer:0.5 Tage
Modell der multiplen Korrespondenzanalyse: Zusammenhangsmatrix, Berechnung von Eigenwerten, Faktorladungen und Koordinatenwerten, Modellprüfgrößen - Nichtmetrische und mehrdimensionale Skalierung: Aufgabenstellung und Ähnlichkeitsmessung, Schätzalgorithmus, Dimensionszahl - Hauptkomponenten- und Faktorenanalyse

B. Ähnlichkeit und Unähnlichkeit
Dauer:0.25 Tage
Dichotome Variablen - Nominale Variablen - Ordinale Variablen - Metrische Variablen

C. Nächste-Nachbarn- und Mittelwertverfahren
Dauer:0.5 Tage
Complete Linkage: Der hierarchisch-agglomerative Algorithmus, Hierarchische Darstellung von Ähnlichkeitsbeziehungen, Clusterzahl, Beurteilung und Güteprüfung - Single-Linkage - Verallgemeinerung

D. K-Means-Verfahren
Dauer:0.25 Tage
Modellansatz - Clusteranzahl - Ausreißer - Validitätsprüfung - Alternative Startwerte - Gemischtes Missniveau

E. Latente Profilanalyse
Dauer:0.25 Tage
Modellansatz - Prüfgrößen - Klassenzahl - Überlappung - Latente Klassen für unterschiedliche Skalen

F. Latent-Gold-Ansatz
Dauer:0.25 Tage
Modellansatz der Latent-Cluster-Analyse - Erweiterung mit Kovariaten - Parameterschätzungen - Statistiken und Tests zur Modellanpassung

Unsere dozenten
Unser Statistik- und Data-Mining-Trainer Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken und als Business Intelligence-Berater. Zu seinen Kunden zählen Marktforschungsunternehmen oder Behörden wie der Deutsche Bundesrat sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung.

Veröffentlichungen:

  • "Grundlagen empirische Sozialforschung" (Comelio Medien, ISBN 978-3-939701-23-1)

  • "System und Systematik von Fragebögen" (Comelio Medien, ISBN 978-3-939701-26-2)

  • "Oracle SQL" (Comelio Medien, ISBN 978-3-939701-41-5)

  • "SQL Server 2012: Data Mining und multivariate Verfahren" (Comelio Medien, ISBN 978-3-939701-85-9)

  • "SQL und relationale Datenbanken" (Comelio Medien, ISBN 978-3-939701-52-1)

Erfahrung:
Projekte: Als Berater und Projektleiter konzipiert Herr Skulschus Business Intelligence-Systeme auf Basis von OLAP und Data Warehouse-Technologien mit MS SQL Server und Oracle mit Berichtskomponenten im Intranet oder MS Excel, statistische Analysen und Data Mining-Modulen. Je nach Aufgabe setzt er R, IBM SPSS oder Minitab ein.

Forschung: Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

Zertifizierung:
Marco Skulschus ist zertifiziert als "Microsoft Certified Trainer" und "Oracle Certified Associate" und hat die ComptiaCTT+ Prüfung absolviert.

Webseite:

  • http://www.marco-skulschus.de

  • http://de.wikipedia.org/wiki/Marco_Skulschus



Referenzkurse:
  • Statistik - Deskriptive und Induktive Statistik

Zusätzliche Informationen

Unter Clusteranalyse versteht man Verfahren zur Entdeckung von Ähnlichkeitsstrukturen in Datenbeständen. Die gefundenen Ähnlichkeitsgruppen können hierarchisch oder agglomerativ sein, also Untergruppen oder Teilgruppen in Gruppen kennzeichnen. Die Clusteranalyse ist eine wichtige Disziplin des Data-Mining, dem Analyseschritt des Knowledge Discovery in Databases Prozesses. Die zahlreichen Algorithmen unterscheiden sich vor allem in ihrem Ähnlichkeits- und Gruppenbegriff, ihrem Cluster-Modell, ihrem algorithmischen Vorgehen und der Toleranz gegenüber Störungen in den Daten. Dieses Seminar stellt gängige Cluster-Techniken theoretisch und mit Hilfe von praktischen Übungen ausführlich dar. Sie werden dadurch in die Lage versetzt, die Eigenschaften und damit auch Vor- und Nachteile verschiedener Verfahren zu kennen und selbstständig eine Cluster-Analyse durchzuführen.