Kategoriale Datenanalyse mit R

Comelio GmbH
In Düsseldorf, Hamburg, Frankfurt Am Main und an 7 weiteren Standorten

1.600 
Möchten Sie den Bildungsanbieter lieber direkt anrufen?
030 8... Mehr ansehen

Wichtige informationen

  • Intensivseminar berufsbegleitend
  • Anfänger
  • An 10 Standorten
  • 22 Lehrstunden
  • Dauer:
    3 Tage
Beschreibung

Statistik - Kategoriale Datenanalyse mit R                                                    

Wichtige informationen
Veranstaltungsort(e)

Wo und wann

Beginn Lage
auf Anfrage
Berlin
Goethestr. 34, 13086, Berlin, Deutschland
Plan ansehen
auf Anfrage
Dresden
Rosenstraße 36, 01067, Sachsen, Deutschland
Plan ansehen
auf Anfrage
Düsseldorf
Stadttor 1, Nordrhein-Westfalen, NRW, Deutschland
Plan ansehen
auf Anfrage
Frankfurt Am Main
Mainzer Landstraße 50, 60325, Hessen, Deutschland
Plan ansehen
auf Anfrage
Hamburg
Stadthausbrücke 1-3, 20355, Hamburg, Deutschland
Plan ansehen
Alle ansehen (10)

Meinungen

Zu diesem Kurs gibt es noch keine Meinungen

Was lernen Sie in diesem Kurs?

Grundlegende StatistikkenntnisseKategoriale Daten
Analyse von 2 Variablen
Analyse von n Variablen
Log-Lineare Modelle und das Allgemeine Lineare Modell
Logit Modell und die logistische Regression
Assoziationsmodelle

Themenkreis

Kurslevel:
Einsteiger

Zielgruppe:
Datenanalysten

Voraussetzungen:
Grundlegende Statistikkenntnisse

Methode:
Vortrag mit Beispielen und Übungen.

Seminarziele:
Kontingenztabellen oder Kreuztabellen sind Tabellen, die die absoluten oder relativen Häufigkeiten von Kombinationen bestimmter Merkmalsausprägungen enthalten. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Dieses Seminar zeigt Ihnen, wie Sie mit R kategoriale Daten in solchen Kontingenztabellen analysieren können. Dabei lernen Sie zunächst die wesentlichen Konzepte von kategorialen Daten und ihren diskreten Verteilungen kennen. Danach sehen Sie, wie Sie Tabellen des Aufbaus 2x2 und IxJ visualisieren und analysieren können. Ein weiterer Teil des Seminars beschäftigt sich damit, Modelle für kategoriale Variablen abzuleiten. Dazu zählen das Log-Lineare Modell und das Allgemeine Lineare Modell sowie verschiedene Varianten des Assoziationsmodells. Das letzte Themengebiet ist dann die Analyse von Antwortvariablen mit Hilfe der Logistischen Regression. Die Beispiele werden in R und mit geeigneten R-Paketen vorgeführt und praktisch getestet.

Themen:
A. Kategoriale Daten
Dauer:0.25 Tage
Definition von kategorialen Daten - Verteilungen für kategoriale Variablen: die Binomial- und Multinomial-Verteilungen, die Poisson-Verteilung und die Hypergeometrische Verteilung - Typische Fragestellungen der induktiven Statistik - Statistische Modellierung für kategoriale Daten

B. Analyse von 2 Variablen
Dauer:0.5 Tage
2x2- und IxJ-Tabellen - Abhängigkeit und Unabhängigkeit - Vergleich der Verteilungen - Odds Ratio - Fisher-Test - Residualanalyse - Grafiken für 2 Variablen

C. Analyse von n Variablen
Dauer:0.5 Tage
Verbundene, bedingte und Randwahrscheinlichkeiten - Odds Ratio für 2x2 K Tabellen und höher-dimensionale Tabellen - Analyse von 2x2 K Tabellen - Unabhängigkeit bei 3 Variablen - Grafiken für n Variablen

D. Log-Lineare Modelle und das Allgemeine Lineare Modell
Dauer:0.75 Tage
LL Modell für 2 und 3 Variablen sowie im n-dimensionalen Fall - Modellanpassung und Modellauswahl - Graphen-Modelle - ALM und ihre Schätzung für verbundene Verteilung und die Randverteilungen

E. Logit Modell und die logistische Regression
Dauer:0.25 Tage
Logit-Modell für binäre Antwortvariable - Nominale und ordinale Skala - Mehrstufige Antwortvariable

F. Assoziationsmodelle
Dauer:0.75 Tage
Einführung in die Assoziationsmodelle - Reihen- und Spalten-Effekte - Modellanpassung und Modellauswahl - Assoziationsmodelle für n Variablen

Unsere dozenten

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen:

  • "Grundlagen empirische Sozialforschung" (Comelio Medien, ISBN 978-3-939701-23-1)

  • "System und Systematik von Fragebögen" (Comelio Medien, ISBN 978-3-939701-26-2)

  • "Oracle SQL" (Comelio Medien, ISBN 978-3-939701-41-5)

  • "SQL Server 2012: Data Mining und multivariate Verfahren" (Comelio Medien, ISBN 978-3-939701-85-9)

  • "SQL und relationale Datenbanken" (Comelio Medien, ISBN 978-3-939701-52-1)

Erfahrung:
Projekte:
Als Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.

Forschung:
Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

Webseite:

  • http://www.marco-skulschus.de

  • http://de.wikipedia.org/wiki/Marco_Skulschus



Referenzkurse:
  • Statistik mit R
  • Dummy

Zusätzliche Informationen

Kontingenztabellen oder Kreuztabellen sind Tabellen, die die absoluten oder relativen Häufigkeiten von Kombinationen bestimmter Merkmalsausprägungen enthalten. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Dieses Seminar zeigt Ihnen, wie Sie mit R kategoriale Daten in solchen Kontingenztabellen analysieren können. Dabei lernen Sie zunächst die wesentlichen Konzepte von kategorialen Daten und ihren diskreten Verteilungen kennen. Danach sehen Sie, wie Sie Tabellen des Aufbaus 2x2 und IxJ visualisieren und analysieren können. Ein weiterer Teil des Seminars beschäftigt sich damit, Modelle für kategoriale Variablen abzuleiten. Dazu zählen das Log-Lineare Modell und das Allgemeine Lineare Modell sowie verschiedene Varianten des Assoziationsmodells. Das letzte Themengebiet ist dann die Analyse von Antwortvariablen mit Hilfe der Logistischen Regression. Die Beispiele werden in R und mit geeigneten R-Paketen vorgeführt und praktisch getestet.