Kategoriale Datenanalyse mit R

Seminar

In Frankfurt Am Main, Hamburg, München und an 7 weiteren Standorten

1.600 € inkl. MwSt.

Beschreibung

  • Kursart

    Intensivseminar berufsbegleitend

  • Niveau

    Anfänger

  • Ort

    An 10 Standorten

  • Unterrichtsstunden

    22h

  • Dauer

    3 Tage

Statistik - Kategoriale Datenanalyse mit R                                                    

Standorte und Zeitplan

Lage

Beginn

Berlin
Karte ansehen
Goethestr. 34, 13086

Beginn

auf Anfrage
Dresden (Sachsen)
Karte ansehen
Rosenstraße 36, 01067

Beginn

auf Anfrage
Düsseldorf (Nordrhein-Westfalen, NRW)
Karte ansehen
Stadttor 1

Beginn

auf Anfrage
Frankfurt Am Main (Hessen)
Karte ansehen
Mainzer Landstraße 50, 60325

Beginn

auf Anfrage
Hamburg
Karte ansehen
Stadthausbrücke 1-3, 20355

Beginn

auf Anfrage
Munster (Niedersachsen)
Karte ansehen

Beginn

auf Anfrage
München (Bayern)
Karte ansehen
Baaderstraße 88-90, 80469

Beginn

auf Anfrage
Stuttgart (Baden-Württemberg)
Karte ansehen
Königstraße 10, 70173

Beginn

auf Anfrage
Wien (Australien)
Karte ansehen
Mariahilfer Straße 123, 1060

Beginn

auf Anfrage
Zürich (Schweiz)
Karte ansehen
Seefeldstrasse 69, 8008

Beginn

auf Anfrage
Alle ansehen (10)

Fragen & Antworten

Ihre Frage hinzufügen

Unsere Berater und andere Nutzer werden Ihnen antworten können

Wer möchten Sie Ihre Frage beantworten?

Geben Sie Ihre Kontaktdaten ein, um eine Antwort zu erhalten

Es werden nur Ihr Name und Ihre Frage veröffentlicht.

Meinungen

Themen

  • Grundlegende StatistikkenntnisseKategoriale Daten
  • Analyse von 2 Variablen
  • Analyse von n Variablen
  • Logit Modell und die logistische Regression
  • Assoziationsmodelle

Inhalte

Kurslevel:
Einsteiger

Zielgruppe:
Datenanalysten

Voraussetzungen:
Grundlegende Statistikkenntnisse

Methode:
Vortrag mit Beispielen und Übungen.

Seminarziele:
Kontingenztabellen oder Kreuztabellen sind Tabellen, die die absoluten oder relativen Häufigkeiten von Kombinationen bestimmter Merkmalsausprägungen enthalten. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Dieses Seminar zeigt Ihnen, wie Sie mit R kategoriale Daten in solchen Kontingenztabellen analysieren können. Dabei lernen Sie zunächst die wesentlichen Konzepte von kategorialen Daten und ihren diskreten Verteilungen kennen. Danach sehen Sie, wie Sie Tabellen des Aufbaus 2x2 und IxJ visualisieren und analysieren können. Ein weiterer Teil des Seminars beschäftigt sich damit, Modelle für kategoriale Variablen abzuleiten. Dazu zählen das Log-Lineare Modell und das Allgemeine Lineare Modell sowie verschiedene Varianten des Assoziationsmodells. Das letzte Themengebiet ist dann die Analyse von Antwortvariablen mit Hilfe der Logistischen Regression. Die Beispiele werden in R und mit geeigneten R-Paketen vorgeführt und praktisch getestet.

Themen:
A. Kategoriale Daten
Dauer:0.25 Tage
Definition von kategorialen Daten - Verteilungen für kategoriale Variablen: die Binomial- und Multinomial-Verteilungen, die Poisson-Verteilung und die Hypergeometrische Verteilung - Typische Fragestellungen der induktiven Statistik - Statistische Modellierung für kategoriale Daten

B. Analyse von 2 Variablen
Dauer:0.5 Tage
2x2- und IxJ-Tabellen - Abhängigkeit und Unabhängigkeit - Vergleich der Verteilungen - Odds Ratio - Fisher-Test - Residualanalyse - Grafiken für 2 Variablen

C. Analyse von n Variablen
Dauer:0.5 Tage
Verbundene, bedingte und Randwahrscheinlichkeiten - Odds Ratio für 2x2 K Tabellen und höher-dimensionale Tabellen - Analyse von 2x2 K Tabellen - Unabhängigkeit bei 3 Variablen - Grafiken für n Variablen

D. Log-Lineare Modelle und das Allgemeine Lineare Modell
Dauer:0.75 Tage
LL Modell für 2 und 3 Variablen sowie im n-dimensionalen Fall - Modellanpassung und Modellauswahl - Graphen-Modelle - ALM und ihre Schätzung für verbundene Verteilung und die Randverteilungen

E. Logit Modell und die logistische Regression
Dauer:0.25 Tage
Logit-Modell für binäre Antwortvariable - Nominale und ordinale Skala - Mehrstufige Antwortvariable

F. Assoziationsmodelle
Dauer:0.75 Tage
Einführung in die Assoziationsmodelle - Reihen- und Spalten-Effekte - Modellanpassung und Modellauswahl - Assoziationsmodelle für n Variablen

Unsere dozenten

Unser Trainer für Statistik und Data-Mining mit R Marco Skulschus studierte in Wuppertal und Paris Ökonomie und arbeitet schon seit mehr als 10 Jahren als Dozent, Fachbuch-Autor zum Thema Datenbanken, Datenanalyse und als Berater für statistische Analyse mit R. Teilnehmer/innen seiner R-Seminare sind Betriebswirte / Volkswirtschaftler, Ingenieure und Doktoranden, die für Statistik und Data Mining R einsetzen wollen.

Veröffentlichungen:

  • "Grundlagen empirische Sozialforschung" (Comelio Medien, ISBN 978-3-939701-23-1)

  • "System und Systematik von Fragebögen" (Comelio Medien, ISBN 978-3-939701-26-2)

  • "Oracle SQL" (Comelio Medien, ISBN 978-3-939701-41-5)

  • "SQL Server 2012: Data Mining und multivariate Verfahren" (Comelio Medien, ISBN 978-3-939701-85-9)

  • "SQL und relationale Datenbanken" (Comelio Medien, ISBN 978-3-939701-52-1)

Erfahrung:
Projekte:
Als Berater konzipiert Herr Skulschus Analysesysteme auf Basis von relationalen Datenbanken und entwickelt dann statistische Modelle und Analysen mit R-Programmierung. Zu seinen Kunden zählen Marktforschungsunternehmen, Marketing-Abteilungen sowie Abteilungen für die Qualitätssicherung und Prozessoptimierung oder auch Forschungseinrichtungen.

Forschung:
Er leitete ein mehrjähriges Forschungsprojekt zur Entwicklung eines Fragebogensystems mit ontologie-basiertem Datenmodell und innovativen Frage-Antwort-Darstellungen. Förderung durch das BMWi und Zusammenarbeit mit verschiedenen Universitäten.

Webseite:

  • http://www.marco-skulschus.de

  • http://de.wikipedia.org/wiki/Marco_Skulschus



Referenzkurse:
  • Statistik mit R
  • Dummy

Zusätzliche Informationen

Kontingenztabellen oder Kreuztabellen sind Tabellen, die die absoluten oder relativen Häufigkeiten von Kombinationen bestimmter Merkmalsausprägungen enthalten. Kontingenz hat dabei die Bedeutung des gemeinsamen Auftretens von zwei Merkmalen. Diese Häufigkeiten werden ergänzt durch deren Randsummen, die die sogenannten Randhäufigkeiten bilden. Dieses Seminar zeigt Ihnen, wie Sie mit R kategoriale Daten in solchen Kontingenztabellen analysieren können. Dabei lernen Sie zunächst die wesentlichen Konzepte von kategorialen Daten und ihren diskreten Verteilungen kennen. Danach sehen Sie, wie Sie Tabellen des Aufbaus 2x2 und IxJ visualisieren und analysieren können. Ein weiterer Teil des Seminars beschäftigt sich damit, Modelle für kategoriale Variablen abzuleiten. Dazu zählen das Log-Lineare Modell und das Allgemeine Lineare Modell sowie verschiedene Varianten des Assoziationsmodells. Das letzte Themengebiet ist dann die Analyse von Antwortvariablen mit Hilfe der Logistischen Regression. Die Beispiele werden in R und mit geeigneten R-Paketen vorgeführt und praktisch getestet.

Kategoriale Datenanalyse mit R

1.600 € inkl. MwSt.