Statistik und Datenanalyse mit R (3 Tage)

Seminar

In München

1.420 € zzgl. MwSt.

Beschreibung

  • Kursart

    Intensivseminar

  • Niveau

    Anfänger

  • Ort

    München

  • Unterrichtsstunden

    24h

  • Dauer

    3 Tage

Dieser Kurs führt in die Programmiersprache R ein und erläutert Begriffe aus der Statistik und deren praktischen Umsetzung in R. Die Datenstruktur data.table wird behandelt. Damit können wichtige Grundlagen der Datenanalyse umgesetzt werden.

R ist eine weit verbreitete Sprache für Datenanlyse und statistische Fragestellungen. Sie wird in der Wissenschaft, Industrie und Wirtschaft verwendet, z.B. in der Versicherungsbranche, im Finanzbereich oder der medizinischen Statistik. Weltweit verwenden etwa zwei Millionen Benutzer die Programmiersprache R.

Der Fokus des Kurses ist die direkte Umsetzung in R und die das eigenständige Schreiben von Code. Erklärungen sind anschaulich gehalten und enthalten nur das nötigste an mathematischen Formeln.

Behandelte Themen in dieser Schulung:
* Einführung in R
* Wichtigste Datenstrukturen in R
* Statistiken in R (Mittelwert, Median, Quantile, Varianz,...)
* Kreuztabelle & bedingte Wahrscheinlichkeiten
* Statistische Verteilungen und Zufallszahlen
* Grundlagen eines DataTables
* Weitere Datenanalysen
* Bivariate Deskriptivstatistik
* Datenvisualisierung mit ggplot2
* Statistische Tests
* Lineare Regression in R

Standorte und Zeitplan

Lage

Beginn

München (Bayern)
Karte ansehen

Beginn

auf Anfrage

Hinweise zu diesem Kurs

Sie lernen die Grundlagen von R kennen, z.B. Variablen zuweisen, Pakete installieren und laden. Wie verwenden die Entwicklungsumgebung RStudio. Es werden wichtige Datentypen in R (vector, factor array) erläutert und wir zeigen Ihnen, wie Sie einfache deskriptive Statistiken mit R schnell berechnen können. Wir gehen auf die wichtigsten Lagemaße (Quantile, Median, Mittelwert) und Streuungsmaße (Standard Abweichung, Varianz) in der Statistik ein und erläutern die Berechnung dieser in R. Zudem werden bedingte Wahrscheinlichkeiten und Kreuz- und Häufigkeitstabellen erläutert.

In diesem Kurs lernen Sie bekannte statistische Verteilungen kennen, verstehen was Dichtefunktionen und Verteilungsfunktionen sind und wie man Zufallszahlen aus einer Verteilung ziehen kann.

In der deskriptiven, bivariaten Statistik führen wir Korrelationsanalysen durch und behandeln die gängigen Korrelationsmaße "Korrelationskoeffizient nach Pearson" und "Rangkorrelation nach Spearman".

Für die Erstellung von Grafiken und Visualisierungen werden die Pakete ggplot2 und die zugrundelegende grammar of graphics behandelt.

Die Datenanalysen werden mit dem Paket data.table gemacht. Es ist für größere Datenmengen effizienter als die tidyverse-Pakete (tidyverse, dplyr). Dieser Kurse behandelt nicht die tidyverse-Pakete.

Die Schulung ist für Teilnehmer gedacht mit geringer oder keiner Erfahrung in Statistik, der Analyse von Daten und der Programmiersprache R.
Das Ziel des Kurses ist es die Grundlagen der Datenanalyse und statistische Grundlagen zu erlernen. Kursteilnehmer beschäftigen sich idealerweise in ihrer Arbeit mit der Datenanylse oder wollen sich dahingehend weiterbilden.

Kenntnisse in R oder einer anderen Programmiersprache werden nicht vorausgesetzt. Notwendig sind jedoch grundlegende Kenntnisse im Umgang mit Daten, z.B. durch einer BI-Software oder mit Excel, damit Konzepte wie das spaltenweise Berechnen bekannt sind.

Vorausgesetzt werden allgemeine Computerkenntnisse und mathematische Grundkenntnisse (Grundrechenarten, Summenzeichen, Ablteiung, Integral, Koordinatensystem zum Plotten, Was ist eine Funktion, ...)

Kenntnisse im Lesen der Englischen Sprache sind hilfreich.

* Die Schulungsleiter kommen aus der Praxis und haben langjährige praktische Erfahrung in dem Gebiet.

* Unsere Kurse sind vollständig ausgearbeitet. Die Schulung hat eine klare Struktur. Die Theorie wird anhand von Folien erläutert, welche auch als Nachschlagemöglichkeit verwendet werden können. Zu jeder Übungsaufgabe gibt Lösungen (fertigen Code,) der einen (oder mehrere) Lösungswege darstellt. Fragen, auch über das Thema hinausgehende, werden am Flipchart erläutert. Falls wir eine Frage nicht spontan oder nur unzureichend am Flipchart beantworten können, erarbeiten wir neue Unterlagen und versenden diese nach dem Seminar. Unsere Seminare sind KEINE Live-Coding Sessions des Kursleiters, in denen die Kursteilnehmer hauptsächlich damit beschäftigt sind, den Code des Dozenten abzutippen.

* Bisherige Schulungsteilnehmer empfehlen uns weiter uns sind sehr zufrieden mit unseren Kursen (siehe unsere ProvenExpert Bewertungen https://www.provenexpert.com/enable-ai/)

* Der Schwerpunkt der Schulung liegt in der praktische Umsetzung mit vielen Übungsaufgaben (und Lösungen). Dabei erhoffen wir uns, dass Sie die gängigen Fehler schon während des Kurses machen können (um sie hinterher zu vermeiden :)

* Die Gruppengröße ist auf max. 10 Teilnehmer beschränkt. Damit können wir garantieren, dass wir jede Frage individuell beantworten können.

Unsere Seminare finden ab 3 Teilnehmern statt. Die Gruppengröße ist auf max. 10 Teilnehmer beschränkt.

Die Widerrufsbelehrung können Sie unter https://www.enable-ai.de/widerrufsrecht/ finden. Buchungen können bis 14 Tage vor Kursbeginn kostenlos storniert werden. 7 bis 14 Tage vor Kursbeginn fallen 50% Stornokosten an. Bei einer Stornierung von weniger als 7 Tagen vor Kursbeginn müssen wir Ihnen die gesamte Kursgebühr zzgl. MwSt in Rechnung stellen. Sie haben bei Stornierung aber die Möglichkeit das (oder ein anderes) bereits stattfindendes Seminar kostenfrei (bzw. nach Bezahlung des Differenzbetrages) zu besuchen. Natürlich kann auch kurzfristig ein Kollege / eine Kollegin Sie im Seminar vertreten.

Sie können uns gerne kontaktieren (info@enable-ai.de). Gemeinsam können wir feststellen, ob der Kurs für Sie geeignet ist, oder ob zur Erreichung Ihrer Ziele ein anderer Kurs aus unserem Angebot an Data Science, Machine Learning bzw. Deep Learning Schulungen besser passen würde. Falls nicht, haben wir ggfs. den ein oder anderen Hinweis, wie Sie ohne unsere Dienstleistungen im Bereich Künstlicher Intelligenz weiterkommen können.

Die Übungsaufgaben sind meistens Coding Aufgaben, d.h. Sie sollen entweder Code-Snippets selbst schreiben oder Lücken im Code ausfüllen. Das Lückenausfüllen schult auch das Lesen und Verstehen von Code. Die Schwierigkeit und Umfang der Aufgaben ist so gestaltet, dass die wichtigsten Übungen von allen Kursteilnehmern erfolgreich (in der dafür vorgegebenen Zeit) bearbeitet werden können. Es gibt Übungsaufgaben unterschiedlichen Schwierigkeitsgrades, so dass Teilnehmer mit Vorwissen oder schnellere Teilnehmer zusätzliche Aufgaben zur Verfügung stehen. Desweiteren haben wir in einigen Kapiteln kurze Kontrollfragen zum theoreitschen Teil vorbereitet.

Jeder Block (meist 90 Minuten lang) umfasst eine oder mehrere Einheiten aus Theorie und Praxis. Die Theorieeinheit erläutert das nötige Wissen um die Übungsaufgaben verstehen und eigenständig bearbeiten zu können. Wir vermeiden es, Ihre Zeit mit langen, wissenschaftlich theoretischen Ausschweifungen zu verschwenden und beschränken uns stattdessen auf die notwendige Theorie, die zu einem besseren Verständnis und Intuition verhilft. Der Schwerpunkt der Schulung ist die Praxis, d.h. Codeschreiben und das Lösen von Verständnisaufgaben stehen im Mittelpunkt. Wir beantworten jederzeit gerne Fragen von Kursteilnehmern. Aufkommende Fragen während der Übungsaufgaben werden individuell beantwortet. Fragen, die alle Teilnehmer interessieren könnten, werden nach dem Praxisblock ausführlich erläutert. Das Skript, welches neben den Folien mit der vorgestellten Theorie und mach weiterführenden Erklärungen, auch den Code umfasst, erhalten Sie in digitaler (als .pdf) und gedruckter Version. Der Code und die Musterlösung der Aufgaben gibt es digital.

Fragen & Antworten

Ihre Frage hinzufügen

Unsere Berater und andere Nutzer werden Ihnen antworten können

Wer möchten Sie Ihre Frage beantworten?

Geben Sie Ihre Kontaktdaten ein, um eine Antwort zu erhalten

Es werden nur Ihr Name und Ihre Frage veröffentlicht.

Meinungen

Themen

  • Einführung in R
  • Wichtige Datenstrukturen in R
  • Statistiken in R
  • Kreuztabelle
  • Bedingte Wahrscheinlichkeiten
  • Statistische Verteilung
  • Zufallszahlen
  • Grundlagen eines DataTables in R
  • Datenanalysen
  • Bivariate Deskriptivstatistik
  • Datenvisualisierung mit ggplot2
  • Statistische Tests
  • Lineare Regression in R

Dozenten

Jan Köhler

Jan Köhler

Deep Learning, Machine Learning, Data Science, KI, Python, R

Vom Hintergrund Statistiker und Wirtschaftsingenieur hat er über 7 Jahre an den neuesten Technologien in Machine Learning, Deep Learning und Data Science im Bosch Center for Artificial Intelligence (BCAI) gearbeitet, hat in der Praxis bei über 25 Patentanmeldungen (meist als Haupterfinder) beigetragen und ist Mitautor bei Veröffentlichungen im Bereich Machine Learning, Medizinstatistik bzw. Operations Research. In vielen Praxisprojekten unterstützte er bisher als Data Scientist bei den verschiedenen Stufen eines Data Mining Projekts und hat bisher über 300 Teilnehmer geschult.

Inhalte

Behandelte Themen in dieser Schulung:
* Einführung in R
* Wichtigste Datenstrukturen in R
* Statistiken in R (Mittelwert, Median, Quantile, Varianz,...)
* Kreuztabelle & bedingte Wahrscheinlichkeiten
* Statistische Verteilungen und Zufallszahlen
* Grundlagen eines DataTables
* Weitere Datenanalysen
* Bivariate Deskriptivstatistik
* Datenvisualisierung mit ggplot2
* Statistische Tests
* Lineare Regression in R

Statistik und Datenanalyse mit R (3 Tage)

1.420 € zzgl. MwSt.