Beschreibung

Kursart

Intensivseminar
Niveau

Anfänger
Methodik

Inhouse

Unterrichtsstunden

24h
Dauer

3 Tage
Beginn

Oktober

Anfänger, Fortgeschrittene, Data-Science, Python

Die dreitägige Schulung Data Mining mit Python führt in die Grundlagen und die Verwendung von Python zum Data Mining ein. Das Training Data Mining mit Python vermittelt nicht nur das theoretische Verständnis, sondern auch die praktische Anwendung für wichtige der im Data Mining eingesetzten Verfahren. Sie lernen grundlegende Schritte mit Python im Bereich Data Mining, um selbständig erste Data Mining Analysen durchzuführen. Ein Schwerpunkt hierbei ist das für Data Science entwickelte Python Paket pandas. Die mit diesem Paket erzeugten data frames entsprechen den in der statistischen Programmiersprache R üblichen data.frames und ermöglichen einen wesentlich höheren Datendurchsatz. Für die Visualisierung der Ergebnisse wird das Paket matplotlib eingesetzt. Sie werden auch erfahren, wie weitergehende Algorithmen und Methoden in Python zu finden sind, um das Wissen nach dem Seminar fortlaufend erweitern zu können. Sie erhalten einen Überblick über verwendete Algorithmen aus dem Machine Learning, welche in Python umgesetzt werden. Sie arbeiten überwiegend selbständig mit Unterstützung des Trainers, um das Erlernte in den Übungen direkt umzusetzen und anzuwenden.

Standorte und Zeitplan

Inhouse

Beginn

OktoberAnmeldung möglich

Hinweise zu diesem Kurs

Welche Ziele werden in diesem Kurs verfolgt?

Die Teilnehmer erhalten einen Überblick über Python und die Entwicklungsumgebung Spyder aus der Anaconda distribution und können erste Analysen mit Python im Data Mining umsetzen. Die Schulung zielt darauf, die Einstiegshürde für die Anwendung von Python im Data Science zu nehmen, so dass die Teilnehmer überwiegend mit den eigenen Laptops und der Unterstützung des Trainers in Python arbeiten, um das Erlernte direkt umzusetzen und anzuwenden. Ein selbstständiges Arbeiten als data scientist wird ermöglicht, indem die Konzepte von Python vermittelt werden. Möglichkeiten weitergehende Algorithmen und Methoden zu finden werden aufgezeigt, um das Erlernte nach dem Seminar durch stetige Anwendung zu erweitern. Ein Überblick über bekannte Algorithmen im Machine Learning wird gegeben und die Teilnehmer können die verschiedenen Algorithmen voneinander differenzieren und in Python benutzen.

An wen richtet sich dieser Kurs?

Datenanalysten und zukünftige Data Scientists, welche eine Vertiefung in wichtige Machine Learning Algorithmen erhalten wollen oder die die Syntax der Programmiersprache R kennenlernen wollen, um R-Skripte für Data-Mining-Analysen schreiben zu können

Voraussetzungen

Grundlegende Kenntnisse in Python werden nicht vorausgesetzt, sind jedoch hilfreich. Alternativ wäre auch die Erfahrung in einer anderen Programmiersprache sehr förderlich, um Konzepte wie Variable, Variablenzuweisung, Funktionsaufruf und den Unterschied zwischen Ganzzahl und Dezimalzahl bereits zu kennen. Ein Basiswissen von grundlegenden statistischen Begriffen wie Mittelwert, Median, Perzentil, Normalverteilung, lineare Regression ist sehr empfehlenswert, um den Inhalten besser folgen zu können.

Qualifikation

Schulungszertifikat mit den Seminarinhalten

Worin unterscheidet sich dieser Kurs von anderen?

In den konkreten Beispielen und praktischen Übungen, welche selbstständig mit Unterstützung des Trainers bearbeitet werden, werden die vorhandenen Kenntnisse über die Programmiersprache Python dahingehend ausgebaut, dass eine praktische Umsetzung und ein selbständiges Arbeiten im Bereich data science ermöglicht wird. Ein durchgehendes Datenbeispiel wird verwendet, um die wichtigsten Bibliotheken zu behandeln, welche in umfangreichen Übungen trainiert werden. Die Praxisbeispiele und Übungsaufgaben erfolgen mit der Programmiersprache Python und der Entwicklungsumgebung Spyder. Hierfür sollte die Python Distribution Anaconda auf dem eigenen Laptop installiert sein.

Welche Schritte folgen nach der Informationsanfrage?

Sie erhalten innerhalb von 1-3 Werktagen die Information, wie Sie den gewünschten Kurs online auf der Webseite des Seminaranbieters www.statistik-seminare.de buchen können.

Fragen & Antworten

Ihre Frage hinzufügen

Unsere Berater und andere Nutzer werden Ihnen antworten können

Wer möchten Sie Ihre Frage beantworten?

Alle
Studierende
Bildungszentrum

Geben Sie Ihre Kontaktdaten ein, um eine Antwort zu erhalten

Es werden nur Ihr Name und Ihre Frage veröffentlicht.

Meinungen

Themen

Data Mining
Python
Spyder
Pandas
Pickle
Matplotlib
Visualisierung
Supervised learning
Unsupervised learning
Reinforcement learning
Lineare Regression
Logistische Regression
Entscheidungsbäume
Random forest
Support Vector Machine
K-means
Kerndichteschätzer
Data science
Datamining
Machine Learning

Dozenten

Jan Köhler

Data Science

Technischer Projektleiter: Bosch Center for Artificial Intelligence Forschung an neuesten Technologien für Data Science, Machine Learning, Deep Learning mehrere wissenschaftliche Publikationen in internationalen Journals 2015: Harold W. Kuhn best paper award Hält neun Patente/Patentanmeldungen im Bereich Data Science/Machine Learning Zuvor Data Scientist in verschiedenen Stufen eines Data Mining Projekts (Beratung bis Implementierung mit R, Python, Matlab Seit 2012 Trainer für Data Science Master of Science in Statistik und Dipl.-Kfm. (technisch, Schwerpunkt: Operations Research)

Inhalte

Grundkenntnisse für Data Mining mit Python:

Pakete installieren und laden
Hilfe und weiterführende Informationen finden

Einführung:

Datenstrukturen in Python (tuples, list, dictionaries, strings)
Installieren von neuen Paketen
Klassen, Funktionen
Entwicklungsumgebungen (Spyder)

Datenverarbeitung:

Einführung in das Data Science Paket pandas
Indexierung und Slicing eines DataFrames
Erzeugen und Ändern von DataFrames
Statistische Informationen über die Daten ableiten
Umgang mit fehlenden Werten
Datentypen konvertieren

Daten einlesen und grundlegende Statistiken:

Grundlegende, deskriptive Statistiken
Kontingenztafeln erstellen
Daten aus verschiedenen Formaten (csv, xlsx, txt) einlesen und schreiben
Daten in das binäre Python Format pickle schreiben und lesen

Visualisierung:

Grundlegende Visualisierungen (Scatterplot, Linienplot, Barplot, Histogram) mit dem Paket matplotlib
Anpassung und Individualisierung von Grafiken
Grafiken mit dem Paket pandas erzeugen
Speichern von Grafiken

Überblick über Machine Learning:

Einführung in Machine Learning (Supervised – Unsupervised Learning. Overfitting, cross-validation)
Grundlegendes Konzept von den Algorithmen Support Vector Machine (SVM), Random Forest und K-means
Modelle der Algorithmen in Python erstellen
Ergebnisse validieren

Detaillierte Umsetzung der Algorithmen Entscheidungsbaum und Logistische Regression:

Grundlagen des Algorithmus
Train-Test Split der Daten
Ein Model in Python erstellen
Validieren der Ergebnisse (u.a. confusion matrix, sensitivity, accuracy)
Hyperparameter im Training
cross-validation

Verwandte Kategorien

Kontakt

Data Mining mit Python (3tägig)

Fragen & Antworten

Meinungen

Themen

Inhalte

Fügen Sie ähnliche Kurse hinzu und vergleichen Sie sie, um eine bessere Auswahl zu treffen.