PROKODA Gmbh

MOC 20775 Performing Data Engineering on Microsoft HDInsight

PROKODA Gmbh
In Nürnberg, Hamburg, Hannover und 1 weiterer Standort

Preis auf Anfrage
Möchten Sie den Bildungsanbieter lieber direkt anrufen?

Wichtige informationen

Tipologie Seminar
Ort An 4 Standorten
Beginn nach Wahl
Beschreibung

Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen, Kenntnisse über gängige statistische Methoden und Best Practices für die Datenanalyse, Grundkenntnisse über das Microsoft-Windows-Betriebssystem und seine Kernfunktionalität, praktische Erfahrung mit relationalen Datenbanken.

Einrichtungen (4)
Wo und wann
Beginn Lage
nach Wahl
nach Wahl
Hamburg
Hamburg, Deutschland
nach Wahl
nach Wahl
Hannover
Niedersachsen, Deutschland
nach Wahl
nach Wahl
München
Bayern, Deutschland
nach Wahl
nach Wahl
Nürnberg
Bayern, Deutschland
Beginn nach Wahl
nach Wahl
Lage
Hamburg
Hamburg, Deutschland
Beginn nach Wahl
nach Wahl
Lage
Hannover
Niedersachsen, Deutschland
Beginn nach Wahl
nach Wahl
Lage
München
Bayern, Deutschland
Beginn nach Wahl
nach Wahl
Lage
Nürnberg
Bayern, Deutschland

Zu berücksichtigen

· Welche Ziele werden in diesem Kurs verfolgt?

Planung und Implementierung von Data Workflows auf HDInsight.

· An wen richtet sich dieser Kurs?

Zielgruppe sind Dateningenieure, Datenarchitekten, Datenwissenschaftler und Entwickler.

Fragen & Antworten

Teilen Sie Ihre Fragen und andere User können Ihnen antworten

Was lernen Sie in diesem Kurs?

Microsoft
Engineering
Microsoft
Engineering

Themenkreis

Einführung in HDInsight:

  • Big Data

  • Hadoop

  • MapReduce

  • HDInsight

Bereitstellung von HDInsight-Clustern:

  • HDInsight-Clustertypen

  • Verwaltung von HDInsight-Clustern

  • Verwaltung von HDInsight-Clustern mit PowerShell

Berechtigung von Benutzern für den Zugriff auf Ressourcen

Laden von Daten in HDInsight:

  • HDInsight-Speicher

  • Tools für das Laden von Daten

  • Performance und Verlässlichkeit

Troubleshooting von HDInsight:

  • Analyse von HDInsight-Protokollen

  • YARN-Protokolle

  • Heap Dumps

  • Operations Management Suite

Implementierung von Batch-Lösungen:

  • Apache-Hive-Speicher

  • Abfragen mit Hive und Pig

  • Operationalisieren von HDInsight

Design von Batch-ETL-Lösungen für Big Data mit Spark
Datenanalyse mit Spark SQL
Datenanalyse mit Hive und Phoenix
Azure Stream Analytics
Spark Streaming mithilfe der DStream API
Entwicklung von Lösungen für die Echtzeitverarbeitung von Big Data mit Apache Storm