Microsoft Azure

Perform Data Engineering on Microsoft HD Insight

Ihr Nutzen

Dieses Seminar richtet sich an Daten-Analysten, die mit HDInsight Cluster, Spark, Stream Analytics Big-Data Workflows implementieren möchten.

Inhalte

PDF Konfigurator

    1. Tag

    • Einführung in HDInsight
    • Was ist Big Data?
    • Einführung in Hadoop
    • Arbeiten mit der MapReduce Funktion
    • Einführung in HDInsight
    • Bereitstellen von HDInsight
    • HDInsight Cluster Types
    • Verwaltung über das Azure Portal und Azure PowerShell
    • Benutzer und Berechtigungen
    • Domain-Joined und Non-Domain Joined Clusters
    • Verwaltung über die Azure PowerShell
    • Das Ambari Management UI
    • Das Ranger Admin UI
    • Hive Polices
    • Daten in HDInsight laden
    • Speicher fpr HDInsight
    • Azure Blob und Azure Data Lake Storage
    • Verwenden der Data Loading Tools

    2. Tag

    • Troubleshooting und Logging in HDInsight
    • HDInsight Logs
    • YARN Logs
    • Heap Dumps
    • OMS
    • Batch Solutions
    • Apache Hive Storage
    • Data Queries mit Hive und Pig
    • Batch ETL Solutions mit Spark
    • Was ist Spark?
    • ETL mit Spark

    3. Tag

    • Daten mit Spark SQL analysieren
    • Interative und interaktive Abfragen
    • Verwenden von Zeppelin und Livy
    • Daten mit Hive und Phoenix analysieren
    • Interaktive Abfragen mit interactive hive
    • Interactive Processing mit Apache Phoenix

    4. Tag

    • Stream Analytics
    • Verarbeiten von Streaming Daten
    • Verwalten von Stream Analytics Jobs
    • Implmentierung von Streaming Solutions
    • Aufbau und Bereitstellung eines Kafka Clusters
    • Storm Cluster, Kafka Producer und Power BI Dashboards
    • Publizieren und Nutzen des Kafka Clusters
    • Verwenden von HBase für Storage und Abfrage

    5. Tag

    • Real Time Processing Solutions mit Apache Storm
    • Streaming von Daten mit Storm
    • Storm Topologies
    • Spark Streaming Applications erstellen
    • Arbeiten mit Spark Streaming
    • Spark Structured Streaming Applications
    • Erstellen einer Spark Streaming Pipeline
    • Verwenden von DStreams

    Termine

    • 14.01.19, Innsbruck
    • 20.05.19, Innsbruck
    Ihr Wunschtermin ist nicht dabei?
    Mich bei Termingarantie benachrichtigen.

    Zielgruppe

    IT Professional

    Original-Seminar

    MOC20775 mit digitalen Seminarunterlagen.

    Voraussetzungen

    Kenntnisse des Windows Betriebssystem von Datenanalyse und Statistik und Kenntnisse der Programmiersprache R.

    Dauer und Investition

    Seminardauer: 5 Tag(e)
    € 2350,- pro Teilnehmer excl. MwSt.

    Individuelle Firmenseminare
    Frühbucher-Bonus möglich
    Mehr Teilnehmer?
    Punktekarte

    Beschreibung

    Microsoft Azure bietet eine Vielzahl von Daten-Analyse Lösungen in der Cloud an.

    Hinweis

    MOC20775,

    Zertifizierungen

    • 70-775 Hadoop in the Cloud