Må vi gemme en cookie?

Vi bruger cookies for at forbedre din oplevelse af vores hjemmeside, målrette indhold samt statistik. Læs mere om cookies

Kurser

Kursusadministration

Brug for hjælp?

  • Gregersensvej 8
  • 2630 Taastrup
Google MapsApple MapsRejseplanen
  • Forskerparken Fyn, Forskerparken 10F
  • 5230 Odense M
Google MapsApple MapsRejseplanen
  • Teknologiparken Kongsvang Allé 29
  • 8000 Aarhus C
Google MapsApple MapsRejseplanen
  • NordsøcentretPostboks 104
  • 9850Hirtshals
Google MapsApple MapsRejseplanen
  • Gammel Ålbovej 1
  • 6092Sønder Stenderup
Google MapsApple MapsRejseplanen
90 dages online e-learning

MOC On-Demand Performing Data Engineering on Microsoft HD Insight [20775]

Online undervisning når det passer dig – MOC On-Demand er en unik løsning til dig, der ønsker kursus på en fleksibel, tids- og omkostningseffektiv måde. Lær, hvordan du planlægger og implementerer Big Data workflows on HDInsigth. Du lærer desuden at implementere HDInsight Clusters, fejlfinde HDInsight, indlæse data i HDInsight, analysere data med Spark SQL samt håndtere brugeregodkendelser for at få adgang til ressourcer og meget mere.

Illustration af MOC On-Demand

Læringsform

MOC On-Demand kurserne kombinerer:
  • Læringsplan
  • Video i høj kvalitet
  • Præsentationer og officielt kursusmateriale
  • Live hands-on labs
  • Videnstjek
Du kan i eget tempo kan opbygge kompetencer i Microsoft-teknologier. Du kan du vælge mellem 90 eller 180 dages adgang til at fuldføre dit MOC On-Demand kursus.

Kurset er modulopdelt, så det er op til dig, om du vil tage hele kurset på en gang eller et modul ad gangen. Du kan tage dit kursus på kontoret, hjemme eller på farten.

Live hands-on labs
I modsætning til andre on-demand tilbud, hvor der tilbydes labs, vil du med MOC On-Demand få et levende, real-time miljø til hands-on træningen. Faktisk er det det samme Microsoft Labs Online miljø, der anvendes på vores tilstedeværelseskurser.

Videnscheck i slutningen af hvert modul, giver dig mulighed for at teste dit niveau, så du ved, om du er klar til at gå videre.

Når du tilmelder dig et On-Demand kursus, vil du modtage en mail med et link til online kurset og login-oplysninger. Her får du adgang til en side med din Learning Plan.

Video

 

Forudsætninger

In addition to their professional experience, students who attend this course should have:
  • Programming experience using R, and familiarity with common R packages
  • Knowledge of common statistical methods and data analysis best practices.
  • Basic knowledge of the Microsoft Windows operating system and its core functionality.
  • Working knowledge of relational databases.

Deltagerprofil

The primary audience for this course is data engineers, data architects, data scientists, and data developers who plan to implement big data engineering workflows on HDInsight.

Indhold

Module 1: Getting Started with HDInsight
  • What is Big Data?
  • Introduction to Hadoop
  • Working with MapReduce Function
  • Introducing HDInsight
Module 2: Deploying HDInsight Clusters
  • Identifying HDInsight cluster types
  • Managing HDInsight clusters by using the Azure portal
  • Managing HDInsight Clusters by using Azure PowerShell
Module 3: Authorizing Users to Access Resources
  • Non-domain Joined clusters
  • Configuring domain-joined HDInsight clusters
  • Manage domain-joined HDInsight clusters
Module 4: Loading data into HDInsight
  • Storing data for HDInsight processing
  • Using data loading tools
  • Maximising value from stored data
Module 5: Troubleshooting HDInsight
  • Analyze HDInsight logs
  • YARN logs
  • Heap dumps
  • Operations management suite
Module 6: Implementing Batch Solutions
  • Apache Hive storage
  • HDInsight data queries using Hive and Pig
  • Operationalize HDInsight
Module 7: Design Batch ETL solutions for big data with Spark
  • What is Spark?
  • ETL with Spark
  • Spark performance
Module 8: Analyze Data with Spark SQL
  • Implementing iterative and interactive queries
  • Perform exploratory data analysis
Module 9: Analyze Data with Hive and Phoenix
  • Implement interactive queries for big data with interactive hive.
  • Perform exploratory data analysis by using Hive
  • Perform interactive processing by using Apache Phoenix
Module 10: Stream Analytics
  • Stream analytics
  • Process streaming data from stream analytics
  • Managing stream analytics jobs
Module 11: Implementing Streaming Solutions with Kafka and HBase
  • Building and Deploying a Kafka Cluster
  • Publishing, Consuming, and Processing data using the Kafka Cluster
  • Using HBase to store and Query Data
Module 12: Develop big data real-time processing solutions with Apache Storm
  • Persist long term data
  • Stream data with Storm
  • Create Storm topologies
  • Configure Apache Storm
Module 13: Create Spark Streaming Applications
  • Working with Spark Streaming
  • Creating Spark Structured Streaming Applications
  • Persistence and Visualization

Efter endt kursus, er du i stand til:

  • Deploy HDInsight Clusters.
  • Authorizing Users to Access Resources.
  • Loading Data into HDInsight.
  • Troubleshooting HDInsight.
  • Implement Batch Solutions.
  • Design Batch ETL Solutions for Big Data with Spark
  • Analyze Data with Spark SQL.
  • Analyze Data with Hive and Phoenix.
  • Describe Stream Analytics.
  • Implement Spark Streaming Using the DStream API.
  • Develop Big Data Real-Time Processing Solutions with Apache Storm.
  • Build Solutions that use Kafka and HBase.

Pris

Prisen er inkl. det officielle DMOC kursusmateriale og online labs. Når du tilmelder dig, kan du vælge mellem ubegrænset adgang til MOC On-Demand kurset i enten 90 dage eller i 180 dage.

Microsoft Software Training Vouchers

Du kan betale din adgang til MOC On-Demand pakken med 5 SA Vouchers.

Certificering

Kurset leder hen mod eksamen 70-775: Perform Data Engineering on Microsoft Azure HDInsight .

Har du faglige spørgsmål så kontakt
Andre kurser