Må vi gemme en cookie?

Vi bruger cookies for at forbedre din oplevelse af vores hjemmeside, målrette indhold samt statistik. Læs mere om cookies

Kurser

Kursusadministration

Brug for hjælp?

  • Gregersensvej 8
  • 2630 Taastrup
Google MapsApple MapsRejseplanen
  • Forskerparken Fyn, Forskerparken 10F
  • 5230 Odense M
Google MapsApple MapsRejseplanen
  • Teknologiparken Kongsvang Allé 29
  • 8000 Aarhus C
Google MapsApple MapsRejseplanen
  • NordsøcentretPostboks 104
  • 9850Hirtshals
Google MapsApple MapsRejseplanen
  • Gammel Ålbovej 1
  • 6092Sønder Stenderup
Google MapsApple MapsRejseplanen

Introduktion til PySpark med Azure Databricks Notebooks

Kurset den 23. - 24. april afholdes på engelsk med en dansk instruktør (The course on 23. - 24. April is held in English with a Danish instructor).Spark er et populært framework til processering af enorme mængder data, brugt bredt i industrien. Dette kursus vil give dig en kort introduktion til den populære Python API til Spark frameworket gennem brug af Azure Databricks Notebooks. Målet med kurset er at hjælpe deltageren i gang med at anvende PySpark genenm interaktive lektioner i de dele af PySpark, man anvender mest i praksis som Data Scientist.

Azure Databricks Notebooks vil derfor ikke være hovedemnet men kun platformen, som øvelserne vil laves i gennem kurset. Set-up og konfigurering af et cluster vil heller ikke være emnet for kurset.

Forudsætninger

Du har erfaring med programmering gennem dit daglige arbejde med data eller fra din uddannelse og har en grundlæggende matematisk forståelse. Grundlæggende kendskab til Python eller SQL vil også være nyttigt.

Deltagerprofil

Du søger en introduktion til PySpark, så du kan starte med at anvende dette i dit daglige arbejde.

Indhold

  • Introduktion til Spark
  • DataFrame API'en
  • Spark SQL
  • Data Aggregation
  • Window Functions
  • User Defined Functions
  • Machine Learning med pyspark.ml
  • Med mere

Underviser

Troels Lægsgaard
Troels Lægsgaard arbejder som Data Scientist, hvor han til hverdag bruger SQL, Python, Scala, Spark og R til Big Data analyse. Han har en kandidat i Matematisk Investering fra Aarhus Universitet, hvor han har undervist i flere år i statistiske og matematiske kurser. Han er meget interesseret i Data Science både fra et teoretisk og praktisk perspektiv.

Har du faglige spørgsmål, så kontakt:
Andre kigger også på