Kurser

Kursusadministration

Brug for hjælp?

  • Gregersensvej 8
  • 2630 Taastrup
Google MapsApple MapsRejseplanen
  • Forskerparken Fyn, Forskerparken 10F
  • 5230 Odense M
Google MapsApple MapsRejseplanen
  • Teknologiparken Kongsvang Allé 29
  • 8000 Aarhus C
Google MapsApple MapsRejseplanen
  • NordsøcentretPostboks 104
  • 9850Hirtshals
Google MapsApple MapsRejseplanen
  • Gammel Ålbovej 1
  • 6092Sønder Stenderup
Google MapsApple MapsRejseplanen
Random Forest

R4 - Machine learning og predictive models i R

Kurset er fjerde og sidste kursus af i alt fire statistikkurser i R. Store mængder data medfører udfordringer. Kurset er til dig, der ønsker at komme i gang med din Big Data analyse. Du lærer at bruge R til at modellere data i to poplære machine learning algoritmer: Random Forest og Boosting.

Udbytte

Du har lært, at machine learning dækker over algoritmer udviklet til prædiktion og data mining særligt i store datamængder. Du har lært om the curse of dimensionality og the variance-bias-trade-off, som grundlæggende problemer i enhver data analyse og særligt i en data analyse af store datamængder. Du har lært rationalet i krydsvalideringsproceduren og lært at gennemføre en krydsvalidering i R. Du har lært to populære machine learning algoritmer at kende og anvende i R: Random Forest og Boosting.

Forudsætninger

Du skal medbringe egen PC. Du skal have kendskab til R og en forståelse af statistiske grundprincipper svarende til niveauet i kurset Introduktion til statistikprogrammet R og Lineære og generaliserede lineære modeller i R.

Program

Programmet består af flere oplæg fra underviseren og en række Hands-on forløb bestående af et udleveret R-script, som deltageren kører igennem under underviserens vejledning.

10:00 Velkomst

10:15 Big data og machine learning - en ny æra begynder: Nye algoritmer til nye udfordringer, Machine learning og predictive modelling, Krydsvalidering, Et eksempel

11:00 Pause

11:10 Hands-on 1: Krydsvalidering i en lineær model i R

12:00 Frokost

12:30 Machine learning 1: Random Forest, Random Forest algoritmen, Et eksempel

13:00 Hands-On 2: Random Forest model i R

13:50 Pause

14:00 Machine learning 2: Boosting, Bosting algoritmen, Et eksempel

14:50 Pause

15:00 Hands-On 3: Boosting i R

15:50 Afrunding

16:00 Slut

Frokost

Frokostbuffet er inkluderet i prisen.

Min. antal deltager

8. Teknologisk Institut forbeholder sig retten til at aflyse kurset såfremt der er færre end det minimale antal deltager.

Sted

Teknologisk Institut, Skejby, Agro Food Park 13, 8200 Aarhus N. Lokale PLANT, for enden af kantinen i Agro Food Park 13.

Foreslået læsning

Gareth, J., Witten, D., Hastie, T., Tibshirani, R. 2013. An Introduction to Statistical Learning with Applications in R. Springer, NY. Gratis online version: http://www-bcf.usc.edu/~gareth/ISL/

Har du faglige spørgsmål så kontakt
Andre kurser