ID2214 Programmering för data science 7,5 hp

Programming for Data Science

OBS!

Informationen nedan baseras på en kursplan som ännu inte har börjat gälla.

Kursen tar upp följande:

  • Syntax och semantik för programmeringsspråk som är särskilt lämpade för data science, t.ex. Python, Julia.
  • Rutiner för att importera, kombinera, omvandla och göra urval av data. 
  • Algoritmer för hantering av saknade värden, diskretisering och dimensionalitetsreduktion. 
  • Algoritmer för övervakad maskininlärning, t.ex. naïve Bayes, beslutsträd, random forests. 
  • Algoritmer för oövervakad maskininlärning, t.ex. k-means clustering. 
  • Bibliotek för dataanalys. 
  • Utvärderingsmetoder och prestandamått. 
  • Visualisering och analys av resultat från dataanalys.
  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Datalogi och datateknik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

HT19 för programstuderande

HT18 för programstuderande

HT18 Doktorand för fristående studerande

  • Perioder

    HT18 P2 (7,5 hp)

  • Anmälningskod

    10172

  • Kursen startar

    2018-10-29

  • Kursen slutar

    2019-01-14

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    Campus Kista

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser *

    Max. 1

    *) Vid fler sökande än platser kommer urval att ske.

  • Kursansvarig

    Henrik Boström <bostromh@kth.se>

  • Lärare

    Henrik Boström <bostromh@kth.se>

  • Målgrupp

    För doktorander på KTH

Lärandemål

Efter godkänd kurs ska studenten kunna

  • redogöra för och resonera om tillämpningen av i) tekniker för att omvandla data till lämpligt format för dataanalys, ii) algoritmer för att analysera data genom övervakad och oövervakad maskininlärning, samt iii) tekniker och prestandamått för utvärdering av dataanalysresultat
  • implementera och tillämpa i) tekniker för att omvandla data till lämpligt format för dataanalys, ii) algoritmer för övervakad och oövervakad maskininlärning, samt iii) tekniker och prestandamått för utvärdering av dataanalysresultat.

Kursens huvudsakliga innehåll

Syntax och semantik för programspråk som är särskilt lämpade för data science, t.ex. Python.

Rutiner för att importera, kombinera, omvandla och göra urval av data.

Algoritmer för hantering av saknade värden, diskretisering och dimensionalitetsreduktion.

Algoritmer för övervakad maskininlärning, t.ex. naïve Bayes, beslutsträd, random forests.

Algoritmer för oövervakad maskininlärning, t.ex. k-means clustering.

Bibliotek för dataanalys.

Utvärderingsmetoder och prestandamått.

Visualisering och analys av resultat från dataanalys.

Behörighet

Antagen till masterprogram vid KTH inom huvudområdet.

Litteratur

I. Witten, E. Frank, M. Hall and C. Pal, Data Mining: Practical Machine Learning Tools and Techniques (4th ed.), Morgan Kaufmann, 2016 ISBN: 9780128042915. 

J. VanderPlas, Python Data Science Handbook: Essential tools for working with data (1st ed.), O’Reilly Media Inc., 2016 ISBN: 9781491912058.

Examination

  • INL1 - Inlämningsuppgift, 4,5, betygsskala: A, B, C, D, E, FX, F
  • TEN1 - Tentamen, 3,0, betygsskala: A, B, C, D, E, FX, F

Skriftlig tentamen. Inlämningsuppgifter.

Examinator beslutar, i samråd med KTH:s samordnare för funktionsnedsättning (Funka), om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning. Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Ges av

EECS/Datavetenskap

Kontaktperson

Henrik Boström, bostromh@kth.se

Examinator

Henrik Boström <bostromh@kth.se>

Versionsinformation

Kursplan gäller från och med HT2019.
Examinationsinformation gäller från och med VT2019.