ID2221 Data-intensiv databehandling 7,5 hp

Välj termin och kursomgång
Välj termin och kursomgång för att se information från rätt kursplan och kursomgång.
Innehåll och lärandemål
Kursinnehåll
Ämnen:
- Distribuerade filsystem
- “No-SQL”-databaser
- Skalbara meddelandesystem
- Exekveringsmaskiner för Big Data: Map-Reduce, Spark
- Högnivå-frågor och interaktiv bearbetning: Hive och Spark SQL
- Stream processing
- Graph processing
- Skalbar maskininlärning
- Resurshantering.
Lärandemål
Kursen kompletterar kurserna i distribuerade system med ett fokus på bearbetning, lagring och analys av massiva datamängder. Den förbereder studenterna på examensarbetsprojekt för masterexamen, och för forskarutbildning inom området data-intensive computing systems.
Huvudsyftet med denna kurs är att erbjuda studenten en solid grund för att förstå storskaliga distribuerade system som används för att lagra och bearbeta massiva datamängder.
Mer specifikt kommer studenter efter avslutad kurs att kunna
- förklara arkitekturen och de egenskaper hos datorsystem som behövs för att lagra, utsöka och indexera stora datavolymer
- beskriva olika beräkningsmodeller för att bearbeta stora datamängder för statiska data (batchbearbetning) och för data i rörelse (stream processing)
- använda olika beräkningssystem för design och implementation av icke-triviala analysmetoder på massiva data
- förklara olika modeller för att schemalägga och allokera resurser för beräkningsuppgifter på stora datorkluster
- förklara avvägningarna som görs vid design av effektiva algoritmer för att bearbeta stora datamängder i en distribuerad beräkning.
Kursupplägg
Ingen information tillagd
Kurslitteratur och förberedelser
Särskild behörighet
Ingen information tillagd
Rekommenderade förkunskaper
Grundkunskaper inom distribuerade system och programmeringsmodeller, programmeringsspråk (Scala, Java, Python).
Utrustning
Ingen information tillagd
Kurslitteratur
Ingen information tillagd
Examination och slutförande
När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.
Betygsskala
A, B, C, D, E, FX, F
Examination
- LAB1 - Programmeringsuppgifter, 3,0 hp, betygsskala: P, F
- TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F
Examinator beslutar, baserat på rekommendation från KTH:s samordnare för funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.
Examinator får medge annan examinationsform vid omexamination av enstaka studenter.
Skriftlig tentamen. Laborationsuppgifter.
Möjlighet till komplettering
Ingen information tillagd
Möjlighet till plussning
Ingen information tillagd
Examinator
Etiskt förhållningssätt
- Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
- Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
- Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.
Ytterligare information
Kurswebb
Ytterligare information om kursen kan hittas på kurswebben via länken nedan. Information på kurswebben kommer framöver flyttas till denna sida.
Kurswebb ID2221Ges av
Huvudområde
Datalogi och datateknik
Utbildningsnivå
Avancerad nivå
Påbyggnad
Ingen information tillagd
Övrig information
I denna kurs tillämpas EECS hederskodex, se: http://www.kth.se/eecs/utbildning/hederskodex.