ID2222 Datautvinning 7,5 hp

Administrera Om kursen

Information per kursomgång

Termin

HT 2026

Information för HT 2026 Start 2026-10-26 programstuderande

Studielokalisering: KTH Campus
Varaktighet: 2026-10-26 - 2027-01-11
Perioder: HT 2026: P2 (7.5 hp)
Studietakt: 50%
Anmälningskod: 10756
Undervisningsform: Normal Dagtid
Undervisningsspråk: Engelska
Kurs-PM: Kurs-PM är inte publicerat
Antal platser: Min: 25
Målgrupp: Öppen för alla program under förutsättning att kursen kan ingå i programmet.
Planerade schemamoduler: [object Object]
Schema: Schema är inte publicerat
Del av program: Masterprogram, ICT Innovation, åk 2, CLNS, Rekommenderad
Masterprogram, datalogi, åk 2, CSDA, Rekommenderad
Masterprogram, ICT Innovation, åk 2, CLNI, Rekommenderad
Masterprogram, industriell ekonomi, åk 1, MAIG, Villkorligt valfri
Masterprogram, ICT Innovation, åk 2, DASE, Obligatorisk
Masterprogram, ICT Innovation, åk 2, DASC, Obligatorisk
Masterprogram, maskininlärning, åk 2, Villkorligt valfri
Masterprogram, programvaruteknik för distribuerade system, åk 1, Villkorligt valfri
Masterprogram, maskininlärning, åk 1, Villkorligt valfri

Kontakt

Examinator

Ingen information tillagd

Kursansvarig

Ingen information tillagd

Lärare

Ingen information tillagd

Kursplan som PDF

Notera: all information från kursplanen visas i tillgängligt format på denna sida.

Kursplan ID2222 (VT 2019–)

Rubriker med innehåll från kursplan ID2222 (VT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Introduktion till datautvinning
Frekventa Itemmängder
Att hitta liknande enheter
Klustring
Rekommendationssystem
Datautvinning från strömmar
Dimensionalitetsreduktion
Storskalig maskininlärning

Lärandemål

Kursen behandlar fundamenta inom datautvinning, bearbetning av dataströmmar, och maskininlärningsalgoritmer för att analysera mycket stora datamängder. Vi använder plattformar för storskaliga datamängder, såsom MapReduce, Spark och Apache Flink, för att implementera parallella algoritmer, och även beräkningssystem för bearbetning av dataströmmar, såsom Storm och InfoSphere.

Efter denna kurs kommer studenterna att kunna utföra datautvinning på olika typer av data, till exempel data av högre dimension, grafdata och infinita/icke-avslutade data (dataströmmar); liksom att programmera och bygga tillämpningar inom datautvinning. De förväntas också att kunna lösa problem i praktiska tillämpningar, till exempel rekommendationssystem, associationsregler, länkanalys, och detektion av duplikat. Dessutom kommer de att behärska olika matematiska tekniker till exempel linjär algebra, optimering, och dynamisk programmering.

Kurslitteratur och förberedelser

Särskild behörighet

Ingen information tillagd

Rekommenderade förkunskaper

Kännedom om begrepp och terminologi associerad med statistik, databassystem, och maskininlärning; en kurs om datastrukturer, algoritmer, och diskret matematik (som ID1021 Algoritmer och datastrukturer); en kurs i mjukvarusystem, software engineering, och programmeringsspråk; en kurs om att behandla, lagra and analysera massiva datamängder (som ID2221 Data-Intensive Computing).

Kurslitteratur

Innehållet i kursen hämtas från dessa två kursböcker:

A. Rajaraman and J. D. Ullman, Mining of massive datasets. Cambridge University Press, 2012 (alternative: J. Han, M. Kamber, J. Pei, Data Mining: Concepts and Techniques, 3-rd Ed., Morgan Kaufmann, 2012)

Examination och slutförande

Betygsskala

A, B, C, D, E, FX, F

Examination

TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F
LAB1 - Programmeringsuppgifter, 3,0 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Skriftlig tentamen. Laborativa uppgifter.

Examinator

Vladimir Vlassov

Sarunas Girdzijauskas

Ahmad Al-Shishtawy

Etiskt förhållningssätt

Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

EECS/Datatekniska och lärande system

Huvudområde

Datalogi och datateknik

Utbildningsnivå

Avancerad nivå

Övrig information

I denna kurs tillämpas EECS hederskodex, se: http://www.kth.se/eecs/utbildning/hederskodex.

Studier

Stöd och vägledning

IT och digitala tjänster

Kontakt

ID2222 Datautvinning 7,5 hp

Information per kursomgång

Information för HT 2026 Start 2026-10-26 programstuderande

Kontakt

Kursplan som PDF

Innehåll och lärandemål

Kursinnehåll

Lärandemål

Kurslitteratur och förberedelser

Särskild behörighet

Rekommenderade förkunskaper

Kurslitteratur

Examination och slutförande

Betygsskala

Examination

Examinator

Etiskt förhållningssätt

Ytterligare information

Kursrum i Canvas

Ges av

Huvudområde

Utbildningsnivå

Övrig information