Hoppa till huvudinnehållet

FID3016 Data mining 7,5 hp

Välj termin och kursomgång

Välj termin och kursomgång för att se aktuell information och mer om kursen, såsom kursplan, studieperiod och anmälningsinformation.

Kursval

Gäller för kursomgång

HT 2023 Start 2023-10-30 programstuderande

Anmälningskod

50684

Rubriker med innehåll från kursplan FID3016 (VT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Innehåll:
• Introduction till Data Mining
• Frekventa Itemmängder
• Att hitta  liknande enheter
• Klustring
• Recommender-system
• Mining Data Streams
• Dimensionalitetsreduktion
• Storskalig maskininlärning
• Översikt av aktuell forskning inom data mining och dess koppling till andra relevanta forskningsområden.

Lärandemål

Kursen behandlar fundamenta inom data mining, data stream processing, och maskininlärningsalgoritmer för att analysera mycket stora datamängder. Vi använder plattformar för big data, såsom MapReduce, Spark och Apache Flink, för att implementera parallella algoritmer, och även beräkningssystem för data stream processing, såsom Storm och InfoSphere.
Efter denna kurs kommer studenterna att kunna utföra data mining på olika typer av data, t.ex. data av högre dimension, grafdata, och infinita/icke-avslutade data (data streams); liksom att programmera och bygga tillämpningar inom data-mining. De förväntas också att kunna lösa problem i praktiska tillämpningar, t.ex. recommender-system, associationsregler, länkanalys, och detektion av duplikat. Dessutom kommer de att behärska olika matematiska tekniker t.ex. linjär algebra, optimering, och dynamisk programmering. Dessutom ska studenten kunna beskriva och tillämpa aktuella forsknings trender i data mining (inklusive metoder, algoritmer, språkstöd och verktyg).

Kurslitteratur och förberedelser

Särskild behörighet

Rekommenderade förkunskaper:
Kännedom om begrepp och terminologi associerad med statistik, databassystem, och maskininlärning; en kurs om datastrukturer, algoritmer, och diskret matematik (som ID1020 Algoritmer och datastrukturer); en kurs i mjukvarusystem, software engineering, och programmeringsspråk; en kurs om att behandla, lagra and analysera massiva datamängder (som ID2221 Data-Intensive Computing).

Rekommenderade förkunskaper

Rekommenderade förkunskaper:
Kännedom om begrepp och terminologi associerad med statistik, databassystem, och maskininlärning; en kurs om datastrukturer, algoritmer, och diskret matematik (som ID1020 Algoritmer och datastrukturer); en kurs i mjukvarusystem, software engineering, och programmeringsspråk; en kurs om att behandla, lagra and analysera massiva datamängder (som ID2221 Data-Intensive Computing).

Utrustning

Ingen information tillagd

Kurslitteratur

Ingen information tillagd

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

P, F

Examination

  • EXA1 - Examination, 7,5 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Övriga krav för slutbetyg

Godkänd skriftlig tentamina,  godkända inlämningsuppgifter och godkänd tillämpning av nuvarande forskning (till exempel: användning i en forskningsartikel, forskningsrapport, eller forskningsprojekt).

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

Huvudområde

Denna kurs tillhör inget huvudområde.

Utbildningsnivå

Forskarnivå

Påbyggnad

Ingen information tillagd

Forskarkurs

Forskarkurser på EECS/Programvaruteknik och datorsystem