Hoppa till huvudinnehållet

ID2211 Datautvinning, grundkurs 7,5 hp

I kursen studeras grunderna i datautvinning med speciellt fokus på informationsnätverksanalys och utvinning.

Välj termin och kursomgång

Välj termin och kursomgång för att se information från rätt kursplan och kursomgång.

Rubriker med innehåll från kursplan ID2211 (VT 2020–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

  • Grundläggande definitioner inom grafteori, starka och svaga band, graddistribution och klustringsmått.
  • Erdos-Renyi, Wats-Strogatz, konfigureringsmodell, effekten av en "liten värld".
  • Slumpmässig grafvandring, Page Rank.
  • Grafklustring, identifiering av "communities".
  • Algoritmen "Label Propagation", länkprediktion.
  • Distributiv semantik, ämnesmodellering, dokumentsammanfattning.

Lärandemål

Efter godkänd kurs ska studenten kunna

  • förklara olika fundamentala begrepp och algoritmer i datautvinning samt grundläggande tekniker för informationsnätverksanalys och utvinning (till exempel de fundamentala begreppen i grafteori, nätverksmodeller, algoritmer for grafklustring, identifiering av "communities", "Label Propagation", länkprediktion, etcetera)
  • analysera, välja, använda, och utvärdera tekniker för datautvinning som bygger på ovanstående koncept, samt självständigt utforska och implementera existerande datautvinningsalgoritmer
  • kommunicera fynd, resultat och idéer med klart och formellt språk.

Kursupplägg

Ingen information tillagd

Kurslitteratur och förberedelser

Särskild behörighet

Ingen information tillagd

Rekommenderade förkunskaper

Grundläggande bekantskap med sannolikhetslära, linjär algebra och förmåga att skriva icketriviella datorprogram.

Utrustning

Ingen information tillagd

Kurslitteratur

Ingen information tillagd

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

A, B, C, D, E, FX, F

Examination

  • PRO1 - Projekt, 3,0 hp, betygsskala: P, F
  • TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s samordnare för funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Profile picture Sarunas Girdzijauskas

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kurswebb

Ytterligare information om kursen kan hittas på kurswebben via länken nedan. Information på kurswebben kommer framöver flyttas till denna sida.

Kurswebb ID2211

Ges av

EECS/Datavetenskap

Huvudområde

Datalogi och datateknik

Utbildningsnivå

Avancerad nivå

Påbyggnad

Ingen information tillagd

Övrig information

I denna kurs tillämpas EECS hederskodex, se: http://www.kth.se/eecs/utbildning/hederskodex.