DD2475 Informationssökning 9,0 hp

Information Retrieval

OBS!

Detta är en nedlagd kurs.

En kurs i datalogi som behandlar grundläggande teori, modeller och metoder för datorbaserad informationssökning.

  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Datalogi och datateknik
  • Betygsskala

    A, B, C, D, E, FX, F

Sista planerade examination: HT13.

Det finns inget planerat kurstillfälle.

Lärandemål

Efter genomförd kurs ska du kunna:

  • förklara koncepten indexering, vokabulär, normalisering och kodbok i informationssökning
  • definiera en boolesk modell och en vektorrumsmodell, och förklara skillnaden mellan dem
  • förklara skillnaderna mellan klassificering och klustring
  • diskutera skillnaderna mellan olika klassificerings- och klustringsmetoder
  • välja en lämplig klassificerings- eller klustringsmetod beroende på det aktuella problemets begränsningar
  • implementera klassificering i en boolesk modell och i en vektorrumsmodell
  • implementera en grundläggande klustringsmetod
  • redogöra för en grundläggande spektralmetod
  • utvärdera informationssökningsalgoritmer, och redogöra för svårigheter med utvärdering
  • förklara grunderna i XML och internetsökning.

Kursens huvudsakliga innehåll

Grundläggande och avancerade tekniker för informationssökning: informationsextraktion; effektiv textindexering; indexering av icke-textdata; booleska modeller och vektorrumsmodeller för sökning; utvärderings- och gränssnittsfrågor; XML, internetsökmotorers uppbyggnad; klustring, klassificering; spektralmetoder, random indexing; sökning i stora mängder data.

Behörighet

För fristående kursstuderande krävs 90 högskolepoäng varav 45 högskolepoäng inom matematik eller informationsteknik. Dessutom krävs engelska B eller motsvarande.

Rekommenderade förkunskaper

Matematikkunskaper motsvarande minst 30 hp, inklusive kurser i linjär algebra, analys i en och flera variabler, matematisk statistik, och datalogikunskaper motsvarande minst 15 hp. Det är också bra att ha läst kurser i maskininlärning, artificiell intelligens, språkteknologi och/eller databasteknologi.

Litteratur

C. D. Manning, P. Raghavan and H. Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008.

Examination

  • LAB1 - Laborationer, 3,0, betygsskala: P, F
  • LAB2 - Projekt, 3,0, betygsskala: A, B, C, D, E, FX, F
  • TEN1 - Tentamen, 3,0, betygsskala: A, B, C, D, E, FX, F

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Krav för slutbetyg

Deltagarna i kursen förväntas medverka aktivt i kursens olika moment, i synnerhet vid övningar och laborationer. Dessutom betonas:

  • träning i att självständigt inhämta nödvändig kunskap
  • träning i muntlig och skriftlig redovisning.

Examinationen sker genom tentamen (TEN1; 3,0 hp), datorlaborationer (LAB1; 3,0 hp) och en projektuppgift som redovisas skriftligt och muntligt (LAB2; 3,0 hp).

Ges av

CSC/Datalogi

Examinator

Hedvig Kjellström <hedvig@kth.se>

Övrig information

Denna kurs ersätts av DD2476 Sökmotorer och informationssökningssystem från och med läsåret 11/12.

Versionsinformation

Kursplan gäller från och med HT2010.
Examinationsinformation gäller från och med HT2010.