DD2476 Sökmotorer och informationssökningssystem 9,0 hp

Search Engines and Information Retrieval Systems

En kurs i datalogi som behandlar grundläggande teori, modeller och metoder för datorbaserad informationssökning.

  • Utbildningsnivå

    Avancerad nivå
  • Kursnivå (A-D)

  • Huvudområde

    Datalogi och datateknik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

VT14 ir14 för programstuderande

VT14 ir14 för programstuderande

  • Perioder

    VT14 P3 (6,0 hp), P4 (3,0 hp)
  • Anmälningskod

    60290
  • Kursen startar

    2014 vecka: 4
  • Kursen slutar

    2014 vecka: 23
  • Undervisningsspråk

    Engelska
  • Campus

    KTH Campus
  • Antal föreläsningar

    24 (preliminärt)
  • Antal övningar

    4 (preliminärt)
  • Undervisningstid

    Dagtid
  • Undervisningsform

    Normal
  • Antal platser

    Ingen begränsning
  • Kursansvarig

    Hedvig Kjellström <hedvig@kth.se>
  • Lärare

    Johan Boye <jboye@kth.se>
    Hedvig Kjellström <hedvig@kth.se>
  • Målgrupp

    Enbart avsedd för studenter in samarbetet Science without Borders

Lärandemål

Efter genomförd kurs ska du kunna:

*  förklara koncepten indexering, vokabulär, normalisering och kodbok i informationssökning,

*  redogöra för olika avståndsmått för text, och välja ett avståndsmått som är lämpligt för ett givet problem,

*  definiera en boolesk modell och en vektorrumsmodell, och förklara skillnaden mellan dem,

*  implementera en metod för rankad sökning av ett mycket stort antal dokument med hyperlänkar,

*  utvärdera informationssökningsalgoritmer, och redogöra för svårigheter med utvärdering,

*  redogöra för en internetsökmotors uppbyggnad.

Kursens huvudsakliga innehåll

Grundläggande och avancerade tekniker för informationssökning: informationsextraktion; effektiv textindexering; indexering av icke-textdata; booleska modeller och vektorrumsmodeller för sökning; utvärderings- och gränssnittsfrågor; internetsökmotorers uppbyggnad.

Behörighet

För fristående kursstuderande krävs 90 högskolepoäng varav 45 högskolepoäng inom matematik eller informationsteknik. Dessutom krävs engelska B eller motsvarande.

Rekommenderade förkunskaper

Matematikkunskaper motsvarande minst 30 hp, inklusive kurser i linjär algebra, analys i en och flera variabler, matematisk statistik, och datalogikunskaper motsvarande minst 15 hp. Det är också bra att ha läst kurser i maskininlärning, artificiell intelligens, språkteknologi och/eller databasteknologi.

Litteratur

C. D. Manning, P. Raghavan and H. Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008.

Examination

  • LABA - Laborationer, 6,0 hp, betygsskala: A, B, C, D, E, FX, F
  • LABB - Laborationer, 3,0 hp, betygsskala: A, B, C, D, E, FX, F

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Ges av

CSC/Datalogi

Kontaktperson

Hedvig Kjellström, e-post: hedvig@kth.se

Examinator

Hedvig Kjellström <hedvig@kth.se>

Versionsinformation

Kursplan giltig från och med VT12.
Examinationsinformation giltig från och med VT13.