DD2476 Sökmotorer och informationssökningssystem 9,0 hp

Search Engines and Information Retrieval Systems

En kurs i datalogi som behandlar grundläggande teori, modeller och metoder för datorbaserad informationssökning.

  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Datalogi och datateknik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

VT19 ir19 för Study Abroad Programme (SAP)

  • Perioder

    VT19 P3 (6,0 hp), P4 (3,0 hp)

  • Anmälningskod

    20069

  • Kursen startar

    2019-01-15

  • Kursen slutar

    2019-06-04

  • Undervisningsspråk

    Engelska

  • Studielokalisering

    KTH Campus

  • Undervisningstid

    Dagtid

  • Undervisningsform

    Normal

  • Antal platser

    Ingen begränsning

  • Schema

    Schema (nytt fönster)

  • Kursansvarig

    Johan Boye <jboye@kth.se>

  • Lärare

    Viggo Kann <viggo@kth.se>

  • Målgrupp

    Endast öppen för betalande studenter inom SAP

Lärandemål

Efter genomförd kurs ska du kunna:

*  förklara koncepten indexering, vokabulär, normalisering och kodbok i informationssökning,

*  redogöra för olika avståndsmått för text, och välja ett avståndsmått som är lämpligt för ett givet problem,

*  definiera en boolesk modell och en vektorrumsmodell, och förklara skillnaden mellan dem,

*  implementera en metod för rankad sökning av ett mycket stort antal dokument med hyperlänkar,

*  utvärdera informationssökningsalgoritmer, och redogöra för svårigheter med utvärdering,

*  redogöra för en internetsökmotors uppbyggnad.

Kursens huvudsakliga innehåll

Grundläggande och avancerade tekniker för informationssökning: informationsextraktion; effektiv textindexering; indexering av icke-textdata; booleska modeller och vektorrumsmodeller för sökning; utvärderings- och gränssnittsfrågor; internetsökmotorers uppbyggnad.

Behörighet

SF1604 Linjär Algebra, SF1901 Sannolikhetsteori och statistik, DD1338 Algoritmer och datastrukturer,  eller motsvarande kurser.

Rekommenderade förkunskaper

Matematikkunskaper motsvarande minst 30 hp, inklusive kurser i linjär algebra och matematisk statistik, och datalogikunskaper motsvarande minst 15 hp.

Litteratur

C. D. Manning, P. Raghavan and H. Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008.

Examination

  • LABA - Laborationer, 6,0, betygsskala: A, B, C, D, E, FX, F
  • LABB - Laborationer, 3,0, betygsskala: A, B, C, D, E, FX, F

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Ges av

EECS/Intelligenta system

Kontaktperson

Johan Boye, e-post: jboye@kth.se

Examinator

Johan Boye <jboye@kth.se>

Versionsinformation

Kursplan gäller från och med VT2019.
Examinationsinformation gäller från och med VT2019.