DD2476 Sökmotorer och informationssökningssystem 9,0 hp

Search Engines and Information Retrieval Systems

En kurs i datalogi som behandlar grundläggande teori, modeller och metoder för datorbaserad informationssökning.

Visa kursinformation utifrån vald termin och kursomgång:

Kursomgång och genomförande

Ingen kursomgång är vald

Välj termin och kursomgång ovan för att få information från rätt kursplan och kursomgång.

Kursinformation

Innehåll och lärandemål

Kursinnehåll *

Grundläggande och avancerade tekniker för informationssökning: informationsextraktion; effektiv textindexering; indexering av icke-textdata; booleska modeller och vektorrumsmodeller för sökning; utvärderings- och gränssnittsfrågor; internetsökmotorers uppbyggnad.

Lärandemål *

Efter genomförd kurs ska du kunna:

*  förklara koncepten indexering, vokabulär, normalisering och kodbok i informationssökning,

*  redogöra för olika avståndsmått för text, och välja ett avståndsmått som är lämpligt för ett givet problem,

*  definiera en boolesk modell och en vektorrumsmodell, och förklara skillnaden mellan dem,

*  implementera en metod för rankad sökning av ett mycket stort antal dokument med hyperlänkar,

*  utvärdera informationssökningsalgoritmer, och redogöra för svårigheter med utvärdering,

*  redogöra för en internetsökmotors uppbyggnad.

Kursupplägg

Ingen information tillagd

Kurslitteratur och förberedelser

Särskild behörighet *

SF1604 Linjär Algebra, SF1901 Sannolikhetsteori och statistik, DD1338 Algoritmer och datastrukturer,  eller motsvarande kurser.

Rekommenderade förkunskaper

Matematikkunskaper motsvarande minst 30 hp, inklusive kurser i linjär algebra och matematisk statistik, och datalogikunskaper motsvarande minst 15 hp.

Utrustning

Ingen information tillagd

Kurslitteratur

C. D. Manning, P. Raghavan and H. Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008.

Examination och slutförande

Betygsskala *

A, B, C, D, E, FX, F

Examination *

  • LABA - Laborationer, 6,0 hp, betygsskala: A, B, C, D, E, FX, F
  • LABB - Laborationer, 3,0 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s samordnare för funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Johan Boye

Ytterligare information

Kurswebb

Ytterligare information om kursen kan hittas på kurswebben via länken nedan. Information på kurswebben kommer framöver flyttas till denna sida.

Kurswebb DD2476

Ges av

EECS/Intelligenta system

Huvudområde *

Datalogi och datateknik

Utbildningsnivå *

Avancerad nivå

Påbyggnad

Ingen information tillagd

Kontaktperson

Johan Boye, e-post: jboye@kth.se

Etiskt förhållningssätt *

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Övrig information

I denna kurs tillämpas EECS hederskodex, se:
http://www.kth.se/eecs/utbildning/hederskodex