DD2476 Sökmotorer och informationssökningssystem 9,0 hp
Search Engines and Information Retrieval Systems
En kurs i datalogi som behandlar grundläggande teori, modeller och metoder för datorbaserad informationssökning.
Utbildningsnivå
Avancerad nivåKursnivå (A-D)
Huvudområde
Datalogi och datateknik
Betygsskala
A, B, C, D, E, FX, F
Kurstillfällen/kursomgångar
VT13 TMAIM för programstuderande
Perioder
VT13 P3 (6,0 hp), P4 (3,0 hp)
Anmälningskod
60279Kursen startar
2013 vecka: 1Kursen slutar
2013 vecka: 21Undervisningsspråk
EngelskaCampus
KTH CampusAntal föreläsningar
24 (preliminärt)Antal övningar
4 (preliminärt)Undervisningstid
DagtidUndervisningsform
NormalAntal platser
Ingen begränsningSchema
Schema (nytt fönster)Kursansvarig
Hedvig Kjellström <hedvig@kth.se>
Lärare
Johan Boye <jboye@kth.se>
Hedvig Kjellström <hedvig@kth.se>
Målgrupp
Obligatorisk för TMAIM men sökbar för andra program
Del av program
- Civilingenjör och lärare, åk 4, MADA, Villkorligt valfri
- Civilingenjörsutb i datateknik, åk 3, Valfri
- Masterprogram, ICT Innovation, åk 1, DMTE, Valfri
- Masterprogram, datalogi, åk 1, CSCA, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCD, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCE, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCG, Villkorligt valfri
- Masterprogram, maskininlärning, åk 1, MAIA, Villkorligt valfri
- Masterprogram, maskininlärning, åk 1, MAIB, Obligatorisk
- Masterprogram, maskininlärning, åk 1, MAIC, Villkorligt valfri
- Masterprogram, systemteknik och robotik, åk 1, Rekommenderad
VT14 ir14 för programstuderande
Perioder
VT14 P3 (6,0 hp), P4 (3,0 hp)
Anmälningskod
60103Kursen startar
2014 vecka: 4Kursen slutar
2014 vecka: 23Undervisningsspråk
EngelskaCampus
KTH CampusAntal föreläsningar
24 (preliminärt)Antal övningar
4 (preliminärt)Undervisningstid
DagtidUndervisningsform
NormalAntal platser
Ingen begränsningKursansvarig
Hedvig Kjellström <hedvig@kth.se>
Lärare
Johan Boye <jboye@kth.se>
Hedvig Kjellström <hedvig@kth.se>
Målgrupp
Obligatorisk för TMAIM
Sökbar för studenter på civilingenjörsprogram som har uppnått minst 90 hp varav minst 50 hp från årskurs 1. Sökbar för studenter på masterprogram.
Del av program
- Civilingenjör och lärare, åk 4, MADA, Villkorligt valfri
- Masterprogram, ICT Innovation, åk 1, DMTE, Valfri
- Masterprogram, datalogi, åk 1, CSCA, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCD, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCE, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCG, Villkorligt valfri
- Masterprogram, datalogi, åk 2, CSCA, Villkorligt valfri
- Masterprogram, datalogi, åk 2, CSCD, Villkorligt valfri
- Masterprogram, datalogi, åk 2, CSCE, Villkorligt valfri
- Masterprogram, maskininlärning, åk 1, MAIA, Villkorligt valfri
- Masterprogram, maskininlärning, åk 1, MAIB, Obligatorisk
- Masterprogram, maskininlärning, åk 1, MAIC, Villkorligt valfri
- Masterprogram, medieteknik, åk 1, METB, Villkorligt valfri
- Masterprogram, medieteknik, åk 2, METB, Villkorligt valfri
- Masterprogram, systemteknik och robotik, åk 1, Rekommenderad
- Masterprogram, systemteknik och robotik, åk 2, Rekommenderad
VT14 ir14 för programstuderande
Perioder
VT14 P3 (6,0 hp), P4 (3,0 hp)
Anmälningskod
60290Kursen startar
2014 vecka: 4Kursen slutar
2014 vecka: 23Undervisningsspråk
EngelskaCampus
KTH CampusAntal föreläsningar
24 (preliminärt)Antal övningar
4 (preliminärt)Undervisningstid
DagtidUndervisningsform
NormalAntal platser
Ingen begränsningKursansvarig
Hedvig Kjellström <hedvig@kth.se>
Lärare
Johan Boye <jboye@kth.se>
Hedvig Kjellström <hedvig@kth.se>
Målgrupp
Enbart avsedd för studenter in samarbetet Science without Borders
Lärandemål
Efter genomförd kurs ska du kunna:
* förklara koncepten indexering, vokabulär, normalisering och kodbok i informationssökning,
* redogöra för olika avståndsmått för text, och välja ett avståndsmått som är lämpligt för ett givet problem,
* definiera en boolesk modell och en vektorrumsmodell, och förklara skillnaden mellan dem,
* implementera en metod för rankad sökning av ett mycket stort antal dokument med hyperlänkar,
* utvärdera informationssökningsalgoritmer, och redogöra för svårigheter med utvärdering,
* redogöra för en internetsökmotors uppbyggnad.
Kursens huvudsakliga innehåll
Grundläggande och avancerade tekniker för informationssökning: informationsextraktion; effektiv textindexering; indexering av icke-textdata; booleska modeller och vektorrumsmodeller för sökning; utvärderings- och gränssnittsfrågor; internetsökmotorers uppbyggnad.
Behörighet
För fristående kursstuderande krävs 90 högskolepoäng varav 45 högskolepoäng inom matematik eller informationsteknik. Dessutom krävs engelska B eller motsvarande.
Rekommenderade förkunskaper
Matematikkunskaper motsvarande minst 30 hp, inklusive kurser i linjär algebra, analys i en och flera variabler, matematisk statistik, och datalogikunskaper motsvarande minst 15 hp. Det är också bra att ha läst kurser i maskininlärning, artificiell intelligens, språkteknologi och/eller databasteknologi.
Litteratur
C. D. Manning, P. Raghavan and H. Schütze: Introduction to Information Retrieval, Cambridge University Press, 2008.
Examination
- LABA - Laborationer, 6,0 hp, betygsskala: A, B, C, D, E, FX, F
- LABB - Laborationer, 3,0 hp, betygsskala: A, B, C, D, E, FX, F
I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.
Ges av
CSC/Datalogi
Kontaktperson
Hedvig Kjellström, e-post: hedvig@kth.se
Examinator
Hedvig Kjellström <hedvig@kth.se>
Versionsinformation
Kursplan giltig från och med
VT12.
Examinationsinformation giltig från och med
VT13.
