Hoppa till huvudinnehållet
Till KTH:s startsida Till KTH:s startsida

EQ2425 Analys och sökning av visuella data 7,5 hp

Kursen introducerar principerna för analys och sökning av visuella data, diskuterar grundläggande begrepp för att avgöra likhet och ger praktisk erfarenhet av utvalda populära algoritmer för visuellt sökande. Kursen innehåller ämnen som visuella ordlistor och påsar-av-ord, bildsärdrag, bildsärdragsdetektion och -beskrivning, särdragsbaserad objektigenkänning, klassificering och klustring, robust igenkänning, skalbar igenkänning, kompression av bildsärdragdeskriptorer, entropi-begränsat särdragsurval, mobilt visuellt sökande, likhetsfrågor på komprimerade data, identifikationshastighet för D-tillåtna system, kompressionsmetoder för likhetsfrågor.

Välj termin och kursomgång

Välj termin och kursomgång för att se aktuell information och mer om kursen, såsom kursplan, studieperiod och anmälningsinformation.

Kursval

Gäller för kursomgång

HT 2024 Start 2024-08-26 programstuderande

Anmälningskod

50240

Rubriker med innehåll från kursplan EQ2425 (VT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Kursen introducerar principerna för analys och sökning av visuella data, diskuterar grundläggande begrepp för att avgöra likhet och ger praktisk erfarenhet av utvalda populära algoritmer för visuellt sökande. Kursen innehåller ämnen som visuella ordlistor och påsar-av-ord, bildsärdrag, bildsärdragsdetektion och -beskrivning, särdragsbaserad objektigenkänning, klassificering och klustring, robust igenkänning, skalbar igenkänning, kompression av bildsärdragdeskriptorer, entropi-begränsat särdragsurval, mobilt visuellt sökande, likhetsfrågor på komprimerade data, identifikationshastighet för D-tillåtna system, kompressionsmetoder för likhetsfrågor.

Lärandemål

Efter genomgången kurs ska deltagarna kunna:

(1) Beskriva principerna för analys och sökning av visuella data, t.ex., visuella ordlistor, bildsärdrag, klassificering, igenkänning, visuella frågor.

(2) Utveckla och implementera (till exemple med MatLab) metoder för bildsärdragsextraktion, klassificering, igenkänning, och mobil visuell sökning.

(3) Analysera, jämför och förklara designalternativ med hjälp av principerna för analys och sökning av visuella data.

(4) kvantitativt bedöma de utvecklade metoderna för frågor / igenkänning

(5) Analysera givna frågeproblem, identifiera och förklara utmaningar, föreslå möjliga lösningar, och förklara den valda designen.

För högre betyg ska deltagarna också kunna:

- Lösa givna projektproblem väl och producera tydliga, vetenskapliga och välskrivna tekniska rapporter.

Kurslitteratur och förberedelser

Särskild behörighet

För fristående kursstudent: 120 hp samt Engelska B eller motsvarande.  

Rekommenderade förkunskaper

 EQ2330 Bild- och videobehandling eller motsvarande

Utrustning

Ingen information tillagd

Kurslitteratur

Föreläsningsanteckningar och utvalda artiklar / bokkapitel finns på kurshemsidan, t.ex.:

 - B. Girod, V. Chandrasekhar, D. M. Chen, N. M. Cheung, R. Grzeszczuk, Y. Reznik, G. Takacs, S. S. Tsai and R. Vedantham, “Mobile Visual Search”, IEEE Signal Processing Magazine, vol. 28, no. 4, pp. 61-76, July 2011.

- J. Sivic and A. Zisserman, “Video Google: A text retrieval approach to object matching in videos,” in Proc. IEEE Int. Conf. Computer Vision (ICCV), Washington, DC, 2003.

- D. Lowe, “Distinctive image features from scale-invariant keypoints,” Int. J. Comput. Vis., vol. 60, no. 2, pp. 91–110, 2004.

 - D. Nistér and H. Stewénius, “Scalable recognition with a vocabulary tree,” in Proc. IEEE Conf. Computer Vision and Pattern Recognition (CVPR), New York, June 2006.

 - H. Li and M. Flierl, "Mobile 3D visual search using the helmert transformation of stereo features," Proc. IEEE International Conference on Image Processing, Melbourne, Australia, Sept. 2013.

 - David Chen and Bernd Girod,

Examination och slutförande

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Betygsskala

A, B, C, D, E, FX, F

Examination

  • INL1 - Förberedelseuppgifter, 1,5 hp, betygsskala: P, F
  • PRO1 - Kursprojekt, 3,0 hp, betygsskala: A, B, C, D, E, FX, F
  • TEN1 - Tentamen, 3,0 hp, betygsskala: A, B, C, D, E, FX, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

Övriga krav för slutbetyg

(1) Förberedelseuppgifter, 1.5 ECTS (G/U): Några dagar innan en övning delas en kort individuell uppgift ut. Under övningen diskuterar du uppgiften med kurskamrater. Den kommenterade versionen av din förberedda lösning lämnas in vid slutet av övningen.

(2) Kursprojekt, 3 ECTS (A-F): Projekten ska ge praktisk erfarenhet och bör utföras i grupper av två studenter.

(3) Skriftlig tentamen, 3 ECTS (A-F).

Slutbetyget baseras på en sammanvägning av kursprojekt och tentamen. Examinatorn avgör viktningen inför varje kursomgång. 

Möjlighet till komplettering

Ingen information tillagd

Möjlighet till plussning

Ingen information tillagd

Examinator

Etiskt förhållningssätt

  • Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
  • Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
  • Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

Huvudområde

Elektroteknik

Utbildningsnivå

Avancerad nivå

Påbyggnad

Ingen information tillagd

Övrig information

I denna kurs tillämpas EECS hederskodex, se:
http://www.kth.se/eecs/utbildning/hederskodex.