DT2118 Igenkänning av tal och talare 7,5 hp

Administrera Om kursen

Denna kurs är avvecklad.

Avvecklingsbeslut:

Ingen information tillagd

Information per kursomgång

Kursomgångar saknas för aktuella eller kommande terminer.

Kursplan som PDF

Notera: all information från kursplanen visas i tillgängligt format på denna sida.

Kursplan DT2118 (VT 2016–)

Rubriker med innehåll från kursplan DT2118 (VT 2016–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

Kursen består av föreläsningar, tre laborationer med inlämingsuppgifter, samt att skriva en uppsats i ett ämne valt i samråd med läraren. Uppsatsen presenteras dessutom muntligt under ett slutseminarium. Laborationerna består i att designa olika delar av en taligenkänningsapplikation, träna systemet och utvärdera dess prestanda.

Följande teoretiska delmoment ingår:

algoritmer för träning, igenkänning samt adaption till egenskaper hos talare och transmissionskanal, inklusive mönsterigenkänning, Hidden Markov Models (HMMs) och Deep Neural Networks (DNNs)
metoder för att minska känsligheten mot störningar och avvikelser
sannolikhetsteori
signalbehandling och parameterextraktion
akustisk modellering av talljudens statiska och tidsvarierande spektrala egenskaper
statistisk modellering av språkbruk i spontant och formellt tal
sökstrategier - grundläggande metoder och strategier för stora vokabulärer
specifika analys- och beslutsmetoder för igenkänning av talare.

Dessutom ges viss praktisk inblick i att bygga en tillämpning. Här ingår att implementera vissa funktioner utifrån prototyper och att testa dem på riktig taldata.

Lärandemål

Studenten ska efter genomgången kurs kunna

använda de i kursen beskrivna metoderna för att känna igen tal eller talare
konfigurera ett system till en given applikation
anpassa och vidareutveckla befintliga system för tal- och talarigenkänning
utvärdera system för tal- och talarigenkänning
bedriva forskningsarbete inom området.

Kurslitteratur och förberedelser

Särskild behörighet

För fristående kursstuderande krävs 90 hp varav 45 hp inom matematik eller informationsteknik. Dessutom krävs engelska B eller motsvarande.

Kurslitteratur

Huang, X., Acero, A., Hon, H.-W. Spoken Language Processing – A Guide to Theory, Algorithm and System Development, Prentice Hall, 2001.
Automatic Speech Recognition: A deep learning approach, Dong Yu and Li Deng, Springer 2015. You can download the PDF through KTH Library.
Särtryck på artiklar inom talarigenkänning och andra ämnen som inte ingår i boken.

Examination och slutförande

Betygsskala

P, F

Examination

LABC - Laboration, 4,5 hp, betygsskala: P, F
PROC - Projekt, 3,0 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Övriga krav för slutbetyg

Laboration
Inlämningsuppgifter
Uppsats med presentation vid ett slutseminarium
Bedömning av två övriga kursdeltagares uppsatser och opposition på deras presentationer.

Examinator

Ingen information tillagd

Etiskt förhållningssätt

Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

CSC/Tal, musik och hörsel

Huvudområde

Datalogi och datateknik, Informationsteknik, Informations- och kommunikationsteknik

Utbildningsnivå

Avancerad nivå

Övrig information

Observera att kursen kan komma att ställas in eller genomföras i annan form om antalet anmälda vid ordinarie kursval är för få.

Studier

Stöd och vägledning

IT och digitala tjänster

Kontakt