EN2300 Talsignalbehandling 6,0 hp
Speech Signal Processing
The course treats current speech signal processing technology by means of home assignments, tutorial excercises, and lectures. It provides hands-on experience with the application of signal processing methods in a speech and audio framework.
Utbildningsnivå
Avancerad nivåKursnivå (A-D)
DHuvudområde
Betygsskala
A, B, C, D, E, FX, F
Kurstillfällen/kursomgångar
HT12 för programstuderande
Perioder
HT12 P2 (6,0 hp)
Anmälningskod
50750Kursen startar
2012 vecka: 43Kursen slutar
2013 vecka: 1Undervisningsspråk
EngelskaCampus
KTH CampusAntal föreläsningar
24 (preliminärt)Antal övningar
24 (preliminärt)Undervisningstid
DagtidUndervisningsform
NormalAntal platser
Ingen begränsningSchema
Schema (nytt fönster)Lärare
Saikat Chatterjee, Petko Petkov
Målgrupp
Öppen för alla program
Del av program
- Masterprogram, inbyggda system, åk 2, Villkorligt valfri
- Masterprogram, industriell ekonomi, åk 1, TSIA, Rekommenderad
- Masterprogram, informations- och kommunikationsteknik, åk 1, Rekommenderad
- Masterprogram, systemteknik och robotik, åk 1, Rekommenderad
- Masterprogram, systemteknik och robotik, åk 2, Rekommenderad
- Masterprogram, trådlösa system, åk 1, Villkorligt valfri
- Masterprogram, trådlösa system, åk 2, Rekommenderad
HT13 för programstuderande
Perioder
HT13 P2 (6,0 hp)
Anmälningskod
50968Kursen startar
2013 vecka: 45Kursen slutar
2014 vecka: 3Undervisningsspråk
EngelskaCampus
KTH CampusAntal föreläsningar
24 (preliminärt)Antal övningar
24 (preliminärt)Undervisningstid
DagtidUndervisningsform
NormalAntal platser
Ingen begränsningSchema
Schema (nytt fönster)Lärare
Saikat Chatterjee, Petko Petkov
Målgrupp
Öppen för alla masterprogram
Del av program
- Masterprogram, ICT Innovation, åk 2, DMTE, Valfri
- Masterprogram, inbyggda system, åk 2, Villkorligt valfri
- Masterprogram, informations- och kommunikationsteknik, åk 1, Rekommenderad
- Masterprogram, informations- och kommunikationsteknik, åk 2, Rekommenderad
- Masterprogram, medieteknik, åk 1, METC, Villkorligt valfri
- Masterprogram, systemteknik och robotik, åk 1, Rekommenderad
- Masterprogram, systemteknik och robotik, åk 2, Rekommenderad
- Masterprogram, trådlösa system, åk 1, Villkorligt valfri
- Masterprogram, trådlösa system, åk 2, Rekommenderad
Lärandemål
Efter genomgången kurs skall deltagarna kunna
* översiktligt beskriva hur människan producerar tal och hur uttalet av olika talljud bestämmer ljudens akustiska egenskaper.
* tillämpa verktyg i MatLab för att analysera talsignaler i tids- och frekvensdomän, samt i form av parametrar i en källa-filter-modell av talproduktionen,
* lösa givna problem angående parameterestimering i källa-filter- modell och analys och syntes av talsignaler med sådana modeller.
* beskriva och implementera metoder och system för effektiv kvantisering och kodning av talsignaler, samt lösa givna problem kring dessa metoder,
* beskriva och implementera metoder för talförbättring (t.ex.
störningsundertryckning), och lösa givna problem kring dessa metoder,
* beskriva och implementera enklare tillämpningar av mönsterigenkänning för tal, såsom talar- och tal-igenkänning, samt lösa givna problem kring dessa metoder.
För att uppnå högre betygsgrader skall deltagare också kunna
* lösa mer avancerade givna problem i alla ovannämnda områden.
Kursens huvudsakliga innehåll
Kursen behandlar aktuella metoder i talsignalbehandling och ger praktisk erfarenhet av att tillämpa dessa metoder.
Kursen innehåller avsnitt av följande fyra områden av
talsignalbehandling:
* analys och syntes av talsignaler,
* kvantisering, kodning och överföring av talsignaler,
* talförbättrring (t.ex. störningsundertryckning)
* akustisk talarigenkänning och taligenkänning.
Behörighet
För fristående kursstudent: 120 hp samt Engelska B eller motsvarande
Rekommenderade förkunskaper
EQ1220 Signalteori eller likvärdig
Litteratur
Vary, P & Martin, R: Digital Speech Transmission. Enhancement, coding, and error concealment. Wiley, 2006.
Tillkommande material.
Examination
- INL1 - Hemuppgift, 1,5 hp, betygsskala: A, B, C, D, E, FX, F
- TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F
Krav för slutbetyg
Skriftlig tentamen (75%), hemuppgift (25%).
Ges av
EES/Ljud- och bildbehandling
Kontaktperson
Saikat Chatterjee
Examinator
Mikael Skoglund <skoglund@kth.se>
Övrig information
Ersätter 2E1400.
Versionsinformation
Kursplan giltig från och med
HT09.
Examinationsinformation giltig från och med
HT07.
