EN2300 Talsignalbehandling 6,0 hp

Speech Signal Processing

The course treats current speech signal processing technology by means of home assignments, tutorial excercises, and lectures. It provides hands-on experience with the application of signal processing methods in a speech and audio framework.

  • Utbildningsnivå

    Avancerad nivå
  • Kursnivå (A-D)

    D
  • Huvudområde

  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

HT12 för programstuderande

Lärandemål

Efter genomgången kurs skall deltagarna kunna

* översiktligt beskriva hur människan producerar tal och hur uttalet av olika talljud bestämmer ljudens akustiska egenskaper.

* tillämpa verktyg i MatLab för att analysera talsignaler i tids- och frekvensdomän, samt i form av parametrar i en källa-filter-modell av talproduktionen,

* lösa givna problem angående parameterestimering i källa-filter- modell och analys och syntes av talsignaler med sådana modeller.

* beskriva och implementera metoder och system för effektiv kvantisering och kodning av talsignaler, samt lösa givna problem kring dessa metoder,

* beskriva och implementera metoder för talförbättring (t.ex.

störningsundertryckning), och lösa givna problem kring dessa metoder,

* beskriva och implementera enklare tillämpningar av mönsterigenkänning för tal, såsom talar- och tal-igenkänning, samt lösa givna problem kring dessa metoder.

För att uppnå högre betygsgrader skall deltagare också kunna

* lösa mer avancerade givna problem i alla ovannämnda områden.

Kursens huvudsakliga innehåll

Kursen behandlar aktuella metoder i talsignalbehandling och ger praktisk erfarenhet av att tillämpa dessa metoder.

Kursen innehåller avsnitt av följande fyra områden av

talsignalbehandling:

* analys och syntes av talsignaler,

* kvantisering, kodning och överföring av talsignaler,

* talförbättrring (t.ex. störningsundertryckning)

* akustisk talarigenkänning och taligenkänning.

Behörighet

För fristående kursstudent: 120 hp samt Engelska B eller motsvarande

Rekommenderade förkunskaper

EQ1220 Signalteori eller likvärdig

Litteratur

Vary, P & Martin, R: Digital Speech Transmission. Enhancement, coding, and error concealment. Wiley, 2006.

Tillkommande material.

Examination

  • INL1 - Hemuppgift, 1,5 hp, betygsskala: A, B, C, D, E, FX, F
  • TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F

Krav för slutbetyg

Skriftlig tentamen (75%), hemuppgift (25%).

Ges av

EES/Ljud- och bildbehandling

Kontaktperson

Saikat Chatterjee

Examinator

Mikael Skoglund <skoglund@kth.se>

Övrig information

 Ersätter 2E1400.

Versionsinformation

Kursplan giltig från och med HT09.
Examinationsinformation giltig från och med HT07.