EQ2321 Tal- och ljudsignalbehandling 7,5 hp
Kursen behandlar fundamentala och avancerade signal- och informationsbehandlingsmetoder for tal- och ljudtillämpningar som exempelvis telefonkonversation och musikspelande. Till exempel, vilken information i mänskligt tal behöver extraheras och överföras för att åstadkomma ett effektivt telefonsamtal, och hur detta ska göras.
(1) Grunder inom digital signalbehandling som faltning, Z-transform, Fourier-transform, effektspektrum etc.
(2) Källa-filter modell: analys- och syntesarkitektur.
(3) Källkodning: skalär- och vektorkvantisering, eliminering av redundans, linjär prediktion, kodning i öppen- och sluten loop, kodningsbrus, kodningsförstärkning.
(4) Tal- och ljudkodning: vocoders, låg- och högbitshastighetskoder, upplevelsebaserad ljudkodning, psykoakustiska principer.
(5) Tal- och ljudförbättring, minsta-medel-kvadrat skattning, linjär estimering för Gaussiska fördelningar, Wiener-filtrering, effektspektrums-subtraktionsmetoder, spektralbandsreplikering etc.
Välj termin och kursomgång
Välj termin och kursomgång för att se aktuell information och mer om kursen, såsom kursplan, studieperiod och anmälningsinformation.
Kursval
Gäller för kursomgång
VT 2025 Start 2025-01-14 programstuderande
Anmälningskod
60424
Innehåll och lärandemål
Kursinnehåll
Kursen behandlar fundamentala och avancerade signal- och informationsbehandlingsmetoder for tal- och ljudtillämpningar som exempelvis telefonkonversation och musikspelande. Till exempel, vilken information i mänskligt tal behöver extraheras och överföras för att åstadkomma ett effektivt telefonsamtal, och hur detta ska göras.
(1) Grunder inom digital signalbehandling som faltning, Z-transform, Fourier-transform, effektspektrum etc.
(2) Källa-filter modell: analys- och syntesarkitektur.
(3) Källkodning: skalär- och vektorkvantisering, eliminering av redundans, linjär prediktion, kodning i öppen- och sluten loop, kodningsbrus, kodningsförstärkning.
(4) Tal- och ljudkodning: vocoders, låg- och högbitshastighetskoder, upplevelsebaserad ljudkodning, psykoakustiska principer.
(5) Tal- och ljudförbättring, minsta-medel-kvadrat skattning, linjär estimering för Gaussiska fördelningar, Wiener-filtrering, effektspektrums-subtraktionsmetoder, spektralbandsreplikering etc.
Lärandemål
Efter avklarad kurs skall studenterna kunna:
* översiktligt beskriva hur människan producerar tal och hur uttalet av olika talljud bestämmer ljudens akustiska egenskaper.
* tillämpa datorverktyg (såsom MatLab eller Python) för att analysera tal- och ljudsignaler i tids- och frekvensdomän, samt i form av parametrar i en källa-filter-modell av talproduktionen.
* kritiskt analysera, jämföra och implementera metoder och system för effektiv kodning av tal- och ljudsignaler, samt konstruera effektiva kodningslösningar.
* analysera och jämföra och implementera metoder för förbättring (t.ex.
störningsundertryckning) av tal- och ljudsignaler is störande/brusiga miljöer.
Kurslitteratur och förberedelser
Särskild behörighet
För fristående kursstudent: 120 hp samt Engelska B eller motsvarande
Rekommenderade förkunskaper
Rekommenderade förkunskaper: EQ1220 Signalteori alt. EQ1270 Signalbehandling eller motsvarande.
Utrustning
Kurslitteratur
Annonseras på kurshemsidan innan kursstart. Preliminärt:
(1) Digital speech transmission: Enhancement, coding and error concealment. Av Peter Vary och Rainer Martin.
(2) Perceptual coding of digital audio. Av Ted Painter och Andreas Spanias.
(3) Anteckningar från läraren. Dessa kan laddas ner från hemsidan
(4) Några forskningsartiklar.
Examination och slutförande
När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.
Betygsskala
Examination
- PRO1 - Projekt 1, 1,5 hp, betygsskala: A, B, C, D, E, FX, F
- PRO2 - Projekt 2, 1,5 hp, betygsskala: A, B, C, D, E, FX, F
- TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F
Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.
Examinator får medge annan examinationsform vid omexamination av enstaka studenter.
Övriga krav för slutbetyg
Det är tre former av examination i kursen.
(1) Kontrollskrivningar: Det är två kontrollskrivningar under kursens gång. Varje prov är 20-30 minuter. De syftar till att testa förståelse av koncept och kontinuerligt lärande av materialet i kursen. Skrivningarna består av korta konceptfrågor och inga komplicerade problem. Betyg A-F.
(2) Projekt: Det är två projekt som examineras genom presentationer. Projekten kan genomföras i grupper om två personer men betygsätts individuellt. Betyg A-F.
(3) Tentamen: En skriftlig tentamen. Betyg A-F.
Slutbetyget på kursen baseras på en sammanvägd bedömning, där examinatorn anger viktningen.
Kontrollskrivnignarna är ej obligatoriska för att klara kursen men har betydelse för slutbetyget. Projekten och den skriftliga tentamen är obligatoriska.
Möjlighet till komplettering
Möjlighet till plussning
Examinator
Etiskt förhållningssätt
- Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
- Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
- Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.
Ytterligare information
Kursrum i Canvas
Ges av
Huvudområde
Utbildningsnivå
Påbyggnad
Övrig information
I denna kurs tillämpas EECS hederskodex, se: http://www.kth.se/eecs/utbildning/hederskodex.