FDT3317 Talsyntes från startpunkt till ändpunkt-till-ändpunkt 7,5 hp

Administrera Om kursen

Information per kursomgång

Kursomgångar saknas för aktuella eller kommande terminer.

Kursplan som PDF

Notera: all information från kursplanen visas i tillgängligt format på denna sida.

Kursplan FDT3317 (HT 2019–)

Rubriker med innehåll från kursplan FDT3317 (HT 2019–) är markerade med en asterisk ( )

Innehåll och lärandemål

Kursinnehåll

”Maskiner som kan prata” är ett klassiskt forskningsområde som på senare tid fått ökad uppmärksamhet. Idag finns talande apparater i allas fickor och talsyntes har blivit en utmanande testplats för nya maskininlärningsmetoder.

Denna kurs utgör en introduktion till text-till-tal (TTT) med delmoment i akustisk fonetik och signalbehandling. Kursen beskriver ett universellt databehandlingsflöde för TTT: textbehandlare, prediktor och vågformsgenerator. Dessa komponenter studeras sedan inom ramen för de olika talsyntesparadigmerna, från konkatenativ syntes via statistisk parametrisk syntes och hybridsyntes till ändpunkt-till-ändpunktssystem.

Lärandemål

Efter avslutad kurs ska studenterna kunna:

1. Uppvisa en stadig kunskapsgrund för oberoende forskning och utveckling inom samtida text-till-tal-teknik.

2. Definiera och motivera grundläggande begrepp från akustisk fonetik och signalbehandling samt alla delsteg i databehandlingen från text till tal.

3. Med utgångspunkt i ovanstående teoretiska förståelse, erhålla och uppvisa kunskaper i systemimplementation, som praktiseras och uppvisas under övningar.

4. Uppvisa god bekantskap med de viktigaste framstegen i talsyntes genom åren (både vid och utanför KTH), såväl som med de senaste genombrotten såsom ändpunkt-till-ändpunktssystem baserade på djupa neurala nätverk.

Kurslitteratur och förberedelser

Särskild behörighet

Antagen till forskarutbildning.

Rekommenderade förkunskaper

Den tilltänkta studenten har viss erfarenhet av antingen signalbehandling, maskininlärning eller fonetik.

Kurslitteratur

Examination och slutförande

Betygsskala

P, F

Examination

EXA1 - Tentamen, 7,5 hp, betygsskala: P, F

Examinator beslutar, baserat på rekommendation från KTH:s handläggare av stöd till studenter med funktionsnedsättning, om eventuell anpassad examination för studenter med dokumenterad, varaktig funktionsnedsättning.

Examinator får medge annan examinationsform vid omexamination av enstaka studenter.

När kurs inte längre ges har student möjlighet att examineras under ytterligare två läsår.

Flera moment bidrar till slutbetyget, inklusive att framlägga en diskussionsartikel, deltagande i övningar samt det avslutande grupparbetet med systemdemonstrationer.

Övriga krav för slutbetyg

Godkänt omdöme i alla kurskomponenter (angivna ovan) krävs för att bli godkänd i kursen.

Examinator

Zofia Malisz

Gustav Henter

Etiskt förhållningssätt

Vid grupparbete har alla i gruppen ansvar för gruppens arbete.
Vid examination ska varje student ärligt redovisa hjälp som erhållits och källor som använts.
Vid muntlig examination ska varje student kunna redogöra för hela uppgiften och hela lösningen.

Ytterligare information

Kursrum i Canvas

Registrerade studenter hittar information för genomförande av kursen i kursrummet i Canvas. En länk till kursrummet finns under fliken Studier i Personliga menyn vid kursstart.

Ges av

EECS/Tal, musik och hörsel

Utbildningsnivå

Forskarnivå

Forskarkurs

Forskarkurser på EECS/Tal, musik och hörsel

Studier

Stöd och vägledning

IT och digitala tjänster

Kontakt