DT2112 Talteknologi 7,5 hp
Speech Technology
Kursens centrala del är hur tal kan utnyttjas i Människa-datorinteraktion. Tillämpningar som behandlas inkluderar talande och talförstående datorer, talarverifiering som identifieringsmetod och multimodala dialogsystem. I kursen ingår grunderna för mänsklig kommunikation inom tal, språk, och hörsel. Dessutom användning av digital signalbehandling och statistiska metoder för analys och klassificering av tal.
Utbildningsnivå
Avancerad nivåKursnivå (A-D)
CHuvudområde
Elektroteknik
Betygsskala
A, B, C, D, E, FX, F
Kurstillfällen/kursomgångar
VT14 för programstuderande
Perioder
VT14 P3 (7,5 hp)
Anmälningskod
60117
Kursen startar
2014 vecka: 4
Kursen slutar
2014 vecka: 12
Undervisningsspråk
Engelska
Campus
KTH Campus
Antal föreläsningar
24 (preliminärt)
Antal övningar
1 (preliminärt)
Undervisningstid
Dagtid
Undervisningsform
Normal
Antal platser
Ingen begränsning
Kursansvarig
Jens Edlund <jedlund@kth.se>
Joakim Gustafsson <jkgu@kth.se>
Lärare
Giampiero Salvi <giampi@kth.se>
Joakim Gustafsson <jkgu@kth.se>
Olov Engwall <engwall@kth.se>
Målgrupp
Obligatorisk för CMETE-LJD, THCIM-MI och TMETM
Sökbar för studenter på civilingenjörsprogram som har uppnått minst 90 hp varav minst 50 hp från årskurs 1. Sökbar för studenter på masterprogram.
Del av program
- Civilingenjör och lärare, åk 4, MADA, Villkorligt valfri
- Civilingenjörsutb i medieteknik, åk 3, LJD, Obligatorisk
- Masterprogram, datalogi, åk 1, CSCA, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCE, Villkorligt valfri
- Masterprogram, datalogi, åk 1, CSCI, Villkorligt valfri
- Masterprogram, datalogi, åk 2, CSCA, Villkorligt valfri
- Masterprogram, datalogi, åk 2, CSCE, Villkorligt valfri
- Masterprogram, datalogi, åk 2, CSCI, Villkorligt valfri
- Masterprogram, medieteknik, åk 1, METC, Villkorligt valfri
- Masterprogram, medieteknik, åk 2, METC, Villkorligt valfri
- Masterprogram, människa-datorinteraktion, åk 1, HCIB, Obligatorisk
Lärandemål
Deltagarna ska efter genomgången kurs kunna:
- beskriva tal ur akustiskt, fonetiskt och lingvistiskt perspektiv
- förklara hur datorer känner igen tal och talare med hjälp av statistiska metoder, och utvärdera igenkänningsresultaten
- beskriva och bedöma olika metoder för att producera tal med datorer
- analysera talbaserade dialogsystem med avseende på tillämpning, komponenter, funktion och användaraspekter
- sammanfatta idag tillgänglig talteknologi och ge exempel på den aktuella talforskningen inom t.ex. mobila system och IT
- tillämpa de teoretiska kunskaperna i småskaliga talteknologiska projekt.
Kursens huvudsakliga innehåll
Kursen Talteknologi behandlar informationsöverföring med talet som medium och ger grundläggande kunskaper om tal, språk och hörsel. I kursen ingår moment som behandlar:
språkteori och fonetik
talproduktion av människor (talets fysiologi och akustik) och datorer (talsyntes)
talperception av människor (hörsel och psykolingvistik) och datorer (taligenkänning)
metoder för automatisk verifiering av talare (talarigenkänning)
multimodala dialogsystem för människa-dator-interaktion med tal och bild
praktiska studier och experiment med text-till-tal och tal-till-text.
Behörighet
För fristående kursstuderande krävs 60 högskolepoäng varav 30 högskolepoäng inom matematik eller datorlingvistik. Dessutom krävs engelska B eller motsvarande.
Rekommenderade förkunskaper
Kunskaper i matematik och signalanalys motsvarande basblocket för Civilingenjörsprogrammet i Medieteknik.
Litteratur
R. Rodman (1999). Computer Speech Technology. Artech House
Kompletterande särtryck som görs tillgängliga via kursens hemsida.
Examination
- INL1 - Inlämningsuppgifter, 1,5 hp, betygsskala: P, F
- LAB1 - Laborationer, 1,5 hp, betygsskala: P, F
- TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F
I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.
Krav för slutbetyg
Skriftlig tentamen (4,5 hp.), laborationskurs (1,5 hp.) med tre obligatoriska laborationer och uppsats (1,5 hp).
Ges av
CSC/Tal, musik och hörsel
Kontaktperson
Joakim Gustafson, e-post: jkgu@kth.se
Examinator
Joakim Gustafsson <jkgu@kth.se>
Versionsinformation
Kursplan giltig från och med
HT12.
Examinationsinformation giltig från och med
VT08.
