DT2112 Talteknologi 7,5 hp

Speech Technology

Kursens centrala del är hur tal kan utnyttjas i Människa-datorinteraktion. Tillämpningar som behandlas inkluderar talande och talförstående datorer, talarverifiering som identifieringsmetod och multimodala dialogsystem. I kursen ingår grunderna för mänsklig kommunikation inom tal, språk, och hörsel. Dessutom användning av digital signalbehandling och statistiska metoder för analys och klassificering av tal.

  • Utbildningsnivå

    Avancerad nivå
  • Kursnivå (A-D)

    C
  • Huvudområde

    Elektroteknik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

VT14 för programstuderande

Lärandemål

Deltagarna ska efter genomgången kurs kunna:

  • beskriva tal ur akustiskt, fonetiskt och lingvistiskt perspektiv
  • förklara hur datorer känner igen tal och talare med hjälp av statistiska metoder, och utvärdera igenkänningsresultaten
  • beskriva och bedöma olika metoder för att producera tal med datorer
  • analysera talbaserade dialogsystem med avseende på tillämpning, komponenter, funktion och användaraspekter
  • sammanfatta idag tillgänglig talteknologi och ge exempel på den aktuella talforskningen inom t.ex. mobila system och IT
  • tillämpa de teoretiska kunskaperna i småskaliga talteknologiska projekt.

Kursens huvudsakliga innehåll

Kursen Talteknologi behandlar informationsöverföring med talet som medium och ger grundläggande kunskaper om tal, språk och hörsel. I kursen ingår moment som behandlar:

språkteori och fonetik

talproduktion av människor (talets fysiologi och akustik) och datorer (talsyntes)

talperception av människor (hörsel och psykolingvistik) och datorer (taligenkänning)

metoder för automatisk verifiering av talare (talarigenkänning)

multimodala dialogsystem för människa-dator-interaktion med tal och bild

praktiska studier och experiment med text-till-tal och tal-till-text.

Behörighet

För fristående kursstuderande krävs 60 högskolepoäng varav 30 högskolepoäng inom matematik eller datorlingvistik. Dessutom krävs engelska B eller motsvarande.

Rekommenderade förkunskaper

Kunskaper i matematik och signalanalys motsvarande basblocket för Civilingenjörsprogrammet i Medieteknik.

Litteratur

R. Rodman (1999). Computer Speech Technology. Artech House

Kompletterande särtryck som görs tillgängliga via kursens hemsida.

Examination

  • INL1 - Inlämningsuppgifter, 1,5 hp, betygsskala: P, F
  • LAB1 - Laborationer, 1,5 hp, betygsskala: P, F
  • TEN1 - Tentamen, 4,5 hp, betygsskala: A, B, C, D, E, FX, F

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Krav för slutbetyg

Skriftlig tentamen (4,5 hp.), laborationskurs (1,5 hp.) med tre obligatoriska laborationer och uppsats (1,5 hp).

Ges av

CSC/Tal, musik och hörsel

Kontaktperson

Joakim Gustafson, e-post: jkgu@kth.se

Examinator

Joakim Gustafsson <jkgu@kth.se>

Versionsinformation

Kursplan giltig från och med HT12.
Examinationsinformation giltig från och med VT08.