DT2112 Talteknologi 7,5 hp

Speech Technology

Kursens centrala del är hur tal kan utnyttjas i människa-datorinteraktion. Tillämpningar som behandlas inkluderar talande och talförstående datorer och multimodala dialogsystem. I kursen ingår grunderna för mänsklig kommunikation inom tal, språk, och hörsel. Dessutom användning av digital signalbehandling och statistiska metoder för analys och klassificering av tal, samt utvärdering, forskning och utveckling av talteknologiska metoder.

  • Utbildningsnivå

    Avancerad nivå
  • Huvudområde

    Elektroteknik
  • Betygsskala

    A, B, C, D, E, FX, F

Kurstillfällen/kursomgångar

Lärandemål

Efter genomgången kurs ska deltagarna kunna:

  • Beskriva tal ur akustiskt, fonetiskt och lingvistiskt perspektiv
  • Förklara hur datorer känner igen tal med hjälp av statistiska metoder, och utvärdera igenkänningsresultaten
  • Beskriva och bedöma olika metoder för att producera tal med datorer
  • Analysera talbaserade dialogsystem med avseende på tillämpning, komponenter, funktion och användaraspekter
  • Beskriva hur utvärdering av talteknologiska system går till och de speciella krav som ställs avjust den typen av system
  • Designa och beskriva datainsamlingar för talteknologisk forskning och utveckling
  • Sammanfatta idag tillgänglig talteknologi och ge exempel på den aktuella talforskningen inom t.ex. mobila system och IT
  • Tillämpa de teoretiska kunskaperna i småskaliga talteknologiska projekt

Kursens huvudsakliga innehåll

Kursen Talteknologi behandlar forskning och utveckling inom talteknologi och ger grundläggande kunskaper om tal, språk och hörsel. I kursen ingår moment som behandlar:

  • Språkteori och fonetik
  • Talproduktion av människor (talets fysiologi och akustik) och datorer (talsyntes)
  • Talperception av människor (hörsel och psykolingvistik) och datorer (taligenkänning)
  • Multimodala dialogsystem för människa-dator-interaktion med tal och bild
  • Praktiska talteknologiska studier och experiment
  • Metoder för utvärdering av och experimentering inom talteknologi
  • Datainsamling med inrktning på talteknologisk forskning och utveckling

Kursupplägg

  • Fyra heldagar med lektioner samt grupplaborationer
  • Projektdesign och projektgenomförande i grupp
  • Projekthandledning i större grupper
  • Projektpresentationer samt inlämning av projektrapport
  • Hemtentamen med genomgång i seminarieform

Behörighet

För fristående kursstuderande krävs 60 högskolepoäng varav 30 högskolepoäng inom matematik eller datorlingvistik. Dessutom krävs engelska B eller motsvarande.

Rekommenderade förkunskaper

Kunskaper i matematik och signalanalys motsvarande basblocket för Civilingenjörsprogrammet i Medieteknik.

Litteratur

Vetnskapliga publikationer. Pekare ges under föreläsningarna, men eleverna förväntas dessutom kunna söka relevanta artiklar självständigt eller med lärares stöd.

Examination

  • LABA - Laborationsuppgifter, 0,5, betygsskala: P, F
  • LABB - Forskningslaboration, , betygsskala: A, B, C, D, E, FX, F
  • PR01 - Projektuppgift och rapport, 3,5, betygsskala: A, B, C, D, E, FX, F
  • TENA - Hemtentamen, 3,5, betygsskala: A, B, C, D, E, FX, F

I denna kurs tillämpas skolans hederskodex, se: http://www.kth.se/csc/student/hederskodex.

Krav för slutbetyg

  • Aktivt deltagande i schemalagda aktiviteter
  • Godkänt på laborationer (i tid)
  • Godkänt projektanbud (i tid) 
  • Godkänd projektpresentation (i tid) 
  • E eller bättre på projektrapport (A-E, avgör 50% av slutbetyget)
  • E eller bättre på skriftlig hemtentamen (A-E, avgör 50% av slutbetyget)

Godkända laborationer, projektanbud och projektpresentation är nödvändiga för att gå vidare i kursen. Försenad hemtenta eller projektrapport ger ett betygssteg lägre betyg. En omtentamen ges, med möjliga godkända betyg begränsade till B-E.

Ges av

EECS/Intelligenta system

Kontaktperson

Jens Edlund, e-post: edlund@speech.kth.se

Examinator

Jens Edlund <jedlund@kth.se>

Joakim Gustafsson <jkgu@kth.se>

Versionsinformation

Kursplan gäller från och med VT2019.
Examinationsinformation gäller från och med VT2019.