Igenkänning av tal och talare

Innehåll visas utifrån dina val

Om du inte hittar någon sida, schemahändelse eller nyhet på din kurswebb kan det bero på att du inte ser den kursomgången/gruppen inom kursen som innehållet tillhör.

Veta mer om din kurswebb

Din kurswebb är sidorna för en kurs du prenumererar på. Du väljer sedan vilka omgångar/grupper inom kursen du vill ha information från. Är du registrerad på en kursomgång sköts prenumeration och val av kursomgäng automatiskt åt dig. Vill du ändra något av detta gör du det under Mina inställningar.

När du är inloggad på din kurswebb ser du:
  • Kursöversikt, nyheter och schema med information som är filtrerat utifrån dina valda omgångar/grupper inom kursen
  • Allmänna sidor för hela kursen
  • Kurswikin som är sidor som alla, lärare och studenter, kan skapa och redigera
  • Sidor som hör till de omgångar/grupper inom kursen du valt eller som valts för dig

Logga in till din kurswebb

Du är inte inloggad på KTH så innehållet är inte anpassat efter dina val.

Speak Now

NEW VT2017:

NEW VT2016: the course has been redesigned with:

  • third lab updated with Deep Learning for Speech Recognition
  • collaboration with PDC for computing resources

NEW VT2015: the course has been redesigned with:

  • three new laboratory exercises
  • new lecture on Deep Learning for Speech Recognition

Automatic Speech Recognition (ASR) is concerned with the problem of transcribing spoken words and phrases into text. The ASR functionality is usually integrated into a larger system that makes it possible for humans to interact with computers using natural language. From a technical point of view, the ASR problem poses a number of challenges, emerging from the need to deal with real life signals produced by different individuals and in different conditions. The solutions are usually based on statistical modeling and machine learning.

This course gives insights into the signal processing and statistical methods employed in ASR and in Speaker identification.

Topics

Speech recognition, speech production, speech analysis, features, statistical modeling of sequences, hidden Markow models, search algorithms, language models, speaker identification.

PhD Students

The course can be also taken at the doctoral level with course number 2F5118. The extra requirements for doctoral level credits will be discussed on a individual basis.

Lärare

Ingen aktivitet senaste månaden. Gå till Nyhetsflödet för att se äldre.

Feedback Nyheter