De avslöjar röstens hemligheter

Bygger supermodell av rösten

NYHET

Publicerad 2013-05-06

I ett omfattande europeiskt forskningsprojekt som leds av KTH ska en komplett modell av människorösten tas fram. Arbetet är redan igång, och forskningen inbegriper så väl fysiska modeller, simuleringar som visualiseringar av vår röst. Den ökade förståelsen ska utgöra en grund för att andra att jobba vidare med, och kan exempelvis leda till bättre talproteser, röstvård, talande robotar och undervisningsmöjligheter i sammanhang där människors röst spelar stor roll.

Ögonblicksbild från en animering av en stämbandsmodell. Bild: J. Jansson, C. Degirmenci och J. Hoffman. — Ögonblicksbild från en animering av en stämbandsmodell. Bild: J. Jansson, C. Degirmenci och J. Hoffman

Sten Ternström, professor i musikakustik, är en av de KTH-forskare som ingår i Eunison som koordineras av KTH.

Med tre forskningsgrupper från KTH som samarbetar med fyra andra röstexpertgrupperingar på universitet och forskningsinstitut i Frankrike, Tyskland och Spanien är projektet omfattande. Det gäller även budgeten, som ligger på 25 miljoner kronor och motsvarar många tusentals forskningstimmar, enligt Sten Ternström.

– Människorösten är en mycket central del av våra liv, och därtill komplicerad. Därför behöver vi bättre förståelse för hur rösten fungerar, och hur den fallerar. Syftet med forskningen är att resultatet i förlängningen ska leda till bättre talproteser, röstvård, pratande maskiner och undervisningsmöjligheter, säger Sten Ternström.

I projektet samarbetar en mängd röst- och beräkningsexperter på universitet över halva Europa, med kraftfulla datorer till sin hjälp.

Sten Ternström, professor i musikakustik vid KTH. Foto: Anna Ternström.

– Forskningsberäkningarna skulle förvisso kunna göras på en vanlig persondator, men det skulle resultera i biblisk tidsåtgång. Vi använder istället KTH:s superdator Lindgren, den vassaste vi har när det gäller kolossala beräkningsresurser. Det handlar visserligen i grunden om rätt enkla fysikaliska samband och de fyra räknesätten, men samtidigt är det snabba rörelser hos mijontals punkter i tre dimensioner" vi talar om, så det blir väldigt mycket plus, minus och gånger, vilket gör forskningen beräkningstung, säger Sten Ternström.

I den kompletta modellen över människorösten ingår alltså simuleringar och visualisering, där superdatorer spelar stor roll. Men även mekaniska modeller i silikon och plast av stämband, ansatsrör och tunga kommer att konstrueras samt studeras i experiment för att kontrollera att simuleringarna räknar rätt.

– Rösten är en väldigt komplex företeelse, som kräver mycket arbete för att efterlikna och förstå. Vi är därför också intresserade av att se hur mycket modellen kan förenklas, utan att röstljuden påverkas av detta, säger Sten Ternström.

Biomekaniska datormodeller används för att studera hur röstljuden skapas och fortplantas i kroppen. Bild: M.Arnela och O.Guasch, La Salle R&D, Universitat Ramon Llull.

Han tillägger att forskarna redan blivit klara med en förstudie, och har kommit igång med forskningsarbetet. En stor skillnad mot tidigare gjord forskning på området är att Eunison kommer att kombinera rön från flera discipliner, och gå från ax till limpa där tidigare insatser varit av mer fragmentarisk karaktär. Det finns sedan tidigare åtskilliga modeller av olika delar av rösten, som till exempel stämbanden eller ansatsröret, men de är oftast förenklade just för att man ska slippa de tunga fysikberäkningarna.

– Vår färdiga modell över människorösten kommer att likna en marionettdocka. Forskaren rycker i en eller flera trådar och kan sedan se vad som händer, säger Sten Ternström.

Han fortsätter med att berätta att röstmodellen ska vara styrbar över internet. Det betyder att forskare var som helst ska kuna mata in data och få tillbaka en visualisering via nätet.

Förutom Sten Ternström ingår även KTH-forskarna Olov Engwall, Johan Hoffman, Johan Jansson och Örjan Ekeberg i Eunison.

Hit hittar du Eunisons webbplats: www.eunison.eu

För mer information, kontakta Sten Ternström på 08 - 790 78 55 eller sten@speech.kth.se.

Peter Larsson

IS nyheter