Till innehåll på sidan

KTH hjälper Wikipedia börja prata

NYHET

Publicerad 2016-03-07

KTH deltar nu i ett fyramiljonersprojekt som syftar till att lära Wikipedia att prata. Det är genom ett samarbete som är finansierat av Post- och telestyrelsen (PTS), där KTH tillsammans med Wikimedia Sverige och STTS skall göra Wikipedia mer tillgängligt för personer med nedsatt syn eller dyslexi. Projektet har fått namnet Wikispeech.

Joakim Gustafson, professor i talteknologi på KTH.

– Vi har precis fått 2,8 miljoner tillsammans med bland andra Wikimedia Sverige för att ta fram en talsyntes som ska kunna ge människor med synskador och lässvårigheter bättre tillgång till Wikipedia. Vi har dessutom erhållit ytterligare 1 miljon kronor i form av en postdoc-tjänst där forskaren ska hjälpa till med detta arbete, säger Joakim Gustafson, professor i talteknologi på KTH.

Wikipedia, som ofta kallas för världens största uppslagsverk, är den mest använda webbplatsen som inte drivs av ett kommersiellt företag. Enligt Wikimedia Sverige besöks webbplatsen av cirka 500 miljoner personer och har 20 miljarder sidvisningar varje månad. Upp till 25 procent av dessa besökare behöver, eller föredrar att, ta till sig textinformation i uppläst form. Talsynteslösningen har alltså potential att stötta cirka 125 miljoner användare varje månad.

Talsyntesen kommer att vara användargenerad, en metod som kallas "crowdsourcing". I likhet med Wikipedias artiklar innebär detta att användarna bidrar till ständig utveckling av talsyntesen så att den blir bättre och låter mer naturlig. Talsyntesen kommer först finnas på svenska och engelska men kommer även att fungera på arabiska. Möjligheten finns sedan att med hjälp av användarna utöka till resterande språk som Wikipedia finns tillgängligt på, vilket i dagsläget är drygt 280 stycken.

Cirka 125 miljoner användare kommer månatligen att ha användning av KTH-forskarnas arbete.

Talsyntesen kommer vara ett tillägg till mjukvaran Mediawiki - som Wikipedia använder - och blir därmed öppen källkod och fri att använda för de tusentals svenska företag, kommuner och universitet som redan använder mjukvaran. Allt producerat material kommer att vara fritt licenserat och kan återanvändas gratis av vem som helst, något som inte tidigare gjorts för en så omfattande talsynteslösning.

– Den interna finanseringen om 1 miljon kronor till postdoc-tjänsten kommer från det strategiska forskningsområdet Informations- och kommunikationsteknik och ICT - The Next Generation. Projektledare för projektet är Jonas Beskow, professor i Talkommunikation på KTH, och postdoktor Zofia Malisz är den som kommer att stödja Wikispeech genom att jobba med talsyntesens uttal. Hon studerar var någonstans människor lägger tonvikten när de pratar. Om en talsyntes avviker från detta mönster, till exempel genom felplacerad eller utebliven tonvikt, blir det i längden tröttsamt att lyssna på talsyntesen. Rösten blir då både mindre naturlig och otydligare, säger Joakim Gustafson.

Förutom KTH, PTS och Wikimedia Sverige ingår även Södermalms talteknologiservice i forskningsprojektet som ska pågå mellan mars 2016 till september 2017.

Text: Peter Larsson

För mer information, kontakta Joakim Gustafson på 070 - 206 08 17 eller jocke@speech.kth.se.