Till innehåll på sidan

De förädlar framtidens musiktjänster

NYHET

Publicerad 2014-10-29

Trött på att få vilseledande tips i musiktjänster som Spotify eller Grooveshark? Snart kan det problemet vara löst. Forskare på KTH har nämligen tagit fram ett nytt sätt att beskriva och kategorisera musik som kan ligga till grund för hur framtidens musiktjänster ger låttips till lyssnarna.

Anders Friberg och Anders Elowsson, forskare vid KTH. Foto: Peter Larsson

Visst finns det ett knippe musikteoretiska termer som vi kan använda oss av när det kommer till att beskriva och diskutera musik. Det stora flertalet människor har emellertid inte studerat musikteori vilket gör att notskrift, harmoni- och gehörslära samt termer som andantino och dissonans tillhör ett obegripligt språk för de flesta.

Samma princip gäller förstås även för datorer. För att de ska kunna tipsa dig musik som du förhoppningsvis gillar måste de också kunna analysera vad du lyssnar på enligt en tydlig uppsättning parametrar. Parametrar som beskriver musik på samma sätt oavsett vilken grupp, låt eller musikgenre det handlar om.

Det är här KTH-forskarnas arbete kommer in i bilden.

De har tagit fram något de valt att kalla för perceptuella särdrag som ett sätt att beskriva all musik enligt samma, tydliga parametrar.

Anders Friberg, forskare vid KTH.

– Musiklyssnande är ett sätt för människor att försöka förstå sin omgivning, och det har vi utgått från. Man vill förstå musikern bakom musiken. Vad har musikern för intentioner?! Hur ledsen eller arg är hon eller han? Hur mycket energi har personen lagt ner på att framföra musiken? Det är samma grundläggande mekanismer som överallt annars. Att förstå andra människors känslor kan vara livsviktigt, säger Anders Friberg, forskare vid KTH.

Forskarna har således i ett första steg tagit fram följande 9 perceptuella särdrag som musik kan beskrivas med, och som bygger på just dessa mänskliga sidor snarare än ren faktaspäckad musikteori.

Här är listan med de 9 perceptuella särdragen KTH-forskarna Anders Friberg och Anders Elowsson genom sin gemensamma forskning kommit fram till:

  1. Hastighet: I stället för att tala om tempo, den term man brukar prata om vanligtvis, så använder vi hastighet. Detta då tempo till exempel inte tar hänsyn till hur många toner som spelas under en viss tid.
  2. Rytmisk komplexitet: Stor variation av olika taktarter i ett och samma musikstycke.
  3. Rytmisk klarhet: Detta berättar hur tydligt pulsen anges. Pulsen det är tempot eller ska vi säga "beatet". Det du stampar takten till i techno. Är tydligt i dansmusik, mer flytande i avancerad jazz eller klassisk musik.
  4. Artikulation: Om musiken innehåller korta eller bundna/långa toner.
  5. Dynamik: Om musiken uppfattas starkt eller svagt, till exempel löst eller hårt spelande på trummor eller fingrarnas anslag på pianots tangenter.
  6. Modalitet: Om musiken går i dur eller moll.
  7. Harmonisk komplexitet: Berör om harmoniken ändras mycket, det vill säga ackord med många dissonanser. Mer förenklat: massor av toner på en och samma gång.
  8. Tonhöjd: Hög eller låg.
  9. Klangfärg: Ljus eller mörk.

I ett andra steg har dessa 9 perceptuella särdrag testats på människor.

– Vi har låtit försökspersoner - 20 till antalet - bedöma dessa särdrag genom att de applicerats på musik. Totalt cirka 210 exempel från pop och filmmusik har personerna lyssnat på. Det vi kan se är att de perceptuella särdragen fungerar, och att till exempel egna referenser och kulturella skillnader inte spelar någon roll. Vi skulle kunna ta 20 nya försökspersoner och resultatet skulle bli det samma, säger Anders Friberg.

Han fortsätter med att berätta att de särdrag som funkat allra bäst är hastighet, modalitet, dynamik och harmonisk komplexitet.

– Dynamik är ju det som ger musiken energi, harmonisk komplexitet bidrar med själva känslouttrycket. Det här gör att det går att bestämma eller karakterisera musikgenrer, både från ett mänskligt och tekniskt perspektiv. Det som vi nu jobbar med är att ta forskningen vidare och utveckla datormodeller som gör att musiken kan analyseras automatiskt av och i till exempel musiktjänster, säger Anders Friberg.

Jaha. Blir musikrecensenterna överflödiga och därmed arbetslösa nu?

– Haha. Näe. Vårt sätt säger ingenting om musiken är bra eler dålig. Just den estetiska bedömningen är bland det svåraste man kan ägna sig åt, och det musikrecensenter jobbar med. Det är ju den sociala och kulturella kontexten som bestämmer recensentens uppfattning. Men visst, den biten kan väl forskare också försöka sig på att bedöma med hjälp av datorer, men då blir det riktigt avancerat, säger Anders Friberg.

Ämnesområdet som sådant är hett just nu.

– Precis som att Google analyserar både text och bilder så jobbar de, Spotify, Apple och andra företag intensivt med musikanalyser just nu, säger Anders Friberg.

Han tillägger att han och några andra KTH-forskare redan haft ett förutsättningslöst möte med Spotify, även om de ännu inte kommit fram till något speciellt.

KTH-forskarnas arbete har hittills varit framgångsrikt och de har precis fått en vetenskaplig artikel publicerad i tidskriften Journal of the Acoustical Society of America ( dx.doi.org/10.1121/1.4892767 ).

Förutom Anders Friberg har även KTH-doktoranden Anders Elowsson varit involverad i forskningsarbetet.

Text: Peter Larsson

För mer information, kontakta Anders Friberg på 08 - 790 75 76, 070 - 774 62 87 eller afriberg@kth.se.