Till innehåll på sidan
Till KTH:s startsida Till KTH:s startsida

Dela och publicera data

Det finns många fördelar med att dela forskningsdata, men det finns också en hel del saker att tänka på innan data delas.

Att tänka på innan data delas

Det är vanligt att dela data redan under aktiv forskning med samarbetspartners, men det blir också allt vanligare att tillgängliggöra data öppet vid publicering. Det finns dock juridiska och etiska överväganden innan du delar dina datapublikt. Forskningsdata kan inte delas helt öppet om det innehåller något av följande:

  • Material som är sekretessbelagt enligt Offentlighets- och sekretesslag (2009:400).
  • Känsliga personuppgifter
  • Material som är upphovsrättsskyddat av någon annan
  • Material som innehåller företagshemligheter eller finansiell information

Varför ska du dela data

…science moves faster in an open world” / Steven Salzberg, Director of the center for Computational Biology, Johns Hopkins University

  • Att dela data öppet gör det möjligt att återanvända data i andra forskningsprojekt. Det gör det också möjligt för andra att bekräfta vetenskapliga observationer och bidrar till en mer transparent forskningsprocess.

  • Det kan skapa nya möjligheter för erkännande av din forskningsgärning genom exempelvis citerade eller nedladdade datasets.  

  • Det möjliggör för nya möjligheter till samarbeten mellan forskargrupper, både nationellt och internationellt.

  • Genom att välja en tillförlitlig dataportal sparas data på ett tillförlitligt sätt.

Hur delar du data

När du delar data bör du så långt som möjligt följa FAIR-principerna . FAIR står för Findable, Accessible, Interoperable and Reusable, och FAIR-principerna syftar till att göra det så enkelt som möjligt att hitta och återanvända data på ett korrekt sätt. Genom att beskriva ditt data med relevant metadata gör du det möjligt för andra att hitta och återanvända dina dataset. På fairsharing.org  hittar du olika standarder för metadata.

Du behöver också använda beständiga identifierare för att det ska gå att hitta till ditt data. Exempel på beständiga identifierare är DOI (digital object identifier) , URI (uniform resource identifier)  och ORCID (Open researcher and contributer ID) .

En annan viktig aspekt för att möjliggöra återanvändning är att du behöver förse ditt data med en licens för återanvändning. Läs mer om licenser i avsnittet om upphovsrätt  på sidan om juridiska aspekter kring forskningsdata.

För att maximera synligheten för din forskning, och samtidigt öka möjligheterna för andra att reproducera dina resultat bör du tydligt länka till både data och eventuell källkod från en publikation de ligger till grund för, och tillbaka till publikationen från data och källkod.

Var delar du data

Det finns en stor mängd datarepositorier och -plattformar för att dela data. Inom vissa forskningsområden finns redan väletablerade ämnesspecifika datarepositorier som används internationellt. Ett annat sätt för dig att dela data är att använda dig av en bred dataportal. Vi kan rekommendera följande breda dataportaler där du kan beskriva och dela data:

KTH-Zenodo community : Zenodo  är ett repositorium skapat av CERN och OpenAIRE. I Zenodo kan du registrera ett konto och ladda upp till 50 GB per dataset, med möjlighet till utökat utrymme. Det är också möjligt med versionering samt att beskriva data med begränsad åtkomst. Du kan koppla ihop ditt data i Zenodo med både din publikation (via ditt ORCiD) och tillhörande källkod (på Github). Som KTH-forskare kan du beskriva och ladda upp data via KTH-Zenodo community . Där får dina data en DOI och blir också tydligt associerat med KTH. KTH:s forskningsdatagrupp granskar metadatakvaliteten på det data som laddas upp till KTH-Zenodo community. Om en del av din forskning resulterar i källkod kan du beskriva den och få en DOI i Zenodo som pekar mot källkod i GitHub, vilket synliggör och underlättar citerbarheten för programkod. Här kan du läsa mer om hur du gör din källkod på GitHub citerbar.

SND: Svensk Nationell Datatjänst  är ett svenskt initiativ till forskningsinfrastruktur som drivs av ett konsortium av olika svenska lärosäten. SND syftar till att stödja tillgänglighet, bevarande och återanvändning av forskningsdata. Här får du en kontroll av metadatakvaliteten från KTH:s forskningsdatagrupp innan publicering och det är också möjligt att beskriva dina data enligt FAIR-principerna även för data där direktåtkomst inte är möjlig. SND är ett bra alternativ om du har ett flertal dataset som ingår i en större samling eller konfidentiella data som kan beskrivas enligt FAIR men inte får tillgängliggöras helt öppet.

Du hittar andra mer ämnesspecifika repositorier Re3data.org  där du kan browsa och filtrera på ämne, område, certifiering, metadatastandarder etc. Det finns också europeiskt initiativ till att knyta ihop gemensam digital infrastrukturinom forskning via European Open Science Cloud.

Inom vissa områden finns också datatidskrifter som är inriktade på att publicera dataartiklar.

När bör du dela data

Under den aktiva fasen av ett forskningsprojekt är det vanligt att dela data med olika samarbetspartners. I denna fas är det ofta inte önskvärt att dela data helt publikt, speciellt inte inom forskningsfält med hög konkurrens. Då är det viktigt att använda sig av en plattform för att dela data som uppfyller rimliga krav på informationssäkerhet och där spårbarhet och versionering finns på plats.

När forskningen resulterat i publicerbart material däremot, är det en lämplig tidpunkt att också tillgängliggöra de data som ligger till grund för publikation. Har data dokumenterats och hanterats i system med spårbarhet och versionering är det inte särskilt tidskrävande att tillgängliggöra också data vid publicering.

När det kommer till dokumentation är det bra att redan i projektets planeringsfas undersöka om det finns metadatastandarder, kontrollerade vokabulärer eller ontologier inom forskningsfältet som kan användas för att ”tagga”/beskriva den data som genereras inom projektet.

Här finns en lista över metadatastandarder från Research Data Alliance.

Bild från kursen

Öppen vetenskap och hantering av forskningsdata

I denna kurs för KTH-anställda kan du lära dig mer om öppen vetenskap och datahantering. Kursen ges i lärplattformen Canvas och kräver inloggning med KTH-kontot. Kursen är på engelska och du går den i din egen takt.

Gå till kursen Open Science and Research Data Management