Datarepositorier

För att tillgängliggöra och publicera forskningsdata öppet rekommenderas att registrera dem i ett datarepositorium. Det finns en stor mängd datarepositorier för att publicera och dela data. Inom vissa forskningsområden finns redan väletablerade ämnesspecifika datarepositorier.

Att publicera forskningsdata i etablerade repositorier ger dig som forskare flera fördelar:  

  • Du skapar "automatiskt" standardmetadata som gör ditt dataset interoperabelt och återanvändbart 
  • Datasetet får en beständig identifierare (PID) vilket gör det tillgängligt och möjliggör korrekt citering där dataset kopplas till en publikation.   

Dataset som innehåller personuppgifter av något slag kan inte laddas upp i öppna repositorier. Du kan fortfarande använda repositorier för att skapa en metadata-post för att beskriva ett dataset som innehåller personuppgifter, medan filerna i datasetet laddas upp till en säker lagringsyta på KI.

Om du använder skript för att analysera dina data kan du kommentera skripten och publicera dem öppet. På det sättet blir det tydligt för andra forskare vilka metoder du har använt, oavsett om datasetet är öppet tillgängligt eller ej.

Exempel på repositorier

  • Svensk Nationell Datatjänst (SND) är en nationell plattform där forskningsdata kan delas öppet eller göras sökbara genom publicerade beskrivningar av dataset som av olika skäl inte kan delas öppet. SND:s system för att beskriva och dela forskningsdata kallas DORIS. Detta är det bästa alternativet för att dela forskningsdata som innehåller känsliga data som t ex personuppgifter. Läs mer här.
  • Zenodo är ett repositorium skapat av CERN och OpenAIRE. I Zenodo kan du ladda upp till 50 GB per dataset utan kostnad. Det går att koppla ihop data i Zenodo med  tillhörande källkod på GitHub. 
  • Figshare är ett generellt datarepositorium som används av och är tillgängligt för forskare från alla discipliner. Det går att ladda upp till 20 GB utan kostnad. 
  • BioStudies är ett datarepositorium för beskrivningar av biologiska studier. BioStudies finns med på ELIXIR:s lista över rekommenderade databaser.
  • GitHub är en webbaserad tjänst för lagring av kod. Här kan du publicera analysskript och annan kod inom forskning. Det är möjligt att använda Github för versionskontroll och få en tidsstämpel med en beständig identifierare genom repositoriet Zenodo.

Fler repositorier, både generella och ämnesspecifika, finns listade hos Re3data.org. Här går det att söka efter information om repositorier eller bläddra och filtrera på ämne, område, certifiering, metadatastandarder etc.

En person arbetar framför dator.

Data Access Unit

Data Access Unit på universitetsbiblioteket hjälper dig med tillgängliggörande och publicering av forskningsdata. Vi är en del av Research Data Office (RDO) på KI.