Datarepositorier
För att tillgängliggöra och publicera forskningsdata öppet rekommenderas att registrera dem i ett datarepositorium. Det finns en stor mängd datarepositorier för att publicera och dela data. Inom vissa forskningsområden finns redan väletablerade ämnesspecifika datarepositorier.
Att publicera forskningsdata i etablerade repositorier ger dig som forskare flera fördelar:
- Du skapar "automatiskt" standardmetadata som gör ditt dataset interoperabelt och återanvändbart
- Datasetet får en beständig identifierare (PID) vilket gör det tillgängligt och möjliggör korrekt citering där dataset kopplas till en publikation.
- Du följer KI:s policy för öppen tillgång till forskningsdata.
Dataset som innehåller personuppgifter av något slag kan inte laddas upp i öppna repositorier. Du kan fortfarande använda repositorier för att skapa en metadata-post för att beskriva ett dataset som innehåller personuppgifter, medan filerna i datasetet laddas upp till en säker lagringsyta på KI.
KI:s centrala lagring för publicering av dataset är under uppbyggnad. Under tiden tillhandahåller KI:s Data Access Unit en lagringsyta där vi kan ta emot dataset upp till 1 TB. På denna yta kan du lagra dataset oavsett om de innehåller känsliga uppgifter eller inte.
Det kan vara bra att förbereda för publicering av forskningsdata i samband med att du skickar in ditt manuskript, då det kan ta lite tid att registrera datasetet.
Research Data Office kan hjälpa till med mallar för avtal vid tillgängliggörandet av forskningsdata som innehåller personuppgifter, om du publicerar datasetet i ett repositorium som erbjuder kontrollerad åtkomst.
Om du använder skript för att analysera dina data kan du kommentera skripten och publicera dem öppet. På det sättet blir det tydligt för andra forskare vilka metoder du har använt, oavsett om datasetet är öppet tillgängligt eller ej.
Kontakta oss för mer information.
Exempel på repositorier
- Svensk Nationell Datatjänst (SND) är en nationell plattform där forskningsdata kan delas öppet eller göras sökbara genom publicerade beskrivningar av dataset som av olika skäl inte kan delas öppet. Detta är det bästa alternativet för att dela forskningsdata som innehåller känsliga data som t ex personuppgifter. SND:s system för att beskriva och dela forskningsdata kallas DORIS. Läs mer här.
- Zenodo är ett repositorium skapat av CERN och OpenAIRE. I Zenodo kan du ladda upp till 50 GB per dataset utan kostnad. Det går att koppla ihop data i Zenodo med tillhörande källkod på GitHub.
- Figshare är ett generellt datarepositorium som används av och är tillgängligt för forskare från alla discipliner. Det går att ladda upp till 20 GB utan kostnad.
- BioStudies är ett datarepositorium för beskrivningar av biologiska studier. BioStudies finns med på ELIXIR:s lista över rekommenderade databaser.
- GitHub är en webbaserad tjänst för lagring av kod. Här kan du publicera analysskript och annan kod inom forskning. Det är möjligt att använda Github för versionskontroll och få en tidsstämpel med en beständig identifierare genom repositoriet Zenodo.
Fler repositorier, både generella och ämnesspecifika, finns listade hos Re3data.org. Här går det att söka efter information om repositorier eller bläddra och filtrera på ämne, område, certifiering, metadatastandarder etc.
Data papers och Datatidskrifter/Data Journals
Du kan publicera en dataartikel där du beskriver ditt forskningsmaterial i en datatidskrift (data journal). Ofta hänvisar man då till att forskningsmaterialet finns tillgängligt i ett datarepositorium med ett unikt ID.
Exempel på datatidskrifter som ingår i KI:s avtal med förbetalda publiceringsavgifter/APC:
Data Access Unit
Data Access Unit på universitetsbiblioteket hjälper dig med tillgängliggörande och publicering av forskningsdata. Vi är en del av Research Data Office (RDO) på KI.
Om du vill att vi ska kontakta dig angående din feedback, var god ange dina kontaktuppgifter i formuläret nedan