Perspektiv på FAIR öppen tillgång forskningsdata

Svensk Nationell Datatjänst (SND) hade möten och workshopar i Göteborg i november 2017 om FAIR (findable, accessible, interoperable & reusable) öppen tillgång till forskningsdata. Sammanfattning dag 1 & 2 finns här. Den tredje dagen riktade sig till forskare, och de teman som togs upp då är aktuella runt om i forskningsvärlden, och har också diskuterats på många andra ställen.

Som många säkert känner till har forskningsfinansiärer som t.ex. EU börjat kräva datahanteringsplaner (Data Management Plans, DMP) som en del av ansökan eller rapportering när man fått forskningsmedel, och den svenska regeringen har satt som mål att all forskningsdata i den mån det är möjligt (alltså med undantag för data innehållande känsliga personuppgifter etc.) skall vara öppet tillgängliga inom 10 år.

I och med att forskarfinansiärer och regeringar har den inställningen kommer det därför på lång sikt att bli omöjligt för individuella forskare att avstå från att undersöka möjligheten att göra sin data FAIR (vilket omfattar öppen tillgång). Men dessa beslut har givetvis tagits därför att de är tänkta att gagna såväl forskare som allmänhet.

Fördelarna med att göra forskningsdata FAIR är tydliga, bland annat:

  • Det gör det möjligt att återanvända data i nya studier
  • Det gör det möjligt att verifiera tidigare forskning
  • Det sparar merarbete när man kan undvika dubblering av datainsamling
  • Det gör metaanalyser och annan liknande forskning lättare och mer robust
  • Det gör data tillgänglig för de skattebetalare och andra organisationer som finansierar forskningen

Enligt Regeringens proposition 2016/17:50 Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft sid. 107 (pdf) lyfts också följande fram:

Öppen tillgång till forskningsresultat bidrar till att upprätthålla och främja en hög forskningskvalitet. När resultat blir snabbt tillgängliga kan forskningen snabbare gå framåt genom att fler forskare kan validera och bygga vidare på tidigare resultat. Forskning och utveckling bedrivs inte bara på lärosäten utan även i hög grad inom industri, små och medelstora företag och den offentliga sektorn. Genom aktiv spridning och öppen tillgång till forskningsresultat får även dessa aktörer snabbare del av nya forskningsgenombrott, vilket kan bidra till innovationer, stärkt konkurrenskraft och en stärkt offentlig sektor.

Men man kan ju också fråga – varför inte göra all forskningsdata FAIR, eftersom det verkar vara en sådan stor fördel för den vetenskapliga världen?

Under SND dagen och i andra källor kan man då se ett flertal hinder som ofta nämns:

  • Praktiska hinder – hur ska man lagra data som kan räknas i terabyte eller t.o.m. petabyte?
  • Tidsåtgång – att beskriva data så att den kan användas av andra är tidskrävande
  • Sekretess och personuppgifter – öppen tillgång krockar ibland med personuppgiftslagen (och blivande GDPR)
  • Olustighet – att lägga ut data kan kännas som att man riskerar att den används ”fel”, eller att andra forskare kommer och utnyttjar den innan man själv hunnit få avkastning på arbetet med att samla in och bearbeta den.

Det finns givetvis många olika sätt att tackla dessa hinder på. SND har nu fått finansiering av Vetenskapsrådet för att samarbeta med lärosäten för att bygga ut den svenska forskningsinfrastrukturen, vilket kommer att bli en stor hjälp för den praktiska förvaringsdelen. SND är också en av många organisationer som har råd och tips för hur man ska tänka för att skriva en datahanteringsplan och göra datahantering så enkelt som möjligt. Som en del i SNDs arbete kommer lärosäten som Högskolan i Borås också att ha lokala expertgrupper (Data Access Units, DAU) tillgängliga för att hjälpa forskare. Som med allting annat kan man tänka sig att det blir enklare och går snabbare om man gör lite i taget från början, istället för att försöka reda ut allt i efterhand.

När det kommer till risken att förlora något på att göra forskningsdata öppet tillgänglig menar experter som Gustav Nilsonne (Karolinska Institutet och Stockholms Universitet) att det aldrig har skett hittills. Om ens data finns tillgänglig att användas och någon publicerar något baserat på den som känns fel så finns det akademiska kanaler för att ifrågasätta resultat – och då är det enligt Nilsonne bättre att bara ha tillgängliggjort data, och inte direkt ha samarbetat med den som publicerar något undermåligt. Och om någon annan forskare eller forskningsgrupp skulle hitta resultat i ens egen data som man inte själv varit medveten – är det inte så vetenskapen är tänkt att fungera?

Sist men inte minst är också öppen tillgång till forskningsdata något som kanske kan hjälpa den reproductibility crisis som många forskare tycker att dagens vetenskap befinner sig i. Har den data ett forskningsresultat stödde sig på försvunnit eller blivit oanvändbar finns det ju heller ingen chans att validera resultat som blir ifrågasatta.

Som flera deltagare under SND-dagarna uttryckte det: man ska inte behöva återuppfinna hjulet. Så att spara, tillgängliggöra och standardisera data kanske ska ses som att montera ihop en cykel snarare än att lämna alla delar till cykeln stående i ett låst skjul. Visst kräver det mer arbete, men i slutändan blir resultatet också så mycket mer användbart!

Text: Signe Wulund

För mer information om forskningsdata vid Högskolan i Borås, se bibliotekets forskningsdatasidor.

Källor (externa länkar)

Biblioteken vid Lunds universitet: Varför öppna data?
Gustav Nilsonne: Öppna, slutna och dolda data (föreläsning)
Gustav Nilsonne: Diskussion om behovet av öppen data (föreläsning)
Nature 533, 452-454 (26 May 2016): 1,5000 scientists lift the lid on reproducibility
Regeringens proposition 2016/17:60: Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft (pdf)
SND: Samarbeten ska ge individdata av hög kvalitet

SND nätverksträff och forum

Den 13-15 november 2017 ordnade Svensk Nationell Datatjänst (SND) tre evenemang i Göteborg – en dags diskussion med lärosäten om den nya gemensamma infrastrukturen, en dags forum om FAIR (Findable, Accessible, Interoperable, Reusable) data, och en dags workshop riktad mot forskare.

Nätverksmötet och forumet behandlade många olika frågor, men det var tydligt att behovet av en nationell infrastruktur för att kunna förvara forskningsdata var en av de viktigaste. Därför var det mycket bra att höra att Vetenskapsrådet under de kommande åtta åren ska bidra med fyra miljarder kronor till Open Science och relaterade aktiviteter. Exakt hur mycket av det som går till SND är ännu inte känt. Däremot har VR beslutat att under en femårsperiod fördela ca 1,2 miljarder till Swedish National Infrastructure for Computing (SNIC) som samordnar datorresurser vid lärosätena och där SND för närvarande lagrar data.

En av talarna den första dagen var Sofie Björling, chef för Vetenskapsrådets avdelning för forskningsinfrastruktur, och hon påpekade att VR också har ett ansvar att samordna det nationella arbetet med öppen tillgång till forskningsdata. Än så länge är det inte helt klart hur det ska gå till, då det är ett område med många aktörer och överlappande ansvarsområden, men VR arbetar med SND och andra för att kunna reda ut det.

Vi fick mycket information om SNDs struktur, med Data Access Units (DAU) och domänspecialister (DoSp) och fick se över hur långt vi kommit på våra respektive lärosäten. Här på Borås väntar vi med Högskolan i Väst och Högskolan i Skövde på en gemensam koordinator för forskningsdata. Men vi vill också arbeta med de här frågorna lokalt och tillsammans med varandra redan innan den tjänsten är tillsatt, för det finns mycket att göra.

Det blev också mycket information om FAIR data, där det viktigaste meddelandet är det akronymen Findable, Accessible, Interoperable & Reusable faktiskt innebär. Väldigt kort kan man säga att forskningsdata måste gå att hitta (här är det bra med en PID, beständig identifikator som t.ex. DOI), komma åt (inte nödvändigtvis med ett klick, utan man kan givetvis ha data som helt eller delvis måste skyddas på olika sätt) och kunna läsas och användas på ett vettigt sätt (SND tillhandahåller guider med best practice och checklistor).

Det internationella repositoriet ICOS Carbon Portal som jobbat mycket med frågan kom och berättade hur de gjort för att få sin data FAIR. Deras sida rekommenderas för de som är intresserade av ett gott exempel.

I dagsläget sägs 80% av all forskningsdata vara ’re-useless’, alltså inte gå att återanvända. Det är en skrämmande siffra när man vet hur mycket tid, pengar och arbete som krävs för att skapa forskningsdata till att börja med. Att inte ens kunna garantera att man kan återanvända eller kontrollera sin egen eller andras data i efterhand måste ses som ett stort problem. Ett sätt EU har bestämt sig för att handskas med det är att kräva att alla som får Horizon 2020-bidrag lämnar in en Data Managament Plan (DMP) för att hindra det här informationssvinnet.

Och för att avsluta med ett positivt besked rekommenderas repositoriet ICOS Carbon Portal. De har jobbat mycket med att göra sin data FAIR, och upplevt att det har varit väldigt värdefullt för dem.

Program, presentationer och sammanfattningar

Dag 1
SND och lärosätena – arbetet framåt (program och presentationer)
SNDs sammanfattning av nätverksträffen och Sofies presentation

Dag 2
Vägen till FAIR data? (program och presentationer)
SNDs sammanfattning av forumet runt FAIR data

Text: Signe Wulund

OA week 2016, presentationer

Open Access Week är slut för i år, om du missade de aktiviteter vi anordnade under veckan kan du hitta presentationsmaterialet här i bloggen:

SND: Datahantering och tillgång till forskningsdata
Biblioteksfrukost: Open access to research data

Om du har frågor om open access, open data eller publicering får du gärna kontakta oss på biblioteket. oaweek

Text: Thomas

Open Access Week 2016

Årets Open Access Week infaller mellan 24–30:de oktober och har temat “open in action“. Nu satsar flera aktörer resurser för att öka mängden artiklar som publiceras fritt tillgängligt. Ett exempel är Vetenskapsrådet (VR) som satsar 8 miljoner under 2 år för att underlätta publicering av öppet tillgänglig forskning. Ni kan läsa mer om detta i DN:s debattartikel “Att göra forskning tillgänglig för alla kräver mer stöd”.

Forskningsdata är en annan del av OA-weekforskningsprocessen som troligtvis kommer att påverkas av kommande forskningspropp, krav på datahanteringsplaner har redan börjat komma upp som en del av medelstilldelning och i de föreslagna riktlinjerna från 2015 skrivna av VR kan vi läsa att: […]forskningsdata […] ska vara öppet tillgänglig[…]
Eller i sitt sammanhang:
Grundprincipen i de föreslagna nationella riktlinjerna är att vetenskapliga publikationer och konstnärliga verk samt forskningsdata som ligger till grund för vetenskapliga publikationer, som är resultatet av offentligt finansierad forskning, ska vara öppet tillgängliga. I båda fallen anges förslag till tidsramar för genomförandet. Vetenskapsrådet föreslår att Sverige ska ha en målbild för 2025 och att riktlinjerna gäller fram till 2020. Inom ramen för uppdraget lämnas rekommendationer för vad som behöver utredas vidare. […]
På biblioteket väljer därför att rikta veckans aktiviteter mot tillgängliggörande av forskningsdata. Vi inleder veckans aktiviteter på tisdag den 25 oktober med talare från Svensk nationell datatjänst (SND). Elisabeth Strandhagen och Ilze Lac kommer hit och pratar om öppen tillgång till forskningsdata och god datahantering. Därefter kommer vi ha en biblioteksfrukost och en workshop i datahantering som erbjuds i två omgångar (omgång 1 och omgång 2). Under dessa tillfällen går vi igenom SND:s datahanteringsmall och diskuterar gemensamt med deltagarna hur det går att anpassa mallen till olika situationer och om eller hur det går att går hantera problem som finns i samband med hantering av forskningsdata. Kom ihåg att anmäla dig till biblioteksfrukosten. Det krävs ingen anmälan till SNDs föreläsning och våra efterföljande workshops.
Under hela veckan finns vi dessutom tillgängliga (precis som övriga veckor om året i och för sig) för att svara på frågor om exempelvis open access och forskningsdata. Hör bara av er!
Text: Thomas