Perspektiv på FAIR öppen tillgång forskningsdata

Engelska

Svensk Nationell Datatjänst (SND) hade möten och workshopar i Göteborg i november 2017 om FAIR (findable, accessible, interoperable & reusable) öppen tillgång till forskningsdata. Sammanfattning dag 1 & 2 finns här. Den tredje dagen riktade sig till forskare, och de teman som togs upp då är aktuella runt om i forskningsvärlden, och har också diskuterats på många andra ställen.

Som många säkert känner till har forskningsfinansiärer som t.ex. EU börjat kräva datahanteringsplaner (Data Management Plans, DMP) som en del av ansökan eller rapportering när man fått forskningsmedel, och den svenska regeringen har satt som mål att all forskningsdata i den mån det är möjligt (alltså med undantag för data innehållande känsliga personuppgifter etc.) skall vara öppet tillgängliga inom 10 år.

I och med att forskarfinansiärer och regeringar har den inställningen kommer det därför på lång sikt att bli omöjligt för individuella forskare att avstå från att undersöka möjligheten att göra sin data FAIR (vilket omfattar öppen tillgång). Men dessa beslut har givetvis tagits därför att de är tänkta att gagna såväl forskare som allmänhet.

Fördelarna med att göra forskningsdata FAIR är tydliga, bland annat:

  • Det gör det möjligt att återanvända data i nya studier
  • Det gör det möjligt att verifiera tidigare forskning
  • Det sparar merarbete när man kan undvika dubblering av datainsamling
  • Det gör metaanalyser och annan liknande forskning lättare och mer robust
  • Det gör data tillgänglig för de skattebetalare och andra organisationer som finansierar forskningen

Enligt Regeringens proposition 2016/17:50 Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft sid. 107 (pdf) lyfts också följande fram:

Öppen tillgång till forskningsresultat bidrar till att upprätthålla och främja en hög forskningskvalitet. När resultat blir snabbt tillgängliga kan forskningen snabbare gå framåt genom att fler forskare kan validera och bygga vidare på tidigare resultat. Forskning och utveckling bedrivs inte bara på lärosäten utan även i hög grad inom industri, små och medelstora företag och den offentliga sektorn. Genom aktiv spridning och öppen tillgång till forskningsresultat får även dessa aktörer snabbare del av nya forskningsgenombrott, vilket kan bidra till innovationer, stärkt konkurrenskraft och en stärkt offentlig sektor.

Men man kan ju också fråga – varför inte göra all forskningsdata FAIR, eftersom det verkar vara en sådan stor fördel för den vetenskapliga världen?

Under SND dagen och i andra källor kan man då se ett flertal hinder som ofta nämns:

  • Praktiska hinder – hur ska man lagra data som kan räknas i terabyte eller t.o.m. petabyte?
  • Tidsåtgång – att beskriva data så att den kan användas av andra är tidskrävande
  • Sekretess och personuppgifter – öppen tillgång krockar ibland med personuppgiftslagen (och blivande GDPR)
  • Olustighet – att lägga ut data kan kännas som att man riskerar att den används ”fel”, eller att andra forskare kommer och utnyttjar den innan man själv hunnit få avkastning på arbetet med att samla in och bearbeta den.

Det finns givetvis många olika sätt att tackla dessa hinder på. SND har nu fått finansiering av Vetenskapsrådet för att samarbeta med lärosäten för att bygga ut den svenska forskningsinfrastrukturen, vilket kommer att bli en stor hjälp för den praktiska förvaringsdelen. SND är också en av många organisationer som har råd och tips för hur man ska tänka för att skriva en datahanteringsplan och göra datahantering så enkelt som möjligt. Som en del i SNDs arbete kommer lärosäten som Högskolan i Borås också att ha lokala expertgrupper (Data Access Units, DAU) tillgängliga för att hjälpa forskare. Som med allting annat kan man tänka sig att det blir enklare och går snabbare om man gör lite i taget från början, istället för att försöka reda ut allt i efterhand.

När det kommer till risken att förlora något på att göra forskningsdata öppet tillgänglig menar experter som Gustav Nilsonne (Karolinska Institutet och Stockholms Universitet) att det aldrig har skett hittills. Om ens data finns tillgänglig att användas och någon publicerar något baserat på den som känns fel så finns det akademiska kanaler för att ifrågasätta resultat – och då är det enligt Nilsonne bättre att bara ha tillgängliggjort data, och inte direkt ha samarbetat med den som publicerar något undermåligt. Och om någon annan forskare eller forskningsgrupp skulle hitta resultat i ens egen data som man inte själv varit medveten – är det inte så vetenskapen är tänkt att fungera?

Sist men inte minst är också öppen tillgång till forskningsdata något som kanske kan hjälpa den reproductibility crisis som många forskare tycker att dagens vetenskap befinner sig i. Har den data ett forskningsresultat stödde sig på försvunnit eller blivit oanvändbar finns det ju heller ingen chans att validera resultat som blir ifrågasatta.

Som flera deltagare under SND-dagarna uttryckte det: man ska inte behöva återuppfinna hjulet. Så att spara, tillgängliggöra och standardisera data kanske ska ses som att montera ihop en cykel snarare än att lämna alla delar till cykeln stående i ett låst skjul. Visst kräver det mer arbete, men i slutändan blir resultatet också så mycket mer användbart!

Text: Signe Wulund

För mer information om forskningsdata vid Högskolan i Borås, se bibliotekets forskningsdatasidor.

Källor (externa länkar)

Biblioteken vid Lunds universitet: Varför öppna data?
Gustav Nilsonne: Öppna, slutna och dolda data (föreläsning)
Gustav Nilsonne: Diskussion om behovet av öppen data (föreläsning)
Nature 533, 452-454 (26 May 2016): 1,5000 scientists lift the lid on reproducibility
Regeringens proposition 2016/17:60: Kunskap i samverkan – för samhällets utmaningar och stärkt konkurrenskraft (pdf)
SND: Samarbeten ska ge individdata av hög kvalitet