Wetenschap uitgelegd

W.Y. Liu, NOV-Werkgroep Orthopedie en Wetenschap

Delen van wetenschappelijke data: wel of niet?

Binnen medisch-wetenschappelijk onderzoek is de trend steeds meer verschoven naar het toegankelijk maken van onderzoeksresultaten. Een belangrijke ontwikkeling hierbij is open access publiceren van wetenschappelijke artikelen, waarbij artikelen kosteloos te lezen zijn. Vervolgens is de focus steeds meer komen te liggen op het delen van data. Maar, wat valt onder data? Wat zijn de voordelen van en belemmeringen bij het delen van data? Dit artikel geeft hierin – in vogelvlucht - meer inzicht.

In 2016 publiceerde de International Committee of Medical Journal Editors (ICMJE, een groep van medisch wetenschappelijke editors en vertegenwoordigers van organisaties die streven naar het verbeteren van de kwaliteit en rapportage van medisch wetenschappelijk onderzoek) hun standpunt: onderzoekers hebben een ethische verplichting om data van klinisch interventieonderzoek op een verantwoorde manier te delen, omdat deelnemers zichzelf aan risico’s hebben blootgesteld. De ICMJE steunt het delen van niet-identificeerbare patiëntgegevens die de resultaten in het manuscript ondersteunen. Hierdoor kunnen andere onderzoekers bijvoorbeeld de analyses herhalen en de conclusies controleren.

Data sharing statement en plan Dit standpunt leidde tot een aanpassing in het indieningsproces van een manuscript: sinds 1 juli 2018 wordt bij de indiening van een manuscript bij een wetenschappelijk tijdschrift dat de ICMJE-richtlijnen volgt een data sharing statement gevraagd1. Voorbeelden van dergelijke wetenschappelijke tijdschriften binnen de orthopedie zijn: British Journal of Sports Medicine, Journal of Bone and Joint Infection, Journal of Bone and Joint Surgery, Osteoarhtritis and Cartilage, en Clinical Orthopaedics and Related Research.

Een data sharing statement bevat volgens ICMJE de volgende onderdelen2:

- Worden gecodeerde patiëntgegevens (inclusief data dictionaries) gedeeld? Een data dictionary is een document waarin de data in de database staan beschreven, zoals de naam, structuur en beschrijving van een variabele.

- Welke data worden specifiek gedeeld?

- Worden andere documenten beschikbaar gesteld (bijvoorbeeld studieprotocol)?

- Wanneer zijn de data toegankelijk en voor hoe lang?

- Welke toegangscriteria zijn er voor het delen van data?

o Aan wie wordt de data beschikbaar gesteld?

o Voor welke type analyses wordt de data beschikbaar gesteld?

o Via welke methode wordt de data beschikbaar gesteld?

SInds 1 januari 2019 moet een data sharing plan toegevoegd worden bij de registratie van een klinische studie (denk hierbij aan www.ClinicalTrials.gov). In een data sharing plan beschrijven onderzoekers in hoeverre ze de individuele patiëntendata gaan delen, inclusief de data dictionaries, en ook hoe ze dat gaan doen.

Maar wat valt onder data?

Data zijn de gegevens die de onderbouwing vormen voor het beantwoorden van de onderzoeksvragen. Veelal zijn dit gepseudonimiseerde (gecodeerde) patiëntgegevens die geanalyseerd worden in wetenschappelijk onderzoek. Hierbij blijft de sleutel tot de daadwerkelijke patiëntennummers in het eigen ziekenhuis. De meest voor de hand liggende data zijn de karakteristieken van de patiëntenpopulatie, kenmerken over de behandeling en uitkomsten (zoals survival en patiëntgerapporteerde uitkomstmaten, PROMs). Echter, onder data vallen ook software, algoritmes, scripts, modellen, protocollen, methodes en codes die zijn ontwikkeld tijdens het onderzoek en die nodig zijn om de ruwe data te bewerken, te analyseren en te interpreteren.

Waarom data delen?

Er zijn argumenten voor het delen van data. Het delen van data vergroot het vertrouwen in de conclusies van klinische studies, omdat de resultaten geverifieerd kunnen worden door een onafhankelijk partij. Daarnaast kunnen de verzamelde data opnieuw gebruikt worden, waardoor u meer waarde creëert van uw onderzoeksgegevens. Denk hierbij aan het vergelijken van data uit verschillende studies of het combineren van data uit verschillende studies om grotere populaties te onderzoeken of subgroepen te analyseren. Bovendien stimuleert het delen van data de onderlinge samenwerking en wordt onnodige herhaling van studies voorkomen.

Er zijn echter ook bedenkingen bij het delen van data, bijvoorbeeld dat de onderzoeker vreest dat hij of zij niet de erkenning krijgt voor het gedane werk, het mislopen van publicatiemogelijkheden en mogelijke kritiek op de kwaliteit van de data. Daarnaast kunnen de data verkeerd geïnterpreteerd worden en speelt de gevoeligheid van de data mogelijk mee; het gaat veelal om patiëntengegevens. Ook zijn er praktische twijfels: het delen van data kost veel tijd, faciliteiten zoals een veilige ICT-omgeving kunnen ontbreken of het is onduidelijk hoe voor het delen van data bij studiedeelnemers informed consent verkregen moet worden.

Om deze bedenkingen en praktische twijfels weg te kunnen nemen, zijn er ontwikkelingen om ze aan te pakken en het delen van data te stimuleren. Auteurs die de data van andere onderzoekers gebruiken, zijn verplicht om te verklaren dat ze de data gebruiken zoals is overeengekomen met de oorspronkelijke onderzoekers. Daarnaast moeten de auteurs in de nieuwe publicatie de onderzoekers de erkenning geven voor het gedane werk. Tenslotte moeten zij ook expliciet aangeven hoe hun analyses verschillen van eerdere analyses. Om het delen van data te faciliteren, zijn er tegenwoordig data repositories beschikbaar; dit zijn online opslagplaatsen voor onderzoekers om datasets te plaatsen en te delen. Een aantal voorbeelden hiervan zijn: DataverseNL, Zenodo en Vivli. Via Mendeley Data, kan een overzicht gemaakt worden van relevante datasets uit verschillende repositories.

Data repositories

Bij de keuze van een data repository kunt u letten op:

- Hoelang blijft de dataset na publicatie behouden?

- Wordt de opslagplaats erkend en ondersteund door de onderzoeksgroep of het onderzoeksinstituut?

- Zijn er kosten aan verbonden?

- Levert de opslagplaats stabiele en persistente identifiers? Een voorbeeld hiervan is digital object identifier, oftwel DOI. Een DOI is een uniek blijvend identificatiemiddel voor een bestand op het internet. Mocht het internetadres veranderen, dan zal het bestand nog steeds teruggevonden kunnen worden.

- Heeft de repository duidelijke voorwaarden voor het gebruik van de data en de toegankelijkheid van de dataset (open access of restricted access)?

Aangezien we ons steeds meer begeven in het tijdperk van data-gedreven klinisch onderzoek, zal openheid van wetenschappelijk onderzoek en het delen van data een steeds grotere rol spelen. Informeer daarom naar de mogelijkheden binnen uw instituut en bespreek in uw onderzoeksgroep hoe u hiermee omgaat.

Enquête

Geachte lezer, Om het delen van data te faciliteren, zijn er tegenwoordig data repositories beschikbaar; dit zijn online opslagplaatsen voor onderzoekers om datasets te plaatsen en te delen. We zijn benieuwd of u van data repositories gebruikmaakt, waarom of waarom niet en zo ja, op welke manier. Doe mee en geef antwoord op onderstaande vragen - veel dank!

2. Waarom wel/niet:

3. Als u uw wetenschappelijke data in data repositories deelt, op welke manier doet u dat?