Data-notitie DANS versie 2.0 10-2-2017 Over DANS DANS Data Archiving and Networked Services, is een instituut van de Koninklijke Nederlandse Akademie van Wetenschappen (KNAW) en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek (NWO). De missie van DANS is het bevorderen van duurzame toegang tot digitale onderzoeksgegevens. Het hergebruik van onderzoeksdata maakt onderzoek efficiënter en verifieerbaar, en zorgt ervoor dat aanwezige kennis beter wordt benut. Open toegang tot wetenschappelijke onderzoeksresultaten maakt het mogelijk om informatie uit verschillende bronnen te koppelen. DANS stimuleert onderzoekers om hun gegevens duurzaam te archiveren in een Trusted Digital Repository dat voldoet aan het datakeurmerk Data Seal of Approval (www.datasealofapproval.org). Daarbij bevordert DANS het Open Access principe van open als het kan, beschermd als het moet. Onderzoekers deponeren in EASY (Electronic Archiving System - easy.dans.knaw.nl), de data repository van DANS, via hun instelling of zelf hun onderzoeksdata en voorzien deze van de benodigde metadata. Datamanagers van DANS verwerken in overleg met de depotgevers de aangeleverde informatie voordat die beschikbaar wordt gesteld. De selectie en deponering van onderzoeksdata kan ook in overleg met en vanwege een onderzoeksinstituut of onderzoeksgroep plaatsvinden. EASY is bedoeld als repository voor de lange termijn. DANS beheert DataverseNL. Hierop zijn de meeste universiteiten in Nederland aangesloten. DANS neemt hier ook zelf aan deel. Hierin kunnen onderzoekers al tijdens het onderzoek hun onderzoeksdata in opslaan en delen Via het portaal Narcis.nl biedt DANS toegang tot duizenden datasets, e-publicaties en andere onderzoeksinformatie. Daarnaast verzorgt het instituut training en advies en doet het onderzoek naar duurzame toegang tot digitale informatie. DANS is door de bovengenoemde taken primair een service-instituut. DANS verricht ook Research & Development op het terrein van de digitale levenscyclus van onderzoeksdata en onderzoeksinfrastructuren. Dit gebeurt voor een belangrijk deel in samenwerkingsprojecten met onderzoekers buiten DANS. Eigen onderzoek wordt voornamelijk uitgevoerd door de competentiegroep Onderzoek & Innovatie. Deze notitie bevat het algemene data-archiveringsbeleid van DANS, dat tevens betrekking heeft op de data die door de eigen onderzoeksgroep wordt verzameld. Onderzoekers in de competentiegroep Onderzoek & Innovatie, met inbegrip van de visiting fellows en gastonderzoekers, zijn verplicht Research Data Management plannen in te vullen en standaard onderzoeksdata te deponeren bij DANS. Dit is ook van toepassing op internationale en nationale samenwerkingsverbanden waarvoor DANS services beschikbaar stelt. Daarnaast is alle DANS personeel, met inbegrip van gastonderzoekers, stagiaires, vrijwilligers, gedetacheerden of uitzendkrachten, verplicht de Geheimhoudingsverklaring DANS te ondertekenen. Daarin verklaart de werknemer etc. dat hij of zij alle vertrouwelijke informatie die hem/haar door DANS-KNAW of door DANS aangewezen personen is of wordt verstrekt geheim zal houden. Dit heeft in het bijzonder ook betrekking op de verwerking van persoonsgegevens.
Data steward DANS: Valentijn Gilissen M.A., senior datamanager T 06 20 25 10 16 E valentijn.gilissen at dans.knaw.nl Contact data-repository EASY: EASY Service Desk E info at dans.knaw.nl Hoofd data-archief DANS Drs. Hella Hollander T 06 20 15 80 31 E hella.hollander at dans.knaw.nl Verantwoordelijke voor de bij DANS-onderzoek verzamelde data: Hoofd Onderzoek & Innovatie Groep Dr. Andrea Scharnhorst T 06 236 332 93 E andrea.scharnhorst at dans.knaw.nl Eindverantwoordelijk: Directeur DANS Dr. Peter Doorn T 06 537 532 25 E peter.doorn at dans.knaw.nl
Opslag en Toegang: Digitale Duurzaamheid bij DANS Bruikbare data: Om digitale duurzaamheid van onderzoeksdata te kunnen garanderen heeft DANS gekozen voor de conversiestrategie. De bestanden die in EASY worden gedeponeerd, worden geconverteerd naar een duurzaam bestandsformaat. DANS heeft een aantal preferred formats aangegeven waarvan wordt gegarandeerd dat ze omgezet kunnen worden in een blijvend leesbaar, bruikbaar en duurzaam dataformaat. Een gedeponeerde dataset blijft ook altijd de originele versie behouden met het oog op eventuele toekomstige ontwikkelingen. Afhankelijk van het vakgebied kunnen ruwe dan wel bewerkte data zijn opgeslagen. EASY voldoet aan de criteria van het DSA (Data Seal of Approval, version 2014-2017) en het nestorseal 2016 (toetsing van DIN-standaard 31644). DANS stimuleert het verantwoord hergebruik van de beschikbare data door in de gebruiks-licenties en voorwaarden expliciet de ''Gedragscode voor gebruik van persoonsgegevens in wetenschappelijk onderzoek" van de en de "Nederlandse Gedragscode Wetenschapsbeoefening" van KNAW en VSNU op te nemen. Betrouwbare data: DANS is niet verantwoordelijk voor de wetenschappelijke inhoud van in EASY gedeponeerde datasets. Het oordeel van experts - collega-wetenschappers - is daarvoor volledig bepalend. Het is aan de dataproducent om voldoende informatie aan te leveren zodat collega-wetenschappers zich een oordeel kunnen vormen over de onderzoeksgegevens. DANS treedt wel in overleg met depotgevers die naar het oordeel van de DANS datamanagers onvoldoende documentatie aanbieden om verantwoord hergebruik mogelijk te maken. DANS heeft op proef een review-systeem voor datasets opgezet, waarin gebruikers de data die zij downloaden kunnen beoordelen. Het is de taak van DANS om ervoor te zorgen dat op een betrouwbare wijze aan digitaal onderzoeksmateriaal gerefereerd kan worden. Dit betekent dat een eenmaal gedeponeerde dataset niet meer verwijderd kan worden. Zelfs niet als er latere versies van het databestand komen, die beter en uitgebreider zijn of als blijkt dat de eerste versie fouten bevatte. Het is van belang de oudere versies te bewaren aangezien er altijd al door anderen naar verwezen kan zijn in een publicatie. Dit is te vergelijken met het wetenschappelijke belang van het bewaren van alle gewijzigde herdrukken van een boek. Het systeem van de persistent identifiers maakt het mogelijk om alle versies, dus óók de oudere, duurzaam te bewaren en refereerbaar te houden. Alleen om zwaarwegende redenen (inbreuk op andermans copyright, fraude) kan een eenmaal gedeponeerde dataset door DANS verwijderd worden. Gebruikers vinden standaard de meest actuele versie van een dataset en worden er in de documentatie op geattendeerd indien er oudere versies van de data bestaan. Voor de eigen onderzoekers bij DANS is het verplicht de archivering van onderzoeksdata aan te tonen en uit te voeren, in principe in EASY. Daarbij kan het noodzakelijk zijn om met de rechthebbenden te onderhandelen met betrekking tot privacy en copyright issues. Onderzoeksdata worden binnen de grenzen van deze twee beperkingen in ieder geval aan andere onderzoekers ter beschikking gesteld. Data als publiek goed: Open Access DANS is een voorstander van de Open Access beweging. Dit houdt in dat DANS zoveel mogelijk wil bevorderen dat onderzoeksdata en publicaties zonder enige beperking vrij beschikbaar worden gesteld. Er kunnen echter gegronde redenen zijn waarom onderzoeksdata niet, of niet onmiddellijk, onbeperkt toegankelijk zijn, zoals de aanwezigheid van persoonsgegevens, tijdelijk embargo op data vanwege een op handen zijnde proefschrift of andere publicatie, contractsverplichtingen met derde partijen, etc. DANS biedt daarom naast Open Access ook de mogelijkheid onderzoeksdata beperkt toegankelijk te maken (Restricted Access).
EASY biedt twee Open Access toegangscategorieën en één beperkte toegangscategorie (Restricted Access). Open Access (CC0 Waiver) De dataset wordt zonder enige beperking ter beschikking gesteld aan alle gebruikers van EASY, geregistreerd of ongeregistreerd, volgens de voorwaarden van de Creative Commons Zero Waiver. Van alle mogelijk op de dataset berustende rechten wordt afstand gedaan. Open Access for Registered Users De dataset wordt uitsluitend aan alle geregistreerde gebruikers van EASY ter beschikking gesteld. Bestaande eventuele auteurs- en/of databankrechten worden geëerbiedigd. Restricted Access De dataset wordt uitsluitend ter beschikking gesteld aan gebruikers die daarvoor van de depotgever toestemming hebben gekregen. De restricties hebben doorgaans betrekking op databases met privacygevoelige gegevens. Bestaande eventuele auteurs- en/of databankrechten worden geëerbiedigd. DANS maakt het ook mogelijk dat voor datasets een bepaalde embargo-periode wordt vastgesteld, waarbinnen de gegevens niet toegankelijk zijn voor derden. Dit gebeurt doorgaans op wens van onderzoekers en onderzoeksgroepen, die als eerste(n) over de data willen publiceren. Metadata Vindbare data: Om de onderzoeksgegevens terug te vinden op het Internet is het van belang dat ze goed gedocumenteerd zijn en dat duidelijk is omschreven wat de structuur en inhoud van de bestanden is. Alle metadata bij DANS zijn direct en open toegankelijk, zowel voor geregistreerde als voor niet geregistreerde gebruikers van EASY. Op deze manier kunnen ook niet geregistreerde gebruikers op basis van de metadata bepalen of de gegevens voor hun onderzoek relevant zijn. DANS maakt in zijn EASY online archiefsysteem gebruik van de Dublin Core (DC) metadata standaard. Deze bestaat in principe uit slechts vijftien elementen. Dit maakt het heel eenvoudig, breed toepasbaar en adequaat genoeg voor het opzoeken van beschikbare digitale bronnen in uiteenlopende vakgebieden. Voor EASY zijn acht van de vijftien elementen verplicht om in te vullen. Wanneer ook de andere elementen ingevuld zijn, betekent dat een verrijking van de beschrijving van de dataset met als gevolg dat de dataset beter gevonden kan worden. Voor verschillende vakgebieden zijn varianten/aanvullingen op de (DC) metadatastandaard beschikbaar om de data voor het betreffende gebied beter te beschrijven en terugvinden. In de komende jaren zal het aantal uitbreidingen op de DC-metadata set toenemen. Refereerbare data: In EASY wordt aan elk gedeponeerd databestand automatisch een persistent identifier (PID) toegekend. Deze identificatiecode is net als een ISBN uniek, en zal nooit veranderen. De persistent identifier maakt het dus mogelijk om duurzaam en betrouwbaar aan digitale onderzoeksdata te refereren. Een verwijzing naar een document op een webadres dat in de loop van de tijd kan verdwijnen, zoals de URL (Uniform Resource Locator), is niet voor de lange termijn geschikt. Daarnaast wordt voor de identificatie van personen gebruik gemaakt van het DAI nummer, Digital Author Identification. Dit is een uniek landelijk nummer gekoppeld aan elke auteur met een aanstelling of een andere relevante band bij een Nederlandse universiteit of onderzoeksinstituut. Bij het deponeren van een databestand in EASY wordt de mogelijkheid geboden het DAI-nummer aan de naam van de onderzoeker toe te voegen. Met de DAI wordt de toegankelijkheid, vindbaarheid en kwaliteit van
wetenschappelijke output verhoogd. De DAI wordt al toegepast in het nationale wetenschapsportal NARCIS (www.narcis.nl) dat DANS beheert. Blokkeren van toegang Indien de openbaarheid van de onderzoeksdata wordt betwist kan, op grond van een daartoe ingediend verzoek, volgens het privacyreglement van DANS, de toegang tot de data geblokkeerd worden: Indien een betrokkene, in verband met persoonlijke omstandigheden, bezwaar mocht hebben tegen de verwerking van zijn of haar persoonsgegevens door DANS, kan de betrokkene dit schriftelijk of via e-mail kenbaar maken aan DANS. (http://www.dans.knaw.nl/content/over-dans/meerinformatie/privacyreglement).