Werkpakket 8: Afstemming aanvragen en belangenbehartiging in Den Haag en Brussel Doel Meer middelen voor de onderzoeksdata infrastructuur bij de UMC s uit Nederlandse en EU fondsen Politieke besluiten in Den Haag als Brussel die bijdragen aan het verder ontwikkelen van de onderzoeksdata infrastructuur Resultaten Betere en meer consistente positionering van de UMC s bij calls op het gebied van de onderzoeksdata infrastructuur in de life sciences, zowel in Nederland als in Europa Actieve betrokkenheid bij de voorbereidingen van calls op het gebied van de onderzoeksdata infrastructuur in Nederland en Europa Actieve lobby bij Nederlandse en Europese politiek Aanpak Ondersteuning van toponderzoekers die actief zijn in het NL en EU netwerk door: - actuele informatie over kansen, bedreigingen en relevante spelers in het nationale en internationale speelveld; - ondersteuning bij het schrijven van aanvragen, brieven en andere vormen van communicatie; - informatie over visie en beleidskeuzes in het kader van het programma Onderzoeksdata infrastructuur; - waar nodig partijen te stimuleren resp. te betrekken om aanvragen te doen of een bijdrage te leveren aan de politieke discussie. Financiering Dit is een nieuwe activiteit, waarvoor nieuwe middelen gevonden zullen moeten worden. De omvang van de kosten bedragen naar verwachten ca 160k per jaar, d.w.z. 240k voor plateau 1 1
Surfen op de data golf Onderzoeksdata infrastructuur voor biomedisch onderzoek 25 juni 2014 2
Belangrijkste vraag aan de adviescommissie Op welke terreinen heeft het prioriteit om vanuit de NFU samenwerking en afstemming tussen de huizen te organiseren op het onderwerp van data infrastructuur, uit oogpunt van 1. effectieve wetenschap, 2. kwaliteit en veiligheid en 3. kosten-efficiency? 3
Relevantie en urgentie Relevant» toename van onderzoeksdata; Relevantie» de internationale toppositie te behouden in het onderzoek;» concurrentie wetenschappelijke gelden; Horizon2020 research infrastructures» aansprakelijkheid: het niveau van data handling in de huizen moet omhoog om de risico s van misbruik, wetenschappelijke fraude en beveiligingslekken te verminderen» Versnippering/verspilling: veel activiteiten vinden nu separaat en ongecoördineerd plaats Urgent» de beëindiging subsidies aan diverse grote projecten» de komst nieuwe EU privacy richtlijn Urgentie» de implementatie van nieuwe EPDs» hogere eisen aan kwaliteit van datamanagement en open access door belangrijke sponsors van onderzoek (bijv. door NWO, ZonMW, KWF)» nieuwe kansen: aanspreekpunt voor partijen als KWF en Achmea. 4
Ingewikkeld speelveld Internationale community Veel diverse partijen OC&W Ministeries EZ VWS Funding anders dan ESFRI ZonMW NWO Patiëntenorganisaties Diverse patiëntenorganisaties Standaardisatie instituten Partners in PPP Diverse collectezakfondsen Overlegplatforms NEN NICTIZ CRO s Pharma FP7 / FP8 IMI BMS.NL DTL PSI/Life Lines Ziekenhuizen Diverse andere ziekenhuizen NFU projecten Robijn Platform Klinisch Onderzoek Kennisorganisaties UMC Utrecht Radboud MC VSNU - Beta faculteiten MKB / Spin off NFU Leveranciers escience Center LUMC VUmc AMC Erasmus MC UMCG Horizon 2020 MUMC NGI/NBIC TI Pharma / Mondriaan LSH plaza Topinstituten CTMM / TraIT BMM NL Roadmap grootschalige onderzoeksfaciliteiten / ESFRI Universiteiten SURF EPD leveranciers EATRIS- NL/EATRIS - /ECRIN RIVM TNO DICA e.a. CBS Hubrecht Institute NKI Vancis/SARA/CIT e.a. Diensten binnen de UMC s, zoals LUMC- ADM Laboratorium tools / software IT bedrijven (IBM, Oracle, SAS etc.) TTP s Grootschalige apparatuur (Philips e.a.) NeCEN/ INSTRUCT BBMRI-NL / BBMRI BioImagingNL/ Bioimaging ELIXIR 5
Onderwerpen voor regie Overzicht thema s en framework Data stewardship 1. Processen en architectuur onderzoeksdata 2. Benodigde IT infrastructuur 3. Benodigde expertise 6
Strategie - doelen 1 Data stewardship Onwikkel een beleidsdocument over de kwaliteitsborging van onderzoeksdata, dat een kader biedt aan de UMC s en onwikkel een gecoordineerde aanpak voor implementatie in de huizen 2 3 4 Thema 1: Processen en architectuur onderzoeksdata Ontwikkel standaarden en architectuurprincipes voor het verzamelen, bewerken en uitgeven van data in nauwe samenhang met het project Registratie aan de bron. Draag zorg voor afstemming bij de realisatie van een (gedeelde) onderzoeksdata infrastructuur. Draag zorg voor de afstemming van aanvragen bij calls op het gebied van de onderzoeksdata infrastructuur en zorg voor een netwerk van deskundigen die de belangen van de UMC s behartigd in Brussel. Thema 2: Benodigde IT infrastructuur 5 Maak gezamenlijk afspraken met veldpartijen, waaronder SURF Thema 3: Benodigde expertise 6 Draag zorg voor coördinatie en borging van expertise 7
Data stewardship Patiënt veiligheid / privacy bescherming Betrokkenheid patiënt Betrouwbaarheid van data / data provenance Compliancy wet- en regelgeving Review processen Monitoring kwaliteit Incidenten en afhandeling UMC s en universiteiten Kennisinstituten Financiers Bedrijven 8
Thema 1: Processen onderzoeksdata en architectuur 4. Standaardisatie (meta) dataverzameling & koppelvlakken Patient enters medical center 19. Betrokkenheid patiënt 1. Dataverzameling via de EPD s 3. Kostbare meetapparaatuur Clinical Procedures 2. Harmonisatie registratie/ digitalisering informed consent Electronic Health Record Imaging Samples Experiments Clinical database Image database Biobank database Experimental data 5. Pseudomisering / TTP s 4. Standaardisatie (meta) dataverzameling & koppelvlakken Data Integration Downstream analysis 7. Vereenvoudiging procedures toegang data 6. Ontwikkeling gestandaardiseerde en gekoppelde catalogi 8. Analyse Big Data in zorg en research (Medical Intelligence) Scientific Output Intellectual Property Improved Healthcare 9
Thema 2: Benodigde IT infrastructuur 9. Ontwikkeling Storage clusters 10. High Performance Compute clusters Storage Compute Verwante voorzieningen (SARA / Vancis, CIT, TARGET, IT bedrijven) Storage Computing 11. Eenduidig en hoogwaardig beveiligingsbeleid 13. Snel netwerk Authenticatie & autorisatie Informatiebeveiliging & privacybescherming SURFnet netwerk / lichtpaden 12. Toegang tot andere netwerken en overal toegang tot de eigen werkomgeving ErasmusMC UMC Utrecht LUMC UMCG VUMC RadboudMC MUMC AMC Storage Storage Storage Storage Storage Storage Storage Storage Computing Computing Computing Computing Computing Computing Computing Computing 10
Thema 3: Expertise 14. Schaarste in specifieke kennis 16. Programmering R&D en valorisatie Data management Statistiek en methodologie Bioinformatica / text & data mining Medische informatica Bioinformatica / imaging analysis Bioinformatica / artificial analysis Bioinformatica / -omics data analysis Bioinformatica / systems biology 15. Uitwisseling en organisatie kennis / trainingen Systeem beheer (wetenschappelijk) programmeurs Kennisinstituten Financiers UMC s en universiteiten Bedrijven 11
Akkoord NFU en Uitwerking advies najaar 2013 1. Opstellen beleidsdocument data stewardship NFU getrokken door decaan ErasmusMC met brede schrijfgroep 2. Opstellen programma met uitwerking vd 3 thema s Marc Rietveld (UMCU) Erik Flikkenschild (LUMC) Morris Swertz (UMCG) Jan-Willem Boiten (CTMM - TraIT) Rob Hooft (DTL / NLeSC) 12
Denktank uit de umc s» Remo Plantinga (AMC)» Rudy Scholte (AMC)» Bert van Ooijen (ErasmusMC)» Martin Kalshoven (LUMC)» Igor Schoonbrood (MUMC)» Arnoud van der Maas (RadboudUMC)» Michael van der Zel (UMCG)» Jan Jurjen Uitterdijk (UMCG)» René Oostergo (UMCG)» Harry Pijl (UMC Utrecht)» Ronald van Schijndel (VUMC) 13
Status Data Stewardship Policy Schrijvers» H1. Introductie Reden van beleidsdocument en beschrijving proces van data» H2. Voorbereiding» 1. Soorten data 2. Dataverzameling 3. Meta data, definities, standaardisering inclusief EPD, ontologie en semantiek» H3. Uitvoering 1. Data entry/ Databases, SURF 2. Data kwaliteit 3. Data integriteit audit trail 4. Data storage, beveiliging inclusief gebruik van clouds, etc.» H4. Uitgifte 1. Data analyse incl. Provenance-beschrijving 2. Hergebruik (Secundair gebruik data, Koppelen) 3. Mining 14
Status Data Stewardship Policy» H5. Toegang 1. Data archiving 2. Data access (incl. Open Access) (datacatalogus) 2. Data ownership & sharing 3. Data governance 4. Data security, protection & confidentiality (privacy) 5. Elektronisch Patiënten Dossier (EPD) en privacy (Registratie aan de bron, Onderzoekspaden, Anonimisering)» H6. Ethiek en integriteit 1. Ethiek 2. Wetenschappelijke integriteit» H7. Verantwoording 1. Vanuit het perspectief van de subsidieverstrekker NWO, ZonMW (Open Access) 2. Contract research 3. Vanuit het perspectief van de patiënt/deelnemer CRAZ lid/ Cor Oosterwijk (VSOP) 4. Toekomst Perspectief 15
Werkprogramma- workpackages 1. - 2. Harmonisatie van research IT infrastructuren (architectuur) 3. Biomedical data sharing & analysis 4. Vinden van en toegang tot data and samples (catalogi) 5. Gebruik van EPD in onderzoek 6. Good Research Practice: security, privacy protection en Informed consent 7. Faciliteiten voor high-throughput data processing 8. Afstemming aanvragen en belangenbehartiging den haag en brussel 9. Coördinatie van toegang tot expertise en support 10. PR and communications 16
Programma Data4LSH Stapsgewijze ontwikkeling Zomer 2014 Eind 2018 Eind 2023 programmacommissie NFU programma, phase I Harmonizatie en standaardisatie NFU programma phase II Integratie Extra workpackage Regie in fase II 17
Werkpakket 2: Harmonisatie van research IT infrastructuren (architectuur) Doel Analyse en voorstel voor gewenste samenhang en ontwerp van de beoogde onderzoeksdata infrastructuur. Dit vormt de basis voor keuzes nieuwe projecten en afspraken met UMC s en veldpartijen. Resultaten Analyse bestaande onderzoeksdata infrastructuur en ontwikkelingen Ontwerp van de gewenste architectuur Overzicht van noodzakelijke en wenselijke aanpassingen Aanpak Coördinatie door een werkgroep met specialisten uit de 8 UMC s. De bestaande architectuur werkgroep van CTMM / TraIT en de SURF Special Interest Group PRIMA (waarin de architecten van de huizen deelnemen) kunnen hiertoe de basis vormen. Om de werkgroep formeren van een aantal interest groups, georganiseerd om specifieke thema s, zoals de ontwikkeling van datastandaarden en de problematiek van de registers.. De stem van de onderzoeker zal hierin leidend zijn, maar ook andere stakeholders zullen deelnemen. Er zal ruimte blijven voor het toevoegen van nieuwe thema s resp. interest groups rondom deze thema s, die vanuit het onderzoeksveld worden aangereikt. Dit om optimaal te blijven aansluiten op nieuwe ontwikkelingen. 18
Bijlage uitwerking werkpakketen De volgende dia s geven een globale uitwerking van de werkpakketten. De werkpakketten zijn nog in concept. 19
Werkpakket 3: Biomedical data sharing & analysis Doel Een landelijk toegankelijke infrastructuur van gekoppelde lokale datavoorzieningen voor het delen en analyseren van biomedische gegevens met koppelingen naar zowel de onderliggende klinische zorgsystemen, als de research tools in de UMCs. Resultaten Best practice oplossingen van lokale dataverzameling, data integratie, analyse, workflows en koppeling van klinische data aan experimentele en sample gegevens.. Eenduidig governance model dat toegang tot de lokale infrastructuren borgt voor nationale onderzoeksprogramma's Data sharing voorziening voor het aggregeren en delen van klinische gegevens, beeldvorming en moleculaire profiel data voor onderzoek voor multicenter onderzoek Open interface die het onderzoekers mogelijk maakt eigen oplossingen te ontwikkelen voor gedeelde gegevensverzamelingen. Aanpak Projectorganisatie op basis van onder meer de huidige werkgroep "Medical Intelligence (project in de huizen) Integratie van de bestaande activiteiten en voorzieningen op dit gebied van de landelijke programma s zoals PSI, CTMM-TraIT, BBMRI-NL en Mondriaan resp. van de Europese programma s (m.n. ESFRI- en IMI-projecten BioMedBridges) Inventarisatie en daarna delen van lokale oplossingen en best practices bij de UMC's. Implementatie van data en metastandaarden zoals gedefinieerd in WP 2 (architectuur) Ontwikkeling van eenduidig en breed gedragen data governance model voor uitgifte en gebruik van data. 20
Werkpakket 4: Vinden van en toegang tot data and samples (catalogi) Doel Vindbaar maken van samples resp. gegevens voor onderzoek in de Nederlandse biobanken en onderzoeksdatabases Resultaat Bepalen van standaard model en formaat voor de inrichting van de catalogi Bepalen van standaard software voor biobanken om de benodigde informatie te delen SOP's voor en ondersteuning bij het laden van deze gegevens door biobanken Harmonisatie van de aanvraag procedures voor het verkrijgen van gegevens Aanpak Verdere ontwikkeling catalogus software in nauwe samenwerking met NL en EU partner projecten (zoals LifeLines, CTMM / TraIT, PSI, Mondriaan). Uitbreiding van huidige BBMRI-NL Catalogus 2.0 tot een niveau 3 catalogus (d.w.z. met inbegrip van de dataomschrijvingen en een geaggregeerd overzicht van beschikbare data en samples) Inrichten data governance: standaard procedure(s ) voor verwerking, uitlevering en gebruik van data. Ontwikkeling van interfaces om zoeken over meerdere catalogi mogelijk te maken (bijv. op internationaal niveau) Ondersteuning van deelnemende biobanken bij het voeden van de catalogus Inventarisatie huidige aanvraagprocedures en ontwikkeling geharmoniseerde aanvraag, zodat één aanvraag bij meerdere biobanken tegelijk kan worden gedaan.. 21
Werkpakket 5: Gebruik van EPD in onderzoek Doelen Meer en effectiever onderzoek door toegang tot EPD gegevens Verminderen patiëntbelasting door de dataverzameling t.b.v. onderzoek Efficiëntere dataverzameling door het voorkomen van overtypen Resultaten Afspraken over de inrichting van de EPD s zodat: gegevens zo worden vastgelegd dat deze voor onderzoek bruikbaar zijn (in samenhang met het programma Registratie aan de bron ); Eisen en wensen van onderzoek worden meegenomen bij de modellering van data en metadata (o.m. in de klinische bouwstenen) kwaliteitseisen aan gegevens uniform worden toegepast; processen rond data-uitlevering, terugkoppeling van toevalsbevindingen en monitoring op elkaar zijn afgestemd. Uniform pakket van eisen, waarnaar leveranciers zich zouden moeten richten Klinische bouwstenen specifiek voor onderzoek Aanpak Inrichten projectorganisatie in nauw overleg met Registratie aan de bron Analyse van eisen en wensen onderzoekers Afstemming met stakeholders Afspraken met huizen en leveranciers Uitvoering van pilot projecten om best practices te ontwikkelen Ontwikkeling klinische bouwstenen 22
Werkpakket 6: Good Research Practice: security, privacy protection en Informed consent Doelen Data-opslag en transport tussen de UMC's en projectleden van multi-center studies is veilig: gegevens zijn gepseudonimiseerd / anoniem voor onderzoekers en zo nodig herleidbaar via de behandelend arts Koppelen van datasets op Nederlandse en Europese schaal is mogelijk dankzij gestandaardiseerde TTP diensten Resultaten NEN-norm voor pseudonimisatie diensten TTP service voor multi-center studies, op basis van een integratie van de huidige TTP diensten NFU Richtlijn Veiligheid, Veiligheid en Bescherming van de privacy Aanpak Inrichting project team TTP s vanuit de huidige teams van CTMM / TraIT, PSI en Mondriaan Start en uitvoering NEN standaardisatietraject pseudonimisatiediensten. Inrichting project team Good Research Practice op basis van de huidige Special Interest Group Informatiebeveiliging (NFU / SURF), uit te breiden met relevante specialisten op het gebied van informatiebeveiliging en privacyaspecten 23
Werkpakket 7: Faciliteiten voor high-throughput data processing Doelen Mogelijkheid tot gebruik van elkaars HPC clusters voor het opvangen van piekbelasting Hergebruik en delen van big data analyse protocollen voor onderzoek en diagnostiek Delen van implementatie van best practices en SOP's Schaalvoordelen van gezamenlijke inkoop van hardware Resultaten Toegang tot een landelijk netwerk van HPC clusters voor onderzoekers Opvang van pieken in rekenbehoefte door koppeling van de HPC clusters Virtuele HPC clusters die ook voor privacy gevoelige informatie kunnen worden gebruikt Aanpak Projectorganisatie op basis van huidige werkgroepen bij BBMRI, DTL en AcZie / TacZie Ontwikkel procedures om de barrières weg te nemen bij het uitwisselen van data tussen de HPC clusters Maak de HPC clusters toegankelijk voor onderzoekers uit andere instituten Koppel en deel de verschillende HPC clusters om pieken in rekenbehoefte op te vangen en zorg voor failover capaciteit als HPC voorzieningen in onderhoud zijn Harmonisatie van bestaande virtuele omgevingen en technieken om te komen tot virtuele clusters waarop ook privacy gevoelige informatie kan worden verwerkt 24
Werkpakket 8: Afstemming aanvragen en belangenbehartiging in Den Haag en Brussel Doel Meer middelen voor de onderzoeksdata infrastructuur bij de UMC s uit Nederlandse en EU fondsen Politieke besluiten in Den Haag als Brussel die bijdragen aan het verder ontwikkelen van de onderzoeksdata infrastructuur Resultaten Betere en meer consistente positionering van de UMC s bij calls op het gebied van de onderzoeksdata infrastructuur in de life sciences, zowel in Nederland als in Europa Actieve betrokkenheid bij de voorbereidingen van calls op het gebied van de onderzoeksdata infrastructuur in Nederland en Europa Actieve lobby bij Nederlandse en Europese politiek Aanpak Ondersteuning van toponderzoekers die actief zijn in het NL en EU netwerk door: - actuele informatie over kansen, bedreigingen en relevante spelers in het nationale en internationale speelveld; - ondersteuning bij het schrijven van aanvragen, brieven en andere vormen van communicatie; - informatie over visie en beleidskeuzes in het kader van het programma Onderzoeksdata infrastructuur; - waar nodig partijen te stimuleren resp. te betrekken om aanvragen te doen of een bijdrage te leveren aan de politieke discussie. 25
Werkpakket 9: Coördinatie van toegang tot expertise en support Doel Onderzoekers worden optimaal ondersteund op het gebied van datamanagement (waaronder methodologie, analyse, gebruik specifieke tools) Resultaten Experts met relevante kennis over datamanagement zijn vindbaar en toegankelijk voor onderzoekers Kennis over de nieuwste ontwikkelingen wordt actief getraind Ondersteuning van onderzoekers met gespecialiseerde kennis is een gerespecteerde carrièrepad in de UMC s Professionalisering van herbruikbare tools. Best practices in data management worden geïdentificeerd en gedeeld Aanpak Identificeer de verschillende servicedesks in de UMC s Creëer een landelijk team van coördinatoren, die deelnemen in het DTL Data programma Harmoniseer procedures en aanpak bij de diverse service desk Zorg dat doorverwijzing naar een specialist in een ander huis mogelijk wordt Identificeer trainingsbehoeftes en zorg dat hieraan wordt beantwoord in het DTL Learning program. Inventariseer best practices en faciliteer het delen daarvan binnen de service desks Identificeer relevante tools die van belang, zorg voor een professionele doorontwikkeling en zorg dat onderzoekers deze kunnen vinden en gebruiken Meet het aantal en type van de aanvragen aan de servicedesks, zodat het mogelijk is de behoefte op een continue basis te beoordelen en het netwerk van deskundigheid dienovereenkomstig aan te passen. 26
Werkpakket 10: Public relations and communications Doel Beïnvloeding van het publieke en politieke debat ten gunste van de ontwikkeling van de onderzoeksdata infrastructuur voor biomedisch onderzoek Resultaat Meer kennis en een beter onderbouwde opinie bij publiek en politici over het gebruik van gegevens in medisch-wetenschappelijk onderzoek. Aanpak Ontwikkel een communicatiestrategie en plan en creëer een team met communicatiespecialisten uit de UMC s Betrek daarbij patiëntenverenigingen en collectebusfondsen. Werk hierin samen met het programma Registratie aan de bron, die een vergelijkbaar belang heeft. Voer het communicatieplan uit in nauwe afstemming met de betrokken partners 27