Big data: overvloed en onbehagen

Vergelijkbare documenten
Verslag 194 ste plenaire SWR-conferentie: 16 en 17 september 2016, Leusden Thema: Big data: kansen en risico s

In deze les. Het experiment. Hoe bereid je het voor? Een beetje wetenschapsfilosofie. Literatuuronderzoek (1) Het onderwerp.

Het Onderzoeksdossier & Research Datamanagement Hoe doen wij dat?

Kritisch denken over complexe politieke problemen. Margarita Jeliazkova Instituut ELAN, Universiteit Twente, Enschede

Microdataservices. Documentatierapport Personen met een Algemene Nabestaandenwet (ANW)-uitkering (MICANWPERSOONBUS)

Documentatierapport Personen met een Algemene Nabestaandenwet (ANW)-uitkering (MICANWPERSOONBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Hoofddiploma in het Hoger Beroepsonderwijs (HDIPLOMAHBOTAB)

Voorwoord... iii Verantwoording... v

Ondersteuning van de onderzoek(sgegevens)cyclus en de bijbehorende applicaties

Documentatierapport Ontslagaanvragen bij het Uitvoeringsinstituut Werknemersverzekeringen (UWV) (UWVONTAANVTAB)

Microdataservices. Documentatierapport Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

TITEL LOREM IPSUM DOLOR SIT AMET CONSECTETUR. Subtitel ut enim ad minim veniamquis nostrud

Microdata Services. Documentatie Volgtijdelijk vergelijkbare Persoon_id's van personen (VTVPERSOONTAB)

Centrum voor Beleidsstatistiek en Microdata Services

Microdata Services. Documentatie Maandbedragen van personen met een Ziektewetuitkering (ZWPERSOONMNDBEDRAGBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

Documentatierapport Kenmerken van pensioenuitkeringen aan personen anders dan AOW of ANW (PENSOVPERSOONBUS)

FAIR Data & Personal Health Train

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Wanbetalers Zorgverzekeringswet (WANBZVWTAB)

Microdataservices. Documentatierapport Maandbedragen van personen met een Werkloosheidswet (WW)-uitkering (WWMNDBEDRAGBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Personen met een toegekend PGB voor AWBZ-zorg (PGBAWBZTAB)

Documentatierapport Personen met een re-integratietraject dat wordt verzorgd door het Uitvoeringsinstituut Werknemersverzekeringen (UWVTRAAGGTABULT)

INSTELLINGSBESLUIT COMMISSIE OPSLAG EN BESCHIKBAARHEID VAN DATA VOOR ONDERZOEK

Microdataservices. Documentatierapport Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Maandelijkse loonbedragen van werknemers (BAANPRSMNDBEDRAGBUS)

Documentatierapport In de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven personen en hun juridische ouders (KINDOUDERTAB)

Microdataservices. Documentatierapport Personen met een Algemene Ouderdomswet (AOW)-uitkering (MICAOWPERSOONBUS)

Microdata Services. Documentatie Kenmerken van trajectperiodes van personen met. Uitvoeringsinstituut Werknemersverzekeringen (SIRAGPERSOONBUS)

Big Data en het CBS. Enkele voorbeelden. Piet Daas, May Offermans, Martijn Tennekes, Alex Priem, Paul van den Hurk

Uitvoeringsinstituut Werknemersverzekeringen, niet gecoördineerd.

Microdataservices. Documentatie Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

Microdataservices. Documentatierapport Ontslagaanvragen bij het Uitvoeringsinstituut Werknemersverzekeringen (UWV) (UWVONTAANVTAB)

Microdataservices. Documentatierapport Kenmerken van door studenten behaalde hoofddiploma's in het hoger beroepsonderwijs (HDIPLOMAHBOTAB)

Het Effect van Verschil in Sociale Invloed van Ouders en Vrienden op het Alcoholgebruik van Adolescenten.

Documentatierapport Persoonskenmerken van alle in de Gemeentelijke Basis Administratie (GBA) ingeschreven personen (GBAPERSOONTAB)

Documentatierapport Kenmerken van door studenten behaalde diploma's in het middelbaar beroepsonderwijs (DIPLOMAMBOTAB)

Data Driven Strategy The New Oil Using Innovative Business Models to Turn Data Into Profit

Documentatie Personen met een re-integratietraject dat wordt verzorgd door het Uitvoeringsinstituut Werknemersverzekeringen (UWVTRAAGGTABULT)

het Uitvoeringsinstituut Werknemersverzekeringen, niet gecoördineerd.

Centrum voor Beleidsstatistiek en Microdata Services

(GBA) (VRLGBAOVERLIJDENTAB)

Research informatie- en datamanagement nieuwe taken voor bibliotheken in wetenschappelijke communicatie en ondersteuning bij onderzoek

Microdataservices. Documentatierapport Personen met een bijstandsuitkering (MICBIJSTANDPERSOONBUS)

. naturalis. nederlands centrum voor biodiversiteit. leiden. plantpathogenen, onderdeel van biodiversiteit? kennis en innovatie in breed perspectief

Basisadministratie Persoonsgegevens (GBA) ingeschreven overleden personen.

Microdata Services. Documentatie Maandbedragen personen met een bijstandsuitkering (BIJSTANDPERSOONMNDBEDRAGBUS)

Microdataservices. Documentatierapport Maandelijkse loonbedragen van werknemers (BAANPRSMNDBEDRAGBUS)

Microdata Services. Documentatie Maandbedragen van personen met een werkloosheidsuitkering (WW) (WWPERSOONMNDBEDRAGBUS)

Microdataservices. Documentatierapport Kenmerken van uitkeringsperiodes van personen met een werkloosheidsuitkering (WWPERSOONBUS)

Documentatierapport Kenmerken van uitkeringsperiodes van personen met een werkloosheidsuitkering (WWPERSOONBUS)

Beïnvloedt Gentle Teaching Vaardigheden van Begeleiders en Companionship en Angst bij Verstandelijk Beperkte Cliënten?

Onderzoeksresultaten transparantie en openbaarheid

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Personen met bijstand in de verslagmaand (SECMBIJSTMNDBEDRAGBUS)

Microdata Services. Documentatie Aanbod van arbeid (Arbeidsaanbodpanel)

D4LS Operational Board Meeting

(GBASTANDBEVOLKINGTAB)

Documentatierapport Personen met een uitkering bij ziekte of arbeidsongeschiktheid in de verslagmaand (SECMZIEKTEAOMNDBEDRAGBUS)

Centrum voor Beleidsstatistiek en Microdata Services

Microdata Services. Documentatie Maandbedragen personen met een AOW-uitkering (AOWPERSOONMNDBEDRAGBUS)

Overzicht kwaliteitsregistraties in Nederland

(GBASTANDBEVOLKINGTAB)

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Hoogst behaalde diploma op basis van onderwijsregistraties (HDIPLOMAREGTAB)

Administratie (GBA) ingeschreven personen, niet gecoördineerd.

Documentatierapport Maandbedragen van personen met een pensioenuitkering anders dan AOW of ANW (PENSOVMNDBEDRAGBUS)

Methodologie voor de sociale wetenschappen. Voorwoord. Deel 1 Algemeen: basisbegrippen 1. H1 Waarom sociaalwetenschappelijk onderzoek?

Centrum voor Beleidsstatistiek en Microdata Services

Documentatierapport Datum van overlijden van personen die ingeschreven staan in de Gemeentelijke Basisadministratie (GBA) (GBAOVERLIJDENTAB)

(GBAVERWEDUWDENMASSABUS)

Microdataservices. Documentatierapport Eerst behaalde einddiploma in het hoger onderwijs (EERSTEDIPLOMAHOTAB)

Centrum voor Beleidsstatistiek en Microdata Services

Documentatierapport Maandbedragen inkomsten uit een uitkering uit het buitenland van personen (UITKBUITLANDMNDBEDRAGBUS)

Microdataservices. Documentatierapport Maandbedragen van personen met een Algemene Nabestaandenwet (ANW)-uitkering (ANWMNDBEDRAGBUS)

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

Documentatierapport Kenmerken van deelcertificaten die in het voortgezet algemeen volwassenenonderwijs zijn behaald (DEELCERTIFICATENVAVOTAB)

Microdataservices. Documentatierapport Maandbedragen van personen met een arbeidsongeschiktheids (AO)-uitkering (AOTOTMNDBEDRAGBUS)

Documentatierapport Gegevens over overige pensioenen inclusief nabetalingen van personen (PENSOVJAARBEDRAGTAB)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Jaarbedragen van personen met een overige uitkering (OVUITKJAARBEDRAGTAB)

Documentatierapport Kenmerken van deelcertificaten die in het voortgezet algemeen volwassenenonderwijs zijn behaald (DEELCERTIFICATENVAVOTAB)

Documentatierapport Personen in Nederland met gegevens over hun arbeidsverleden in de afgelopen 4 jaar (RAVTAB)

Microdataservices. Documentatierapport Jaarbedragen van personen met een bijstandsuitkering (BIJSTANDJAARBEDRAGTAB)

Documentatierapport Personen die staan ingeschreven bij een Centrum voor Werk en Inkomen (CWI) (CWITAB)

DE VERBORGEN WAARDE VAN DATA Toegepaste Data Intelligentie

in de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven staan..

(GBANATGEWIJZIGDENMASSABUS)

Microdataservices. Documentatierapport Kenmerken van door studenten behaalde diploma's in het middelbaar beroepsonderwijs (DIPLOMAMBOTAB)

Documentatierapport Personen met een arbeidsongeschiktheids (AO)- uitkering (MICAOTOTPERSOONBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Personen met een bijstandsuitkering (MICBIJSTANDPERSOONBUS)

RDM LCRDM Ethische Toetsing, AVG en RDM in de Sociale Wetenschappen, UU, 4 juni 2019

Centrum voor Beleidsstatistiek en Microdata Services

Microdataservices. Documentatierapport Baanbeëindigingen wegens faillissement (FAILONTSLAGTAB)

Microdata Services. Documentatie Personen met winst in de verslagmaand (SECMZLFMNDBEDRAGBUS)

Microdataservices. Documentatie Maandbedragen van personen met een Werkloosheidswet (WW)-uitkering (WWMNDBEDRAGBUS)

Time³. Finance, life & Quality BM HENGELO (Ov.) 7490 AA DELDEN 7470 VJ DELDEN. vrijdag s gesloten

Published in: Onderwijs Research Dagen 2013 (ORD2013), mei 2013, Brussel, Belgie

Microdata Services. Documentatie Examenuitslagen per vak van leerlingen in het voortgezet onderwijs (EXAMVOVAKTAB)

Microdata Services. Documentatierapport Personen in de Enquete Beroepsbevolking naar familie relatie in huishouden (EBBFAMILIETAB)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport X- en Y-coördinaten van een verblijfsobject (VSLCOORDTAB)

Tevredenheidsonderzoek Heliomare

Transcriptie:

1 Big data: overvloed en onbehagen Kees Aarts SWR conferentie, 16-17 september 2016

2 Inhoud KNAW-Verkenningscommissie Wat is big data? Big data en onderzoeksmethodologie Spanningsvelden Toekomst

3 Commissie Big Data Ingesteld september 2015. De commissie heeft twee taken: uitvoeren van een brede verkenning naar effecten van big data op wetenschappelijk onderzoek met het accent op wetenschapsgebieden die werken met personen voorbereiden van een KNAW-advies over enkele geselecteerde onderwerpen.

4 Gevolgde werkwijze Discussiebijeenkomsten met focusgroepen: Onderzoekers in big data Informatica-specialisten (komt nog) Jongere onderzoekers in big data

5 Dutcher (2014)

6 Een vaag omlijnd begrip Big data: wat is big? De drie v s (volume, velocity, variety) Verwante maar onderscheiden termen Data science E-science (e-humanities) Computational social science Data-driven research Open access, open data, open science

7 Volume, velocity Camerabeelden, GPS gegevens, social media (Twitter; Hosch- Dayican et al. 2014), zoekgedrag op web Electoral campaigning Type of campaigning No electoral campaigning Tweets on Dutch Elections 2012 Persuasive campaigning Figure 1. An overview of the nested structure of the variables. Electoral campaigning Negative campaigning

8 Variety Stelsel van sociaalstatistische bestanden (CBS): virtuele volkstelling (Bakker et al. 2014) Fig. 2. Conceptual model of the SSD register system. [Rectangles: object types; lines: relations between object types; PIN: person identification number; HIN: household identification number; AIN: address identification number; OIN: organization identification number; the indication x:y denotes the type of relation].

9 Paradigmawisseling (Hey et al. 2009)

10 Data is een misleidende term Data zijn nooit gegeven maar worden altijd geconstrueerd (waarnemingstheorie, datatheorie) Iemand maakt de keuze wat wordt waargenomen; die keuze heeft gevolgen voor geldigheid en betrouwbaarheid Een observatie kan worden geïnterpreteerd als uiteenlopende data Dit wordt vaak vergeten als het om big data gaat

11 Toetsen verliezen hun betekenis Conventies bij statistische toetsen zijn ontwikkeld vanuit minimalistisch, experimenteel perspectief (hoe groot moet n zijn om een verdeling te benaderen? Wat is bij die n een acceptabele type-i fout?) Bij grote n wordt volgens deze conventies vrijwel elk verband significant

12 Geldigheid wordt problematisch Externe geldigheid: in hoeverre zijn de data/ relaties generaliseerbaar? Interne geldigheid: in welke mate kun je een correlatie causaal interpreteren?

13 Verificatie en replicatie Data zouden moeten voldoen aan de FAIR principes: findable accessible interoperable re-usable

14 Eigenaarschap (Einav & Levin 2014) 1.0 Share of all published papers with data 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0 No exemption Exemption (private data) Exemption (administrative data) 54% 55% 67% 71% 72% 80% 91% 86% 95% 22% 20% 20% 19% 15% 13% 26% 7% 24% 4% 12% 10% 13% 4% 7% 5% 7% 2006 2007 2008 2009 2010 2011 2012 2013 2014 Publication year*

15 AOL searcher No. 4417749 My goodness, it s my whole personal life I had no idea somebody was looking over my shoulder.

16 Persoonsbescherming Mensen zijn zich doorgaans volstrekt onvoldoende bewust van de geïntegreerde kennis die over hun persoon en hun gedrag beschikbaar is Disclaimers worden niet begrepen

17 Infrastructuur nodig! Data infrastructuur: Voor de kwaliteit van metingen Voor methodologische en statistische expertise Voor maximale generaliseerbaarheid Om de FAIR principes operationeel te maken Om eigenaarschap te regelen Om privacy te beschermen

18 Twee stappen gezet NDSW Dataplatform voor de mens- en maatschappijweten schappen Koepelvoorstel nieuwe nationale roadmap Start: 27 oktober M3 Onderdeel van KNAW Agenda Grootschalige Wetenschappelijke Infrastructuur Integreert biologie, medicijnen, genetica, informatica