Big data, start small Seminar Open en Big Data Den Haag, 20 maart 2017 Frank Bongers & Arthur Vankan
In deze presentatie Waar hebben we het eigenlijk over? Wat is de impact op rekenkamers? Welke rollen kunnen rekenkamers vervullen? Wat zijn de uitdagingen voor rekenkamers? Twee voorbeelden
In mooie woorden Het vermogen van de samenleving om informatie op nieuwe manieren in te zetten voor het verkrijgen van nuttige inzichten of waardevolle goederen en diensten In de praktijk Hele grote datasets ( het past niet meer in Excel ) Bijproducten (bijv. log files, facturering, ) Ongestructureerd en/of ongelijksoortig, bijv. tekstdata, data uit verschillende systemen We moeten er iets mee
Gegevens van de sociale dienst Temperatuur, lichtniveaus, en lawaai meten Gegevens van nutsbedrijven Locatiedata Berichten op sociale media Statistische gegevens over buurt???
Impact op rekenkamers Creatieve/innovatieve verrijking gereedschapskist Nieuwe combinaties en samenwerking met derden Data competenties Data blijft middel, en wordt geen doel op zichzelf Databeleid overheden evalueren Maar ook: geen aanpassing van functie, samenstelling en werkwijze van rekenkamers (i.t.t. O&S)
Impact op rekenkameronderzoek Analyseren van alles i.p.v. een deel Accepteren van rommeligheid i.p.v. exactheid Zoeken naar correlaties i.p.v. (ongrijpbare) causaliteit Grijpen van kansen voor evaluatie van doelmatigheid en doeltreffendheid
Alle gegevens analyseren (i.p.v. kleine verzamelingen). R 2 = 0.897 Werken met rommelige gegevens uit de werkelijkheid (i.p.v. exactheid). Statistische analyses op basis van de gehele dataset (i.p.v. op een (representatief) deel van de dataset). Meer respect voor correlaties (i.p.v. zoektocht naar ongrijpbare causaliteit).
Kaderstellen en controleren Om de spannende mogelijkheden van een datagedreven samenleving te realiseren, hebben we een beleidsontwerp voor data nodig, een New Deal, zoals ik het heb genoemd: werkbare garanties dat we kunnen beschikken over de data die we nodig hebben voor het algemeen belang, terwijl tegelijkertijd de burgers worden beschermd. Het handhaven van de bescherming van de persoonlijke privacy en vrijheid is essentieel voor een succesvolle samenleving Rekenkamer: Heeft de overheid spelregels gedefinieerd? Handelt de overheid conform wet- en regelgeving inzake data? (ex ante)
Aanjagen Stimuleren dat andere organisaties het belang van big data inzien en naar dat belang gaan handelen (dialoog, onderzoek, innovatie, samenwerking, ). Uit een studie over big data voor OCW: Agenderen belang big data voor onderwijs en wetenschap Identificeren van overheidsrollen Stimuleren van gebruik binnen wettelijke kaders Investeren in generieke en specifieke competenties. Bevorderen dat partijen actief data gaan delen. Internationaal meedoen. Rekenkamer: Hoe doelmatig en doeltreffendheid is het open en big databeleid van de overheid?
Produceren en verstrekken big data Transactions Enterprise data Public data Big data Social media Sensor data Rekenkamer: Hoe doelmatig en doeltreffendheid is het intern databeleid van de overheid (gericht op bedrijfsvoering)?
Gebruiken Rekenkamer: Handelt de overheid conform wet- en regelgeving inzake data (ex post)?
Uitdagingen Verzuip niet in de hype Verken de mogelijkheden Ontwikkel competenties, maar maak duidelijke keuze Ben je bewust van grenzen Leer van elkaar Data is een middel en geen doel Begin met kleine stappen
Evaluatie innovatiebox
De data Topsectoren Afbakening (2010-2012) Innovatie-surveys CIS (2006, 2008, 2010, 2012) RTD (2007, 2009, 2011, 2012) Buitenlandse zeggenschap Inward_FATS (2008-2012) Ondernemingengroep BE_OG_ABR (2005-2013) BE_1 BE_2 BE_3 BE_x BE_ID BE_ID Bedrijf BE_ABR (2005-2013) P_1 P_2 P_3 P_x CBS_persoon Vennootschapsbelasting: FE Innovatiebox-bestand (2007-2013) FI_1 FI_2 FI_3 FI_x WBSO (/RDA) CBS_Persoon Vennootschapsbelasting: FI WBSO 2007-2013 KvK BE_persoon_ABR (2005-2013) FI CBS_VPB (2007-2013)
14000 Generatie 2008 14000 Generatie 2009 12000 12000 10000 10000 8000 8000 6000 6000 4000 4000 2000 2000 0 2007 2008 2009 2010 2011 2012 2013 0 2007 2008 2009 2010 2011 2012 2013 ibox geen ibox ibox geen ibox 10000 9000 Generatie 2010 10000 9000 Generatie 2011 8000 8000 7000 7000 6000 6000 5000 5000 4000 4000 3000 3000 2000 2000 1000 1000 0 2007 2008 2009 2010 2011 2012 2013 0 2007 2008 2009 2010 2011 2012 2013 ibox geen ibox ibox geen ibox 9000 8000 Generatie 2012 5000 4500 Generatie 2013 7000 4000 6000 5000 4000 3000 3500 3000 2500 2000 1500 2000 1000 1000 500 0 2007 2008 2009 2010 2011 2012 2013 0 2007 2008 2009 2010 2011 2012 2013 ibox geen ibox ibox geen ibox
Music experience in a digital era
Measuring the music experience Listening Orienting Sharing Buying
Share of pop Share of rock
Music event footprint (based on BandsInTown + MusicBrainz) Eindhoven Average Pop 12% 11% Classical 1% 2% Dance 3% 2% Electro* 4% 4% House* 1% 1% Trance 2% 1% Rock 16% 19% Jazz 2% 4% Metal 6% 7% Soul* 3% 3% Blues 2% 5% NL 22% 10% Rap 0% 1% Hiphop 4% 2% R&B* 0% 0% *door afronding worden de waarden hier als gelijk weergegeven
Gitaar en piano aan kop, in Eindhoven drum en keyboard relatief populair Instrument Amsterdam Den Bosch Eindhoven Helmond Akoestische gitaar 0% 0% 0% 1% Basgitaar 3% 4% 4% 5% Blokfluit 3% 4% 4% 4% Cello 2% 4% 3% 2% Contrabas 1% 2% 1% 1% Drummen 9% 11% 12% 8% Dwarsfluit 2% 3% 2% 3% Elektrische gitaar 2% 2% 1% 2% Gitaar 29% 20% 23% 23% Harp 1% 1% 1% 1% Keyboard 7% 9% 10% 13% Klarinet 2% 2% 3% 4% Orgel 2% 2% 2% 0% Piano 24% 23% 21% 19% Saxofoon 5% 5% 4% 3% Trompet 3% 4% 3% 4% Viool 5% 5% 5% 7% Akoestische gitaar en elektrische gitaar kent weinig zoekopdrachten. Men lijkt op gitaar te zoeken, en niet specifiek het type gitaar.
12% 20 12% 20 Aandeel searches 10% 8% 6% 4% 2% Instrumenten gemiddeld Gemiddelde temperatuur Gitaar 18 16 14 12 10 8 6 4 2 Gemiddelde temperatuur Aandeel searches 10% 8% 6% 4% 2% Instrumenten gemiddeld Gemiddelde temperatuur Piano 18 16 14 12 10 8 6 4 2 Gemiddelde temperatuur 0% 0 0% 0 14% 20 12% 18 Aandeel searches 10% 8% 6% 4% Cello Gemiddelde temperatuur Instrumenten gemiddeld 16 14 12 10 8 6 Gemiddelde temperatuur Het leren spelen van instrumenten is in een jaar niet altijd even populair 4 2% 2 0% 0
Veel interesse voor gesubsidieerde locaties vanuit de regio Gemiddeld aantal zoekopdrachten per maand Regio CKE Dynamo Effenaar Muziekgebouw Parktheater PopEi TOTAAL Eindhoven 370 810 4390 2440 4270 290 12570 (35%) Regio (excl. Eindhoven) 720 1510 6670 6110 8020 440 23470 (65%) Gemiddeld aantal zoekopdrachten per maand Regio CKE Dynamo Effenaar Muziekgebouw Parktheater PopEi TOTAAL Eindhoven 370 810 4390 2440 4270 290 12570 (35%) Asten 20 50 260 200 310 10 850 (2%) Bergeijk 30 60 190 230 250 10 770 (2%) Best 40 80 340 360 540 20 1380 (4%) Bladel 40 70 250 240 290 20 910 (3%) Cranendonck 30 20 230 250 300 10 840 (2%) Deurne 40 70 310 260 330 10 1020 (3%) Eersel 30 50 200 240 290 20 830 (2%) Geldrop-Mierlo 50 110 520 440 690 30 1840 (5%) Gemert-Bakel 20 40 270 240 260 10 840 (2%) Heeze-Leende 40 50 280 310 400 30 1110 (3%) Helmond 40 160 860 490 740 50 2340 (6%) Laarbeek 40 80 290 240 280 20 950 (3%) Nuenen, Gerwen en Nederwetten 40 100 380 480 550 30 1580 (4%) Oirschot 40 70 220 230 260 20 840 (2%) Reusel-De Mierden 20 40 170 160 190 10 590 (2%) Someren 30 60 240 220 270 20 840 (2%) Son en Breugel 40 90 340 360 420 20 1270 (4%) Valkenswaard 40 90 400 320 470 40 1360 (4%) Veldhoven 60 150 620 490 750 30 2100 (6%) Waalre 30 70 300 350 430 30 1210 (3%) Totaal 1090 2320 11060 8550 12290 730 36040 (100%)
Glow populairst onder Eindhovenaren 60000 Populariteit evenementen voor Eindhovenaren 50000 Glow Aantal zoekopdrachten 40000 30000 20000 DDW 10000 0 Lichtjesroute Brabantsedag Glow Dutch Design Week Lichtjesroute Brabantsedag