StatMine StatMine prototype visuele dataexploratie. Edwin de Jonge, Jan van der Laan en Jessica Solcer CBS Datavisualisatie in beweging, 24 mei 2013



Vergelijkbare documenten
Rechtsbescherming en veiligheid op maat

De JGZ-data en het CBS. JGZ-bijeenkomst 20 juni 2019 Ivo Gorissen

Dag van intelligentie

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

Workshop CBS data. Dennis Ramondt

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Ben jij een Sherlock? Duik in StatLine, de databank van CBS. Leerlingenversie

Kansrekening en Statistiek

Nederlandse samenvatting

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements

Microdata Services. Documentatierapport Internationale Handel in Goederen (IHG)

Ben jij een Sherlock? Duik in StatLine, de databank van CBS. Leerlingenversie

Agenda. 1. Introductie. 2. INSPIRE 3. TJS in meer detail 4. Implementatie TJS 5. Conclusies. Table Joining Service. Belofte voor de toekomst?

Oefenvragen bij Statistics for Business and Economics van Newbold

Microdataservices. Documentatierapport Maandelijkse consumentenprijzen (CPI)

Kansrekening en Statistiek

Herkansing eindtoets statistiek voor HBO

Handleiding StatLine

CBS StatLine voor Open Data. Handleiding

Lokale data. Onderzoek op maat, microdata, geoservices. Centraal Bureau voor de Statistiek

S0A17D: Examen Sociale Statistiek (deel 2)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

Centraal Bureau voor de Statistiek. StatLine: alle cijfers van het CBS op internet

De AVG en het CBS. Max Booleman Functionaris gegevensbescherming van het CBS NORA, 29 mei 2018

Microdataservices. Documentatierapport Maandelijkse consumentenprijzen (CPI)

Communiceren van statistische informatie over onzekerheid. 1 juni 2017, Martin Knotters (ESG), Marijn Poortvliet (SSG)

9. Lineaire Regressie en Correlatie

pag.: 1 van 7 code: SPE-OVH-ebk-002-bl TenderNed ELEKTRONISCH AANBESTEDEN EN INSCHRIJVEN Bron: TenderNed 2010 Auteur(s):

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

Statistiek is zo saai nog niet! Een integratie van theorie en praktijk Manfred te Grotenhuis

Leren van meetnetten in stedelijke natuur

Bijdrage aan en impact op de inflatie

Peilingen beoordelen. Een checklist. Jelke Bethlehem. Centraal Bureau voor de Statistiek

Aandeel MKB in buitenlandse handel en investeringen

Centraal Bureau voor de Statistiek

Maandelijkse cijfers over de werkloze beroepsbevolking van het CBS en nietwerkende werkzoekenden van het UWV

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport ConsumentenPrijsIndex (CPI)

Microdata Services. Documentatie Populatie actieve bedrijven naar grootteklasse en rechtsvorm (ABR_PAB)

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Training Social Media succesvol inzetten voor je organisatie of bedrijf

Administratie (GBA) ingeschreven personen, niet gecoördineerd.

Documentatierapport Datum van overlijden van personen die ingeschreven staan in de Gemeentelijke Basisadministratie (GBA) (GBAOVERLIJDENTAB)

Data analyse Inleiding statistiek

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

De kenmerken van schoolverlaters en hun arbeidspositie vijf jaar later

Statistiek. Lieven Clement. Statistiek: 2 de bach. in de Biologie, Biochemie en Biotechnologie, Biomedische Wetenschappen en Chemie

Documentatierapport Energieverbruik

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

(GBASCHEIDINGENMASSATAB)

Release notes Swing Mosaic 1.5.0

Levensverwachting in Caribisch Nederland verschilt weinig met Nederland

Statistiek: Herhaling en aanvulling

Statistisch Bulletin. Jaargang

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

(GBA) (VRLGBAOVERLIJDENTAB)

BELEIDSPLAN. Brederodestraat VG Amsterdam Nederland. info@stichtingopen.nl Rabobank: NL44RABO

Centraal Bureau voor de Statistiek. Maandelijkse cijfers over de werklozen en niet-werkende werkzoekenden van het CBS en UWV.

Onderzoek. B-cluster BBB-OND2B.2

Digitaal aanmelden met DigiD, een gebruikerservaring.

Kansrekening en Statistiek

Hireserve recruitmentsoftware. Brochure 2017

Statistiek voor A.I.

Smart Automation, Quality and IT Excellence Solutions - our experience, your success. Versie

Verschillen in cijfers over huisartscontacten. en de statistiek tiek Geregistreerde contacten met de huisarts

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee

Microdataservices. Documentatie Leeftijd bij overlijden (Leeftijdbov)

(GBAVERBINTENISSENMASSATAB)

Transitieschema overgang coördinator meterpool kleinverbruik gas en elektriciteit. VMNED 2015 Plaats: Hilversum Datum: September 2015 Versie: 1.

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Hoofdstuk 12: Eenweg ANOVA

Microdataservices. Documentatierapport Nabijheid verblijfsobject en detailhandel (NABIJHEIDDETAILHTAB)

Documentatierapport In de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven personen en hun juridische ouders (KINDOUDERTAB)

3 Microdata Services. Documentatie Prodcom; verkopen; industriële producten naar productgroep (Prodcom)

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Microdata Services. Documentatie Nabijheid verblijfsobject en voorzieningen voor kinderopvang (NABIJHEIDKINDOPVTAB)

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Ontwikkelingen bij het CBS

Kenmerk ontheffing in de Bijstands Uitkeringen Statistiek

Regionale statistieken anno 2012 Wegwijs in het steeds omvangrijkere statistiekaanbod

De ontwikkeling van een heropnamemodel. Corine Penning, Jan van der Laan, Agnes de Bruin (CBS) Landelijke Themabijeenkomst Heropnamen DHD

Centraal Bureau voor de Statistiek. Maandelijkse cijfers over de werklozen en niet-werkende werkzoekenden van het CBS en UWV WERKbedrijf.

Basisverlegging Producentenprijzen Indexcijfers, 2010 = 100

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Microdataservices. Documentatie Maandbedragen van personen met een Algemene Ouderdomswet (AOW)-uitkering (AOWMNDBEDRAGBUS)

Testen+ Testaanpak Sogeti testteam bij de Friesland Bank. Versie: 13 februari 2012 André Louwes / Arjan van der Haar

Handleiding. (databank) StatLine. Handleiding CBS website en databank StatLine

HANDLEIDING IMA ATLAS

Microdataservices. Documentatierapport Maandbedragen van personen met een Algemene Nabestaandenwet (ANW)-uitkering (ANWMNDBEDRAGBUS)

Centraal Bureau voor de Statistiek

Documentatie Personen met een re-integratietraject dat wordt verzorgd door het Uitvoeringsinstituut Werknemersverzekeringen (UWVTRAAGGTABULT)

Valkuilen bij Nulhypothese Toetsen inleiding tot het gastcollege van Dr. Eric-Jan Wagenmakers. Peter Grünwald HOVO

Documentatierapport Selectie Inkomenspanelonderzoek uit integraal vermogensbestand (selectie IPO Integraal- Vermogensbestand)

Opgaven hoofdstuk 10 Het ontwerpen van experimenten en variantieanalyse

LOKALE ECOLOGISCHE KENNIS: EEN HISTORISCHE BRON. Overleg Historische Visserij 4 februari 2010

Kenmerk ontheffing in de Bijstands Uitkeringen Statistiek 2009 Versie 2

het Uitvoeringsinstituut Werknemersverzekeringen, niet gecoördineerd.

Advies van de Wetenschappelijke Commissie Wijkaanpak

Transcriptie:

StatMine StatMine prototype visuele dataexploratie Edwin de Jonge, Jan van der Laan en Jessica Solcer CBS Datavisualisatie in beweging, 24 mei 2013

Wat is StatMine? 2

StatMine Doel: Verbeter gebruik van huidige CBS cijfers Hoe: Analyse-schil op StatLine Werkwijze: Formuleer verbeterhypothese Maak software prototype Test prototype op gebruikers Evalueer test StatMine 3

Missie CBS? 4

Missie CBS Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving (bron: www.cbs.nl) 5

Missie CBS Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving 6

Zonder cijfers geen beleid 7

Hoe gaat het met Nederland? StatMine 8

Waarom StatMine? StatLine bevat meer dan één miljard cijfers voor Beleidsmakers Journalisten Burgers Bedrijven Economen Sociale wetenschappers Historici etc 9

Probleem 1 Cijfers Informatie StatMine 10

Missie CBS Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving 11

1. Cijfers Informatie Een aantal invloedrijke (potentiele) gebruikers van CBS cijfers wordt onvoldoende bediend: Datajournalisten Beleidsmedewerkers Veel interessante informatie in StatLine wordt niet gespot omdat de tabelvorm dit moeilijk maakt 12

H1: Data analyse = Data inzicht StatMine 13

H1. Data inzicht StatMine 0.1 had tot doel om meer inzicht te geven in StatLine cijfers door cijfers StatLine visueel en interactief te presenteren Met StatMine I (2012 Q1) werd deze hypothese succesvol getest op 4 moeilijke StatLine tabellen. 14

Lijngrafiek - ontwikkelingen Staafdiagram - vergelijken Bubble/scatter chart - correlatie/samenhang Mosaic chart - structuur 15

Small multiples? 16

17

StatMine 0.1 Resultaten Periode: 2012 Q1 Testpersonen: 25 CBS-ers Bevindingen - Testpersonen vinden dat visueel maken van data meerwaarde biedt (small multiples) - StatLine-tabeleigenaren zien hun data op een andere wijze - StatLine-tabeleigenaren willen tool als controletool 18

Probleem 2. Verbrokkelde informatie StatMine 19

Missie CBS Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving 20

2. Verbrokkelde informatie Veel informatie in StatLine is gefragmenteerd: Gebruiker moet in meerdere tabellen kijken en informatie zelf combineren Diabetes Energiegebruik vgl economische groei Veiligheid vgl criminaliteit 21

2. Tabellen koppelen StatMine 22

H2. Tabellen koppelen had tot doel om meer inzicht te geven in StatLine cijfers door: - Gebruikers zelf tabellen te laten combineren. - Voorwaarde is dat ze tenminste één dimensie gemeenschappelijk moeten hebben. Met prototype II (2012 Q4 2013 Q1) is deze hypothese getest. 23

Resultaten Periode: 2012 Q4 2013 Q1 Testpersonen: 20 CBS-ers, 40 externen (beleidsmakers ministeries, journalisten) Bevindingen: - Externen enthousiast over visuele mogelijkheden StatMine - Koppelen van data vervult een externe wens 24

Probleem 3 Statistische cijfers zijn onzeker StatMine 25

Missie CBS Het Centraal Bureau voor de Statistiek heeft als taak het publiceren van betrouwbare en samenhangende statistische informatie, die inspeelt op de behoefte van de samenleving (bron: www.cbs.nl) StatMine 26

H3 Onzekerheidsmarges Alle CBS cijfers hebben een onzekerheidsmarge European Statistics Code of Practice (12.2): sampling and non sampling errors should be systematically documented Doel van StatMine 0.3 (2013 Q2): kijken hoe gebruikers op een begrijpelijke manier attent kunnen maken op onze onzekerheidsmarges. StatMine 27

StatLine & marges Ongeveer 5% van de StatLine tabellen publiceert expliciete marges per tabelcel: Standaardfout (uit steekproef!) Of boven + ondermarge Alle cijfers in StatLine hebben een precisie Aantal cijfers achter komma (1, 1,0, 1,00, 1,000) In duizendtallen/miljoenen 28

StatMine 0.3 Beperkt zich tot: Hoe interpreteren gebruikers de marges? Wat betekent dat voor de interpretatie van de cijfers? Is er behoefte aan marges? Aanname: Voor de testtabellen is een puntschatting met bijbehorend betrouwbaarheidsinterval aanwezig. 29

StatMine 0.3 Testen invloed tonen onzekerheid op antwoorden gebruikers (analyse nog bezig) Inbouwen van onzekerheid in: Lijngrafieken Staafdiagrammen Scatterplots 30