HISSTAT. Voorstelling Kritische analyse bronnen. Brussel, FOD Economie, 20 juni 2012. Workshop 20 juni 2012 1

Vergelijkbare documenten
Statistisch Product. Structuur van de bevolking op basis van het Rijksregister

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport X- en Y-coördinaten van een verblijfsobject (VSLCOORDTAB)

Data, tools en infrastructuren Rollen en verantwoordelijkheden

Microdataservices. Documentatie Pensioenaanspraken

Eindkwalificaties van de bacheloropleiding Geschiedenis

In deze les. Het experiment. Hoe bereid je het voor? Een beetje wetenschapsfilosofie. Literatuuronderzoek (1) Het onderwerp.

Documentatie Personen met een re-integratietraject dat wordt verzorgd door het Uitvoeringsinstituut Werknemersverzekeringen (UWVTRAAGGTABULT)

het Uitvoeringsinstituut Werknemersverzekeringen, niet gecoördineerd.

Microdataservices. Documentatierapport X- en Y-coördinaten van een verblijfsobject (VSLCOORDTAB)

(GBA) (VRLGBAOVERLIJDENTAB)

Gegevensverwerving en verwerking

Microdataservices. Documentatierapport Coördinaten van de vierkanten van 100x100 en 500x500 meter waarin een verblijfsobject valt (VSLVIERKANTTAB)

(GBAVERWEDUWDENMASSABUS)

Microdata Services. Documentatie Bedrijven van ondernemers (revisie 2017) (INPBEIDTAB)

Hoe kan wetenschappelijk onderzoek versneld worden met de diagnosethesaurus? Jan Verschuuren. Symposium DHD 24 september 2015

Statistisch Product. Sterfte

voetafdrukrekeningen, herbe rekend

Administratie (GBA) ingeschreven personen, niet gecoördineerd.

Documentatierapport Coördinaten van de vierkanten van 100x100 en 500x500 meter waarin een verblijfsobject valt niet gecoördineerd (VSLVIERKANTTAB)

Documentatierapport Datum van overlijden van personen die ingeschreven staan in de Gemeentelijke Basisadministratie (GBA) (GBAOVERLIJDENTAB)

Uitvoeringsinstituut Werknemersverzekeringen, niet gecoördineerd.

PERSBERICHT Brussel, 22 oktober 2014

Microdata Services. Documentatie Populatie actieve bedrijven naar grootteklasse en rechtsvorm (ABR_PAB)

ONGEOORLOOFD AFWEZIG ZIJN IN VLAANDEREN Een actuele beschrijving op basis van registratiegegevens. Gil Keppens & Bram Spruyt

(GBAVERBINTENISSENMASSATAB)

Statistisch Product. Doodsoorzaken

Microdata Services. Documentatie Aanbod van arbeid (Arbeidsaanbodpanel)

Statistisch Product. Echtscheidingen

Basisadministratie Persoonsgegevens (GBA) ingeschreven personen, nietgecoördineerd.

Microdata Services. Documentatie Energieverbruik particuliere woningen (ENERGIEVERBRUIKTAB)

Microdataservices. Documentatierapport Maandbedragen studiefinanciering van personen (STUDIEBEURSMNDBEDRAGBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Maandbedragen studiefinanciering van personen (STUDIEBEURSMNDBEDRAGBUS)

Documentatierapport Selectie Inkomenspanelonderzoek uit integraal vermogensbestand (selectie IPO Integraal- Vermogensbestand)

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument.

Statistisch Product. Sterftetafels en levensverwachting

Microdata Services. Documentatie Personen in Nederland met gegevens over hun arbeidsverleden in de afgelopen 4 jaar (RAVTAB)

Partnerkeuze en huwelijkssluiting onder migranten

(GBASTANDBEVOLKINGTAB)

PERSBERICHT Brussel, 15 mei 2017

Evidence Based Practice

(GBASTANDBEVOLKINGTAB)

Microdata Services. Documentatie Kenmerken van trajectperiodes van personen met. Uitvoeringsinstituut Werknemersverzekeringen (SIRAGPERSOONBUS)

Demografische ontwikkeling Gemeente Hoorn

Microdataservices. Documentatierapport Personen met een Algemene Nabestaandenwet (ANW)-uitkering (MICANWPERSOONBUS)

Documentatierapport Personen in Nederland met gegevens over hun arbeidsverleden in de afgelopen 4 jaar (RAVTAB)


Documentatie In de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven personen en hun juridische ouders (KINDOUDERTAB)

Wijzigingen worden door de docent in Edmodo of in de les doorgegeven. Hoofdstuk 1 Lineaire en exponentiële functies. Week Onderwerp Opgaven

(GBASCHEIDINGENMASSATAB)

Microdata Services. Documentatie Maandbedragen van personen met een Ziektewetuitkering (ZWPERSOONMNDBEDRAGBUS)

Microdata Services. Documentatie Personen met een toegekend PGB voor AWBZ- of Wlz-zorg (PGBAWBZTAB)

Documentatierapport In de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven personen en hun juridische ouders (KINDOUDERTAB)

BIBLIOTHEEK SOCIALE WETENSCHAPPEN JSTOR. Arts & Sciences I, II, III, IV, V, VI, VII & Complement; Ireland; 19th Century British Pamphlets.

Microdata Services. Documentatie Personen met een besteed PGB ten laste van Wlz, Wmo 2015 en Jeugdwet (PGBWLZWMOJWTAB)

Microdata Services. Documentatie Personen met winst in de verslagmaand (SECMZLFMNDBEDRAGBUS)

Microdataservices. Documentatie Personen met studiebeurs in de verslagmaand (SECMBEURSMNDBEDRAGBUS)

Open Overheid & Open data

Microdataservices. Documentatierapport Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Personen met een toegekend PGB voor AWBZ-zorg (PGBAWBZTAB)

Microdataservices. Documentatierapport Energieverbruik particuliere woningen (ENERGIEVERBRUIKTAB)

Microdataservices. Documentatie Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

Microdata Services. Documentatie Personen met studiebeurs in de verslagmaand (SECMBEURSMNDBEDRAGBUS)

Microdataservices. Bronvermelding

Barometer van de informatiemaatschappij (2017) Juli Barometer van de informatiemaatschappij

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Door bureau jeugdzorg afgegeven indicaties voor AWBZ-zorg (BJZAWBZTAB)

Documentatierapport In de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven personen en hun juridische ouders (KINDOUDERTAB)

Demografische ontwikkeling Gemeente Enkhuizen

Microdataservices. Documentatie Pensioenaanspraken

Leeftijd en geslacht jaar jaar jaar. Studieniveau en geslacht Laag Midden Hoog

De Vlaamse arbeidsmarkt Een terugblik

Demografische ontwikkeling Gemeente Hoorn

Basisadministratie Persoonsgegevens (GBA) ingeschreven overleden personen.

Microdataservices. Documentatierapport Maandelijkse consumentenprijzen (CPI)

Statistisch Product. Afzetprijsindexen in de industrie

Microdataservices. Documentatierapport Maandelijkse loonbedragen van werknemers (BAANPRSMNDBEDRAGBUS)

Microdata Services. Bronvermelding

GEZONDE LEVENSVERWACHTING NAAR OPLEIDING EN STIJGENDE PENSIOENLEEFTIJD

Microdataservices. Documentatie Leeftijd bij overlijden (Leeftijdbov)

Structuur en Beweging van de residentiële bevolking (wettelijke statistiek geldig op nationaal vlak)

Microdataservices. Documentatierapport Personen met een Werkloosheidswet (WW)- uitkering (MICWWPERSOONBUS)

Microdata Services. Documentatie Nabijheid verblijfsobject en voorzieningen voor kinderopvang (NABIJHEIDKINDOPVTAB)

Microdata Services. Documentatie Gemeente-, wijk- en buurtcodes van een verblijfsobject (VSLGWBTAB)

Microdata Services. Documentatie Maandbedragen van personen met een werkloosheidsuitkering (WW) (WWPERSOONMNDBEDRAGBUS)

Centrum voor Beleidsstatistiek en Microdata Services

Documentatierapport Persoonskenmerken van alle in de Gemeentelijke Basis Administratie (GBA) ingeschreven personen (GBAPERSOONTAB)

Stand van zaken van de Smart City -dynamiek in België: een kwantitatieve barometer

Microdata Services. Documentatie Maandbedragen personen met een AOW-uitkering (AOWPERSOONMNDBEDRAGBUS)

Formulier voor het beoordelen van de kwaliteit van een artikel over een interventieonderzoek (bij voorkeur een RCT)

Microdataservices. Documentatierapport Gegevens over buitenlandse dochters van Nederlandse ondernemingen (Outward_FATS)

Documentatierapport Persoonskenmerken van alle in de Gemeentelijke Basis Administratie (GBA) ingeschreven personen, gecoördineerd (GBAPERSOONTAB)

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport ConsumentenPrijsIndex (CPI)

BIBLIOTHEEK SOCIALE WETENSCHAPPEN. LexisNexis Academic. Kris Scheys

Microdataservices. Documentatierapport Ontslagaanvragen bij het Uitvoeringsinstituut Werknemersverzekeringen (UWV) (UWVONTAANVTAB)

Microdataservices. Documentatierapport Baanbeëindigingen wegens faillissement (FAILONTSLAGTAB)

werkkring waarin werkzame personen in een bepaalde maand werkzaam zijn.

Masterproef oktober 2009

Bij gebrek aan bewijs

Databank Digitale Dagbladen

Transcriptie:

HISSTAT Voorstelling Kritische analyse bronnen Brussel, FOD Economie, 20 juni 2012 Workshop 20 juni 2012 1

Inhoud 1. Voorstelling van HISSTAT 2. Toepassing: kritische analyse van de volkstellingen (1800-1970) 3. Demonstratie van de website Census 1900 Workshop 20 juni 2012 2

1. Voorstelling van HISSTAT Workshop 20 juni 2012 3

1. HISSTAT - voorstelling Beschrijving Infrastructuur voor historische statistieken Databanken voor de opslag en het beheer van primaire, originele data Instrumenten voor de analyse van de gegevens (o.a. GIS) Metadatabank en bronnenkritiek Scope: Volledige Belgische grondgebied op microniveau (gemeenten of lager) Periode 1800-1970 Workshop 20 juni 2012 4

1 HISSTAT - voorstelling Doelstellingen Bewaring van het statistisch erfgoed Wetenschappelijk potentieel van oude bronnen valoriseren Door data exploiteerbaar te maken Gebruik van moderne technieken mogelijk maken Potentieel wordt nog onvoldoende benut Stimuleren van interdisciplinaire samenwerking Brug slaan tussen micro-onderzoek en onderzoek op nationaal en internationaal niveau Coördinatie van expertise in België Workshop 20 juni 2012 5

1. HISSTAT - voorstelling Verschillende aanpak door toestand bronnenmateriaal 1801-1970 alleen geaggregeerde data op het niveau van de gemeenten (ca. 2500) alleen beschikbaar op papier (bibliotheken, archieven) digitalisering en ontsluiting door de UGent, Lokstat Vanaf 1961 data beschikbaar op individueel niveau in machine-leesbare vorm afkomstig van overheidsinstellingen ontsluiting door de VUB, Interface Demography Workshop 20 juni 2012 6

1. HISSTAT - voorstelling HISSTAT: Research Infrastructure for Historical Statistics based on Microdata in Belgium GIS (TRANSCENS) 1961-2001 VUB Databases Population statistics 1970-2001 VUB LOKSTAT: database of local statistics 1800-1970 UGent GIS (HISGIS ) 1800-1961 UGent Digital datasets from the Belgian gov. Institutions (Censuses ADSEI,...) Data from non digital sources: Books, archives Database Raw Data source Quantitative Database of the Belgian Municipalities Tool Digital collections from external depositors Data available at individual level Data available at local level (municipalities) Workshop 20 juni 2012 7

1. HISSTAT - voorstelling LOKSTAT Selectiecriteria van de microstatistieken Graad van detail moet volledig Belgische grondgebied beslaan moet teruggaan tot op het niveau van de gemeenten Relevantie en bruikbaarheid van de variabelen Beschikbaarheid van de bronnen Mogelijkheid tot vergelijking in de tijd Voornamelijk klassieke tellingen van de bevolking, landbouw, handel en nijverheid Occasionale statistieken (stemrecht, kadaster) Workshop 20 juni 2012 8

1. HISSTAT - voorstelling LOKSTAT/HISSTAT Project gefinancierd door de Herculesstichting Duur 2009-2013 Toegang tot de data data komen vrij op het einde van het project staan ter beschikking van het wetenschappelijk onderzoek met inachtneming van de privacywetgeving via website Census 1900 (www.lokstat.ugent.be) op eenvoudige aanvraag bij ploegen VUB en UGent Workshop 20 juni 2012 9

2. Voorbeeldtoepassing Kritische analyse van de volkstellingen in België 1800-1970 Workshop 20 juni 2012 10

Kritische evaluatie van Lokstat-data Vraag naar de kwaliteit van oude statistieken Tellingen zijn vatbaar voor vertekening en fouten Relatief weinig bekend over de betrouwbaarheid, door onvoldoende data in digitale vorm gebrek aan evaluatietechnieken Kritische doorlichting met de volkstellingen 1800-1970 1. Principes van de Wet van Benford 2. Analyse van de officiële uitslagen Workshop 20 juni 2012 11

De Wet van Benford Artikel The Law of Anomalous Numbers (New York, 1938) Principe: frequentie van de begincijfers van getallen uit bepaalde datasets beantwoordt aan vaste verhoudingen geen uniforme verdeling zoals intuïtief wordt aangevoeld Vast percentage begincijfers 1 30,1 % 2 17,6 % 3 12,5 % 4 9,7 % 5 7,9 % 6 6,7 % 7 5,8 % 8 5,1 % 9 4,5 % Totaal 100 % Workshop 20 juni 2012 12

Workshop 20 juni 2012 13

De Wet van Benford Empirisch aangetoond in zeer uiteenlopende domeinen Wiskundige verklaring volgt pas laat (Hill 1996 ) Datasets onderhevig aan de wet: op basis van waarnemingen geen onder- of bovengrens niet ontsproten aan de menselijke brein of random gekozen geen telefoonnumers, lotto-uitslagen; Voldoende aantal waarnemingen bij voorkeur minstens 10.000 Workshop 20 juni 2012 14

Sambridge e.a. 2010 Workshop 20 juni 2012 15

De Wet van Benford: praktische toepassingen Opsporing bias in datasets Fraudebestrijding Boekhouding, financiële audits Macro-economische statistieken (bv. begrotingscijfers Eurozone) Verkiezingsuitslagen (Iran) Officiële statistieken van broekasgasemissies Vnl. toepassingen in V.S. Minder in Europa, weinig in België Toepasbaar op bevolkingsstatistieken (Benford 1938, Sakai 1991) Workshop 20 juni 2012 16

De Wet van Benford: Onderzochte LOKSTAT- datasets Volkstellingen: Bevolking naar burgerlijke staat en geslacht, 1801-1970 (N = 185.000) Bevolkingsverloop: Geboorten, sterfte, in- en uitwijking per geslacht en per jaar, 1841-1976 (N = 2.500.000) Artikel De macht van het getal: een kritische analyse van de bevolkingsstatistieken in België (1801-1970) In: Belgisch Tijdschrift voor Nieuwste Geschiedenis (31 blz., ingestuurd mei 2012) Workshop 20 juni 2012 17

35% % Aandeel van de eerste cijfers Bevolkingsstatistieken van de Belgische gemeenten, 1800-1975 Bevolking naar geslacht en burgerlijke staat (tellingen); Geboorten, sterften, migratie (Mouvement) 30% 25% 20% 15% Volkstellingen Mouvement Wet van Benford 10% 5% 0% 1 2 3 4 5 6 7 8 9 Workshop 20 juni 2012 18

χ² 100 Afwijking met het Patroon van Benford (eerste cijfer) Bevolking naar Burgerlijke Staat en geslacht (volkstellingen) 10 MAD 90 χ² MAD 9 80 8 70 7 60 6 50 5 40 4 30 3 20 2 10 1 0 1801 1806 1818 1830 1846 1856 1866 1880 1890 1900 1910 1961 1970 0 Workshop 20 juni 2012 19

De Wet van Benford: Criteria van conformiteit (first digit, Drake & Nigrini 2000) Gemiddelde Absolute Afwijking 0 4 : grote gelijkenis met het patroon van Benford» Verschillen toe te schrijven aan toeval» Tellingen 1800-1818 4 8: duidelijke afwijkingen, maar acceptabel» Tellingen 1830-1846, 1890-1971 8 en meer: aanzienlijke afwijking» Tellingen 1856-1880 Workshop 20 juni 2012 20

χ² 100 Afwijking met het Patroon van Benford (eerste cijfer) Bevolking naar Burgerlijke Staat en geslacht (volkstellingen) 10 MAD 90 χ² MAD 9 80 8 70 2 3 7 60 6 50 5 40 30 1 4 3 20 2 10 1 0 1801 1806 1818 1830 1846 1856 1866 1880 1890 1900 1910 1961 1970 0 Workshop 20 juni 2012 21

Standaard telformulieren -1818 1830- Workshop 20 juni 2012 22

Standaard telformulieren 1818 1830 Workshop 20 juni 2012 23

χ² 100 Afwijking met het Patroon van Benford (eerste cijfer) Bevolking naar Burgerlijke Staat en geslacht (volkstellingen) 10 MAD 90 χ² MAD 9 80 8 70 60 2 7 6 50 5 40 4 30 3 20 2 10 1 0 1801 1806 1818 1830 1846 1856 1866 1880 1890 1900 1910 1961 1970 0 Workshop 20 juni 2012 24

Fr. 0,50 0,45 0,40 Kostprijs van de volkstellingen (Fr. per inwoner geïndexeerd, basis 1914) 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 1846 1856 1866 1880 1890 1900 1910 1920 1930 1947 1961 Workshop 20 juni 2012 25

2. Voorbeeldtoepassing χ² 100 Afwijking met het Patroon van Benford (eerste cijfer) Bevolking naar Burgerlijke Staat en geslacht (volkstellingen) 10 MAD 90 χ² MAD 9 80 8 70 3 7 60 6 50 5 40 4 30 3 20 2 10 1 0 1801 1806 1818 1830 1846 1856 1866 1880 1890 1900 1910 1961 1970 0 Workshop 20 juni 2012 26

Organisatie volkstellingen 1880-1890 Scope Richtlijnen Uitvoering Resultaten Controle Significant X Verschillen Niet-significant X X X X Controle van de gemeentelijke telformulieren 1880: geringe controle beperkte controlemechanismen 1890: oprichting van een telbureau in de schoot van Binnenlandse Zaken 37 000 tabellen nagekeken 4 829 tabellen voor rectificatie teruggestuurd naar gemeenten 3 970 aanmaningen en rappels gestuurd naar gemeenten Workshop 20 juni 2012 27

χ² 100 Afwijking met het Patroon van Benford (eerste cijfer) Bevolking naar Burgerlijke Staat en geslacht (volkstellingen) 10 MAD 90 χ² MAD 9 80 8 70 7 60 6 50 5 40 4 30 3 20 2 10 1 0 1801 1806 1818 1830 1846 1856 1866 1880 1890 1900 1910 1961 1970 0 Workshop 20 juni 2012 28

Volkstellingen 1801-1818 Geen afwijking met de verdeling volgens Benford Datasets die de verdeling volgen zijn niet noodzakelijk betrouwbaar Alleen systematische cijfervertekening is detecteerbaar Redenen voor grote conformiteit met de verdeling van Benford Afwezigheid van centrale instantie die teluitkomsten kon bijwerken Telformulieren waren niet complex Workshop 20 juni 2012 29

Conclusie De Wet van Benford biedt een bruikbaar referentiekader om datasets kritisch te wegen bepaalde vormen van systematische afwijkingen detecteerbaar Voorzichtigheid is geboden bij de interpretatie van de resultaten De toepassingsvoorwaarden van de wetmatigheid zijn niet altijd duidelijk Artikel De macht van het getal: een kritische analyse van de bevolkingsstatistieken in België (1801-1970) In: Belgisch Tijdschrift voor Nieuwste Geschiedenis (31 blz., ingestuurd mei 2012) Workshop 20 juni 2012 30

2. Kritiek statistieken bevolkingsverloop 1841-1976 χ² 160 140 120 Aantal geboorten geregistreerd per jaar en per geslacht in de Belgische gemeenten, 1841-1976 (uitgezonderd 1851-1879) Conformiteit met de frequentieverdeling van Benford (eerste cijfer) Trend 100 80 60 40 20 0 Workshop 20 juni 2012 31

2. Kritiek statistieken bevolkingsverloop 1841-1976 χ² 160 140 Aantal sterften geregistreerd per jaar en per geslacht in de Belgische gemeenten, 1841-1976 (uitgezonderd 1851-1879) Conformiteit met de frequentieverdeling van Benford (eerste cijfer) Trend 120 100 80 60 40 20 0 Workshop 20 juni 2012 32

3. Voorstelling van de website Census 1900 Workshop 20 juni 2012 33

3. Voorstelling website Website Census 1900 www.lokstat.ugent.be Ontwikkeld in samenwerking van Vakgroep Geografie UGent Bronnen: Landbouwtelling 1895 Nijverheidstelling 1896 Volkstelling 1900 Structuur: Toelichting bronnen Tabellen Kaarten Technische achtergrond: HTML PHP MySQL Workshop 20 juni 2012 34