Steekproeftheorie 0t. Deelthema: Herhaald ald wegen. José Gouweleeuw en Paul Knottnerus. Statistische Methoden (08006)

Maat: px
Weergave met pagina beginnen:

Download "Steekproeftheorie 0t. Deelthema: Herhaald ald wegen. José Gouweleeuw en Paul Knottnerus. Statistische Methoden (08006)"

Transcriptie

1 07 Steeproeftheorie 0t rie Deelthema: Herhaald ald wegen José Gouweleeuw en Paul Knottnerus Statistische Methoden (08006 Den Haag/Heerlen 008

2 Verlaring van teens. = gegevens ontbreen * = voorlopig cijfer x = geheim = nihil = (indien vooromend tussen twee getallen tot en met 0 (0,0 = het getal is leiner dan de helft van de geozen eenheid niets (blan = een cijfer an op logische gronden niet vooromen = 005 tot en met /006 = het gemiddelde over de jaren 005 tot en met / 06 = oogstjaar, boejaar, schooljaar enz., beginnend in 005 en eindigend in / / 06 = oogstjaar, boejaar enz., 003/ 04 tot en met 005/ 06 In geval van afronding an het vooromen dat het weergegeven totaal niet overeenstemt met de som van de getallen. Colofon Uitgever Centraal Bureau voor de Statistie Henri Faasdreef 3 49 JP Den Haag Prepress Centraal Bureau voor de Statistie - Facilitair bedrijf Omslag TelDesign, Rotterdam Inlichtingen Tel. ( Fax ( Via contactformulier: Bestellingen veroop@cbs.nl Fax ( Internet ISSN: 876_0333 Centraal Bureau voor de Statistie, Den Haag/Heerlen, 008. Verveelvoudiging is toegestaan, mits het CBS als bron wordt vermeld X-37

3 Inhoudsopgave. Inleiding op het thema...4. Algemene beschrijving...4. Afbaening en relatie met andere thema s Plaats in het statistisch proces...4. Herhaald wegen...5. Korte beschrijving...5. Toepasbaarheid Uitgebreide beschrijving Inleiding Methodologie De splitting-up procedure Minimale weegmodellen Tabellen met wantitatieve variabelen Slotopmeringen Toepassen van herhaald wegen bij de Volstelling Tabellen, variabelen en databloen Startgewichten Het schatten van de tabellen Pratijproblemen en mogelije oplossingen Kwaliteitsindicatoren Literatuur...7 3

4 . Inleiding op het thema. Algemene beschrijving In de standaard manier van ophogen hoort normaliter bij iedere steeproef een vaste set van gewichten waarmee de waarnemingen van een bepaalde doelvariabele in die steeproef moeten worden opgehoogd. Dit an er evenwel toe leiden dat er verschillende cijfers naast elaar worden gepubliceerd over één en dezelfde variabele wanneer er twee publicaties zijn over die variabele op basis van twee verschillende onderzoeen. Een dergelije discrepantie of inconsistentie an zich vooral voordoen bij multidimensionale tabellen die vaa een marginaal gemeenschappelij hebben terwijl de onderliggende tabellen zijn geschat op basis van verschillende onderzoeen. In dit document beschrijven we de technie van het herhaald wegen. Bij deze technie wordt in vooromende gevallen bij een bepaalde tabel de set gewichten aangepast. Deze veelal cosmetische aanpassing gebeurt op zo'n manier dat de consistentie met andere tabellen of met het register weer volledig wordt hersteld.. Afbaening en relatie met andere thema s Het spreet voor zich dat er relaties bestaan tussen aan de éne ant herhaald wegen en aan de andere ant de thema's Steeproeftheorie en Wegen als correctie voor non-respons. De daar besproen methoden en technieen resulteren in het algemeen in een set van gewichten die in het verdere statistische proces worden gebruit bij de ophoging. Deze gewichten dienen weer als input voor het herhaald wegen van een bepaalde tabel wanneer de desbetreffende schattingen niet consistent blijen te zijn met reeds geschatte of beende cijfers. Herhaald wegen resulteert dan voor die tabel in een set van nieuwe gewichten en aangepaste tabelschattingen die wel consistent zijn..3 Plaats in het statistisch proces Uit het voorafgaande moge het duidelij zijn dat herhaald wegen zich afspeelt aan het einde van het statistische proces vla voor het publiceren van de cijfers. Immers het doel van herhaald wegen is het vooromen van gepubliceerde cijfers die numerie inconsistent zijn. 4

5 . Herhaald wegen. Korte beschrijving In de statistische pratij zijn verschillende schatters mogelij om het totaal van een doelvariabele te schatten. In de pratij moeten er meestal totalen van meerdere doelvariabelen worden geschat. Dit hoeft oo niet altijd op basis van een enele steeproef, soms unnen hier meerdere steeproeven voor worden gebruit. Wanneer verschillende tabellen worden geschat op basis van meerdere steeproeven, hoeven deze niet noodzaelije numerie consistent te zijn. Wanneer bijvoorbeeld een tabel leeftijd opleiding uit een of andere steeproef wordt geschat en een tabel gezondheid opleiding uit een andere steeproef dan zullen de schattingen voor de verschillende categorieën van opleiding over het algemeen niet exact overeenomen. Immers, op schattingen die gebaseerd zijn op steeproefdata zit een steeproeffout waardoor de schattingen unnen afwijen van het echte populatietotaal. Uiteraard moeten ze als het goed is binnen de steeproefmarge wel overeen omen. Met de methode van herhaald wegen worden dergelije numeriee inconsistenties tussen schattingen uit verschillende bronnen zo veel mogelij vooromen (zie bijvoorbeeld Kroese en Renssen, 999. Het voornaamste doel van herhaald wegen is dus puur cosmetisch: het vooromen van verschillen door steeproeffouten in schattingen. In plaats van één set gewichten die wordt gebruit om alle tabellen te schatten, rijgt bij herhaald wegen iedere tabel zijn eigen set gewichten. Feitelij omt de methode neer op het herhaald toepassen van de regressieschatter. Om de uitvoering van herhaald wegen te vereenvoudigen is speciale software ontwield: het paet VRD (Vullen Reference Database.. Toepasbaarheid Bij het CBS wordt het herhaald wegen vooral toegepast bij de sociaal-economische statistieen. Zo is herhaald wegen gebruit om de tabellen voor de Volstelling 00 te schatten. Met deze methode was het mogelij om 40 consistente tabellen aan Eurostat te leveren, zonder dat er een heuse volstelling voor nodig was. Voor meer informatie over de volstelling wordt de lezer verwezen naar Schulte Nordholt (005 en Advoaat et al. (004; zie oo paragraaf.4. Oo is herhaald wegen gebruit bij het Loonstructuuronderzoe 00 (zie Gouweleeuw, 005. Alvorens over te gaan tot herhaald wegen dient men er zich van te vergewissen dat aan de volgende vier voorwaarden is voldaan:. de steeproeven en registers hebben betreing op dezelfde periode;. de steeproeven en registers hebben betreing op dezelfde populatie; 3. een variabele met dezelfde naam heeft op alle plaatsen dezelfde definitie; 5

6 4. verschillende classificaties van dezelfde categoriale variabele zijn genest ofwel een lasse van een bepaalde classificatie zit altijd in precies één lasse van een minder gedetailleerde classificatie. In de volgende paragraaf gaan we hier nader op in..3 Uitgebreide beschrijving.3. Inleiding In deze paragraaf zal globaal worden beschreven wele stappen er moeten worden doorlopen bij het herhaald wegen. De precieze, wisundige uitwering van deze stappen zal in de volgende paragrafen worden gedaan. Herhaald wegen wordt met name gebruit wanneer er een groot aantal tabellen moet worden geschat, en dit schatten moet numerie consistent worden uitgevoerd. Het belangrijste idee achter herhaald wegen is dat er meer dan één set gewichten per steeproefbestand an worden gebruit. Voor iedere tabel die moet worden geschat, unnen de gewichten (als dit nodig is worden aangepast om ervoor te zorgen dat schattingen van de nieuwe tabel consistent zijn met de schattingen van de tabellen die eerder zijn gemaat. Dit omt in feite neer op het herhaald toepassen van de regressieschatter (zie bijvoorbeeld Särndal et al, 99. Iedere tabel an in principe met een andere set gewichten worden geschat, zelfs wanneer verschillende tabellen op basis van dezelfde steeproef worden geschat. Voorbeeld. Beschouw ter illustratie het volgende (fictieve voorbeeld. Veronderstel dat de twee tabellen opleiding leeftijd en opleiding gezondheid moeten worden geschat. Hiertoe zijn één register en twee steeproeven beschibaar, zoals geschetst in Figuur. In het register is de variabele leeftijd (weergegeven met X in twee categorieën (jong, oud opgenomen. Er zijn volgens het register 30 jonge personen en 70 oude personen in de populatie. Steeproef bevat naast leeftijd oo opleidingsniveau (weergegeven met Z in twee categorieën (hoog, laag en steeproef bevat naast leeftijd en opleiding oo de variabele gezondheid (weergegeven met in twee categorieën (goed, slecht. De tabel opleiding leeftijd (= Z X an nu op basis van de gecombineerde steeproeven en worden geschat, en de tabel opleiding gezondheid (= Z an op basis van steeproef worden geschat. Dit levert de volgende tabellen op. Z X jong oud totaal Z goed slecht totaal hoog hoog laag laag totaal totaal

7 Figuur. Schematische weergave van de beschibare data Register Steeproef Steeproef De geschatte tabellen leveren een tweetal inconsistenties op. Allereerst omt de geschatte verdeling over de categorieën van leeftijd niet overeen met de beende verdeling in de populatie. Daarnaast leveren beide tabellen inconsistente schattingen voor het opleidingsniveau op. Met herhaald wegen worden de schattingen als volgt aangepast. Allereerst worden de gewichten van de tabel Z X aangepast, zodat de marginale tabel van leeftijd consistent is met de beende verdeling in de populatie. Hiervoor wordt de regressieschatter gebruit. Vervolgens worden de gewichten van de tabel Z aangepast, zodat de marginale tabel van opleiding consistent is met de marginaal uit Z X. Hiervoor wordt wederom de regressieschatter gebruit, waarbij de geschatte tabel van opleiding als beend populatietotaal wordt beschouwd. Dit levert de volgende tabellen op, die nu wel numerie consistent zijn. Z X jong oud totaal Z goed slecht totaal hoog hoog laag laag 9 50 totaal totaal Zoals eerder is opgemert, is herhaald wegen alleen bruibaar wanneer aan de volgende voorwaarden is voldaan. De verschillende databronnen die worden gebruit, moeten betreing hebben op dezelfde periode en populatie. Verder moet een variabele met dezelfde naam op alle plaatsen dezelfde definitie hebben. Om herhaald wegen te unnen toepassen moet een aantal stappen worden doorlopen:. Specificatie van de tabellen.. Afbaenen van databloen. 3. Bepalen van startgewichten. 4. Uitvoeren van herhaald wegen. Deze stappen zullen hier ort achtereenvolgens worden beschreven. Allereerst moeten de te schatten tabellen worden gespecificeerd. Iedere tabel wordt gearateriseerd door één of meerdere classificatievariabelen in combinatie met hetzij een telvariabele hetzij een wantitatieve variabele. De telvariabele geeft aan 7

8 dat er populatie-elementen worden geteld in de tabel. Dit an bijvoorbeeld het aantal personen of huishoudens zijn. Bij een wantitatieve variabele an men denen aan bijvoorbeeld een tabel met per cel het (geschatte inomenstotaal van alle personen in die cel. De classificatievariabelen beschrijven wele groepen men binnen de populatie beschouwt, bijvoorbeeld geslacht of leeftijd. Een classificatievariabele verdeelt de populatie in een aantal disjuncte groepen. Deze variabelen unnen op verschillende niveaus vooromen, bijvoorbeeld leeftijd per jaar en leeftijd in 5- jaarslassen. Het classificatieniveau wordt altijd aangegeven door een getal tussen haajes achter de naam van de variabele waarbij het hoogste cijfer slaat op de meest gedetailleerde classificatie, bijvoorbeeld L ( en L ( voor leeftijd in 5-jaarslassen en leeftijd per jaar. Voor herhaald wegen is het van belang dat de gebruite classificaties hiërarchisch zijn. Dit beteent dat iedere lasse op een hoger niveau an worden gevormd door hele lassen van een lager niveau samen te voegen. Op deze manier is een tabel met een variabele op een lager niveau altijd een marginale tabel van dezelfde variabele op een hoger niveau. Dergelije hiërarchische classificaties vooromen dat herhaald wegen nodeloos ingewield wordt. In stap moet eerst worden onderzocht wele bronnen (registraties en/of enquêtes er beschibaar zijn voor het schatten van de tabellen. Deze bronnen moeten vervolgens op microniveau aan elaar worden geoppeld. Hierdoor ontstaat een microdatabase die voor ieder element in de populatie een record bevat. De variabelen in de registers zijn beschibaar voor ieder element. Voor sommige elementen is er extra informatie beschibaar uit één of meerdere steeproeven. Uit deze database moeten rechthoeige, volledig gevulde databloen worden afgeleid. Ieder datablo bevat alle records die een bepaalde maximale verzameling variabelen gemeenschappelij hebben. Er is bijvoorbeeld een registerblo dat records bevat voor alle elementen in de populatie en alle variabelen uit het register. Figuur. Databloen bij Figuur Blo Registerblo Blo Register + steeproef + steeproef Blo 3 Register + steeproef 8

9 Een ander voorbeeld is een blo gebaseerd op één steeproef. Dit blo bevat records voor alle elementen die in de steeproef vooromen en alle variabelen uit zowel het register als de steeproef. Gecompliceerdere bloen die uit meer dan een steeproef bestaan zijn oo mogelij. Uit de datasets die in figuur zijn weergegeven, an in totaal een drietal relevante bloen worden afgeleid. Deze bloen zijn in figuur weergegeven. Voordat de gewenste tabellen uit de rechthoeige databloen unnen worden geschat of geteld, moet ieder blo worden voorzien van een startgewicht voor herhaald wegen. Uit het registerblo moeten alleen tellingen worden gemaat. Om dit te unnen uitvoeren, wordt aan ieder record in het registerblo een startgewicht dat gelij is aan toegeend. Voor een blo dat oo steeproefinformatie bevat, worden de startgewichten veelal gebaseerd op de publicatiegewichten uit het betreffende onderzoe. Wanneer een blo uit meerdere steeproeven bestaat, moeten de gewichten van de verschillende steeproefonderzoeen gecombineerd worden. In de volgende subparagraaf zal worden beschreven hoe dit combineren moet worden uitgevoerd. Wanneer de startgewichten zijn bepaald, unnen de tabellen in stap 4 worden geschat. Hierbij moet eerst worden vastgesteld in wele volgorde de tabellen worden geschat. De tabellen die uit het grootste datablo (met de meeste records unnen worden geschat staan in principe vooraan. De reden hiervoor is dat een groter datablo een leinere steeproeffout heeft althans wanneer alle steeproeven aselect zijn getroen. Daarna omen de tabellen die uit het op één na grootste datablo unnen worden geschat, etc. Wanneer van een bepaalde tabel de marginalen uit een groter blo unnen worden geschat, worden deze marginalen vóór de tabel zelf geschat. Per blo omen eerst de tabellen die consistent unnen worden geschat op basis van de startgewichten, daarna omen de overige tabellen in een min of meer willeeurige volgorde. Wanneer herhaald wegen wordt uitgevoerd, moet per tabel eerst worden onderzocht wele marginalen deze gemeenschappelij heeft met reeds geschatte tabellen. De (geschatte of getelde populatietotalen van deze gemeenschappelije marginalen worden gebruit als beende populatietotalen waarop de regressieschatter wordt gecalibreerd. Mer op dat de resultaten van herhaald wegen op deze manier afhanelij zijn van de volgorde waarin de tabellen worden geschat. Immers, iedere tabel moet consistent worden geschat met de eerder geschatte tabellen, en dit is duidelij afhanelij van de volgorde. Deze afhanelijheid an worden omzeild door gebrui te maen van de splitting-up procedure. Deze houdt in dat bij iedere tabel die wordt geschat oo alle marginale tabellen afzonderlij (en eerder worden geschat..3. Methodologie In deze subparagraaf geven we een wat technische beschrijving van herhaald wegen. Voor een goed begrip van deze subparagraaf is het nodig dat de lezer vertrouwd is met de basisprincipes van matrixalgebra. Bij herhaald wegen unnen twee belangrije varianten worden onderscheiden: de splitting-up procedure en het zogenaamde minimaal (herwegen. In deze subparagraaf zullen we eerst aandacht besteden aan de splitting-up procedure die bij 9

10 een eerste ennismaing in het algemeen als eenvoudiger wordt ervaren. Daarna gaan we in op de zogenaamde minimale weegmodellen. De laatste methode wordt in de pratij veel vaer gebruit omdat de splitting-up procedure bij een beperte dataset leidt tot een te groot aantal te schatten tabellen. Bij de tabellen die dan onderaan de lijst te schatten tabellen staan, zijn inmiddels zoveel randvoorwaarden dat het niet mogelij is om de tabel consistent te schatten..3.. De splitting-up procedure Bij de splitting-up procedure zijn drie stappen van belang. Eerst moet de set van doeltabellen worden gespecificeerd. Na een eventuele aanvulling moeten de tabellen in de goede volgorde worden gezet. Ten tweede dienen alle tabellen vervolgens in die volgorde te worden geschat met de gebruielije regressieschatter. Ten derde, wanneer in stap de schattingen van een bepaalde tabel strijdig zijn met die van eerder geschatte tabellen of registers, moeten de gewichten van die tabel zodanig worden aangepast dat hij in overeenstemming is met de eerder geschatte cijfers en met de cijfers van de beschibare registers. Hieronder zullen we de drie stappen wat uitgebreider beschrijven. Stap. Specificatie en ordenen van de tabellen Na een eerste specificatie van de tabellenset moet de set worden uitgebreid met de tabellen van alle splitting-up marginalen van de tabellen uit de oorspronelije tabellenset. Om uit te leggen wat een splitting-up marginaal is, beschouwen we een ( r ( r ( r3 willeeurige driedimensionale tabel T = A B C. Tussen haajes staat een getal r (=,,3 dat de mate van detaillering aangeeft van de desbetreffende categoriale variabele. Hoe groter dat getal is, des te fijner is de classificatie van deze variabele in de tabel. In het extreme geval dat r = 0 hebben we te maen met de grofst mogelije classificatie ofwel met een categoriale variabele die voor alle elementen in de populatie de waarde aanneemt. De drie splitting-up marginalen van tabel T zijn nu gedefinieerd als de volgende drie (multiple categoriale variabelen A A A ( r ( r ( r B B B ( r ( r ( r C C C ( r ( r ( r Dit zijn de meest gedetailleerde marginalen van tabel T die er zijn. Vervolgens moeten oo de splitting-up marginalen van deze marginalen worden toegevoegd, enzovoorts. Nadat alle tabellen van de splitting-up marginalen zijn toegevoegd aan de set, moeten de tabellen zo worden geordend dat de marginalen van een tabel altijd eerder worden geschat dan de tabel zelf. Mer oo op dat gegeven het feit dat deze tabel gaat over de categoriale variabelen A, B en C de tabel volledig wordt gearateriseerd door de rijvector r = r, r,. ( r3 0

11 Stap. Schatting van de tabellen met behulp van de regressieschatter Om de formules bij het schatten van de tabellen goed te unnen weergeven, moet eerst enige aandacht worden besteed aan het vectoriseren van de tabellen. Indien A een categoriale variabele is met P categorieën, is de vector a (=,,N voor element van de populatie gedefinieerd als een vector met (P- nullen en één die de correcte categorie van element aangeeft. Hetzelfde unnen we doen voor de categoriale variabelen B, C, enz. De rechthoeige frequentietabel A B in gevectoriseerde vorm waarbij de olommen van de tabel op elaar worden gestapeld, an dan worden geschreven als t N A B = b = a. Hierbij staat voor het Kronecerproduct. Voor twee willeeurige matrices M en N beteent dit symbool m M N = : m p N N mq N, mpqn waarbij p en q de dimensies van M aangeven. Voor een meerdimensionale tabel met een multiple categoriale variabele van de vorm =A B C an dit vectoriseren eenvoudig worden gegeneraliseerd. De resulterende vector duiden we ortweg aan met t. Verder definiëren we x als de vector met de waarden van de J hulpvariabelen voor element in de populatie. Definieer t x als de vector van de bijbehorende populatietotalen uit het register. Voorbeeld. Indien leeftijd met bijvoorbeeld vijf 0-jaarslassen als hulpvariabele wordt gebruit, bestaat x in feite uit vijf dummyvariabelen waarvan één de waarde aanneemt corresponderend met de leeftijdslasse van persoon. De andere dummy s rijgen de waarde 0. In dit geval zeggen we oo wel dat we wegen naar leeftijd. Voorbeeld. Indien naast leeftijd oo de variabele regio met vier categorieën als hulpvariabele wordt gebruit omen er in de vector x nog vier dummy s bij om de regio van persoon aan te geven. Nu wordt er gewogen naar leeftijd en regio ofwel ortweg L+R. Dit laatste wordt oo wel het weegschema of weegmodel genoemd. Wanneer we de vector met de dummy s voor leeftijd aanduiden met l en die voor regio met r, geldt er

12 l x. r Voorbeeld 3. Vaa wordt oo een ruisvariabele zoals bijvoorbeeld leeftijd regio gebruit als hulpvariabele. Dit geeft zoals we hierboven al hebben gezien x r l. Met S duiden we het grootste blo aan waarmee t an worden geschat. Eenvoudigheidshalve nemen we aan dat bij het schatten van de tabellen steeds dezelfde hulpvariabelen worden gebruit. De regressieschatter van een willeeurige, gevectoriseerde tabel t an dan worden geschreven als tˆ REG( S Bˆ d, x ( tˆ HT ( S S S d d ( S ( S Bˆ y d, x x x ( t Bˆ x d, x tˆ ( t S d x HT ( S x ( S S d ( S x y, x (. waarbij ˆ t Horvitz-Thompson (HT schatters zijn uit blo S, terwijl HT ( S ˆHT ( S en tx y, x en B de getransponeerde vormen zijn van respectievelij y, x en B. De ( S d staan voor de startgewichten in blo S. Voor een enelvoudige steeproef zijn deze gelij aan ( S d / S,. Hierbij staat S, voor de eerste orde insluitans die hoort bij het blo of in dit geval de steeproef S. Voor een blo dat bestaat uit de vereniging van twee steeproeven zoals bijvoorbeeld EBB 006 en EBB 007, zeg S and S, unnen we de desbetreffende schatter definiëren als HT S HT S HT S S t ˆ ( tˆ ( ( ( ( ˆ t d y, S waar het relatieve belang aangeeft van S in blo S. Dit houdt in dat d ( S / ( / / ( / als als als S en S S en S. S S (. Nu moet alleen de waarde van nog worden bepaald. Een eenvoudige manier is om evenredig te nemen aan de omvang van S. Oo an men de waarde van laten afhangen van de steeproeffout en het non-respons percentage in S in vergelijing met die van S. Voor een blo van de vorm S S S zijn de startgewichten gelij aan ( S d / S S, (

13 waarbij π staat voor de voorwaardelije ans dat element wordt geselecteerd voor S, gegeven het feit dat element reeds is geselecteerd voor S. Wanneer beide ( S steeproeven onafhanelij zijn, geldt er d = / π π. Door de uitdruing voor B ˆ d, x te substitueren in (. an de regressieschatter oo worden geschreven in termen van gewichten tˆ REG( S ( S w = = d S ( S ( S w { + x ( y S ( S d x x ( t x tˆ HT ( S x }. (.3 De aldus verregen gewichten voldoen aan de zogenaamde calibratievergelijingen S y w x = t x. Dit volgt uit S S w ( S x ( S = d { x + x x ( d = tˆ S HT ( S x + t x tˆ HT ( S x S = t x. ( S x x ( t x tˆ HT ( S x } Verder dient te worden opgemert dat wanneer de te inverteren matrices in (. en (.3 singulier blijen te zijn, de inversen moeten worden vervangen door de gegeneraliseerde inversen. Oo de zo verregen gewichten voldoen dan aan de zojuist genoemde calibratievergelijingen; zie Renssen en Martinus (00. Een alternatieve methode om singuliere matrices te vooromen is om overtollige hulpvariabelen te verwijderen. Stap 3. Herhaald wegen Indien bij het schatten van een bepaalde tabel t in stap een marginaal is geschat die al eerder is geschat met andere uitomsten, moet deze tabel worden herwogen. Een andere mogelijheid waarbij moet worden herwogen is dat één van de marginalen van de tabel al beend is uit het register maar bij het wegen in stap is daar geen reening mee gehouden of anders gezegd, de desbetreffende marginaal maate geen deel uit van de hulpvariabelen in x. Zij m de vector met de waarden voor element van alle variabelen uit de splittingup marginalen van de desbetreffende tabel. Laat HW tˆ m de vector zijn van de geschatte marginalen op basis van een eerdere tabel of een integrale telling uit het register. Wanneer een marginaal in eerdere tabellen niet vooromt en oo niet beend is uit het register, is het desbetreffende element in simpelweg gelij aan de regressieschatter uit stap. Herhaald wegen van tabel t is dan nodig wanneer de ( regressiegewichten w S uit stap niet voldoen aan de consistentie-eisen ( S HW w = S m tˆ m. De HW-schatter van tabel t is nu analoog aan de regressieschatter gedefinieerd als HW tˆ m 3

14 tˆ HW Bˆ w, m tˆ ( REG( S S w Bˆ ( S w, m m m (ˆ t HW m tˆ S REG( S m w ( S m y. (.4 Analoog aan (.3 an de HW-schatter oo weer worden geformuleerd in termen van gewichten tˆ HW ( r S w ( S ( r y { m ( S w ( S m m (ˆ t HW m tˆ REG ( S m }. (.5 ( HW De gewichten r voldoen wel aan de consistentie-eisen r m tˆ. Mer ( op dat in feite de regressieschatter weer wordt gebruit, waarbij wordt gecalibreerd op de geschatte totalen van m. Voorbeeld 3. Het voorbeeld dat we nu geven, is al eerder aan de orde geweest in subparagraaf.3.. We nemen aan dat beide steeproeven S en S in dat voorbeeld enelvoudig aselect zonder teruglegging (EAZT zijn getroen. Aan de hand van de te schatten doeltabel opleiding gezondheid ofwel Z zullen we de stappen en 3 hierboven nader toelichten. Verder nemen we nu aan dat alle tabellen standaard worden gewogen met leeftijd ofwel worden geschat met behulp van de regressieschatter waarbij leeftijd als hulpvariabele wordt gebruit of eigenlij de dummy l met l als persoon jong is en l 0 als dat niet zo is. Alvorens de doeltabel Z te schatten op basis van S moet eerst de fractie hoogopgeleiden worden geschat op basis van het blo dat bestaat uit de vereniging van beide steeproeven, hier ortweg aangeduid met S. We nemen aan dat S eveneens an worden gezien als een EAZT-steeproef. Uit de linertabel op pagina 7 blijt dat de schatting van de fractie hoogopgeleiden op basis van de desbetreffende regressieschatter gelij is aan z 0,50. Volgens de splitting-up procedure zou ˆ, reg formeel oo eerst de fractie gezonde personen moeten worden geschat op basis van S. Ter wille van de eenvoud laten we dat hier achterwege. Om de notatie eenvoudig te houden beperen we ons in dit voorbeeld oo alleen tot de linerboven cel van de doeltabel Z ofwel de fractie personen met een hoge opleiding en een goede gezondheid. Definieer de dummy a S m a 0 als persoon hoogopgeleid én gezond is anders. Voor steeproef s (s=,, geven we de omvang aan met n s en het steeproefgemiddelde met as. Het populatiegemiddelde duiden we aan met a pop. Omdat de populatie bestaat uit N=00 personen, an Na pop worden gezien als het percentage personen met een hoge opleiding en een goede gezondheid. Omdat iedere variabele slechts twee lassen heeft, neemt de regressieschatter van de fractie op basis van S overeenomstig stap in dit geval de volgende vorm aan a pop 4

15 aˆ = a + bˆ ( l., reg d, l pop l Uit het register is beend dat l pop = 0, 3. Uit de rechtertabel op pagina 6 blijt dat a = 0,3. Verder is b ˆ d, l de geschatte regressiecoëfficiënt in een regressie van a op l, inclusief de constante term, op basis van de data in steeproef ofwel ( l ˆ S l a b d, l =. ( l l S ( S Mer op dat alle startgewichten d gelij zijn. Onder de aanname dat l = 0, 8 en b ˆ d, l = 0,5 is a ˆ, reg gelij aan 0,33. Substitutie van de laatste uitdruing voor b ˆ d, l in de regressieschatter levert op dat de regressieschatter an worden geschreven als een gewogen gemiddelde aˆ, reg w = = / n S + ( l w a pop l ( l l / Σ S ( l Mer op dat deze w oo van toepassing zijn op de andere cellen van de doeltabel Z. Stel nu dat de data in S zodanig zijn dat w = 0,5. Om dan l. S consistentie te bereien met de eerder geschatte fractie hoogopgeleiden z 0,50 moet overeenomstig stap 3 de geschatte tabel Z worden herwogen ˆ, reg = met opleiding. In dit voorbeeld wordt de HW-schatter van a pop dan gedefinieerd als z aˆ bˆ, HW w, z = = aˆ, reg S S + bˆ w, z w ( z w ( z (0,50 zˆ zˆ zˆ, reg, reg a, reg. Stap leverde op dat a 0,33. Onder de aanname dat b ˆ, = en z 0, 5 is ˆ, reg = w z ˆ, reg = a ˆ,HW dan gelij aan 0,3. Net als de regressieschatter hierboven an de HWschatter worden geschreven als een gewogen gemiddelde aˆ r, HW = = w { + (0,50 zˆ s r a, reg ( z zˆ, reg / Σ S w ( z zˆ, reg }. Het is niet moeilij na te gaan dat de zo verregen gewichten S r z = 0,50 precies zoals de bedoeling was. r voldoen aan 5

16 .3.. Minimale weegmodellen Het voordeel van de hierboven besproen splitting-up procedure is dat de volgorde waarin de tabellen worden geschat min of meer vastligt. Dat wil zeggen, eerst moeten de (grofste marginalen van een tabel worden geschat, maar wele van twee zule marginalen van een tabel het eerst moet worden geschat doet er niet toe. Een alternatieve aanpa is om uit te gaan van een bepaalde vaste volgorde. De set van tabellen hoeft dan in principe oo niet meer te worden aangevuld. Wel is het verstandig om tabellen die op basis van de grote bloen unnen worden geschat bovenaan te zetten. Dit verhoogt de nauweurigheid van de schattingsresultaten. Aan de hand van een voorbeeld zullen we nu uitleggen wat wordt bedoeld met minimaal wegen. Laten leeftijd (L, geslacht (G en beroepsniveau (B beend zijn uit het register. Laat het aantal gewerte uren (W worden waargenomen in steeproef ofwel blo ( B. Laat opleiding ( O zijn waargenomen in steeproef ofwel blo B. Verder nemen we aan dat het gebruite weegmodel bij de regressieschatter voor alle tabellen gelij is aan X = L G. In Tabel staat een overzicht van vijf tabellen die achtereenvolgens moeten worden geschat. Oo is aangegeven wele tabellen opnieuw (herhaald moeten worden gewogen en wat hun herweegschema (-model is. Dit herhaald wegen gebeurt weer precies zoals is beschreven in de vorige subparagraaf. Het zal duidelij zijn dat tabellen over gewerte uren opleiding alleen unnen worden geschat op basis van de overlap van de steeproeven en ofwel blo B 3. Tabel. Doeltabellen met hun herweegschema s tabellen blo minimaal herweegschema M{T } T =L W B nvt T =L G O ( B nvt T 3 =B O ( B B+O ( T 4 =W O ( B 3 W+O ( T 5 =L W O ( B 3 L W + L O ( + W O ( In principe zijn alle doeltabellen van de vorm T ( r ( r ( r ( r ( r = L G B W O = T ( r (=,,5. Zoals al eerder is opgemert wordt iedere tabel volledig gearateriseerd door de bijbehorende classificatievector r. Voor een willeeurige tabel T (=,,5 uit de geordende tabellenset is het minimale herweegschema gelij aan M. { T } = T0 + T T, Hierbij is T h (h=0,,- gedefinieerd als 6

17 T h = T[min( r, r ] [min( r, r ] h j h = min( r j, r hj ( j =,...,5. Verder staat T 0 voor het register dat in deze context moet worden gezien als een grote tabel. De eerste twee tabellen hoeven niet te worden herwogen want ze zijn al consistent met het register omdat beide tabellen reeds zijn gewogen met leeftijd maal geslacht. Anders gezegd, uit de categoriale variabele leeftijd geslacht zijn de hulpvariabelen voor de gebruite regressieschatter afgeleid. Oo wordt het aantal gewerte uren niet waargenomen buiten blo en opleiding niet buiten blo. Verder is bij T 5 in het herweegschema T 50 =L weggelaten omdat L al is opgenomen ( 53 O in het herweegschema via L W. Hetzelfde geldt voor T =. Mer oo op dat wanneer B 3 de enige steeproef was, herhaald wegen niet nodig zou zijn geweest behalve voor T 3. Immers wanneer alle tabellen worden geschat op basis van B 3 met behulp van de regressieschatter met de hulpvariabelen uit het weegmodel X = L G, zijn de vijf aldus geschatte tabellen reeds onderling consistent. Qua leeftijd en geslacht zijn ze oo consistent met het register. Alleen T 3 moet worden herwogen omdat B niet in het overall weegmodel zit. Soms is het aan te bevelen om de gegeven set van te schatten tabellen toch nog uit te breiden met andere tabellen. Dit doet zich voor wanneer een marginaal, zeg T m, van de ruistabel T an worden geschat op basis van een groter blo dan T. In dat geval is het verstandig T m toe te voegen aan de tabellenset zodanig dat hij voor T wordt geschat. Hetzelfde geldt wanneer T niet consistent an worden geschat met de gewone regressieschatter terwijl een bepaalde marginaal van die tabel op basis van hetzelfde blo wel consistent an worden geschat. Oo in die situatie dient een dergelije marginaal aan de set te worden toegevoegd wanneer dat nog niet is gebeurd en te worden geschat voor T. Als bezwaar tegen minimaal (herwegen wordt wel naar voren gebracht dat de uitomsten van herhaald wegen op deze manier van de volgorde van de doeltabellen afhangen. Op zich is deze opmering correct. Zolang de verschillen tussen de verschillende uitomsten blijven binnen de onzeerheidsmarges van de oorspronelije schattingen is er weinig aan de hand. Een andere steeproef had oo tot andere uitomsten geleid. Dergelije statistische verschillen zijn inherent aan het schattingsproces Tabellen met wantitatieve variabelen In de vorige paragrafen hebben we het steeds gehad over het herwegen van frequentietabellen. Enigszins formeel unnen frequentietabellen worden geschreven als =[F]. Hierbij staat F voor een (multiple categoriale variabele van de vorm A B, terwijl de aangeeft dat het gaat om het tellen van de populatieeenheden die horen bij de desbetreffende cellen van tabel. Soms wordt de oo wel weggelaten en schrijven we ortweg =F. In deze subparagraaf zullen we in het ort ingaan op het herwegen van een tabel met de wantitatieve inomensvariabele, 7

18 zeg Z w. Een dergelije tabel duiden we aan met =[F] Z w. Met andere woorden, in een cel van een dergelije tabel staat het (geschatte inomenstotaal van alle populatie-eenheden in die cel. Een belangrij begrip bij het herwegen van tabellen met de wantitatieve inomensvariabele is de zogenaamde gewantiseerde versie van een frequentietabel. Dit is vooral van belang wanneer er doeltabellen zijn met categoriale variabelen met ( (max inomenslassen, zeg Z cat,..., Z cat. Aan de hand van een voorbeeld leggen we uit wat we verstaan onder de gewantiseerde versie van een frequentietabel. Beij de ( ( volgende (fictieve frequentietabel van inomen leeftijd ofwel Z cat L Tabel. Frequentietabel van inomen leeftijd (in mln jong oud laag inomen 5,5 hoog inomen,5 Stel nu dat het gemiddelde inomen in de groep met lage inomens grofweg is geschat op Euro en voor de groep met hoge inomens op Euro. Het totale inomen van de jongeren en de ouderen an dan worden geschat op basis van de cijfers in Tabel. De aldus geschatte inomenstotalen voor jong en oud staan in Tabel 3. Tabel 3. Gewantiseerde versie van ( ( Z cat L (in mld Euro s jong oud inomen Dit wordt de gewantiseerde versie van Tabel genoemd en wordt oo wel ( ( aangeduid met K( Z cat L. Het voordeel van de gewantiseerde Tabel 3 ten opzichte van de oorspronelije frequentietabel is dat het aantal weegvariabelen op deze manier an worden gereduceerd van 4 tot. Dit is vooral van belang wanneer er niet voldoende waarnemingen zijn bij veel multidimensionale tabellen. Bij meer dan twee inomenslassen wordt oo wel simpelweg het lassemidden gebruit als schatting voor het gemiddelde inomen in de desbetreffende inomenslasse. Het gaat er om dat er een representatieve waarde wordt geozen. In het vervolg noteren we het weegschema van een doeltabel in deze subparagraaf als W{}. Het minimale weegmodel uit de vorige subparagraaf geven we aan met M{.}. In feite an een tabel van de vorm =[F] Z w oo weer worden gearateriseerd door een vector r waarvan het laatste element de waarde aanneemt als de inomensvariabele Z w in de tabel vooromt en 0 als dat niet zo is. Mer op dat wanneer het inomenstotaal an worden geschat op basis van een groter blo, de tabel [] Z w aan de tabellenset moet worden toegevoegd en moet worden geschat voor ; zie vorige subparagraaf. Hierbij is [] Z w gebruit als een als een wat formele aanduiding voor de nuldimensionale tabel totaal inomen. 8

19 Hieronder geven we enele resultaten met betreing tot het herwegen van wantitatieve tabellen:. Indien er geen categoriale inomensvariabelen in de doeltabellen vooromen, is het weegschema voor =[F] Z w gelij aan W{} = M{} + F. De uitbreiding van het weegmodel met F heeft het voordeel dat men later oo consistent het gemiddelde inomen an bepalen waarbij men deelt door het bijbehorende aantal personen per categorie.. Indien er van de wantitatieve inomensvariabele Z w oo categoriale versies ( (max Z cat,..., Z cat vooromen in de set te schatten doeltabellen, wordt de zaa wat ( ingewielder. Het herweegschema van de frequentietabel =F (=,,max is bijvoorbeeld gelij aan ( cat W{}=M{}+M{K(F Z }. ( cat Nadat de frequentietabel F Z is geschat met herhaald wegen, moet met dezelfde gewichten oo de gewantiseerde versie K(F Z (l cat ( cat Z cat worden bereend, alsmede alle lagere gewantiseerde versies K(F Z met l = De aldus verregen gewantiseerde versies zijn allemaal onderling consistent. 3. Opnieuw veronderstellen we dat er van de wantitatieve inomensvariabele Z w ( (max categoriale versies Z cat,..., Z cat bestaan. Bij herweging van de tabel =[F] Z w is het herweegschema gelij aan (max cat W{}= F +M{} + K(M{F Z }. Met andere woorden, als het minimale weegmodel van ( cat ( cat (max F Z cat gelij is aan A Z + B Z dan moet nog de volgende component aan het weegschema moet worden toegevoegd K(A Z ( cat ( cat + K(B Z. Voorbeeld. Stel dat de volgende doeltabellen moeten worden geschat ( T = [ L Zcat ] = [ leeftijd inomen ] T = [ L R] Z = [ leeftijd regio] inomen. w De tabel L R is beend uit het register ( T 0. Bovendien is gegeven dat het totale inomen 300 mld bedraagt. Nadat T is geschat eventueel met behulp van herwegen, ( moet oo de gewantiseerde versie K(L Z cat hiervan worden geschat met dezelfde gewichten als T. Dan is tabel T aan de beurt. Volgens punt 3 hierboven bestaat het weegschema van T uit drie componenten. De eerste component bestaat uit de bijbehorende frequentietabel L R. De tweede component bestaat uit het minimale ( 9

20 weegschema van T zoals hierboven besproen. Dit geeft als resultaat het reeds beende inomenstotaal ofwel [ ] Zw (NB: L en L R zitten reeds in de eerste component. Ten slotte is de derde component gelij aan de gewantiseerde versie ( van het minimale weegmodel van L R. Het minimale weegmodel van de laatste tabel levert als extra bijdrage alleen nog op L Z cat. De gewantiseerde versie van de laatste tabel wordt gegeven door Tabel 3 aan het begin van deze subparagraaf en is bereend nadat T was geschat. Tabel T moet derhalve herwogen of gealibreerd worden op leeftijd regio uit het register, het inomenstotaal van 300 mld en op Tabel 3. Voor meer details zie Renssen et al. (00 en Houbiers en Renssen (00. Schatten van dergelije tabellen met herhaald wegen is op grote schaal uitgevoerd voor het Loonstructuuronderzoe 00, zie Gouweleeuw (005. Z cat (.3.3 Slotopmeringen Tot nu toe is gesproen over tabellen waarvan de cijfers geen onderlinge verschillen mogen laten zien als het over dezelfde variabele gaat. Een andere vorm van consistentie heeft te maen met het bestaan van zogeheten editregels. Bijvoorbeeld het aantal personen met een rijbewijs an niet meer zijn dan het aantal personen boven de 8 jaar. Naast deze if-then relaties (op microniveau an het oo nog vooromen dat wantitatieve variabelen aan een bepaalde relatie moeten voldoen zoals winst is gelij aan omzet minus osten. Een dergelije relatie is van toepassing op ieder bedrijf afzonderlij maar moet oo gelden voor de geschatte aggregaten. Daas en Renssen (00 en Van de Laar (004 besteden uitgebreid aandacht aan het schatten van tabellen met dit soort editregels. Wanneer er onderlinge relaties tussen de (geschatte variabelen bestaan, unnen oo macro-integratietechnieen worden gebruit. Voor een uitgebreide beschrijving van deze aanpa en de relatie met Kalmanvergelijingen zie Knottnerus (003, Hfdst en Sefton en Weale (995. Boonstra (004b wert een en ander verder uit voor het calibreren van tabelschattingen. In dit document wordt niet ingegaan op de variantie van de HW-schatter. In principe an onder bepaalde voorwaarden de variantie van de HW-schatter worden geschat. Er bestaat een nauwe relatie tussen de variantie van de HW-schatter en die van de regressieschatter. Uit herhaald toepassen van (.4 volgt oo dat de HW-schatter altijd is te schrijven als een lineaire combinatie van regressieschatters. Hierbij is wel aangenomen dat er voldoende waarnemingen (n>> zijn voor iedere cel van de tabel zodat de stochastie in de geschatte regressiecoëfficiënten an worden verwaarloosd. Wanneer dit niet het geval is, neemt de variantie van de HW-schatter toe net als bij de regressieschatter. Dit verschijnsel doet zich vooral voor wanneer de tabellen te gedetailleerd worden met teveel categoriale variabelen in verhouding tot de omvang van de bloen (steeproeven. Voor een uitgebreide beschrijving van het schatten van de variantie van de HW-schatter zie Boonstra et al. (003 en Knottnerus en van Duin (006. Voor verschillende simulatiestudies naar de 0

21 performance van de HW-schatter zie Boonstra (004a en Van Duin en Snijders ( Toepassen van herhaald wegen bij de Volstelling 00 Herhaald wegen is toegepast in de Virtuele volstelling van 00 (VT00. Deze volstelling omvatte 40 tabellen die numerie consistent aan Eurostat moesten worden geleverd. Het CBS heeft deze tabellen volledig gevuld op basis van register en enquêtedata die reeds beschibaar was. Dit maate de VT relatief goedoop. Daarnaast was de doorlooptijd relatief ort: hoewel Nederland pas laat is gestart, heeft het toch als een van de eerste landen de tabellen aan Eurostat unnen leveren. Doordat er gebrui is gemaat van herhaald wegen, zijn de tabellen bovendien numerie consistent geschat. Er is een softwarepaet ontwield (VRD = Vullen Reference Database om het herhaald wegen te automatiseren. In deze subparagraaf zal nader worden ingegaan op de verschillende stappen (zoals beschreven in paragraaf.3. die zijn doorlopen bij het uitvoeren van herhaald wegen voor de VT Tabellen, variabelen en databloen Allereerst moeten de te schatten tabellen worden gespecificeerd. In het geval van de volstelling was deze set door Eurostat voorgeschreven. De telvariabele was hier in alle gevallen het aantal personen of het aantal huishoudens. Wanneer de variabelen volledig gespecificeerd zijn, moet er worden onderzocht uit wele databron (register of enquête deze unnen worden afgeleid. Mer op dat verschillende niveaus van één variabele niet noodzaelij uit dezelfde databron hoeven worden afgeleid. De databronnen die bij de VT zijn gebruit zijn: de gemeentelije basisadministratie (GBA, register voor demografische variabelen zoals geslacht, leeftijd, geboorteland, nationaliteit; het Sociaal Statistisch bestand (SSB, register om vast te stellen of iemand al dan niet werzaam is; de Enquête Wergelegenheid en Lonen (EWL, steeproef voor de arbeidsduur; de Enquête Beroepsbevoling (EBB, steeproef voor de variabelen opleiding, beroep en economische status. Wanneer al deze databronnen aan elaar zijn geoppeld, unnen de rechthoeige databloen worden afgeleid. Deze zijn in Figuur 3 weergegeven. Het eerste blo is het registerblo. De variabelen in dit blo (zoals geslacht en leeftijd op alle niveaus zijn voor alle personen in de populatie beend. Het tweede blo is het SBI-blo. Dit bestaat uit de variabelen in het registerblo, aangevuld met de variabele SBI. (Het betreft dan de SBI van de hoofdbaan van de betreffende persoon. Het blo bevat records voor bijna alle personen in de populatie (met uitzondering van degenen van wie de SBI niet beend is. Dit blo wordt gebruit voor de schatting van de tabellen waarin de variabele SBI uitsluitend wordt gecombineerd met registervariabelen. Het Dit betreft overigens niet de tabellen die over wonen handelen. Deze zijn in een apart project geschat.

22 volgend blo is het EWL-blo. Dit blo bevat alleen records voor personen die in de EWL (een grote steeproef vooromen en bestaat uit de variabelen van het registerblo aangevuld met de variabele arbeidsduur. Het vierde blo is het EWL- SBI-blo. Dit bevat records voor alle personen die in het SBI-blo en het EWL-blo vooromen (de doorsnede van beide bloen. Dit blo is nodig om de tabel te schatten waarin de variabele SBI wordt geruist met arbeidsduur. Het vijfde blo is het EcActblo. Voor personen die tot de wernemers, wergevers en gepensioneerden behoren omt dit overeen met het register, voor de overige zijn alleen personen die in de EBB vooromen opgenomen. Dit blo an worden gebruit om de vele tabellen waarin register variabelen worden geruist met al dan niet economisch actief zijn (d.w.z. werend of werloos zo nauweurig mogelij te schatten. Het laatste blo is het EBB-blo. Dit bevat records voor alle personen die in de EBB vooromen, en wordt gebruit voor tabellen waarin opleiding, beroep of economische status wordt geruist met registervariabelen. Figuur 3. Schema databloen VT00; objecttype personen, 5-74 jaar Register-blo SBI- EWL- EWL-SBI- EcAct- EBBblo blo blo blo blo Wernemers EWL EWL EBB Wergevers EBB Gepensioneerd Arbeids- SBI of Ar- SBI duur beidsduur Overig niet van niet van niet van (niet werend, toepas- toepas- toepasniet gepensioneerd sing sing sing EBB EBB.4. Startgewichten Wanneer de databloen zijn gedefinieerd en afgeleid, moeten er voor ieder datablo startgewichten voor het herhaald wegen worden bepaald. Allereerst worden er per datablo initiële blogewichten bepaald, en uit deze worden vervolgens de definitieve blogewichten, of startgewichten bepaald. Voor het registerblo is dit eenvoudig. Dit blo bevat records voor alle personen uit de populatie. Iedere persoon rijgt hierin dus een startgewicht gelij aan.

23 De overige bloen zijn opgebouwd uit registers in combinatie met één of meer steeproeven. Iedere steeproef is op zichzelf al voorzien van een (of meer sets gewichten. De startgewichten voor herhaald wegen unnen nu per blo in drie stappen worden bepaald:. Het bepalen van de gewichten per steeproef (binnen een blo. Het combineren van de gewichtensets uit stap tot blogewichten. (Wanneer een blo slechts één enquête omvat, an stap achterwege blijven. 3. Het herwegen van de gewichten uit stap naar beende populatietotalen. Binnen stap is het meest eenvoudige om voor ieder steeproefonderzoe de anten-lare publicatiegewichten van het betreffende onderzoe te nemen. Deze gewichten zijn meteen beschibaar. Bovendien zijn zij gebaseerd op uitgebreide analyses en veel inhoudelije ennis van zaen. Stap is van belang voor het EcAct-blo en het EBB-blo. Deze bloen bestaan namelij uit twee steeproeven (namelij twee jaargangen van de EBB. Laat ( w voor het eerste onderzoe zijn, en evenzo, laat stap voor het tweede onderzoe zijn., =,,n de gewichten uit stap ( w, =,,n de gewichten uit De gewichten die in stap zijn bepaald, tellen ongeveer op tot het populatietotaal. Wanneer het blo uit twee steeproeven bestaat, zullen alle gewichten bij elaar optellen tot twee maal de populatieomvang. Het is natuurlij mogelij om de gewichten uit het blo te vermenigvuldigen met /, om op deze manier gewichten te rijgen die tot de juiste populatieomvang optellen. Het is echter beter om de gewichten te vermenigvuldigen met een factor die reening houdt met de relatieve omvang van de steeproeven. Dit zorgt ervoor dat de gewichten in het uiteindelije steeproefblo van vergelijbare grootte zijn. De gewichten na stap worden dan vermenigvuldigd met: N n n ( n + n w =, resp. N n n ( n + n w =. Ten slotte an het handig zijn om de blogewichten te herwegen naar een aantal populatietotalen. Dit an ervoor zorgen dat, wanneer er veel tabellen moeten worden geschat, er een aantal met de startgewichten consistent wordt geschat. Hoe dit moet worden geozen hangt van het onderzoe en de te schatten tabellen af..4.3 Het schatten van de tabellen Wanneer de tabellen en variabelen gedefinieerd zijn, de steeproefbloen bepaald en afgebaend en voorzien van startgewichten an het schatten van de tabellen beginnen. Zoals al gezegd an dit worden uitgevoerd met behulp van het softwarepaet VRD. Allereerst moet er worden besloten of er wordt geozen voor de minimale weegprocedure of voor de splitting-up procedure. Dit is afhanelij van het onderzoe. Als het aantal tabellen dat moet worden geschat erg groot wordt, zal de splitting-up procedure tot nog meer tabellen leiden, en dat an op een bepaald moment tot schattingsproblemen leiden. Splitting up is dan niet aan te raden, zeer 3

24 niet als van tevoren exact vaststaat wele tabellen er moeten worden geschat. Dit was bijvoorbeeld bij de volstelling het geval. Vervolgens moet de volgorde worden geozen waarin de tabellen worden geschat. Uiteraard worden eerst de tabellen bepaald, die volledig uit het registerblo unnen worden afgeleid. Daarna verdient het de aanbeveling om te beginnen met de tabellen die uit het grootste blo unnen worden geschat, daarna de tabellen uit het op één na grootste blo, enzovoorts. Per blo moeten de tabellen die met behulp van de startgewichten consistent unnen worden geschat het eerst worden geschat..4.4 Pratijproblemen en mogelije oplossingen In de pratij an men bij het toepassen van herhaald wegen tegen een aantal problemen aanlopen. Allereerst is daar het probleem van steeproefnullen. Dit beteent dat een bepaalde categorie in de populatie wel vooromt, terwijl deze in de steeproef ontbreet. Een tabel die last heeft van steeproefnullen an onmogelij consistent worden geschat. Alle problemen die te maen hebben met steeproefnullen unnen echter voordat er wordt geschat al worden geïdentificeerd. Voor iedere tabel an worden nagegaan of alle categorieën die in de populatie vooromen oo in de steeproef zijn vertegenwoordigd. Als dit niet het geval is, zullen er cellen moeten worden samengevoegd. Dit an beteenen dat er voor bepaalde variabelen een extra niveau moet worden aangemaat. Daarom is het handig om dit van tevoren te doen. Een andere mogelije oplossing is om een dergelije tabel niet in volledig detail, maar alleen marginalen te schatten. In het algemeen an worden gezegd dat eigenschappen die zeldzaam zijn in de populatie dit oo zullen zijn in de steeproef en dus gemaelij unnen leiden tot steeproefnullen. Den hierbij bijvoorbeeld aan werzame personen ouder dan 60 jaar (uitgesplitst naar leeftijd en nationaliteit. Een tweede probleem dat an vooromen, wordt veroorzaat door editregels tussen verschillende variabelen. Het proces van herhaald wegen houdt hier niet automatisch reening mee. Dit an tot inconsistenties tussen verschillende tabellen leiden, hetgeen niet wenselij is. Den bijvoorbeeld aan de variabele economische status (die aangeeft of een persoon werzaam, werloos, gepensioneerd of iets anders is en de variabele beroep. Alleen een werzame persoon heeft een beroep, maar hier wordt niet automatisch reening mee gehouden. Dit an worden opgelost door tabellen naar beroep te ruisen met economische status. Een betere oplossing is in dit geval om een extra niveau in de variabele beroep op te nemen, waarin wordt uitgesplitst naar werzaam en niet werzaam..5 Kwaliteitsindicatoren Kwaliteitsindicatoren voor wat betreft de HW-schatter van een bepaalde tabel zijn: - de omvang van de non-respons; - de onzeerheidsmarges van de HW-schatters van de totalen in de tabel; - de celvulling ofwel het aantal waarnemingen per cel; 4

Differentiequotiënten en Getallenrijen

Differentiequotiënten en Getallenrijen Lesbrief 4 Binomiaalcoëfficiënten, Differentiequotiënten en Getallenrijen Binomiaalcoëfficiënten Het is beend dat (a + b 2 = a 2 + 2ab + b 2 en dat (a + b 3 = a 3 + 3a 2 b + 3ab 2 + b 3. In het algemeen

Nadere informatie

Arbeidsparticipatie icipatie Almere 2006

Arbeidsparticipatie icipatie Almere 2006 0i08 08 Arbeidsparticipatie icipatie Almere 2006 Maaike Hersevoort en Nicol Sluiter Centrum voor Beleidsstatistiek (maatwerk) Den Haag/Heerlen, 2009 Verklaring van tekens. = gegevens ontbreken * = voorlopig

Nadere informatie

werkwillendheid eid van ouderen (50-64 jaar) in 2007

werkwillendheid eid van ouderen (50-64 jaar) in 2007 08 Arbeidsparticipatie 0i icipatie en werkwillendheid eid van ouderen (50-64 jaar) in 2007 Maaike Hersevoort, Marleen Geerdinck en Lian Kösters Centrum voor Beleidsstatistiek (maatwerk) Den Haag/Heerlen

Nadere informatie

Voorpublicatie Diversiteit in cijfers 2005

Voorpublicatie Diversiteit in cijfers 2005 08 07 Voorpublicatie Diversiteit in cijfers 2005 Karin Hagoort, Kathleen Geertjes en Osman Baydar Centrum voor Beleidsstatistiek (maatwerk) Voorburg/Heerlen, 2008 Verklaring van tekens. = gegevens ontbreken

Nadere informatie

Uitstroom uit de WW binnen twee jaar na instroom

Uitstroom uit de WW binnen twee jaar na instroom 08 Uitstroom uit de WW binnen twee jaar na instroom 08 Henk van Maanen, Mathilda Copinga-Roest en Marleen Geerdinck Centrum voor Beleidsstatistiek (maatwerk) Den Haag/Heerlen 2009 Verklaring van tekens.

Nadere informatie

Verhuizingen 0n n van personen tussen Twentse gemeenten, 2007

Verhuizingen 0n n van personen tussen Twentse gemeenten, 2007 08 Verhuizingen 0n n van personen tussen Twentse gemeenten, 2007 Harold Kroeze en Ivo Gorissen Centrum voor Beleidsstatistiek Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig

Nadere informatie

Jongeren met een tijdelijk contract in 2009 en 2010

Jongeren met een tijdelijk contract in 2009 en 2010 Jongeren met een tijdelijk contract in 2009 en 2010 11 Martine de Mooij Vinodh Lalta Sita Tan Centraal Bureau voor de Statistiek Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer ** = nader

Nadere informatie

Voortijdig schoolverlaten 0c het voortgezet et onderwijs in

Voortijdig schoolverlaten 0c het voortgezet et onderwijs in e088 Voortijdig schoolverlaten 0c olverlaten vanuit het voortgezet et onderwijs in Nederland en 21 gemeenten naar herkomstgroepering en geslacht Antilianen- Toelichting bij geleverde everde maatwerktabellen

Nadere informatie

Prijsindexcijfers 0f Reclamediensten

Prijsindexcijfers 0f Reclamediensten 07 Prijsindexcijfers 0f Reclamediensten Michel van Veen Publicatiedatum CBS-website: 20 november 2008 Den Haag/Heerlen, 2008 Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim

Nadere informatie

Introductie Coach-modelleren

Introductie Coach-modelleren Inhoud Introductie Coach-modelleren... Coach-modelleren versus Excel...4 Opgave: Kennismaing met Coach-Modelleren...4 Satellietbanen in COACH-Modelleren...5 Opgave: GPS-satelliet...5 Alleen voor de geïnteresseerden...7

Nadere informatie

1999 2004 van de COROP-gebieden Achterhoek en Arnhem/Nijmegen

1999 2004 van de COROP-gebieden Achterhoek en Arnhem/Nijmegen 08 Regionaal consistente 0o stente tijdreeksen 1999 2004 van de COROP-gebieden Achterhoek en Arnhem/Nijmegen Publicatiedatum CBS-website: 3 februari 2009 Den Haag/Heerlen, 2009 Verklaring van tekens. =

Nadere informatie

Uitwerkingen Tentamen Wat is Wiskunde (WISB101) Donderdag 10 november 2016, 9:00-12:00

Uitwerkingen Tentamen Wat is Wiskunde (WISB101) Donderdag 10 november 2016, 9:00-12:00 Uitweringen Tentamen Wat is Wisunde (WISB101) Donderdag 10 november 2016, 9:00-12:00 Docenten: Barbara van den Berg & Carel Faber & Arjen Baarsma & Ralph Klaasse & Vitor Blåsjö & Guido Terra-Bleeer Opgave

Nadere informatie

Voortijdig schoolverlaters 0c van misdrijf in Nederland, naar woongemeente ente (G4) en schoolsoort

Voortijdig schoolverlaters 0c van misdrijf in Nederland, naar woongemeente ente (G4) en schoolsoort 08 Voortijdig schoolverlaters 0c olverlaters verdacht van misdrijf in Nederland, naar woongemeente ente (G4) en schoolsoort Toelichting bij geleverde everde maatwerktabellen De maatwerktabel bevat gegevens

Nadere informatie

Bijdrage aan en impact op de inflatie

Bijdrage aan en impact op de inflatie Paper Bijdrage aan en impact op de inflatie Jan Walschots Februari 2016 CBS 2014 Scientific Paper 1 Inhoud 1. Inleiding 3 2. De CBS methode om bijdragen te berekenen 3 3. De Eurostat methode om impacts

Nadere informatie

Breuk in de tijdreeks internationale ale handel in diensten0t

Breuk in de tijdreeks internationale ale handel in diensten0t 07 Breuk in de tijdreeks internationale ale handel in diensten0t Publicatiedatum CBS-website: 24 november 2008 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim

Nadere informatie

Verschillen in cijfers over huisartscontacten. en de statistiek tiek Geregistreerde contacten met de huisarts

Verschillen in cijfers over huisartscontacten. en de statistiek tiek Geregistreerde contacten met de huisarts m0 Verschillen in cijfers over huisartscontacten tussen 0u sen POLS-Gezondheid en de statistiek tiek Geregistreerde contacten met de huisarts Publicatiedatum CBS-website: november 2009 Den Haag/Heerlen

Nadere informatie

Tijdreeks CAO-lonen

Tijdreeks CAO-lonen Tijdreeks CAO-lonen 1972 2014 B.J.H. Lodder R.H.M. van der Stegen 18-08-2014 gepubliceerd op cbs.nl CBS Tijdreeks CAO-lonen 1972-2014 1 Inhoud 1. Inleiding 3 2. Databronnen 3 3. Methode van onderzoek 4

Nadere informatie

Pensioenfondsen ndsen en hun deelnemers,

Pensioenfondsen ndsen en hun deelnemers, Pensioenfondsen ndsen en hun deelnemers, 17 Eddy van de Pol Publicatiedatum CBS-website: 1 april 9 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim = nihil =

Nadere informatie

binnen Rotterdam

binnen Rotterdam 07 Inkomens en 0n verhuizingen binnen Rotterdam 1999 2005 Karin Hagoort en Nicol Sluiter Centrum voor Beleidsstatistiek (paper 08012) Den Haag/Heerlen, 2008 Verklaring van tekens. = gegevens ontbreken

Nadere informatie

Verwachtingswaarde en spreiding

Verwachtingswaarde en spreiding Les 13 Verwachtingswaarde en spreiding 13.1 Stochasten In een paar voorbeelden hebben we al gezien dat we bij een experiment vaa niet zo zeer in een enele uitomst geïneteresseerd zijn, maar bijvoorbeeld

Nadere informatie

Locatie van banen, opleiding van niet werkend werkzoekenden, in- en uitstroom van uitkeringen

Locatie van banen, opleiding van niet werkend werkzoekenden, in- en uitstroom van uitkeringen Locatie van banen, opleiding van niet werkend werkzoekenden, in- en uitstroom van uitkeringen Gemeente Enschede 2002-2006 Centrum voor Beleidsstatistiek Frank van der Linden, Mariëtte Goedhuys-van der

Nadere informatie

-- III De variatiemethode berust voor de grondtoestand op het volgende theorema:

-- III De variatiemethode berust voor de grondtoestand op het volgende theorema: -- III - 1 - HOOFDSTUK III VARIATIEREKENING Alleen voor enele zeer eenvoudige systemen an de Schrödinger Vergeliing exact worden opgelost, in alle andere gevallen moeten benaderingen worden toegepast.

Nadere informatie

Prijsindexcijfers Zee- en kustvaart

Prijsindexcijfers Zee- en kustvaart 0f07 07 Prijsindexcijfers Zee- en kustvaart Marc Woudstra en Nicol Sluiter Publicatiedatum CBS-website: 15 april 2008 Voorburg/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x

Nadere informatie

Ziekteverzuim naar leeftijd en geslacht, 2002 2005

Ziekteverzuim naar leeftijd en geslacht, 2002 2005 0i07 07 Ziekteverzuim naar leeftijd en geslacht, 2002 2005 Frank van der Linden en Anouk de Rijk Centrum voor Beleidsstatistiek (maatwerk) Voorburg/Heerlen, 2008 Verklaring van tekens. = gegevens ontbreken

Nadere informatie

102 < 11. Je kunt ook snel na 102 < 10, 5 ( = 110, 25).

102 < 11. Je kunt ook snel na 102 < 10, 5 ( = 110, 25). DE FORMULE VAN MACLAURIN. Inleiding: de wortel uit 0. Als je nou eens geen reenmachine had, hoe bereen je dan de wortel uit 0? Met proberen om je een heel eind. 0 > 0 omdat 0 > 0 en 0 < omdat reenen dat

Nadere informatie

Verwachtingswaarde en spreiding

Verwachtingswaarde en spreiding Les 3 Verwachtingswaarde en spreiding 3.1 Stochasten In een paar voorbeelden hebben we al gezien dat we bij een experiment vaa niet zo zeer in een enele uitomst geïneteresseerd zijn, maar bijvoorbeeld

Nadere informatie

NATUURLIJKE, GEHELE EN RATIONALE GETALLEN

NATUURLIJKE, GEHELE EN RATIONALE GETALLEN II NATUURLIJKE, GEHELE EN RATIONALE GETALLEN Iedereen ent getallen: de natuurlije getallen, N = {0,1,2,3,...}, gebruien we om te tellen, om getallen van elaar af te unnen treen hebben we de gehele getallen,

Nadere informatie

Examen G0U13 - Bewijzen en Redeneren,

Examen G0U13 - Bewijzen en Redeneren, Examen G0U13 - Bewijzen en Redeneren, 2010-2011 bachelor in de Wisunde, bachelor in de Fysica, bachelor in de Economische Wetenschappen en bachelor in de Wijsbegeerte Vrijdag 4 februari 2011, 8u30 Naam:

Nadere informatie

De Conjunctuurklok; 0t patronen in de Nederlandse e conjunctuur

De Conjunctuurklok; 0t patronen in de Nederlandse e conjunctuur 08 De Conjunctuurklok; 0t patronen in de Nederlandse e conjunctuur Floris van Ruth Publicatiedatum CBS-website: 4 december 2009 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig

Nadere informatie

Telproblemen. K. P. Hart

Telproblemen. K. P. Hart Telproblemen K. P. Hart 1. Theorie en opgaven voor zelfstudie Inleiding Iedereen weet wat tellen is. Hoeveel studenten zijn er in de collegezaal? Even tellen: één, twee, drie,..., éénenvijftig,... Wat

Nadere informatie

Bevolkingstrends 2013. Bevolkingsgroei in grote steden vooral dankzij Vinex-wijken

Bevolkingstrends 2013. Bevolkingsgroei in grote steden vooral dankzij Vinex-wijken Bevolkingstrends 2013 Bevolkingsgroei in grote steden vooral dankzij Vinex-wijken Frank Bloot november 2013 Van de vier grootste gemeenten in ons land is het aantal inwoners in Utrecht de afgelopen tien

Nadere informatie

VUT-fondsen op weg naar het einde

VUT-fondsen op weg naar het einde Webartikel 2014 VUT-fondsen op weg naar het einde Drs. J.L. Gebraad mw. T.R. Pfaff 05-03-2013 gepubliceerd op cbs.nl CBS VUT-fondsen op weg naar het einde 3 Inhoud 1. Minder VUT-fondsen in 2012 5 2. Kortlopende

Nadere informatie

VUT-fondsen kalven af

VUT-fondsen kalven af 132 VUT-fondsen kalven af Drs. J.L. Gebraad en mw. T.R. Paff Publicatiedatum CBS-website: 03-07-2013 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer

Nadere informatie

Verschillenanalyse methodewijziging Eigendom woningen

Verschillenanalyse methodewijziging Eigendom woningen Paper Verschillenanalyse methodewijziging Eigendom woningen Januari 217 CBS Centraal Bureau voor de Statistiek Verschillenanalyse methodewijziging Eigendom woningen, 1 Inhoud 1. Inleiding 3 2. Belangrijkste

Nadere informatie

Vernieuwde StatLine-tabel over onderwijsuitgaven

Vernieuwde StatLine-tabel over onderwijsuitgaven 19 Vernieuwde StatLine-tabel over onderwijsuitgaven Daniëlle Andarabi-van Klaveren Publicatiedatum CBS-website: 18 juni 21 Centraal Bureau voor de Statistiek Verklaring van tekens. = gegevens ontbreken

Nadere informatie

Aan het werk met re-integratieondersteuning

Aan het werk met re-integratieondersteuning Aan het werk met re-integratieondersteuning Zesmeting, fase 3 21-11-2014 gepubliceerd op cbs.nl CBS Centraal Bureau voor de Statistiek Sociaal Economische Trends, januari 2014, 01 1 Inhoud Inleiding 4

Nadere informatie

MNP Rapport /2006. Gevoeligheidsanalyse van de bepaling van de duurzaamheidsindex. Peter S.C. Heuberger en Peter H.M.

MNP Rapport /2006. Gevoeligheidsanalyse van de bepaling van de duurzaamheidsindex. Peter S.C. Heuberger en Peter H.M. MNP Rapport 550031004/2006 Gevoeligheidsanalyse van de bepaling van de duurzaamheidsindex Bijlage III bij het Methoderapport Duurzaamheidsverenning (MNP Rapport 550031001/2006) Peter S.C. Heuberger en

Nadere informatie

Statistisch Bulletin. Jaargang

Statistisch Bulletin. Jaargang Statistisch Bulletin Jaargang 72 2016 20 20 mei 2016 Inhoud 1. Arbeid en sociale zekerheid 3 Werkloosheid daalt licht 3 Werkloze beroepsbevolking (17) 4 Verklaring van tekens 5 Colofon 5 Meer recente gegevens

Nadere informatie

Daling omvang VUT-fondsen in 20060a

Daling omvang VUT-fondsen in 20060a 7 Daling omvang VUT-fondsen in 6a Drs. J.L. Gebraad en mw. T.R. Pfaff Publicatiedatum CBS-website: 18 juli 8 Voorburg/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim

Nadere informatie

Rendementen en CO -emissie van elektriciteitsproductie in Nederland, update 2012

Rendementen en CO -emissie van elektriciteitsproductie in Nederland, update 2012 Webartikel 2014 Rendementen en CO -emissie van 2 elektriciteitsproductie in Nederland, update 2012 Reinoud Segers 31-03-2014 gepubliceerd op cbs.nl CBS Rendementen en CO2-emissie elektriciteitsproductie

Nadere informatie

Einde in zicht voor de VUT

Einde in zicht voor de VUT Einde in zicht voor de VUT 11 0 Drs. J.L. Gebraad en mw. T.R. Pfaff Publicatiedatum CBS-website: 1 september 2011 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer ** =

Nadere informatie

III (vervolg) Lineaire Transformaties in R

III (vervolg) Lineaire Transformaties in R III (vervolg) Lineaire Transformaties in R III.7 a Opmeringen over dit hoofdstu Oorspronelij waren de volgende paragrafen deel van hoofdstu III. De bedoeling ervan is om na te gaan hoe binnen het ader

Nadere informatie

Verwachtingswaarde en spreiding

Verwachtingswaarde en spreiding Les 3 Verwachtingswaarde en spreiding 3.1 Stochasten In een aantal voorbeelden hebben we gezien dat we bij een experiment vaa niet zo zeer in een enele uitomst geïneteresseerd zijn, maar bijvoorbeeld wel

Nadere informatie

De vergrijzing komt, de VUT gaat

De vergrijzing komt, de VUT gaat 0n08 08 De vergrijzing komt, de VUT gaat John Gebraad en Feny Pfaff Publicatiedatum CBS-website 28 augustus 2009 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim

Nadere informatie

Concept Leidraad Ervaringssterfte

Concept Leidraad Ervaringssterfte Concept Leidraad Ervaringssterfte Hoofdindeling: Leidraden Opgesteld door: AG Wergroep Prognosetafels Vastgesteld door: Commissie Sterfte Onderzoe Datum (laatste wijziging): 2 otober 202 Inhoudsopgave

Nadere informatie

Zin en onzin van de normale benadering van de binomiale verdeling

Zin en onzin van de normale benadering van de binomiale verdeling Zin en onzin van de normale benadering van de binomiale verdeling Jef Hendricx 1, 18 november 26 In lassiee handboeen van statistie worden ansen van de binomiale verdeling bereend met tabellen. Voor grotere

Nadere informatie

Stroomschema financiering zorg 2010 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 2010 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 2010 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

Stroomschema financiering zorg 2007 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 2007 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 2007 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

02 mei Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek

02 mei Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek 02 mei 2013 Statistisch Bulletin 13 18 no. Jaargang 69 Centraal Bureau voor de Statistiek Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil (indien voorkomend

Nadere informatie

Nulmeting 60%-doelstelling Uitstroom naar ar werk (voorlopige cijfers)06

Nulmeting 60%-doelstelling Uitstroom naar ar werk (voorlopige cijfers)06 07 Nulmeting 60%-doelstelling Uitstroom naar ar werk (voorlopige cijfers)06 Maaike Hersevoort, Daniëlle ter Haar en Luuk Schreven Centrum voor Beleidsstatistiek (paper 08010) Den Haag/Heerlen Verklaring

Nadere informatie

Warmteleveringen in de CBS Energiebalans

Warmteleveringen in de CBS Energiebalans Paper Warmteleveringen in de CBS Energiebalans Oktober 2015 CBS Centraal Bureau voor de Statistiek Losse elektronische publicatie, 1 1. Inleiding Momenteel is er een toenemende belangstelling voor warmteleveringen

Nadere informatie

Stroomschema financiering zorg 2008 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 2008 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 2008 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

21 augustus Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek

21 augustus Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek 21 augustus 2008 Statistisch Bulletin 08 33 no. Jaargang 64 Centraal Bureau voor de Statistiek Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim = nihil 2007 2008 = 2007 tot en

Nadere informatie

Statistisch Bulletin. Jaargang 71 2015 17

Statistisch Bulletin. Jaargang 71 2015 17 Statistisch Bulletin Jaargang 71 2015 17 23 april 2015 Inhoud 1. Arbeid en sociale zekerheid 3 CBS: Meer mensen aan het werk, vooral jongeren 3 Werkloze beroepsbevolking 4 2. Inkomen en bestedingen 5 Vertrouwen

Nadere informatie

14 maart Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek

14 maart Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek 14 maart 2013 Statistisch Bulletin 13 11 no. Jaargang 69 Centraal Bureau voor de Statistiek Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil (indien

Nadere informatie

Obligatiemarkt arkt Amsterdam ruimschoots s verdubbeld sinds eeuwwisseling

Obligatiemarkt arkt Amsterdam ruimschoots s verdubbeld sinds eeuwwisseling 7 Obligatiemarkt arkt Amsterdam ruimschoots s verdubbeld sinds eeuwwisseling ing Jos van Heiningen Publicatiedatum CBS-website: 27 maart 28 Voorburg/Heerlen, 28 Verklaring van tekens. = gegevens ontbreken

Nadere informatie

Statistisch Bulletin. Jaargang

Statistisch Bulletin. Jaargang Statistisch Bulletin Jaargang 72 2016 33 18 ustus 2016 Inhoud 1. Inkomen en bestedingen 3 Consumentenconjunctuuronderzoek 1) (29) 4 Verklaring van tekens 5 Colofon 5 Meer recente gegevens Het Statistisch

Nadere informatie

Stroomschema ma financiering zorg 2007

Stroomschema ma financiering zorg 2007 0m08 08 Stroomschema ma financiering zorg 2007 Publicatiedatum CBS-website: 26 november 2009 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim = nihil = (indien

Nadere informatie

Berekenen van dynamisch evenwicht

Berekenen van dynamisch evenwicht Bereenen van dynamisch evenwicht Voor het bereenen van dynamische evenwichten zijn er verscheidene methodes. De meest beende zijn het gebrui van traagheidsreacties. Deze traagheidsreacties unnen verder

Nadere informatie

27 september Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek

27 september Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek 27 september 2012 Statistisch Bulletin 12 39 no. Jaargang 68 Centraal Bureau voor de Statistiek Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil (indien

Nadere informatie

3 mei Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek

3 mei Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek 3 mei 2012 Statistisch Bulletin 12 18 no. Jaargang 68 Centraal Bureau voor de Statistiek Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil (indien voorkomend

Nadere informatie

Stroomschema financiering zorg 2006 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 2006 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 2006 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

Statistisch Bulletin. Jaargang

Statistisch Bulletin. Jaargang Statistisch Bulletin Jaargang 72 2016 23 9 juni 2016 Inhoud 1. Financiële en zakelijke diensten 3 Kappers en schoonheidsverzorging (SBI 9602); waarde-, prijs- en volumeontwikkeling van de omzet (2010=100)(09)

Nadere informatie

Statistisch Bulletin. Jaargang 71 2015 35

Statistisch Bulletin. Jaargang 71 2015 35 Statistisch Bulletin Jaargang 71 2015 35 27 augustus 2015 Inhoud 1. Arbeid en sociale zekerheid 3 Werkloosheid verder gedaald 3 Werkloze beroepsbevolking 4 2. Inkomen en bestedingen 5 Consumenten zijn

Nadere informatie

_., i _._ Lo-. -J EEN ANALYSE VAN EEN SPELLETJE MET DOMINOSTENEN. door. Jacob Wijngaard.

_., i _._ Lo-. -J EEN ANALYSE VAN EEN SPELLETJE MET DOMINOSTENEN. door. Jacob Wijngaard. _.,.....-..-...------.---i 7703520 -_._------ Lo-. -J EEN ANALYSE VAN EEN SPELLETJE MET DOMINOSTENEN door Jacob Wijngaard Bd/OR/75-06 Een veel beoefend spelletje met dominostenen is het volgende: Zet aile

Nadere informatie

Opkomende e groeimarkten voor Nederland steeds belangrijker

Opkomende e groeimarkten voor Nederland steeds belangrijker 7 Opkomende e groeimarkten voor Nederland steeds belangrijker Marjolijn Jaarsma Publicatiedatum CBS-website: 9 april 28 Voorburg/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer

Nadere informatie

Rijksbelastingen 0n verdubbeld en vergroend

Rijksbelastingen 0n verdubbeld en vergroend 08 Rijksbelastingen 0n verdubbeld en vergroend Laurens Cazander Publicatiedatum CBS-website: 3 februari 2009 Den Haag/Heerlen, 2009 Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x =

Nadere informatie

Opgaven Bewijzen en Inductie 1 mei 2019, Datastructuren, Werkcollege.

Opgaven Bewijzen en Inductie 1 mei 2019, Datastructuren, Werkcollege. Opgaven Bewijzen en Inductie mei 09, Datastructuren, Wercollege. Gebrui deze opgaven, naast die uit het boe, om de stof te oefenen op het wercollege. Cijfer: Op een toets rijg je meestal zes tot acht opgaven..

Nadere informatie

Obligatiemarkt arkt Amsterdam heeft last van crisis

Obligatiemarkt arkt Amsterdam heeft last van crisis 7 Obligatiemarkt arkt Amsterdam heeft last van crisis Jos van Heiningen Publicatiedatum CBS-website: 12 december 28 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x =

Nadere informatie

De onzekere toekomst van de pensioengerechtigde leeftijd

De onzekere toekomst van de pensioengerechtigde leeftijd 11 0 De onzekere toekomst van de pensioengerechtigde leeftijd Coen van Duin Publicatiedatum CBS-website: 2 september 2011 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer

Nadere informatie

INTRODUCTIE VERPLAATSINGENMETHODE

INTRODUCTIE VERPLAATSINGENMETHODE IRODUCIE VERPLSIGEMEHODE Blo op eren Op onderstaande blo, in het platte la, grijpen in het massaentrum een ertiale raht, een horizontale raht u en/of een oppel aan. Het blo is in, B en C met eren elastish

Nadere informatie

Groot vertrouwen onder hoger opgeleiden. Hans Schmeets en Bart Huynen

Groot vertrouwen onder hoger opgeleiden. Hans Schmeets en Bart Huynen 109 Groot vertrouwen onder hoger opgeleiden Hans Schmeets en Bart Huynen Publicatiedatum CBS-website: 27 juli 2010 Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer ** = nader voorlopig

Nadere informatie

Onzekerheidsmarges rond regionale bevolkings- en huishoudensprognose

Onzekerheidsmarges rond regionale bevolkings- en huishoudensprognose Statistische Trends Onzekerheidsmarges rond regionale bevolkings- en huishoudensprognose In samenwerking met Coen van Duin (CBS) Andries de Jong (PBL) December 2017 CBS Statistische Trends, 1 Inhoud 1.

Nadere informatie

Stroomschema financiering zorg 2012

Stroomschema financiering zorg 2012 Stroomschema financiering zorg 2012 6-10-2013 gepubliceerd op cbs.nl CBS Stroomschema financiering zorg 2012 1 20.553 II Overheid Instellingen Gezinnen/werknemers Bedrijven Incl. niet-ingezetenen 5.289

Nadere informatie

Beleggingen institutionele beleggers 1,5 biljoen euro in 2010

Beleggingen institutionele beleggers 1,5 biljoen euro in 2010 11 Beleggingen institutionele beleggers 1,5 biljoen euro in John Gebraad Publicatiedatum CBS-website: 3-11-211 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer ** = nader

Nadere informatie

grote ondernemingen nemingen in eerste kwartaal aal 2009

grote ondernemingen nemingen in eerste kwartaal aal 2009 08 Wisselende 0s signalen bij grote ondernemingen nemingen in eerste kwartaal aal 2009 Frank Bonger en Hen Pustjens Publicatiedatum CBS-website: 17 juli 2009 Den Haag/Heerlen Verklaring van tekens. = gegevens

Nadere informatie

Statistisch Bulletin. Jaargang

Statistisch Bulletin. Jaargang Statistisch Bulletin Jaargang 72 2016 51 22 december 2016 Inhoud 1. Arbeid en sociale zekerheid 3 Iets minder dan een half miljoen werklozen 3 Werkloze beroepsbevolking 1) (21) 4 Verklaring van tekens

Nadere informatie

Vrijwillige inzet 2008

Vrijwillige inzet 2008 08 Vrijwillige inzet 2008 Marieke van Herten Publicatiedatum CBS-website: 29 april 2009 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim = nihil = (indien voorkomend

Nadere informatie

Annex bij het methoderapport

Annex bij het methoderapport Paper Annex bij het methoderapport Woningmarktontwikkeling rondom het Groningenveld Oktober 2016 CBS Kwaliteits- en riscomanagementpaper 1 1.1 Inleiding Het Centraal Bureau voor de Statistiek (CBS) voert

Nadere informatie

Stroomschema financiering zorg 1998 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 1998 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 1998 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

Nieuwe vacatureindicatoren

Nieuwe vacatureindicatoren Nieuwe vacatureindicatoren Doel, achtergrond en samenstelling11 Floris van Ruth en Roberto Wekker Publicatiedatum CBS-website: 21 maart 211 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken

Nadere informatie

VUT wordt vervangen door langer werken. Drs. J.L. Gebraad en mw. T.R. Pfaff

VUT wordt vervangen door langer werken. Drs. J.L. Gebraad en mw. T.R. Pfaff 109 VUT wordt vervangen door langer werken Drs. J.L. Gebraad en mw. T.R. Pfaff Publicatiedatum CBS-website: 5 augustus 2010 Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer ** = nader voorlopig

Nadere informatie

6 september Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek

6 september Statistisch Bulletin. no. Jaargang. Centraal Bureau voor de Statistiek 6 september 2012 Statistisch Bulletin 12 36 no. Jaargang 68 Centraal Bureau voor de Statistiek Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil (indien

Nadere informatie

Stroomschema financiering zorg 2005 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 2005 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 2005 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

Stroomschema financiering zorg 2011

Stroomschema financiering zorg 2011 Webartikel 2013 Stroomschema financiering zorg 2011 09-08-2013 gepubliceerd op cbs.nl Gezinnen/werknemers Incl. niet-ingezetenen 17.423 II 2 5.248 PP 1.716 QQ 0 16.246 RR 1 1 4.447 EEE 10.147C CC 112 HH

Nadere informatie

Gemeenten voegen 2,3 miljard euro toe aan eigen vermogen

Gemeenten voegen 2,3 miljard euro toe aan eigen vermogen 0n07 07 Gemeenten voegen 2,3 miljard euro toe aan eigen vermogen Florianne Matser en Wouter Jonkers Publicatiedatum CBS-website: 14 juli 2008 Voorburg/Heerlen Verklaring van tekens. = gegevens ontbreken

Nadere informatie

veiligheid en economische zaken, minder voor bijstand en onderwijs

veiligheid en economische zaken, minder voor bijstand en onderwijs 07 s07 Meer gemeentegeld 0e entegeld voor veiligheid en economische zaken, minder voor bijstand en onderwijs Wouter Jonkers Publicatiedatum CBS-website: 7 april 2008 Voorburg/Heerlen Verklaring van tekens.

Nadere informatie

Stroomschema financiering zorg 2002 Publicatiedatum CBS-website: 3 september 2012

Stroomschema financiering zorg 2002 Publicatiedatum CBS-website: 3 september 2012 Stroomschema financiering zorg 2002 121 Publicatiedatum CBS-website: 3 september 2012 Den Haag/Heerlen Verklaring van tekens. gegevens ontbreken * voorlopig cijfer ** nader voorlopig cijfer x geheim nihil

Nadere informatie

Universiteit Leiden, 2015 Wiskundewedstrijdtraining, week 14

Universiteit Leiden, 2015 Wiskundewedstrijdtraining, week 14 Universiteit Leiden, 0 Wisundewedstrijdtraining, wee Wee : reesen Een rees is een speciaal soort rij, dus: den altijd eerst na over convergentie! bijzonder: monotone, begrensde rijen convergeren In het

Nadere informatie

Statistisch Bulletin. Jaargang 70 2014 47

Statistisch Bulletin. Jaargang 70 2014 47 Statistisch Bulletin Jaargang 70 2014 47 20 november 2014 Inhoud 1. Arbeid en sociale zekerheid 3 Iets meer banen en vacatures in het derde kwartaal 3 Werkloze beroepsbevolking 4 2. Macro-economie 5 Koerswaarde

Nadere informatie

Prijsindex Productie van gebouwen

Prijsindex Productie van gebouwen Paper Prijsindex Productie van gebouwen (Basisverlegging van prijspeil 2000 naar 2015=100) Mei 2017 CBS 2014 Scientific Paper 1 nhoud nleiding 3 1. Oude methode 3 2. Wijzigingen bij basisverlegging 4 2.1

Nadere informatie

Resultaten E-commerce Onderzoek Caribisch Nederland

Resultaten E-commerce Onderzoek Caribisch Nederland Paper Resultaten E-commerce Onderzoek Caribisch Nederland 18 19 Maart 19 CBS Paper, 1 Inhoud Inleiding 3 Resultaten e-commerce online aankopen 4 Problemen met bestellen 6 Problemen met betalen 7 Problemen

Nadere informatie

Statistisch Bulletin. Jaargang

Statistisch Bulletin. Jaargang Statistisch Bulletin Jaargang 72 2016 04 28 januari 2016 Inhoud 1. Arbeid en sociale zekerheid 3 Werkloosheid opnieuw gedaald 3 Werkloze beroepsbevolking 4 2. Inkomen en bestedingen 5 CBS: Consumenten

Nadere informatie

The bouncing balls and pi

The bouncing balls and pi The bouncing balls and pi naar een idee van Dir Dancaert 9 september 05 Samenvatting Wisundecollega Dir Dancaert ontdete onlangs een merwaardig filmpje op het internet (https://wwwyoutubecom/user/numberphile

Nadere informatie

Inkomens en verhuizingen Almelo,

Inkomens en verhuizingen Almelo, 109 Inkomens en verhuizingen Almelo, 2001 2007 Mathilda Copinga Mariëtte Goedhuys Centrum voor Beleidsstatistiek Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer ** = nader voorlopig cijfer

Nadere informatie

gelezen het voorstel van Gedeputeerde Staten van Flevoland van 26 juni 2012 kenmerk ;

gelezen het voorstel van Gedeputeerde Staten van Flevoland van 26 juni 2012 kenmerk ; 2012/29 Nummer 1378659 Algemene Subsidieverordening Flevoland 2012 Gedeputeerde Staten van Flevoland maen overeenomstig het bepaalde in artiel 136 van de Provinciewet beend dat Provinciale Staten van Flevoland

Nadere informatie

IV Eigenvectoren en Eigenwaarden bij Lineaire

IV Eigenvectoren en Eigenwaarden bij Lineaire IV Eigenvectoren en Eigenwaarden bij Lineaire Transformaties in R IV0 Meetundige inleiding: delijnen en eigenvectoren Bij veel toepassingen van de Gauss-Jordan methode gaat men uit van de delijnen van

Nadere informatie

Uitstroom uit het mbo schooljaar 2006/ 07

Uitstroom uit het mbo schooljaar 2006/ 07 08 Uitstroom uit het mbo schooljaar 2006/ 07 06/ 07 Daniëlle ter Haar, Frank van der Linden, Alderina Dill-Fokkema Centrum voor Beleidsstatistiek Den Haag/Heerlen, 2009 Verklaring van tekens. = gegevens

Nadere informatie

Stroomschema ma financiering zorg 2000

Stroomschema ma financiering zorg 2000 0m08 08 Stroomschema ma financiering zorg 2000 Publicatiedatum CBS-website: 26 november 2009 Den Haag/Heerlen Verklaring van tekens. = gegevens ontbreken * = voorlopig cijfer x = geheim = nihil = (indien

Nadere informatie