Koppelingsprocedure PRN 2002 Beschrijving en Toelichting

Vergelijkbare documenten
KOPPELINGSPROCEDURE PRN (LVR1, LVR2 & LNR) 2004: Beschrijving en Toelichting

PRN Koppelingsprocedure 2006 (LVR1, LVR2 en LNR-registratie)

PRN Koppelingsprocedure 2005 (LVR1, LVR2 en LNR-registratie)

PRN Koppelingsprocedure 2007 (LVR1, LVR2 en LNR-registratie)

Koppelingsprocedure PRN 2003 en 2004 met ABCD bestand

PRN Koppelingsprocedure 2008 (LVR1, LVR2 en LNR-registratie)

Koppeling PRN registratie 2003 met ABCD onderzoeksbestand 2003

PRN Koppelingsprocedure 2013 (LVR1, LVRh, LVR2 en LNR-deelregistraties)

PRN Koppelingsprocedure 2009 (LVR1, LVRh, LVR2 en LNR-deelregistraties)

Koppelingsprocedure PRN 2001: Deel I Hoofdlijnen

LNR-registratie Compleetheid, Datakwaliteit en Validatie LNR koppeling

Validatie koppelingsprocedure PRN 2001 Technische beschrijving Validatie LVR1 & LVR2 koppeling

UvA-DARE (Digital Academic Repository) Record linkage to enhance data from perinatal registries Tromp, M. Link to publication

Perinatale sterfte verschillen naar zorgregio s in Nederland

Perinatale Zorg in Nederland

Microdataservices. Documentatierapport Perinatale Registratie Nederland (PRN)

Microdata Services. Documentatie Perinatale Registratie Nederland (PRN)

Perinatale Zorg in Nederland

mw.dr. J. Dijs-Elsinga (PRN), mw. C. de Vries (PRN) mw.dr. E. de Miranda (KNOV), mw.dr. A.C.J. Ravelli (AMC), dhr. P.

Methodebeschrijving van de gemeenschappelijke PRN-CBScijfers over perinatale en zuigelingensterfte

Bijkomende informatie bij het bestand 'geboortegegevens pasgeborene' (PATBIRTH)

Betreft: Perinatale Zorg in Nederland 2013

Centrum voor Beleidsstatistiek en Microdata Services. Documentatierapport Perinatale Registratie Nederland (PRN)

De ontwikkeling van een heropnamemodel. Corine Penning, Jan van der Laan, Agnes de Bruin (CBS) Landelijke Themabijeenkomst Heropnamen DHD

Perinatale Zorg in Nederland. Perinatal Care in the Netherlands. Perinatale Zorg. in Nederland

Betreft: Perinatale Zorg in Nederland 2009

Betreft: Perinatale Zorg in Nederland 2010

mw.dr. J. Dijs-Elsinga (PRN), mw. C. de Vries (PRN) mw.dr. E. de Miranda (KNOV), mw.dr. A.C.J. Ravelli (AMC), dhr. P.

Opbouw webinar. Uitleg nieuwe indicatoren en verschil met de oude. Waarom deze indicatoren? Hoe te gebruiken voor de verbetering van kwaliteit?

Documentatierapport Personen met een Algemene

Inventarisatie van Koppelwensen en mogelijkheden van Biobanken en Databanken in Nederland!

Benchmark psychiatrie: preklinische setting

Betreft: Perinatale Zorg in Nederland 2014

Gebruikershandleiding

Perinatale Zorg in in Nederland Perinatal Care in in the the Netherlands

MISSING DATA van gatenkaas naar valide uitkomsten

Betreft: Perinatale Zorg in Nederland 2013

Het Euro-Peristat-project

COMMUNICATIE WisseQ/WoWie

Conflicten in Ons Planning oplossen

Perined Record linking V2.28 design notes

Praktijkanalyse LVR Verloskundig jaarverslag

Biomerkers van effect. Analyse van covariabelen

Documentatierapport Algemene nabestaandenwet personen (ANWPERSOONBUS)

Eyefactory heeft de eerste stap op weg naar optimale datakwaliteit gezet. Gefeliciteerd!

EyeOptics heeft de eerste stap op weg naar optimale datakwaliteit gezet. Gefeliciteerd!

Perinatale Zorg in Nederland. Perinatal Care in the Netherlands

Cover Page. The handle holds various files of this Leiden University dissertation.

Perinatale Zorg in Nederland Perinatal Care in the Netherlands

Handleiding. NCDR Databroker Voor aanlevering van geëncrypteerde data. Mei 2016 Versie 2.0

Microdataservices. NIVEL_CBS: procedure voor koppeling NIVEL data met CBS microdata

Betreft: Perinatale Zorg in Nederland 2015

Inlezen bankbestanden (bankafschriften)

Documentatierapport Landelijk Informatie Netwerk Huisartsenzorg verrichtingen (LINH-verrichtingen)

Peridos. Gegevens aanleveren en controleren in Peridos door zorginstelling

Korte handleiding PRN-Audit

1. Aanlevering databestanden CQI Farmacie 2016

Biomerkers van effect bij het kind gebiedsvergelijking. Ruwe gegevens (niet gecorrigeerd voor confounders)

ZIC: Kengetallen DIS per 1 januari 2017

Afkortingen in figuur 1

Handleiding. NCDR Databroker Voor aanlevering van geëncrypteerde data. Juli 2016 Versie 2.0.3

Handleiding edeclaratie

Opzet. Methode. Inleiding. Resultaten. Conclusie. Martine Eskes, Adja Waelput, Sicco Scherjon, Klasien Bergman en Anita Ravelli

Peridos. Gegevens aanleveren en controleren in Peridos door zorginstelling. Datum: Landelijk beheer Peridos. Versie: 2.

Microdata Services. Nivel_CBS: procedure voor koppeling data Nivel Zorgregistraties Eerste Lijn met CBS microdata

Vrouwen die zwanger zijn van een meerling hebben een verhoogde kans op vroeggeboorte

Verbanden tussen demografische kenmerken, gezondheidsindicatoren en gebruik van logopedie

Cover Page. The handle holds various files of this Leiden University dissertation.

Releasebeschrijving e-former versie 7.0

Documentatierapport In de Gemeentelijke Basisadministratie Persoonsgegevens (GBA) ingeschreven personen en hun juridische ouders (KINDOUDERTAB)

Promedico VDF 10 - bestand maken om in te lezen in VIP-Calculus Ketenzorg

Perined Flatfile-Upload

Onderzoeksvraag zoals geformuleerd door SZW

Documentatierapport Loongegevens, gewerkte uren en dagen per inkomstenverhouding (NPOLISSTATLINEBUS)

Peridos. Aanleveren van gegevens. Datum: Landelijk beheer Peridos. Versie: 1.1

Klik op één van de vragen hieronder om het antwoord te zien. U kunt in dit document ook met Ctrl-F naar trefwoorden zoeken. 1 PNR Algemeen...

Afwijkende biometrie bij SEO

Microdataservices. Documentatierapport Diagnosen behorend bij ziekenhuisopnamen Landelijke Basisregistratie Ziekenhuiszorg (LBZDIAGNOSENTAB)

Betreft: Perinatale Zorg in Nederland 2016

Microdataservices. Documentatie Maandbedragen van personen met een Algemene Ouderdomswet (AOW)-uitkering (AOWMNDBEDRAGBUS)

Module inlezen bankmutaties

Samenvatting Nederlands

HANDLEIDING FysioTopics

Handleiding gebruik dashboard ProMISe

Tweelingen in de groei

3792_Jrvslg_bwwerk :22 Pagina 1. Perinatale Zorg in Nederland

Vervolgonderzoek vuurwerkongevallen

CHAPTER 12. Samenvatting

Nederlandstalige samenvatting

4orange Connect. 4orange, Hogehilweg CD Amsterdam Zuidoost

Perinatale Zorg in Nederland. Perinatal Care in the Netherlands. Perinatale Zorg in Nederland

Handleiding Data invoer in LROI Datum: 16 oktober 2016 Laatste aanpassing: 4 september 2017

Werkinstructies voor de CQI Mammacare

Handleiding EPD-overdrachtbericht (MEDOVD) Versie: 0.2. EPD Overdrachtbericht (MEDOVD)... 2 Aanmaken verhuisdossier Inlezen verhuisbericht...

Microdata Services. Bronvermelding

Releasenotes Landelijk Asbestvolgsysteem

Promedico-ASP. Handleiding EPD Overdrachtbericht Versie: 2.0. Inhoud

PRODUCT UPDATE. Updates, wijzigingen en aanpassingen # juni 2015

Perined. Kwaliteitsbewaking en datastromen

Release notes:

Transcriptie:

Koppelingsprocedure PRN 2002 Beschrijving en Toelichting LinKID team N Méray 1, M Tromp 1, ACJ Ravelli 1,JB Reitsma 2, GJ Bonsel 3 Department of Medical Informatics 1 Department of Clinical Epidemiology and Biostatistics 2 Department of Public Health Epidemiology 3 Technical Report 2005-03 Department of Medical Informatics University of Amsterdam February, 2005

Inhoudsopgave Inleiding...3 Wat is er hetzelfde gebleven en wat is er veranderd?... 3 Samenvatting resultaten... 4 Vergelijking 2002 met 2001... 5 1. Koppeling LVR1 ^ LVR1...6 2. Koppeling LVR2 ^ LVR2...8 3. Koppeling LNR ^ LNR...10 3.1 Koppeling LNR ^ LNR voor verwijderen administratieve dubbeltellingen... 10 3.2 Koppeling LNR ^ LNR voor vinden van heropnames... 12 3.2.1 Koppeling LNR ^ LNR voor vinden van heropnames bij eenlingen... 12 3.2.2 Koppeling LNR ^ LNR voor vinden van heropnames bij meerlingen... 13 3.2.3 Koppeling niet-gekoppelde LNR eenlingen ^ niet-gekoppelde LNR meerlingen voor vinden van heropnames... 15 4. Koppeling LVR1 ^ LVR2...16 4.1 Koppeling LVR1 ^ LVR2 eenlingen... 16 4.2 Koppeling LVR1 ^ LVR2 meerlingen... 19 4.3 Koppeling niet-gekoppelde LVR1 eenlingen met LVR2 meerlingen... 21 4.4 Koppeling niet-gekoppelde LVR1 meerlingen met LVR2 eenlingen... 21 4.5 Creatie LVR1^LVR2 eindbestand... 21 5. Koppeling (LVR1 ^ LVR2) ^ LNR...22 5.1 Koppeling (LVR1 ^ LVR2) ^ LNR eenlingen... 22 5.2 Koppeling LVR12 ^ LNR meerlingen... 24 5.3 Koppeling niet-gekoppelde LVR12 eenlingen met LNR meerlingen... 27 5.4 Koppeling niet-gekoppelde LVR12 meerlingen met LNR eenlingen... 27 5.5 Creatie eindbestand (LVR1 ^ LVR2) ^ LNR... 27 6. Beschrijving eindbestanden...28 Epiloog...31 Appendix: Contents tabel gekoppelde bestand LVR1^LVR2^LNR...32 2

Inleiding Voor u ligt de rapportage van de koppeling van de perinatale registraties (LVR1, LVR2 en LNR) voor het jaar 2002. Dit koppelingsproject is een vervolg op het koppelingsproject van de perinatale registraties voor het jaar 2001. Deze rapportage is de verantwoording van de koppeling van 2002 en de documentatie bouwt voort op de documentatie van de koppeling van 2001 (Koppelingsprocedure PRN 2001: Deel I Hoofdlijnen en Deel II Beschrijving en Toelichting). De documentatie van de koppeling van 2001 is beschikbaar op de website van de Stichting Perinatale Registratie Nederland (www.perinatreg.nl) en de website van de afdeling Klinische Informatiekunde van het AMC (www.kikpage.org) onder Technical Reports. De uitgangspunten voor de koppeling van 2002 zijn niet veranderd ten opzichte van 2001. De projectuitvoering van de 2002 koppeling liep vanaf 1 oktober 2004 t/m 28 februari 2005 en heeft plaatsgevonden op de afdeling Klinische Informatiekunde, AMC Amsterdam. Op basis van de ervaringen van de koppeling van 2001 en de uitgevoerde externe validatie van de LVR1&LVR2 koppeling voor 2001 is een aantal kleine wijzigingen doorgevoerd in de koppelmethodiek. De wijzigingen waren vooral gericht op het verfijnen van de toegepaste methode en geven nagenoeg geen verschillen op de uitkomst. Het aantal koppelingen is wel gereduceerd van 17 naar 14. Het gekoppelde 2002 bestand kan moeiteloos in combinatie met het gekoppelde 2001 bestand worden gebruikt. Wat is er hetzelfde gebleven en wat is er veranderd? Wat is hetzelfde gebleven in vergelijking met de koppeling van 2001? De bestanden worden eerst intern gekoppeld voor het vinden van administratieve dubbeltellingen; dit gebeurt op deterministische wijze. Alle volgende koppelingen worden op probabilistische wijze uitgevoerd, apart voor eenlingen en meerlingen. Hier wordt net als voor 2001 de probabilistische close methodiek gebruikt. Het uitrekenen van de gewichten en het bepalen van het afkappunt gebeurt op dezelfde wijze als voor 2001. Hierbij wordt het Expectation Maximization (EM) algoritme gebruikt. Na de gescheiden eenling en meerling koppelingen worden niet-gekoppelde eenling records nog gekoppeld met niet-gekoppelde meerling records (voor 2001 gebeurde dit bij de LVR1^LVR2 koppeling en de (LVR1^LVR2)^LNR koppeling, maar nog niet bij de LNR^LNR koppeling). Er is getracht de eenling en meerling koppeling gecombineerd uit te voeren, maar dit introduceerde meer problemen (en dus mogelijke fouten) dan dat het extra correcte links zou kunnen opleveren. De laatst genoemde koppeling van niet-gekoppelde eenling records met niet-gekoppelde meerling records zorgt ervoor dat records met fouten in de omvang meerling alsnog gekoppeld kunnen worden. Wat is veranderd in vergelijking met de koppeling van 2001? 1. De koppeling voor het verwijderen van administratieve dubbeltellingen wordt thans niet meer apart voor eenlingen en meerlingen uitgevoerd. Deze vindt nu plaats in één keer, waarbij de variabelen meerlingcode en omvang meerling ook worden meegenomen in de koppelsleutel. 2. Er wordt geen aparte ( dedicated ) koppeling uitgevoerd voor het bij elkaar vinden van losse zwangerschap- en kraambedrecords in de LVR1. Dit bij elkaar vinden is nu onderdeel van het oplossen van de clusters van de LVR1^LVR2 koppeling. LVR1 records die bij elkaar horen, zullen in dezelfde cluster terecht komen bij de LVR1^LVR2 koppeling. Het losse zwangerschapsrecord dat koppelt met een LVR2 record wordt hier weggeschreven als administratieve dubbeltelling van het complete record of losse kraambedrecord dat aan hetzelfde LVR2 record koppelt. Ook met deze (verbeterde) aanpak blijven losse zwangerschapsrecords een groot probleem vormen bij de koppeling van LVR1 en LVR2, omdat er geen kindvariabelen aanwezig zijn in deze records. 3. Een tweede blocking-variabele is geïntroduceerd. Bij een typfout of missende waarde in de eerste blocking-variabele kan een record niet gekoppeld worden, omdat paren alleen worden 3

vergeleken wanneer zij overeenstemmen op de blocking-variabele. Door de introductie van een tweede blocking-variabele kunnen deze records alsnog gekoppeld worden. De variabele postcode moeder is als tweede blocking-variabele gebruikt. 4. De externe LVR1^LVR2 validatie toonde aan dat het ziekenhuisnummer waar de bevalling heeft plaatsgevonden ook een mogelijk geschikte koppelvariabele is. Dit bleek inderdaad het geval te zijn. Daarnaast is geboorteminuut nu ook meegenomen in de koppelsleutel, omdat ook deze variabele voldoende informatiewaarde bleek te hebben. 5. De methodiek van koppelen gaat uit van onafhankelijkheid tussen de koppelvariabelen. Een aantal variabelen in de koppelsleutel blijken echter sterk afhankelijk van elkaar. Dit zijn de variabelen geboortedatum kind en à terme datum en de variabelen postcode moeder en ziekenhuisnummer bevalling. Deze afhankelijkheden zijn voor 2002 verwijderd uit de koppelsleutel door de tweede variabele alleen te vergelijken in het geval dat de eerste variabele niet overeenkomt of missend is. De variabelen met de grootste informatiewaarde zijn daarbij de voorkeursvariabelen, in dit geval geboortedatum kind en postcode moeder. 6. Niet-gekoppelde LNR eenling records worden thans ook nog gekoppeld aan nietgekoppelde LNR meerling records. Samenvatting resultaten Alles bijeen zijn er 14 koppelingen uitgevoerd (ten opzichte van 17 voor 2001). Binnen een registratie: - LVR1 ^ LVR1 - voor het herkennen van administratieve dubbeltellingen. - LVR2 ^ LVR2 - voor het herkennen van administratieve dubbeltellingen. - LNR ^ LNR - Voor het herkennen van administratieve dubbeltellingen. - Herkennen van heropnames die bij hetzelfde kind horen binnen de groep eenlingen. - Herkennen van heropnames die bij hetzelfde kind horen die onderdeel is van een meerling. - Koppelen van niet-gekoppelde LNR eenlingen met niet-gekoppelde LNR tweelingen voor het vinden van heropnames. Tussen de registraties: - Koppeling LVR1 ^ LVR2 - Koppelen van eenlingen LVR1 ^ LVR2. - Koppelen van meerlingen LVR1 ^ LVR2. - Koppelen van niet-gekoppelde LVR1 eenlingen met niet-gekoppelde LVR2 meerlingen. - Koppelen van niet-gekoppelde LVR1 meerlingen met niet-gekoppelde LVR2 eenlingen. - Koppeling (LVR1 ^ LVR2) ^ LNR - Koppelen van eenlingen LVR1 ^ LVR2 met LNR. - Koppelen van meerlingen LVR1 ^ LVR2 met LNR. - Koppelen van niet-gekoppelde LVR1 ^ LVR2 eenlingen met niet-gekoppelde LNR meerlingen. - Koppelen van niet-gekoppelde LVR1 ^ LVR2 meerlingen met nietgekoppelde LNR eenlingen. Het LVR1 bronbestand bestond uit 162.649 records, het LVR2 bronbestand uit 122.859 records en het LNR bronbestand uit 31.996 records. Het gekoppelde PRN eindbestand 2002 bestaat uit 202.778 records. 49.6% van de LVR1 records (82.868 records) kon gekoppeld worden aan een LVR2 record. Van 2.100 kinderen zijn meerdere opnames als heropname van hetzelfde kind geïdentificeerd in de LNR. Er zijn 28.178 LVR1 en/of LVR2 records gekoppeld aan een LNR record, dit houdt in dat 96% van de LNR records gekoppeld kon worden. 4

Vergelijking 2002 met 2001 Wanneer we aannemen dat de bronbestanden voor 2001 en 2002 vergelijkbaar zijn wat betreft omvang, samenstelling, gebruikte classificaties voor de variabelen, toegepaste coderingsregels en voorbewerking tot aan de aanlevering aan LinKID, is de vergelijking van de resultaten van 2002 met de resultaten van 2001 zinvol (valide) en van groot belang voor het beoordelen van de stabiliteit van het koppelingsprotocol. Een zeer gevoelige maat hiervoor zijn de koppelgewichten die op basis van de datasets berekend worden. Alleen als in alle opzichten de koppeling vergelijkbaar is en de databestanden gelijk van inhoud, ontstaan vergelijkbare gewichten. Tabel 1, 2 en 3 geven de koppelgewichten weer voor de LVR1^LVR2 koppeling, de LNR^LNR koppeling en de (LVR1^LVR2)^LNR eenling koppeling voor 2001 en 2002. De gewichten zijn zeer goed vergelijkbaar voor de beide jaren (alleen de close values bij de LVR1^LVR2 koppeling niet helemaal). Ieder hoofdstuk zal eindigen met een vergelijking van de aanpak en resultaten van 2002 met de aanpak en resultaten van 2001. Tabel 1 Koppelgewichten LVR1^LVR2 koppeling (Blocking op geboortedatum moeder) Gewichten 2001 Gewichten 2002 Variabele agree disagree agree disagree postcode moeder 10,17-4,67 10,74-4,55 graviditeit 1,56-3,69 1,65-3,69 geboortedatum kind (full) 8,85-5,26 8,47-7,28 geboortedatum kind (close ± 1 dag) 2,16 1,50 à terme datum (full) 8,35-5,27 8,36-5,79 à terme datum (close ± 7 dgn) 1,58 1,35 geboortegewicht (full) 7,82-4,48 7,98-4,44 geboortegewicht (close ± 10gr) 1,28 0,91 geslacht kind 0,98-5,22 0,99-5,93 geboorte uur 4,49-5,18 4,50-5,00 plaats bevalling (zkhs nr of thuis) 7,11-3,07 geboorte minuut 5,67-3,57 Tabel 2 Koppelgewichten LNR^LNR koppeling (Blocking op geboortedatum kind) Gewichten 2001 Gewichten 2002 Variabele agree disagree agree disagree geboortedatum moeder 12,08-4,33 12,14-4,81 zwangerschapsduur in weken 3,00-4,93 2,99-5,01 postcode moeder 9,75-6,03 9,82-5,97 geboortegewicht (full) 8,51-3,56 8,39-5,19 geboortegewicht (close ± 100gr) 1,88* 1,13 geslacht 0,98-5,71 0,96-4,53 Apgar na 5 min 1,40-3,85 1,35-3,75 patid (SIG) 13,48-1,07 * Bij 2001 was de close value voor geboortegewicht ± 10g Tabel 3 Koppelgewichten LVR12^LNR koppeling (Blocking op geboortedatum kind) Gewichten 2001 Gewichten 2002 Variabele agree disagree agree disagree postcode moeder 10,75-4,67 10,81-4,88 geboortedatum moeder 12,42-4,82 12,46-5,34 zwangerschapsduur in weken 2,00-1,57 2,64-3,72 geboortegewicht (full) 8,17-3,70 8,19-4,71 geboortegewicht (close ± 50 g) 2,13* 0,85 geslacht kind 0,98-5,14 0,97-5,02 Apgar score na 5 min 0,97-2,05 0,95-2,22 * Bij 2001 was de close value voor geboortegewicht ± 10g 5

1. Koppeling LVR1 ^ LVR1 Het doel van de toegepaste interne LVR1 ^ LVR1 koppeling is het verwijderen van administratieve dubbeltellingen uit het LVR1 bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 11 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR1 2002 ASCII bestand (Z:\Jaarbestand\ASCII\LVR1\lvr1jaar2002.dat) wordt ingelezen en omgezet in een SAS jaarbestand (Z:\Jaarbestand\SAS jaar\lvr1\lvr1jr02.sas), het bestand bestaat uit 162.649 records. Geboortes buiten 2002, records waar de geboortedatum van het kind ontbreekt en de à terme datum na juni 2003 is, worden verwijderd (283 records). Het LVR1 2001 (Z:\Jaarbestand\SAS Jaar\LVR1\lvr1jr01) bestand wordt ingelezen (155.832 records). Uit dit bestand worden de records geselecteerd waarbij de à terme datum in 2002 is, records waarbij de geboorte datum van het kind en de à terme datum missend is en records waarbij de à terme datum na 1 december 2001 is (5.142 records). In totaal zijn er nu 167.508 LVR1 records uit 2002 (bestand V ). Zie figuur 1 voor een flowchart van de LVR1 ^ LVR1 koppeling. Het LVR1 bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratie dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (2.394.985 paren). Voor de koppeling worden de volgende 11 variabelen vergeleken: postcode moeder (geboortedatum moeder bij blocking op postcode), praktijknummer, patiënt administratienummer, graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur en geboorte minuut. Records worden als een administratieve dubbeltelling beschouwd als 10 van de 11 variabelen overeenkomen of als 9 variabelen van de 11 overeenkomen en daarnaast ook meerlingcode en meerling omvang overeen komen. Op deze manier worden 317 administratieve dubbeltellingen en 1 administratieve trippel gevonden, waarvan steeds het tweede record verwijderd wordt (319 records, bij de administratieve trippel worden 2 records verwijderd; het tweede en derde record). De nietgekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode overeenkomt worden aangemaakt (9.246.235 paren). Administratieve dubbeltellingen worden op dezelfde wijze geselecteerd, maar nu met geboortedatum moeder als koppelvariabele in plaats van postcode moeder. Er worden nog 6 extra administratieve dubbeltellingen gevonden en verwijderd. Van de 167.508 LVR1 records zijn nu 325 administratieve dubbeltellingen verwijderd, waardoor er nog 167.183 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het sleutelbestand op positie 2 (v_admin1) na positie 1 waar de recordidentificatie (v_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR1 2002 bestand wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_opgeschoond 6

Vergelijking 2002 met 2001 In vergelijking met 2001 ligt het aantal gevonden administratieve dubbeltellingen iets hoger in 2002: 325 tegenover 224 in 2001. Er zijn in 2002 172 administratieve dubbeltellingen gevonden waarbij alleen het praktijknummer verschilt; dit betrof allemaal de praktijknummers 1645 en 1717. Koppeling op de tweede blockings-variabele leverde nog 6 extra paren op. De koppeling is nu gecombineerd voor eenlingen en meerlingen uitgevoerd en daarom is ook gekeken naar de meerling code en de omvang van de meerling. Dit is ook de reden dat de nu gehanteerde methode iets strenger is en meer generiek, omdat er geen vectoren meer worden gedefinieerd (combinatie van variabelen die wel of niet overeenkomen) maar alleen wordt gekeken naar het aantal variabelen dat overeenkomt. De achterliggende gedachte is dat administratieve dubbeltellingen die zich na deze koppeling nog in het bestand bevinden, bij het oplossen van de clusters bij de LVR1^LVR2 koppeling alsnog worden verwijderd. Inlezen LVR1 2001 bestand Z:\Jaarbestand\SASjaar\LVR1\lvr1jaar2001.dat Inlezen LVR1 2002 bestand Z:\Jaarbestand\SASjaar\LVR1\lvr1jaar2002.dat LVR1 2001 bestand (lvr1jr01) 155.832 records LVR1 2002 bestand (lvr1jr02) 162.649 records Aterme datum voor dec 2000 150.064 records Geboortes buiten 2002 283 records LVR1 2001 records die mogelijk met LVR1 2002 records kunnen koppelen 5.142 records LVR1 2002 bestand 162.366 records LVR1 2002 bestand 167.508 records Blocking geboortedatum moeder Administratieve dubbeltellingen 319 records Blocking postcode moeder Administratieve dubbeltellingen 6 records Opgeschoond LVR1 2002 bestand 167.183 records Opslaan opgeschoond lvr1 2002 bestand Z:\jaarbestand\SASjaar\LVR1\ lvr1_opgeschoond.sas Figuur 1 Flowchart LVR1 ^ LVR1 koppeling 7

2. Koppeling LVR2 ^ LVR2 Het doel van de toegepaste interne LVR2 ^ LVR2 koppeling is het verwijderen van administratieve dubbeltellingen uit het LVR2 bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 11 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van de moeder gebruikt en daarna de postcode van de moeder. Het LVR2 2002 ASCII (Z:\Jaarbestand\ASCII\LVR2\lvr2jaar2002.dat) bestand wordt ingelezen en omgezet in een SAS jaarbestand (Z:\Jaarbestand\SAS jaar\lvr2\lvr2jr02.sas). Het LVR2 2002 bestand bestaat uit 122.859 records. Zie figuur 2 voor een flowchart van de LVR2 ^ LVR2 koppeling. Het LVR2 bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratie dubbeltellingen. De koppeling en selectie van administratieve dubbeltellingen vindt op dezelfde wijze plaats als bij de LVR1 koppeling. Met blocking op geboortedatum moeder worden 56 administratieve dubbeltellingen gevonden, waarvan steeds het tweede record wordt verwijderd (56 records). Er worden geen extra administratieve dubbeltellingen gevonden met blocking op postcode van de moeder. Van de 122.859 LVR2 records zijn nu 56 administratieve dubbeltellingen verwijderd, waardoor er nog 122.803 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het sleutelbestand op positie 2 (g_admin1) na positie 1 waar de recordidentificatie (g_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LVR2 2002 bestand wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr2_opgeschoond Vergelijking 2002 met 2001 De koppeling is gecombineerd uitgevoerd voor eenlingen en meerlingen, waar dit voor 2001 apart gebeurde. Het aantal gevonden administratieve dubbeltellingen is vergelijkbaar en de dubbele blocking leverde hier geen extra paren op. De methode is ook hier iets vereenvoudigd door geen vectoren te definiëren (combinaties van variabelen die wel of niet overeenkomen), maar alleen te kijken naar het aantal variabelen dat overeenkomt. 8

Inlezen LVR2 2002 bestand Z:\Jaarbestand\SAS jaar\lvr2\lvr2jaar2002.dat LVR2 2002 bestand 122.859 records Blocking geboortedatum moeder Administratieve dubbeltellingen 56 records Blocking postcode moeder Administratieve dubbeltellingen 0 records Opgeschoond LVR2 2002 bestand 122.803 records Opslaan opgeschoond LVR2 2002 bestand Z:\Jaarbestand\SAS jaar\lvr2\lvr2_opgeschoond.sas Figuur 2 Flowchart LVR2 ^ LVR2 koppeling 9

3. Koppeling LNR ^ LNR 3.1 Koppeling LNR ^ LNR voor verwijderen administratieve dubbeltellingen Het doel van de toegepaste interne LNR ^ LNR koppeling is het verwijderen van administratieve dubbeltellingen uit het LNR bestand. De methodiek van deze koppeling is een deterministische koppeling. De koppeling vond plaats op basis van 10 koppelvariabelen. Als blocking-variabele is eerst de geboortedatum van het kind gebruikt en daarna de postcode van de moeder. Het LNR 2002 ASCII (Z:\Jaarbestand\ASCII\LNR\lnrjaar2002.dat) bestand wordt ingelezen en omgezet in een SAS jaarbestand (Z:\Jaarbestand\SAS jaar\lnr\lnrjaar2002.sas). Het LNR 2002 bestand bestaat uit 31.996 records. Zie figuur 3A voor een flowchart van de LNR ^ LNR koppeling. Het LNR bestand wordt deterministisch met zichzelf gekoppeld voor het vinden van administratieve dubbeltellingen. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (1.436.981 paren). Voor de koppeling worden de volgende 11 variabelen vergeleken: postcode moeder (geboortedatum kind bij blocking op postcode), geboortedatum moeder, amenorroeduur, gewicht, geslacht, datum opname, datum ontslag, lnr praktijkcode, meerlingcode en omvang meerling. Records worden als een administratieve dubbeltelling beschouwd als alle variabelen overeenkomen of geboortedatum moeder niet overeenkomt maar alle andere variabelen wel. Op deze manier worden 37 administratieve dubbeltellingen en 1 administratieve trippel gevonden, waarvan steeds het tweede record verwijderd wordt (39 records, bij de administratieve trippel worden 2 records verwijderd; het tweede en derde record). De niet-gekoppelde records worden vervolgens nog gekoppeld met blocking op postcode moeder. Hierbij worden geen extra administratieve dubbeltellingen gevonden. Van de 31.996 LNR records zijn nu 39 administratieve dubbeltellingen verwijderd, waardoor er nog 31.957 records over zijn. De recordidentificaties van de verwijderde administratieve dubbeltellingen records, staan beschreven in het sleutelbestand op positie 2 (n_admin1) na positie 1 waar de recordidentificatie (n_recid) staat van het record waar het een administratieve dubbeltelling van is. Het opgeschoonde LNR 2002 bestand wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lnr_opgeschoond Vergelijking 2002 met 2001 Er is nog geen externe validatie uitgevoerd van de interne LNR ^ LNR koppeling, zodat deze vergelijking onder meer voorbehoud is dan de vergelijking in 1 en 2. In vergelijking met 2001 worden minder variabelen vergeleken (11 i.p.v. 15 variabelen), maar is de gehanteerde methode strenger. De variabelen die niet meer worden vergeleken zijn: patiëntnummer praktijk, patiëntnummer ziekenhuis, plaats geboorte en volgnummer van kind in praktijk. De handmatige beoordeling van 2001 is volledig vervangen door het algoritme, wat alleen beoordeelt op basis van het aantal variabelen dat overeenkomt. Het aantal gevonden administratieve dubbeltellingen is vergelijkbaar (39 t.o. 48 records). 10

Inlezen LNR 2002 bestand Z:\jaarbestand\SAS jaar\lnr\lnr2002.dat LNR 2002 bestand 31.996 records Blocking op geboortedatum kind Administratieve dubbeltellingen 39 records Blocking op postcode moeder Administratieve dubbeltellingen 0 records Opgeschoond LNR 2002 bestand 31.957 records LNR Meerlingen bestand 3.326 records LNR Eenlingen bestand 28.631 records Blocking op geboortedatum kind LNR ^ LNR links 1.148.152 paren LNR ^ LNR paren boven afkappunt 2.524 paren LNR records van kinderen die 1 keer zijn opgenomen 24.917 records Blocking op postcode moeder LNR ^ LNR links 418.733 paren LNR ^ LNR paren boven afkappunt 6 paren Records van eenling kinderen die 1 keer zijn opgenomen 24.917 records Totaal LNR ^ LNR paren boven afkappunt 2.530 paren Oplossen ties 1.653 clusters 2.530 paren Records van eenling kinderen die meedere keren zijn opgenomen 3.714 records Records van eenling kinderen die 1 keer zijn opgenomen 24.917 records LNR 2002 eenlingen bestand 28.631 records Opslaan LNR 2002 eenlingen bestand Z:\jaarbestand\SASjaar\LNR\lnr_2002_singleton.sas Figuur 3A Flowchart LNR ^ LNR eenling koppeling 11

3.2 Koppeling LNR ^ LNR voor vinden van heropnames Het doel van de toegepaste interne LNR ^ LNR koppeling is het vinden van heropnames behorend bij hetzelfde kind in het LNR bestand. De methodiek van deze koppeling is een probabilistische koppeling op basis van 8 koppelvariabelen, apart voor eenlingen en meerlingen. Als blocking-variabele is eerst de geboortedatum van het kind gebruikt en daarna de postcode van de moeder. 3.2.1 Koppeling LNR ^ LNR voor vinden van heropnames bij eenlingen Het opgeschoonde LNR bestand wordt ingelezen vanaf Z:\Jaarbestand\SAS jaar\lnr\lnr2002_schoon. Uit dit bestand worden de eenling records geselecteerd (28.631 records). Zie figuur 3A voor de flowchart van de LNR ^ LNR eenling koppeling. Het LNR bestand wordt probabilistisch met zichzelf gekoppeld voor het vinden van heropnames. De koppeling wordt eerst uitgevoerd met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (1.148.152 paren). Voor de koppeling worden de volgende 8 variabelen vergeleken (zie Tabel 3.1): geboortedatum moeder, amenorroeduur in weken, postcode (geboortedatum kind bij blocking op postcode), gewicht, geslacht, Apgarscore na 5 minuten en patiëntidentificatie. Voor de variabele geboortegewicht wordt naast een full match ook een close gedefinieerd. Er is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 100 gram. Tabel 3.1 Frequentietabel koppelvariabelen LNR ^ LNR heropnames eenlingen (n=24.362) Variabele label Variabele naam Aantal missend % Missend Geboortedatum kind n_ddgebkind 0 Geboortedatum moeder n_ddgebmoe 3.509 14% Amenorroeduur in weken n_amww 0 Postcode (4 cijfers) n_pc 257 1% Gewicht kind n_gew 212 1% Geslacht kind n_gesl 0 Apgar score na 5 minuten n_apgar_5 1.472 6% Patiëntidentificatie n_patid 0 Tabel 3.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de u i en m i waarden. De u i waarden zijn berekend op basis van de randtotalen en de m i waarden op basis van fitting met een non-lineaire procedure. Tabel 3.2 Gewichten koppelvariabelen LNR ^ LNR heropnames eenlingen Variabele m i waarden u i waarden Gewicht bij overeenstemming Gewicht bij geen overeenstemming Geboortedatum moeder 0,9644 0,000213 12,14-4,81 Amenorroeduur in weken 0,9727 0,1228 2,99-5,01 Postcode (4 cijfers) 0,9841 0,00109 9,82-5,97 Gewicht kind (full) 0,8143 0,00242 8,39-5,19 Gewicht kind (+/- 100 gr) 0,1603 0,0733 1,13 Geslacht kind 0,9785 0,504 0,96-4,53 Apgarscore na 5 minuten 0,9534 0,37503 1,35-3,75 Patiëntidentificatie 0,5243 0,000046 13,48-1,07 Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht je 0.00188 * 1.148.152 = 2.159 matches te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 6.5 gekozen en worden 2.524 paren geselecteerd als match. 12

Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder hetzelfde is (418.733 paren). De u i en m i waarden en daarmee ook de gewichten bij (geen) overeenstemming komen nagenoeg overeen met blocking op geboortedatum kind. De u i waarde voor geboortedatum kind is 0.00285 en de m i waarde 0.9952, het gewicht bij overeenstemming is 8,45 en bij geen overeenstemming -7,70. Paren boven het afkappunt van 6.5 en waarbij de geboortedatum van het kind niet overeenkomt worden geselecteerd (6 paren). In totaal zijn er 2.530 paren geselecteerd als matches. Er worden clusters aangemaakt van deze paren om alle heropnames van een kind bij elkaar te vinden. In totaal zijn er 1.653 kinderen die meer dan één keer zijn opgenomen (1.301 kinderen die twee keer zijn opgenomen, 305 kinderen die drie keer zijn opgenomen, 39 kinderen die vier keer zijn opgenomen, 7 kinderen die vijf keer zijn opgenomen en 1 kind dat zes keer is opgenomen). Het overgebleven LNR eenlingen bestand (24.917 records) bestaat uit kinderen die één keer zijn opgenomen. Het uiteindelijke LNR 2002 eenlingen bestand bestaat uit de samenvoeging van het bestand van kinderen die één keer zijn opgenomen (24.917 records) en het bestand van de kinderen met heropnames (3.714 records van 1.653 kinderen). Dit bestand bestaat in totaal uit 28.631 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\lnr\ lnr_2002_singleton.sas Dit bestand zal gebruikt worden voor de eenlingen koppeling met het gekoppelde LVR1^LVR2 bestand. 3.2.2 Koppeling LNR ^ LNR voor vinden van heropnames bij meerlingen Het vinden van heropnames bij meerlingen gebeurt op dezelfde wijze als bij eenlingen. Nu worden alleen de meerling records geselecteerd uit het Z:\Jaarbestand\SAS jaar\lnr\lnr2002_schoon bestand (3.326 records). Zie figuur 3B voor een flowchart van de LNR^LNR meerlingen koppeling. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (17.930 paren). Naast de 8 variabelen die worden vergeleken bij de eenlingen koppeling, wordt hier ook gekeken naar de meerlingcode en omvang meerling. Alle paren boven het afkappunt 6.5 (op basis van eenlingen koppeling) waar de meerling code en omvang meerling gelijk is en alle paren met een totaalgewicht groter dan 34, worden geselecteerd als match (677 paren). Blocking op postcode moeder levert geen extra paren op. Er worden clusters aangemaakt van de 677 paren om alle heropnames van een kind bij elkaar te vinden. In totaal zijn er 447 kinderen die meer dan één keer zijn opgenomen (361 kinderen die twee keer zijn opgenomen, 61 kinderen die drie keer zijn opgenomen, 22 kinderen die vier keer zijn opgenomen, 2 kinderen die vijf keer zijn opgenomen en 1 kind dat acht keer is opgenomen). Het overgebleven LNR meerlingen bestand (2.315 records) bestaat uit kinderen die één keer zijn opgenomen. Het uiteindelijke LNR 2002 meerlingen bestand bestaat uit de samenvoeging van het bestand van kinderen die één keer zijn opgenomen (2.315 records) en het bestand van de kinderen met heropnames (1.011 records van 447 kinderen). Dit bestand bestaat in totaal uit 3.326 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\lnr\ lnr_2002_meerling.sas Dit bestand zal gebruikt worden voor de meerlingen koppeling met het gekoppelde LVR1^LVR2 bestand. 13

Inlezen opgeschoond LNR 2002 bestand Z:\jaarbestand\SAS jaar\lnr\lnr2002_schoon.sas Opgeschoond LNR 2002 bestand 31.957 records LNR Eenlingen bestand 28.631 records LNR Meerlingen bestand 3.326 records Blocking op geboortedatum kind LNR ^ LNR links 17.930 paren LNR ^ LNR paren boven afkappunt 677 paren LNR records van kinderen die 1 keer zijn opgenomen 2.451 records Blocking op postcode moeder LNR ^ LNR links 6.901 paren LNR ^ LNR paren boven afkappunt 0 paren LNR records van kinderen die 1 keer zijn opgenomen 2.315 records Totaal LNR ^ LNR paren boven afkappunt 677 paren Oplossen ties 447 clusters 677 paren Records van meerling kinderen die meedere keren zijn opgenomen 1.011 records Records van meerling kinderen die 1 keer zijn opgenomen 2.315 records LNR 2002 meerlingen bestand 3.326 records Opslaan LNR 2002 meerlingen bestand Z:\jaarbestand\SASjaar\LNR\lnr_2002_meerling.sas Figuur 3B Flowchart LNR ^ LNR meerling koppeling 14

3.2.3 Koppeling niet-gekoppelde LNR eenlingen ^ niet-gekoppelde LNR meerlingen voor vinden van heropnames Het niet-gekoppelde LNR eenlingen bestand (24.917 records) wordt gekoppeld met het nietgekoppelde LNR meerlingen bestand (2.315 records). Met blocking op geboortedatum kind en met blocking op postcode moeder worden geen extra paren gevonden. Vergelijking 2002 met 2001 De percentages missende waarden zijn vergelijkbaar met 2001, bij 14% van de records ontbreekt de geboortedatum van de moeder. De enige verandering in de koppelvariabelen is het weglaten van de Apgarscore na 1 minuut, omdat deze variabele sterk samenhangt met de Apgarscore na vijf minuten. De close value van geboortegewicht is verruimd van 10 gram naar 100 gram na vergelijking van verschillende close values die berekend worden op basis van het bestand. Het gewicht bij overeenkomst is daardoor iets lager geworden, maar de close overeenkomst zal vaker van toepassing zijn. De aantallen zijn vergelijkbaar met 2001. 15

4. Koppeling LVR1 ^ LVR2 Het doel van de LVR1 ^ LVR2 koppeling is het koppelen van LVR1 records en LVR2 records die bij dezelfde zwangerschap horen, voor eenlingen en meerlingen afzonderlijk. De methodiek van de koppelingen is een probabilistische koppeling op basis van 10 variabelen, met blocking op geboortedatum moeder en vervolgens op postcode moeder. 4.1 Koppeling LVR1 ^ LVR2 eenlingen Het opgeschoonde LVR1 bestand wordt ingelezen (167.183 records). Uit dit bestand worden de eenlingen records geselecteerd (163.079 records). Het opgeschoonde LVR2 bestand wordt ingelezen (122.803 records). Uit dit bestand worden de eenlingen records geselecteerd (115.235 records). Zie figuur 4A voor een flowchart van de LVR1^LVR2 eenlingen koppeling. Het LVR1 en LVR2 bestand worden probabilistisch gekoppeld met blocking op geboortedatum moeder en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van de moeder overeenkomt, worden aangemaakt (3.208.148 paren). Voor de koppeling worden de volgende 10 variabelen vergeleken (zie Tabel 4.1): postcode (geboortedatum moeder bij blocking op postcode), graviditeit, geboortedatum kind, à terme datum, gewicht, geslacht, geboorte uur, plaats bevalling en geboorte minuut. Voor de variabelen geboortedatum kind, à terme datum en geboortegewicht worden naast een full match ook een close gedefinieerd. Bij geboortedatum kind is er sprake van een close als de geboortedatum niet meer dan 1 dag verschilt. Bij à terme datum is er sprake van een close als de à terme datum niet meer dan 1 week verschilt. Bij gewicht is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 10 gram. De à terme datum wordt alleen vergeleken als de geboortedatum van het kind ontbreekt. De plaats bevalling wordt alleen vergeleken als de postcode van de moeder ontbreekt of niet overeenkomt. Tabel 4.1 Frequentietabel koppelvariabelen LVR1 ^ LVR2 eenlingen Variabele label Variabele naam Aantal missend % Missend LVR1 (n=163.079) Geboortedatum moeder v_ddgebmoe 200 0,1% Postcode moeder (4 cijfers) v_kop_pc 594 0,4% Graviditeit v_grav 31 <0,1% Geboortedatum kind* v_ddgebkind 17.236 11% À terme datum v_ddaterm 18.570 11% Gewicht kind* v_kop_gew 17.588 11% Geslacht kind* v_kop_gesl 17.543 11% Geboorte uur kind* v_gebuur 17.310 11% Ziekenhuisnummer bevalling* v_klin 61.482 38% Geboorte minuut* v_gebmin 17.308 11% LVR2 (n=115.235) Geboortedatum moeder g_ddgebmoe 1 <0,1% Postcode moeder (4 cijfers) g_kop_pc 127 0,1% Graviditeit g_grav 3 <0,1% Geboortedatum kind g_ddgebkind 0 À terme datum g_ddaterm 7 <0,1% Gewicht kind g_kop_gew 28 <0,1% Geslacht kind g_kop_gesl 211 0,2% Geboorte uur kind g_gebuur 0 Lvr-nummer praktijk g_lvr 0 Geboorte minuut g_gebmin 0 * Missend is hier soms het gevolg van het terecht (logisch) ontbreken van informatie, een hoog missing percentage betekent in deze gevallen dus niet een op voorhand lage data kwaliteit. 16

Inlezen LVR1 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_opgeschoond.sas Inlezen LVR2 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr2_opgeschoond.sas LVR1 2002 meerlingen bestand 4.104 records LVR1 2002 bestand 167.183 records LVR1 2002 eenlingen records 163.079 records LVR2 2002 bestand 122.803 records LVR2 2002 eenlingen records 115.235 records LVR2 2002 meerlingen bestand 7.568 records Blocking op geboortedatum moeder LVR1 ^ LVR2 links 3.208.148 paren Niet gekoppelde LVR1 eenlingen records 83.749 records LVR1 ^ LVR2 paren boven afkappunt 79.337 paren Niet gekoppelde LVR2 eenlingen records 36.929 records LVR1 records niet gekoppeld 495 records Oplossen ties 1021 clusters 2.059 paren LVR2 records niet gekoppeld 5 records LVR1 Administratieve dubbeltellingen 536 records LVR1 ^ LVR2 matches Na oplossen ties 1.021 paren LVR1 ^ LVR2 matches Niet in de clusters 77.278 paren LVR2 administratieve dubbeltellingen 2 records LVR1 ^ LVR2 matches 78.299 paren Niet gekoppelde LVR1 eenlingen records 84.244 records Niet gekoppelde LVR2 eenlingen records 36.934 records Blocking op postcode moeder LVR1 ^ LVR2 links 1.078.382 paren Niet gekoppelde LVR1 eenlingen records 83.123 records LVR1 ^ LVR2 paren boven afkappunt en geboortedatum moeder ongelijk 1.121 paren Niet gekoppelde LVR2 eenlingen records 35.814 records LVR1 records niet gekoppeld 1 record Oplossen ties 1 clusters 2 paren LVR2 records niet gekoppeld 0 records Niet gekoppelde LVR1 records uit 2001 4.820 records LVR1 ^ LVR2 matches Na oplossen ties 1 paar LVR1 ^ LVR2 matches Niet in de clusters 1.119 paren Blocking op postcode moeder LVR1 ^ LVR2 matches 1.120 paren Niet gekoppelde LVR1 eenlingen records 78.304 records LVR1 ^ LVR2 matches 79.419 paren Niet gekoppelde LVR2 eenlingen records 35.814 records LVR1^LVR2 gekoppeld eenlingen bestand 193.537 records Opslaan gekoppeld lvr1^lvr2 2002 eenlingen bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\ lvr1_lvr2_2002_singleton.sas Figuur 4A Flowchart LVR1 ^ LVR2 eenlingen koppeling 17

Tabel 4.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de u i en m i waarden. De u i waarden zijn berekend op basis van de randtotalen en de m i waarden op basis van fitting met een non-lineaire procedure. Tabel 4.2 Gewichten koppelvariabelen LVR1 ^ LVR2 eenlingen Variabele m i waarden u i waarden Gewicht bij overeenstemming Gewicht bij geen overeenstemming Postcode (4 cijfers) 0,9573 0,00056 10,74-4,57 Graviditeit 0,9457 0,30156 1,65-3,69 Geboortedatum kind (full) 0,9780 0,00276 8,47-7,28 Geboortedatum kind (± 1dg) 0,0156 0,0055 1,50 À terme datum (full) 0,8877 0,0027 8,36-5,79 À terme datum (± 7 dgn) 0,0949 0,0371 1,35 Gewicht kind (full) 0,9356 0,0037 7,98-4,44 Gewicht kind (± 10 gr) 0,0191 0,0102 0,91 Geslacht kind 0,9918 0,50059 0,99-5,93 Geboorte uur kind 0,9701 0,04298 4,50-5,00 Plaats bevalling 0,8818 0,00638 7,11-3,07 Geboorte minuut 0,9173 0,01798 5,67-3,57 Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht je 0,0247 * 3.208.148 = 79.241 matches te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 15,4 gekozen en worden 79.337 paren geselecteerd als match. Er worden clusters aangemaakt van de records die min of meer even goed met twee of meer records uit het andere bestand koppelen. In totaal zijn er 77.278 paren die uniek gekoppeld zijn en 2.059 paren die in de clusters terecht komen (1.005 clusters met 2 paren, 15 clusters met 3 paren en 1 cluster met 4 paren). De clusters worden bekeken en administratieve dubbeltellingen worden alsnog verwijderd (536 LVR1 records en 2 LVR2 records). Vervolgens wordt van iedere cluster het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 1.021 paren geselecteerd als match en bestaat het totale match bestand uit 78.299 recordparen (77.278 + 1.021). De gekoppelde LVR1 records worden verwijderd uit het LVR1 eenlingen bestand dat nu nog bestaat uit 84.244 records (163.079 78.299 536) De gekoppelde LVR2 records worden verwijderd uit het LVR2 eenlingen bestand dat nu nog bestaat uit 36.934 records (115.235 78.299 2). Deze bestanden worden vervolgens gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode moeder overeenkomt worden aangemaakt (1.078.382 paren). Paren boven het afkappunt van 13.7 en waarbij de geboortedatum van de moeder niet overeenkomt worden geselecteerd (1.121 paren). Er worden clusters aangemaakt en er is één cluster met twee paren, waarvan alleen het paar met het hoogste gewicht wordt geselecteerd. Er worden dus 1.120 extra paren gevonden met blocking op postcode moeder. Het totale aantal matches is 78.299 + 1.120 = 79.419 paren. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR1 eenlingen bestand, dat nu nog uit 83.124 records bestaat (84.244 1.120). Uit dit bestand worden de 4.820 records uit 2001 verwijderd, waardoor het niet-gekoppelde LVR1 bestand bestaat uit 78.304 records. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR2 eenlingen bestand, dat nu nog uit 35.814 records bestaat (36.934 1.120). Het totale gekoppelde LVR1^LVR2 eenlingen bestand bestaat uit de niet-gekoppelde LVR1 records (78.304), de gekoppelde LVR1^LVR2 records (79.419) en de niet-gekoppelde LVR2 records (35.814). Het gekoppelde eenlingen bestand bestaat uit 193.537 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_lvr2_2002_singleton.sas 18

Vergelijking 2002 met 2001 Het percentage missende waarden per variabele in het LVR1 en LVR2 bestand is nagenoeg gelijk aan 2001. De wijzigingen in de koppelvariabelen hebben geen invloed op de gewichten. Door het verwijderen van de afhankelijke variabelen uit de koppelsleutel zal overeenkomst op twee afhankelijke variabele nooit een dubbele beloning opleveren, net zo min als geen overeenkomst een dubbele straf zal opleveren. De dubbele blocking hier levert 1.120 extra paren op. In totaal is het aantal gevonden LVR1^LVR2 matches vergelijkbaar met 2001. 4.2 Koppeling LVR1 ^ LVR2 meerlingen De meerling records worden geselecteerd uit het opgeschoonde LVR1 bestand (4.104 records). De meerling records worden geselecteerd uit het opgeschoonde LVR2 bestand (7.568 records). Zie figuur 4B voor een flowchart van de LVR1 ^ LVR2 meerlingen koppeling. De meerling koppeling wordt op dezelfde manier uitgevoerd als de eenling koppeling, alleen wordt er nu ook gekeken naar de meerling code en omvang meerling. De u i en m i waarden die op basis van het eenlingen bestand zijn berekend worden ook hier gebruikt. Alle paren waarbij de geboortedatum van de moeder hetzelfde is, worden aangemaakt (13.122 paren). Het afkappunt van de eenling koppeling wordt aangehouden. Alle paren boven het afkappunt van 15.4 en waarbij de meerling code en omvang meerling overeenkomen, worden geselecteerd als match (3.315 paren). Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 3.283 paren die uniek gekoppeld zijn en 32 paren die in de clusters terecht komen (16 clusters met 2 paren). Van iedere cluster wordt alleen het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 16 paren geselecteerd als match en bestaat het totale match bestand uit 3.299 recordparen. De gekoppelde LVR1 records worden verwijderd uit het LVR1 eenlingen bestand dat nu nog bestaat uit 805 records (4.104 3.299). De gekoppelde LVR2 records worden verwijderd uit het LVR2 eenlingen bestand dat nu nog bestaat uit 4.269 records (7.568 3.299). Deze bestanden worden vervolgens gekoppeld met blocking op postcode moeder. Alle paren waarbij de postcode moeder overeenkomt worden aangemaakt (2.261 paren). Paren boven het afkappunt van 14 en waarbij de geboortedatum van de moeder niet overeenkomt worden geselecteerd (39 paren). Er zijn geen clusters. Er worden dus 39 extra paren gevonden met blocking op postcode moeder. Het totale aantal matches is 3.299 + 39 = 3.338 paren. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR1 eenlingen bestand, dat nu nog uit 766 records bestaat (805-39). Uit dit bestand worden de 136 records uit 2001 verwijderd, waardoor het niet-gekoppelde LVR1 bestand bestaat uit 630 records. De records die gekoppeld zijn met blocking op postcode moeder worden verwijderd uit het LVR2 eenlingen bestand, dat nu nog uit 4.230 records bestaat (4.269-39). Het totale gekoppelde LVR1^LVR2 meerlingen bestand bestaat uit de niet-gekoppelde LVR1 records (630), de gekoppelde LVR1^LVR2 records (3.338) en de niet-gekoppelde LVR2 records (4.230). Het gekoppelde bestand bestaat uit 8.198 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_lvr2_2002_meerling.sas 19

Inlezen opgeschoond LVR1 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_opgeschoond.sas Inlezen opgeschoond LVR2 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr2_opgeschoond.sas LVR1 2002 eenlingen records 163.079 records LVR1 2002 bestand 167.183 records LVR2 2002 bestand 122.803 records LVR2 2002 eenlingen records 115.235 records LVR1 2002 meerlingen bestand 4.104 records LVR2 2002 meerlingen bestand 7.568 records Blocking op geboortedatum moeder LVR1 ^ LVR2 links 13.122 paren Niet gekoppelde LVR1 meerlingen records 789 records LVR1 ^ LVR2 paren boven afkappunt 3.315 paren Niet gekoppelde LVR2 meerlingen records 4.269 records LVR1 records niet gekoppeld 16 records Oplossen ties 32 paren 16 clusters LVR2 records niet gekoppeld 0 records LVR1 ^ LVR2 matches Na oplossen ties 16 paren LVR1 ^ LVR2 matches Niet in de clusters 3.283 paren LVR1 ^ LVR2 matches 3.299 paren Niet gekoppelde LVR1 meerlingen records 805 records Niet gekoppelde LVR2 meerlingen records 4.269 records Blocking op postcode moeder LVR1 ^ LVR2 links 2.261 paren Niet gekoppelde LVR1 eenlingen records 766 records LVR1 ^ LVR2 paren boven afkappunt en geboortedatum moeder ongelijk 39 paren Niet gekoppelde LVR2 eenlingen records 4.230 records Niet gekoppelde LVR1 records uit 2001 136 records Blocking op postcode moeder LVR1 ^ LVR2 matches 39 paren Niet gekoppelde LVR1 meerlingen records 630 records LVR1 ^ LVR2 matches 3.338 paren Niet gekoppelde LVR2 meerlingen records 4.230 records LVR1^LVR2 gekoppeld meerlingen bestand 8.198 records Opslaan gekoppeld lvr1^lvr2 2002 meerlingen bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\ lvr1_lvr2_2002_meerling.sas Figuur 4B Flowchart LVR1 ^ LVR2 meerlingen koppeling 20

4.3 Koppeling niet-gekoppelde LVR1 eenlingen met LVR2 meerlingen Het niet-gekoppelde LVR1 eenlingen bestand (78.304 records) wordt gekoppeld met het nietgekoppelde LVR2 meerlingen bestand (4.230 records). Bij blocking op geboortedatum moeder worden 84 matches gevonden boven het afkappunt van 31. Blocking op postcode moeder levert nog 3 extra paren. In totaal zijn er dus 87 matches. 4.4 Koppeling niet-gekoppelde LVR1 meerlingen met LVR2 eenlingen Het niet-gekoppelde LVR1 meerlingen bestand (630 records) wordt gekoppeld met het nietgekoppelde LVR2 eenlingen bestand (35.814 records). Bij blocking op geboortedatum moeder worden 24 matches gevonden boven het afkappunt van 34. Blocking op postcode moeder levert geen extra paren. In totaal zijn er dus 24 matches. 4.5 Creatie LVR1^LVR2 eindbestand Uit het LVR1^LVR2 eenlingen eindbestand (193.537 records) worden de records verwijderd die nog gekoppeld zijn bij de koppeling van niet-gekoppelde eenlingen met meerlingen (111 paren). Het LVR1^LVR2 eenlingen eindbestand bestaat uit 193.426 records. De gevonden matches bij de koppeling van niet-gekoppelde eenlingen met meerlingen worden toegevoegd aan het meerlingen eindbestand (111 paren). Tevens worden de records die nog gekoppeld zijn, verwijderd uit het meerlingen eindbestand (111 records). Het LVR1^LVR2 eindbestand bestaat uit 8.198 records. Vergelijking 2002 met 2001 Er is nu dubbele blocking toegepast bij de meerling koppeling, terwijl er voor 2001 geen blocking werd toegepast. Het resultaat zal nagenoeg hetzelfde zijn, omdat alleen records waar de geboortedatum van de moeder én de postcode van de moeder niet overeenkomen (of missen) nu niet kunnen koppelen. Bovendien zal het totaalgewicht van paren waarbij de geboortedatum van de moeder en de postcode van de moeder niet overeenkomen, nooit hoog genoeg zijn om boven het afkappunt te komen. Het aantal gevonden matches is iets hoger dan voor 2001 (81.3% van de LVR1 records zijn gekoppeld, t.o. 77.7% voor 2001). De matches die nog gevonden worden bij de koppeling van niet-gekoppelde eenlingen records met niet-gekoppelde meerlingen records, worden toegevoegd aan het LVR12 meerlingen bestand voor 2002. Dit was voor 2001 nog niet het geval en levert hier 111 extra paren op. 21

5. Koppeling (LVR1 ^ LVR2) ^ LNR Het doel van de (LVR1 ^ LVR2) ^ LNR koppeling is het koppelen van LVR12 records en LNR records die bij dezelfde moeder en kind horen voor eenlingen en meerlingen. De methodiek van de koppelingen is een probabilistische koppeling op basis van 7 variabelen, met blocking op geboortedatum kind en vervolgens op postcode moeder. De vergelijking met 2001 is hier wederom onder meer voorbehoud dan bij de LVR1 ^ LVR2 koppeling, omdat er nog geen externe validatie heeft plaatsgevonden van de (LVR1^LVR2)^LNR koppeling. 5.1 Koppeling (LVR1 ^ LVR2) ^ LNR eenlingen Het gekoppelde LVR12 eenlingen bestand (193.426 records) en het gekoppelde LNR eenlingen bestand (28.631 records) wordt ingelezen. Uit het gekoppelde LNR bestand wordt van ieder kind maar één record geselecteerd (26.570 records). Zie figuur 5A voor een flowchart van de (LVR1^LVR2)^LNR eenlingen koppeling. Het LVR12 en LNR bestand worden probabilistisch gekoppeld met blocking op geboortedatum kind en vervolgens met blocking op postcode moeder. Alle paren waarbij de geboortedatum van het kind overeenkomt, worden aangemaakt (13.560.744 paren). Voor de koppeling worden de volgende 7 variabelen vergeleken (zie Tabel 5.1): postcode (geboortedatum kind bij blocking op postcode), geboortedatum moeder, zwangerschapsduur in weken, gewicht, geslacht en Apgarscore na 5 minuten. Voor de variabele geboortegewicht wordt naast een full match ook een close gedefinieerd, er is sprake van een close als het verschil in gewicht kleiner of gelijk is aan 50 gram. Tabel 5.1 Frequentietabel koppelvariabelen LVR12 ^ LNR eenlingen Variabele label Variabele naam Aantal missend % Missend LVR12 (n=193.714) Geboortedatum kind vg_ddgebkind 10545 5,4% Postcode moeder (4 cijfers) vg_pc 393 0,2% Geboortedatum moeder vg_ddgebmoe 191 0,1% Zwangerschapsduur in weken vg_amwk 12941 6,7% Gewicht kind vg_gew 10710 5,5% Geslacht kind vg_gesl 10867 5,6% Apgarscore na 5 minuten vg_apg 10876 5,6% LNR (n=26.570) Geboortedatum kind n_ddgebkind 0 0,0% Postcode moeder (4 cijfers) n_pc 234 0,9% Geboortedatum moeder n_ddgebmoe 2764 10,4% Zwangerschapsduur in weken n_amww 0 0,0% Gewicht kind n_gew 192 0,7% Geslacht kind n_gesl 0 0,0% Apgarscore na 5 minuten n_apg 1303 4,9% 22

Inlezen LVR12 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_lvr2_2002_singleton.sas Inlezen LNR 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\lnr_2002_singleton.sas LVR12 2002 eenlingen bestand 193.426 records LNR 2002 eenlingen bestand 28.631 records LNR 2002 eenlingen bestand 1 record per kind 26.570 records Heropnames 2.061 records Blocking op geboortedatum kind LVR12 ^ LNR links 13.560.744 paren Niet gekoppelde LVR12 eenlingen records 165.489 records LVR12 ^ LNR paren boven afkappunt 28.759 paren Niet gekoppelde LNR eenlingen records 1.371 records Blocking op postcode moeder LVR12 ^ LNR links 2.826.062 paren Niet gekoppelde LVR12 eenlingen records 165.165 records LVR12 ^ LNR paren boven afkappunt 335 paren Niet gekoppelde LNR eenlingen records 1.116 records Totaal LVR12 ^ LNR paren boven afkappunt 29.094 paren LVR12 records niet gekoppeld 2.889 records Oplossen ties 3.016 clusters 7.331 paren LNR records niet gekoppeld 82 records LVR12 ^ LNR matches Na oplossen ties 3.609 paren LVR12 ^ LNR matches Niet in de clusters 21.763 paren Niet gekoppelde LVR12 eenlingen records 168.054 records LVR12 ^ LNR matches 25.372 paren Niet gekoppelde LNR eenlingen records 1.198 records LVR12^LNR gekoppeld eenlingen bestand 194.624 records Opslaan gekoppeld LVR12^LNR 2002 eenlingen bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\ lvr1_lvr2_lnr_2002_singleton.sas Figuur 5A Flowchart (LVR1 ^ LVR2) ^ LNR eenlingen koppeling 23

Tabel 5.2 geeft de gewichten bij overeenstemming en geen overeenstemming weer, die berekend zijn op basis van de u i en m i waarden. De u i waarden zijn berekend op basis van de randtotalen en de m i waarden op basis van fitting met een non-lineaire procedure. Tabel 5.2 Gewichten koppelvariabelen LVR12 ^ LNR eenlingen blocking op geboortedatum kind Variabele m i waarden u i waarden Gewicht bij overeenstemming Gewicht bij geen overeenstemming Postcode moeder 0,9661 0,0005 12,46-4,88 Geboortedatum moeder 0,9753 0,0002 10,81-5,34 Zwangerschapsduur in 2,64-3,72 weken 0,9355 0,1498 Gewicht kind (full) 0,8864 0,0030 8,19-4,71 Gewicht kind (± 50 gr) 0,0771 0,0428 0,85 Geslacht kind 0,9846 0,5013 0,97-5,02 Apgarscore na 5 minuten 0,8836 0,4580 0,95-2,22 Op basis van de geschatte prevalentie van het aantal matches berekend met de fitting procedure verwacht je 0.00212 * 13.560.744 = 28.749 matches te vinden. Op basis van de geschatte prevalentie wordt een afkappunt van 2.56 gekozen en worden 28.759 paren geselecteerd als match. Vervolgens worden alle paren aangemaakt waarbij de postcode van de moeder overeenkomt (2.826.062 paren). Paren boven het afkappunt van 13 en waarbij de geboortedatum van het kind niet overeenkomt, worden geselecteerd (335 paren). Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 21.763 paren die uniek gekoppeld zijn en 7.331 paren die in de clusters terecht komen (3.016 clusters). Vervolgens wordt van iedere cluster het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 3.609 paren geselecteerd als match en bestaat het totale match bestand uit 25.372 recordparen (21.763 + 3.609). De gekoppelde LVR12 records worden verwijderd uit het LVR12 eenlingen bestand dat nu nog bestaat uit 168.054 records (193.426 25.372). De gekoppelde LNR records worden verwijderd uit het LNR eenlingen bestand dat nu nog bestaat uit 1.198 records (26.570 25.372). Het totale gekoppelde LVR12^LNR eenlingen bestand bestaat uit de niet-gekoppelde LVR12 records (168.054), de gekoppelde LVR12^LNR records (25.372) en de niet-gekoppelde LNR records (1.198). Het gekoppelde eenlingen bestand bestaat uit 194.624 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_lvr2_lnr_singleton.sas 5.2 Koppeling LVR12 ^ LNR meerlingen Het gekoppelde LVR12 meerlingen bestand (8.198 records) en het gekoppelde LNR meerlingen bestand (3.326 records) wordt ingelezen. Uit het gekoppelde LNR bestand wordt van ieder kind maar één record geselecteerd (2.762 records). Zie figuur 5B voor een flowchart van de LVR12 ^ LNR meerlingen koppeling. De meerling koppeling wordt op dezelfde manier uitgevoerd als de eenling koppeling, alleen wordt er nu ook gekeken naar de meerling code en omvang meerling. De u i en m i waarden die op basis van het eenlingen bestand zijn berekend worden ook hier gebruikt. Alle paren waarbij de geboortedatum van het kind hetzelfde is, worden aangemaakt (68.330 paren). Het afkappunt van de eenling koppeling wordt aangehouden. Alle paren met een totaalgewicht groter of gelijk aan 2.55 en waarbij de meerling code en omvang meerling overeenkomen, worden geselecteerd als match (2.805 paren). Vervolgens worden alle paren 24

aangemaakt waarbij de postcode van de moeder overeenkomt (17.810 paren). Hiervan worden nog 45 extra paren meegenomen. Het totale match bestand bestaat nu uit 2.850 paren. Er worden clusters aangemaakt van de records die met twee of meer records uit het andere bestand koppelen. In totaal zijn er 2.372 paren die uniek gekoppeld zijn en 478 paren die in de clusters terecht komen (200 clusters). Van iedere cluster wordt alleen het recordpaar met het hoogste gewicht meegenomen. Na het oplossen van de clusters zijn er 254 paren geselecteerd als match en bestaat het totale match bestand uit 2.626 (2.372 + 254) recordparen. De gekoppelde LVR12 records worden verwijderd uit het LVR12 meerlingen bestand dat nu nog bestaat uit 5.572 records. De gekoppelde LNR records worden verwijderd uit het LNR meerlingen bestand dat nu nog bestaat uit 136 records. Het totale gekoppelde LVR12^LNR meerlingen bestand bestaat uit de niet-gekoppelde LVR12 records (5.572), de gekoppelde LVR12^LNR records (2.626) en de niet-gekoppelde LNR records (136). Het gekoppelde bestand bestaat uit 8.334 records en wordt weggeschreven naar: Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_lvr2_lnr_2002_meerling.sas 25

Inlezen LVR12 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\lvr1_lvr2_2002_meerling.sas Inlezen LNR 2002 bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\lnr_2002_meerling.sas LVR12 2002 meerlingen bestand 8.198 records LNR 2002 meerlingen bestand 3.326 records LNR 2002 meerlingen bestand 1 record per kind 2.762 records Heropnames 564 records Blocking op geboortedatum kind LVR12 ^ LNR links 68.330 paren Niet gekoppelde LVR12 meerlingen records 5.476 records LVR12 ^ LNR paren boven afkappunt 2.805 paren Niet gekoppelde LNR meerlingen records 143 records Blocking op postcode moeder LVR12 ^ LNR links 17.810 paren Niet gekoppelde LVR12 meerlingen records 5.433 records LVR12 ^ LNR paren boven afkappunt 45 paren Niet gekoppelde LNR meerlingen records 113 records Totaal LVR12 ^ LNR paren boven afkappunt 2.850 paren LVR12 records niet gekoppeld 143 records Oplossen ties 200 clusters 478 paren LNR records niet gekoppeld 23 records LVR12 ^ LNR matches Na oplossen ties 254 paren LVR12 ^ LNR matches Niet in de clusters 2.372 paren Niet gekoppelde LVR12 meerlingen records 5.572 records LVR12 ^ LNR matches 2.626 paren Niet gekoppelde LNR meerlingen records 136 records LVR12^LNR gekoppeld meerlingen bestand 8.334 records Opslaan gekoppeld lvr12^lnr 2002 meerlingen bestand Z:\Jaarbestand\SAS jaar\gekoppelde bestanden\2002\ lvr1_lvr2_lnr_2002_meerling.sas Figuur 5B Flowchart (LVR1 ^ LVR2) ^ LNR meerlingen koppeling 26

5.3 Koppeling niet-gekoppelde LVR12 eenlingen met LNR meerlingen Het niet-gekoppelde LVR12 eenlingen bestand (168.054 records) wordt gekoppeld met het niet-gekoppelde LNR meerlingen bestand (136 records). Bij blocking op geboortedatum kind worden 23 matches gevonden boven het afkappunt van 15, waarvan 2 paren in een cluster zitten. Blocking op postcode moeder levert geen extra paren. In totaal zijn er dus 22 matches. 5.4 Koppeling niet-gekoppelde LVR12 meerlingen met LNR eenlingen Het niet-gekoppelde LVR12 meerlingen bestand (5.572 records) wordt gekoppeld met het niet-gekoppelde LNR eenlingen bestand (1.198 records). Bij blocking op geboortedatum kind worden 218 matches gevonden boven het afkappunt van 17. Blocking op postcode moeder levert nog 3 extra paren. Van deze in totaal 221 paren zijn er 104 uniek en 117 die in een cluster zitten. Na oplossen van de clusters zijn er in totaal 158 matches. 5.5 Creatie eindbestand (LVR1 ^ LVR2) ^ LNR De extra gevonden matches bij de koppeling van niet-gekoppelde eenling records met meerling records (180 paren) worden verwijderd uit het LVR12^LNR eenlingen eindbestand (194.624 records). Het LVR12^LNR eenlingen eindbestand bestaat uit 194.444 records. De extra gevonden matches bij de koppeling van niet-gekoppelde eenling records met meerling records (180 paren) worden toegevoegd aan het meerlingen bestand (8.334 records). Tevens worden de records die nu nog gekoppeld zijn, verwijderd uit het meerlingen eindbestand. Het LVR12^LNR meerlingen eindbestand bestaat uit 8.334 records. Het eenlingen eindbestand en het meerlingen eindbestand vormen samen het totale eindbestand van de 2002 koppeling. Dit bestand bestaat uit 202.778 records. Vergelijking 2002 met 2001 De enige veranderingen bij deze koppeling zijn de introductie van de tweede blocking op postcode moeder en het verruimen van de close value voor geboortegewicht van 10 naar 50 gram. Het aantal gevonden matches bij de eenlingen koppeling is vergelijkbaar met 2001, bij de meerlingen koppeling zijn iets meer matches gevonden dan in 2001 (95% van de LNR records zijn gekoppeld t.o. 80% in 2001). Dit kan komen door de verfijningen in de koppelmethodiek en/of doordat de LNR^LNR koppeling beter is uitgevoerd. Dit laatste kan alleen aangetoond worden met een externe validatie van de LNR^LNR koppeling. 27

6. Beschrijving eindbestanden Als product van het PRN koppelingsproject 2002 wordt het totale gekoppelde bestand LVR1^LVR^LNR 2002 opgeleverd aan de Stichting PRN. Het totale gekoppelde bestand wordt aangeleverd in twee delen: LVR1^LVR2^(1 e opname in LNR) en een LNR^LNR bestand met alle opnames van hetzelfde kind bij elkaar. Een beschrijving van alle variabelen die in het aangeleverde gekoppelde bestand voorkomen, wordt gegeven aan het einde van dit document. Het totale gekoppelde bestand (LVR1^LVR2^(LNR 1 e opname) bestaat uit 202.778 records en 430 variabelen. Het totale gekoppelde LNR bestand (met alle LNR opnames) bestaat uit 31.957 records en 178 variabelen. Deze bestanden zijn gemaakt in SAS en worden geconverteerd naar ASCII. Deze bestanden worden in een ASCII vorm aangehouden voor de formele overdracht. Naast deze totale gekoppelde bestanden worden 2 sleutelbestanden en 3 vertaalsleutel bestanden meegeleverd. In de sleutelbestanden zijn de verschillende recordidentificatienummers binnen het totale gekoppelde bestand per record zichtbaar. In dit bestand zijn bijvoorbeeld de recordnummers van de administratieve dubbeltellingen zichtbaar. Dit sleutelbestand bevat geen overige informatie. Het aantal records van het LVR1^LVR2^(LNR 1 e opname) sleutelbestand is 202.778. Het aantal records van het LNR^LNR sleutelbestand is 31.957 (dit is het bronbestand zoals aangeleverd door Prismant minus de administratieve dubbeltellingen). In de vertaalsleutel bestanden van LVR1 en LVR2 zit het door LinKID aangemaakte identificatie nummer, het praktijknummer, het administratienummer, de meerlingcode, de omvang meerling en het jaar van de LVR1 en LVR2 bronbestanden. In het vertaalsleutel bestand van LNR zit het door LinKID aangemaakte identificatie nummer, het jaar, het LNR praktijknummer, patientidentificatie en opname volgnummer van het kind. Het doel van deze vertaalsleutel bestanden is om een precieze vertaling tussen de bronbestanden en de LinKID recordidentificatie te garanderen. De drie vertaalsleutel bestanden van LVR1, LVR2 en LNR bevatten hetzelfde aantal records als de originele individuele bronbestanden. De samenstelling van deze vertaalsleutel bestanden is tot stand gekomen in overleg met epidemiologe P. Elferink van de SPRN. Het sleutelbestand van het gekoppelde LNR^LNR bestand bestaat uit 5 variabelen: - n_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LNR record. - n_admin1 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de zesde kolom (n_recid) gedefinieerde LNR record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde opname van een kind twee keer geteld zou worden. - n_admin2 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de tweede administratieve dubbeltelling van het in de zesde kolom (n_recid) gedefinieerde LNR record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde opname van een kind twee keer geteld zou worden. - kind is het door LinKID aangemaakte kind identificatienummer. Voor ieder kind dat in LNR in 2001 opgenomen was, is door LinKID een identificatienummer aangemaakt. De variabele kind geeft aan bij welk kind het in de eerste kolom (n_recid) gedefinieerde LNR record hoort. - her is een door LinKID aangemaakte variabele die aangeeft hoeveelste opname van het kind dit LNR record betreft (n_recid). 28

Het sleutelbestand van het gekoppelde LVR1^LVR2^(LNR alle opnames) bestand bestaat uit 20 variabelen: - v_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LVR1 record. - v_admin1 is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de eerste administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - v_admin2 is de door LinKID aangemaakte recordidentificatie van het LVR1 record, dat de tweede administratieve dubbeltelling van het in de eerste kolom (v_recid) gedefinieerde LVR1 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - g_recid is de door LinKID aangemaakte recordidentificatie van het Prismant bronbestand LVR2 record. - g_admin1 is de door LinKID aangemaakte recordidentificatie van het LVR2 record, dat een administratieve dubbeltelling van het in de vierde kolom (g_recid) gedefinieerde LVR2 record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde zwangerschap twee keer geteld zou worden. - n_recid1 is de door LinKID aangemaakte recordidentificatie van het LNR record. - n_admin1_1 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de zesde kolom (n_recid1) gedefinieerde LNR record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde opname van een kind twee keer geteld zou worden. - n_admin1_2 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de tweede administratieve dubbeltelling van het in de zesde kolom (n_recid1) gedefinieerde LNR record is. Deze administratieve dubbeltelling is door LinKID verwijderd uit het gekoppelde bestand om te voorkomen dat dezelfde opname van een kind twee keer geteld zou worden. - n_recid2 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een tweede opname is van het kind waarvan het in de zesde kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin2 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de negende kolom (n_recid2) gedefinieerde LNR record is. - n_recid3 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een derde opname is van het kind waarvan het in de zesde kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin3 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de elfde kolom (n_recid3) gedefinieerde LNR record is. - n_recid4 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een vierde opname is van het kind waarvan het in de zesde kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin4 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de dertiende kolom (n_recid4) gedefinieerde LNR record is. - n_recid5 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een vijfde opname is van het kind waarvan het in de zesde kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin5 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de vijftiende kolom (n_recid5) gedefinieerde LNR record is. - n_recid6 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een zesde opname is van het kind waarvan het in de zesde kolom gedefinieerde record (n_recid1) de eerste opname betreft. 29

- n_admin6 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de zeventiende kolom (n_recid6) gedefinieerde LNR record is. - n_recid7 is de door LinKID aangemaakte recordidentificatie van het LNR record wat een zevende opname is van het kind waarvan het in de zesde kolom gedefinieerde record (n_recid1) de eerste opname betreft. - n_admin7 is de door LinKID aangemaakte recordidentificatie van het LNR record, dat de eerste administratieve dubbeltelling van het in de negentiende kolom (n_recid7) gedefinieerde LNR record is. Het vertaalsleutel bestand van LVR1 bestaat uit 162.835 records en 6 variabelen (Let op dat dit aantal is niet gelijk aan het aantal records in het LVR1 2002 bronbestand. De reden hiervoor is dat er in dit bestand 162.649 LVR1 records uit 2002 en ook nog 186 LVR1 records uit 2001 zijn): - v_recid is de door LinKID aangemaakte recordidentificatie van het LVR1 record. - v_prak is een PRN variabele (aanwezig in het originele LVR1 bronbestand) van de LVR1 praktijkcode. - v_admin is een PRN variabele (aanwezig in het originele LVR1 bronbestand) van het administratie nummer binnen de LVR1 praktijk. - v_mc is een PRN variabele (aanwezig in het originele LVR1 bronbestand) van de meerlingcode. - v_omv is een PRN variabele (aanwezig in het originele LVR1 bronbestand) van de omvang meerling. - v_jaar is het jaar van registratie om records uit 2001 van records uit 2002 te kunnen onderscheiden. De laatste 6 variabelen maken het mogelijk om in het LVR1 bronbestand te achterhalen welk LinKID recordidentificatie nummer hoort bij welk LVR1 record. Het vertaalsleutel bestand van LVR2 bestaat uit 122.859 records en 6 variabelen: - g_recid is de door LinKID aangemaakte recordidentificatie van het LVR2 record. - g_lvr is een PRN variabele (aanwezig in het originele LVR2 bronbestand) van de LVR2 praktijkcode. - g_partus is een PRN variabele (aanwezig in het originele LVR2 bronbestand) van het partusnummer binnen de LVR2 praktijk. - g_mc is een PRN variabele (aanwezig in het originele LVR2 bronbestand) van de meerlingcode. - g_omv is een PRN variabele (aanwezig in het originele LVR2 bronbestand) van de omvang meerling. - g_jaar is het jaar van registratie. De laatste 5 variabelen maken het mogelijk om in het LVR2 bronbestand te achterhalen welk LinKID recordidentificatie nummer hoort bij welk LVR2 record. Het vertaalsleutel bestand van LNR bestaat uit 31.996 records en 5 variabelen: - n_recid is de door LinKID aangemaakte recordidentificatie van het LNR record. - n_jaar is een PRN variabele (aanwezig in het originele LNR bronbestand) van het jaar. - n_lnr is een PRN variabele (aanwezig in het originele LNR bronbestand) van het LNR praktijk nummer. - n_patid is een PRN variabele (aanwezig in het originele LNR bronbestand) van de patientidentificatie. - n_opnvol2 een PRN variabele (aanwezig in het originele LNR bronbestand) van het volgnummer van het kind binnen de praktijk (sig). De laatste 4 variabelen maken het mogelijk om in het LNR bronbestand te achterhalen welk LinKID recordidentificatie nummer hoort bij welk LNR record. 30

Epiloog De koppeling van de LVR1, LVR2 en LNR perinatale registraties voor 2002 heeft geleid tot een PRN jaarbestand 2002, wat op dezelfde wijze gebruikt kan worden als het PRN jaarbestand 2001. Op basis van de ervaringen van 2001 en de externe validatie van de LVR1&LVR2 koppeling is een aantal verfijningen toegepast op de koppelingsmethodiek. Deze verfijningen hebben slechts een minimale invloed op het aantal gekoppelde records. De resultaten van 2002 zijn dan ook vergelijkbaar met de resultaten van 2001 en de twee bestanden kunnen moeiteloos in combinatie gebruikt worden. Een aantal aandachtspunten blijft nog steeds aanwezig: - losse zwangerschapsrecords; records met moeder informatie zonder kind informatie (+/- 18.000 records, waarvan +/- 7.250 abortussen en +/- 6.000 beëindiging zorg zonder medische reden) blijven moeilijk om te koppelen. De reden is dat deze records geen kindinformatie bevatten en er dus weinig variabelen beschikbaar zijn om te vergelijken bij de koppeling. - meerlingen blijven een probleem bij de koppeling omdat meerlingen zoveel variabelen gemeenschappelijk hebben, waarop dus eenvoudig foutief een broertje aan een zusje gekoppeld kan worden. Externe validatie en in het bijzonder de validatie van de LNR&LNR koppeling voor meerlingen kan hier nog tot verfijningen van de methodiek leiden. - de LNR&LNR koppeling blijft lastig doordat vooraf onbekend is hoeveel verschillende (her)opnames van een kind bestaan. Alleen een externe validatie kan aantonen waar de koppelmethodiek nog verbeterd kan worden. - het oplossen van clusters: bij iedere koppeling ontstaan clusters van paren die bij elkaar horen; het vinden van de beste beslissingsstrategie om te beslissen welke paren als matches worden meegenomen vereist onder andere een aparte validatie studie van de verschillende mogelijkheden. De omvang van de probleemgebieden die hier naar voren gebracht worden is echter gering en een meer verfijnde aanpak zal nooit tot grote verschillen op de uitkomst van de koppeling leiden. Er is zeker reden tot tevredenheid met de huidige koppelingsmethodiek nu ook voor een ander jaar is gebleken dat de gevolgde strategie tot vergelijkbare resultaten leidt. Wij hopen en verwachten dat validatie werkzaamheden op de hierboven beschreven probleemgebieden de huidige koppelingsmethodiek nog meer zekerheid zal bieden. 31

Appendix: Contents tabel gekoppelde bestand LVR1^LVR2^LNR Data Set Name: LVR1^LVR2^LNR Observations: 202778 Member Type: DATA Variables: 430 -----Variables Ordered by Position----- # Variable Type Len Label 1 v_recid Char 18 recordidentificatie -LinKID 2 v_id Char 4 registratie identificatie 3 v_prak Num 8 uniek praktijk nr 4 v_actie Num 8 actiecode SIG 5 v_admin Char 6 padministratienr binnen praktijk 6 v_mc Num 8 meerlingcode 7 v_omv Num 8 omvang meerling 8 v_oza Char 1 onze zorg betrof (A) 9 v_ozb Char 1 onze zorg betrof (B) 10 v_oztot Char 2 onze zorg betrof A+B 11 v_nrvk Char 4 nr vk/ha 12 v_dd1ond Char 6 datum 1e onderzoek 13 v_d1ond_d Num 8 dag, datum 1e onderzoek 14 v_d1ond_m Num 8 maand, datum 1e onderzoek 15 v_d1ond_j Num 8 jaar, datum 1e onderzoek 16 v_contact Num 8 hoe kwam contact tot stand 17 v_ddgebm Char 6 geboorte datum moeder 18 v_mdat_d Num 8 gebdatum moeder, dag 19 v_mdat_m Num 8 gebdatum moeder, maand 20 v_mdat_j Num 8 gebdatum moeder, jaar 21 v_pc2 Num 8 eerste twee cijfers van postcode 22 v_pc Num 8 postcode -4 cijfers 23 v_her Num 8 herkomst moeder 24 v_grav Num 8 graviditeit 25 v_abo Num 8 aant.abortus 26 v_addat Char 6 datum ateme ddmmyy 27 v_addat_d Num 8 dag, datum ateme 28 v_addat_m Num 8 maand, datum ateme 29 v_addat_j Num 8 jaar, datum ateme 30 v_zek Num 8 zekerheid amen 31 v_ovlg Num 8 overlegsit/medium risk 32 v_redovlg Char 3 reden overlegsituatie/medrisk 32

33 v_onda Char 2 onderzoek/verrichting A 34 v_ondb Char 2 onderzoek/verrichting B 35 v_ondc Char 2 onderzoek/verrichting C 36 v_aangep Num 8 aangepakt door 37 v_superv Num 8 supervisie door 38 v_ddvlies Char 4 datum breken vliezen (ddmm) 39 v_vlies_d Num 8 dag, datum breken vliezen 40 v_vlies_m Num 8 maand, datum breken vliezen 41 v_uuvlies Num 8 uur breken vliezen 42 v_amnio Num 8 amniotomie 43 v_vrwat Num 8 kleur vruchtwater 44 v_ontsl Num 8 ontsluitingsduur 45 v_uupers Num 8 uur begin meepersen 46 v_mmpers Num 8 min begin meepersen 47 v_lig Num 8 ligging 48 v_peri1 Num 8 perineum/vulva 1 49 v_peri2 Num 8 perineum/vulva 2 50 v_peri3 Num 8 perineum/vulva 3 51 v_medicpp Num 8 medicatie na geb kind 52 v_hpp Num 8 bloedverlies 53 v_gesl Num 8 geslacht 54 v_ddgeb Char 6 kind geboortedatum ddmmyy 55 v_kind_d Num 8 kind geboortedatum, dag 56 v_kind_m Num 8 kind geboortedatum, maand 57 v_kind_j Num 8 kind geboortedatum, jaar 58 v_gebuur Num 8 uur geboorte kind 59 v_gebmin Num 8 min geboorte kind 60 v_apg Num 8 apgar na 5 min 61 v_gew Num 8 gewicht 62 v_weeg Num 8 weegmethode 63 v_kraam Num 8 kraamzorg 64 v_voed Num 8 voeding 7e dag 65 v_lyn2red1 Char 3 reden zorg 2e lijn 1 66 v_lyn2red2 Char 3 reden zorg 2e lijn 2 67 v_mort1 Num 8 kind overleden 1e lijn 68 v_mort2 Num 8 kind overleden 2e lijn 33

69 v_pltsplan Num 8 geplande plaats bevalling 70 v_pltsecht Num 8 echte plaats bevalling 71 v_klin Num 8 ziekenhuisnr bevalling 72 v_lconsgyn Num 8 laatste consult gyn 73 v_redcon1 Char 3 reden consult gyn 1 74 v_redcon2 Char 3 reden consult gyn 2 75 v_redcon3 Char 3 reden consult gyn 3 76 v_overdr Num 8 overdracht naar 2e lijn 77 v_klinovdr Num 8 ziekenhuisnr overdracht 78 v_ddovdr Char 6 datum overdracht, ddmmyy 79 v_ovdr_d Num 8 dag, datum overdracht 80 v_ovdr_m Num 8 maand, datum overdracht 81 v_ovdr_j Num 8 jaar, datum overdracht 82 v_redovd1 Char 3 reden overdracht 1 83 v_redovd2 Char 3 reden overdracht 2 84 v_redovd3 Char 3 reden overdracht 3 85 v_conska Num 8 consult kinderarts 86 v_redconka Char 2 reden consult kinderarts 87 v_overdrka Char 1 overdracht kinderarts 88 v_redovdka Char 2 reden overdr kinderarts 89 v_klinka Num 8 ziekenhuis kinderarts 90 v_probk1 Char 2 problemen kind 1 91 v_probk2 Char 2 problemen kind 2 92 v_probk3 Char 2 problemen kind 3 93 v_bijz1 Char 2 bijzonderheden 1 94 v_bijz2 Char 2 bijzonderheden 2 95 v_bijz3 Char 2 bijzonderheden 3 96 v_probmoe1 Char 3 problemen moeder 1 97 v_probmoe2 Char 3 problemen moeder 2 98 v_probmoe3 Char 3 problemen moeder 3 99 v_indcode1 Char 2 individule codering 1 100 v_indcode2 Char 2 individule codering 2 101 v_indcode3 Char 2 individule codering 3 102 v_partus Char 6 partusnummer -vrouw binnen praktijk 103 v_lft Num 8 leeftijd moeder -Prismant 104 v_amwwd Num 8 zwangerschapsduur in ww+d -Prismant 34

105 v_epzwk Num 8 eigen prenatale zorg vanaf n-de wk -Prismant 106 v_indzorg Num 8 indicatie zorg -Prismant 107 v_amwws Num 8 am.duur in weeken -Prismant 108 v_par Num 8 pariteit -Prismant 109 v_jaar Num 8 registratiejaar -Prismant 110 v_ddgebmoe Num 8 geboortedatum moeder, date -LinKID 111 v_ddgebkind Num 8 geboortedatum kind, date -LinKID 112 v_ddaterm Num 8 a terme datum, date -LinKID 113 v_dat1ond Num 8 datum 1e onderzoek, date -LinKID 114 v_datvlies Num 8 datum breken vliezen, date -LinKID 115 v_datovdr Num 8 datum overdracht, date -LinKID 116 v_pariteit Num 8 pariteit -LinKID 117 v_kop_par Num 8 pariteit als koppelvariabel -LinKID 118 v_multipari Num 8 multipari j/n -LinKID 119 v_amddd Num 8 amenorroeduur in dagen -LinKID 120 v_amwww Num 8 amenorroeduur in weken -LinKID 121 v_kop_amd Num 8 am.duur in dagen als koppelvariabel -LinKID 122 v_kop_gesl Num 8 geslacht als koppelvariabel -LinKID 123 v_kop_omv Num 8 meerling, volgens meerlingcode, j/n -LinKID 124 omv_ovdr Num 8 meerling, volgens reden overdracht, j/n -LinKID 125 v_kop_gew Num 8 gewicht als koppelvariabel -LinKID 126 v_kop_mort Num 8 kind overleden in 1e of 2e lijn -LinKID 127 v_kop_pc Num 8 postcode (4 cijfers) als koppelvariabele -LinKID 128 v_kop_pc2 Num 8 postcode (2 cijfers) als koppelvariabele -LinKID 129 v_lft_link Num 8 leeftijd moeder -LinKID 130 v_kop_uur Num 8 geboorteuur kind als koppelvariabele -LinKID 131 g_recid Char 18 recordidentificatie -LinKID 132 g_id Char 4 recordnummer 133 g_lvr Num 8 lvr-nummer praktijk 134 g_actie Num 8 actiecode -Prismant 135 g_partus Char 6 partusnummer 136 g_mc Num 8 meerlingcode 137 g_omv Num 8 omvang meerling 138 g_ddgebm Char 6 geboortedatum moeder 139 g_moegeb_d Num 8 dag geboortedatum moeder 140 g_moegeb_m Num 8 maand geboortedatum moeder 35

141 g_moegeb_j Num 8 jaar geboortedatum moeder 142 g_pc Num 8 postcode 143 g_pc2 Num 8 eerste 2 cijfers van postcode 144 g_her Num 8 herkomst moeder 145 g_grav Num 8 graviditeit 146 g_abo Num 8 aant.abortus 147 g_dd_vor Char 6 datum vorige bevalling 148 g_ddvor_d Num 8 dag datum vorige bevalling 149 g_ddvor_m Num 8 maand datum vorige bevalling 150 g_ddvor_j Num 8 jaar datum vorige bevalling 151 g_lvr_vor Num 8 lvrnr zkhs vorige bevalling 152 g_overname Num 8 overname uit 1e/2e lijn 153 g_prak_ov Num 8 praktijknr overname 154 g_bgl Num 8 begeleiding door u 155 g_dd1ond Char 4 datum 1e onderzoek, date -LinKID 156 g_dd1ond_d Num 8 dag datum 1e onderzoek 157 g_dd1ond_m Num 8 maand datum 1e onderzoek 158 g_iuvd1 Num 8 dood bij 1e ond 159 g_ten Num 8 hoogste diastolische tensie 160 g_ddat Char 6 a terme datum 161 g_ddat_d Num 8 dag a terme datum 162 g_ddat_m Num 8 maand a terme datum 163 g_ddat_j Num 8 jaar a terme datum 164 g_zek Num 8 zekerheid amen 165 g_aangep Num 8 aangepakt door 166 g_gyn Num 8 gynnr baring 167 g_superv Num 8 supervisie door 168 g_gynsup Num 8 gynnr supervisie 169 g_bb1 Num 8 begin baring 1 170 g_bb2 Num 8 begin baring 2 171 g_indbeg Num 8 indicatie inl/scp 172 g_ddvlies Char 4 datum breken vliezen 173 g_ddvlies_d Num 8 dag datum breken vliezen 174 g_ddvlies_m Num 8 maand datum breken vliezen 175 g_uuvlies Num 8 uur breken vliezen 176 g_fetloss Num 8 aantal fetal loss (>20 wkn) 36

177 g_uupers Num 8 uur begin meepersen 178 g_mmpers Num 8 min begin meepersen 179 g_lig Num 8 ligging 180 g_hlp1 Num 8 hulp bij baring 1 181 g_hlp2 Num 8 hulp bij baring 2 182 g_indhlp Num 8 indicatie hulp 183 g_peri1 Num 8 perineum 1 184 g_peri2 Num 8 perineum 2 185 g_nageb1 Num 8 nageboortetijdperk 1 186 g_nageb2 Num 8 nageboortetijdperk 2 187 g_gesl Num 8 geslacht 188 g_ddgeb Char 6 geboortedatum kind 189 g_kindgeb_d Num 8 dag geboortedatum kind 190 g_kindgeb_m Num 8 maand geboortedatum kind 191 g_kindgeb_j Num 8 jaar geboortedatum kind 192 g_gebuur Num 8 uur geboorte 193 g_gebmin Num 8 min geboorte 194 g_gew Num 8 gewicht 195 g_apg Num 8 apgar na 5 min 196 g_mort Num 8 mortaliteit 197 g_cgm1 Char 2 cong.afw/trauma 1 198 g_cgm2 Char 2 cong.afw/trauma 2 199 g_cgm3 Char 2 cong.afw/trauma 3 200 g_pediat Num 8 pediatr.betrokkenheid 201 g_huis Num 8 kind mee naar huis 202 g_ddontm Char 4 datum ontslag moeder 203 g_ddontm_d Num 8 dag datum ontslag moeder 204 g_ddontm_m Num 8 maand datum ontslag moeder 205 g_matmort Num 8 maternale mort 206 g_bijz1 Char 2 bijz.-1 207 g_bijz2 Char 2 bijz.-2 208 g_bijz3 Char 2 bijz.-3 209 g_bijz4 Char 2 bijz.-4 210 g_bijz5 Char 2 bijz.-5 211 g_bijz6 Char 2 bijz.-6 212 g_bijz7 Char 2 bijz.-7 37

213 g_redov1 Char 2 reden 1 overname 214 g_redov2 Char 2 reden 2 overname 215 g_redov3 Char 2 reden 3 overname 216 g_concep1 Num 8 wijze conceptie 1 217 g_concep2 Num 8 wijze conceptie 2 218 g_conmed1 Char 2 medicatie 1 conceptie 219 g_conmed2 Char 2 medicatie 2 conceptie 220 g_conmed3 Char 2 medicatie 3 conceptie 221 g_stimul Num 8 stimulatie 222 g_pijn1 Num 8 pijnbestrijding 1 223 g_pijn2 Num 8 pijnbestrijding 2 224 g_prot Num 8 proteinurie j/n 225 g_prot_mg Num 8 proteinurie in mg/l 226 g_ivfnr Char 5 IVF-nummer 227 g_admin Char 6 administratienr uit 1e lijn 228 g_par Num 8 pariteit -Prismant 229 g_lft Num 8 leeftijd moeder -Prismant 230 g_amwwd Num 8 zwangerschapsduur in ww+d -Prismant 231 g_epzwk Num 8 eigen prenatale zorg vanaf n-de wk -Prismant 232 g_ddgebmoe Num 8 geboortedatum moeder, date -LinKID 233 g_ddgebkind Num 8 geboortedatum kind, date -LinKID 234 g_ddaterm Num 8 a terme datum, date -LinKID 235 g_ddvorkin Num 8 datum vorige bevalling, date -LinKID 236 g_ddontsl Num 8 ontslagdatum, date -LinKID 237 g_pariteit Num 8 pariteit -LinKID 238 g_kop_par Num 8 pariteit als koppelvariabel -LinKID 239 g_multipari Num 8 multipariteit j/n -LinKID 240 g_amddd Num 8 amenorroeduur in dagen -LinKID 241 g_amwww Num 8 amenorroeduur in weken -LinKID 242 g_kop_amd Num 8 am. duur in dagen als koppelvariabele -LinKID 243 g_kop_gesl Num 8 geslacht als koppelvariabel -LinKID 244 g_kop_omv Num 8 meerling, volgens meerlingcode -LinKID 245 g_kop_pc Num 8 postcode (4 cijfers) als koppelvariabele -LinKID 246 g_kop_pc2 Num 8 postcode (2 cijfers) als koppelvariabele -LinKID 247 g_lft_link Num 8 leeftijd moeder -LinKID 248 g_kopovern_var Num 8 overgenomen uit 1e ijn? j/n -LinKID 38

249 g_kop_mort Num 8 kind overleden in 1e of 2e lijn -LinKID 250 g_kop_uur Num 8 geboorteuur kind als koppelvariabele -LinKID 251 g_pltsbev Num 8 lvr-nummer praktijk 252 n_id Char 3 identificatie (LNR) 253 n_actie Num 8 actiecode 254 n_lnr Num 8 LNR-nr opname 255 n_patnrprk Num 8 praktijkpatientnummer 256 n_patnrzhs Num 8 ziekenhuispatientnummer 257 n_pc Num 8 postcode (1e 4) 258 n_ddgeb Char 6 geboortedatum kind 259 n_daggeb Char 2 geboortedatum kind, dag 260 n_mndgeb Char 2 geboortedatum kind, maand 261 n_jrgeb Char 2 geboortedatum kind, jaar 262 n_gesl Num 8 geslacht 263 n_amww Num 8 amenorroeduur in weken 264 n_amd Num 8 amenorroeduur +dagen 265 n_gew Num 8 geboortegewicht 266 n_mc Num 8 meerlingvolgnr 267 n_omv Num 8 meerling omvang 268 n_ddgebm Char 6 geboortedatum moeder 269 n_daggebm Char 2 geboortedatum moeder, dag 270 n_mndgebm Char 2 geboortedatum moeder, maand 271 n_jrgebm Char 2 geboortedatum moeder, jaar 272 n_bmoe1 Num 8 bijz moeder 1 273 n_bmoe2 Num 8 bijz moeder 2 274 n_bmoe3 Num 8 bijz moeder 3 275 n_bmoe4 Num 8 bijz moeder 4 276 n_bmoe5 Num 8 bijz moeder 5 277 n_bmoe6 Num 8 bijz moeder 6 278 n_bmoe7 Num 8 bijz moeder 7 279 n_bmoe8 Num 8 bijz moeder 8 280 n_bmoe9 Num 8 bijz moeder 9 281 n_bmoe10 Num 8 bijz moeder 10 282 n_gebplts Num 8 plaats geboorte 283 n_zorg Num 8 zorgverlener zwangerschap 284 n_prak Num 8 praktijknummer 1e lijn 39

285 n_admin Num 8 administratienr 1e lijn 286 n_lvr Num 8 prak.nr lvr-2 287 n_partus Num 8 partusnr lvr-2 288 n_ivfnr Num 8 ivf-nr 289 n_bpart1 Num 8 bijz partus 1 290 n_bpart2 Num 8 bijz partus 2 291 n_bpart3 Num 8 bijz partus 3 292 n_bpart4 Num 8 bijz partus 4 293 n_apgar_1 Num 8 Apgar na 1 min 294 n_apgar_5 Num 8 Apgar na 5 min 295 n_rean1 Num 8 reanimatie 1 296 n_rean2 Num 8 reanimatie 2 297 n_rean3 Num 8 reanimatie 3 298 n_nrvlgprk Num 8 volgnr van kind in praktijk (ka) 299 n_opnnr Num 8 opnamenummer 300 n_ddopn Char 6 datum opname 301 n_dagopn Char 2 datum opname, dag 302 n_mndopn Char 2 datum opname, maand 303 n_jropn Char 2 datum opname, jaar 304 n_herkopn Num 8 herkomst bij deze opname 305 n_herkzkhs Num 8 ziekenhuisnummer herkomst 306 n_spectran Num 8 speciaal transport 307 n_diag1 Num 8 diagnose 1 308 n_diag2 Num 8 diagnose 2 309 n_diag3 Num 8 diagnose 3 310 n_diag4 Num 8 diagnose 4 311 n_diag5 Num 8 diagnose 5 312 n_diag6 Num 8 diagnose 6 313 n_diag7 Num 8 diagnose 7 314 n_diag8 Num 8 diagnose 8 315 n_diag9 Num 8 diagnose 9 316 n_diag10 Num 8 diagnose 10 317 n_diag11 Num 8 diagnose 11 318 n_diag12 Num 8 diagnose 12 319 n_diag13 Num 8 diagnose 13 320 n_diag14 Num 8 diagnose 14 40

321 n_diag15 Num 8 diagnose 15 322 n_diag16 Num 8 diagnose 16 323 n_diag17 Num 8 diagnose 17 324 n_diag18 Num 8 diagnose 18 325 n_diag19 Num 8 diagnose 19 326 n_diag20 Num 8 diagnose 20 327 n_diag21 Num 8 diagnose 21 328 n_diag22 Num 8 diagnose 22 329 n_diag23 Num 8 diagnose 23 330 n_diag24 Num 8 diagnose 24 331 n_diag25 Num 8 diagnose 25 332 n_diag26 Num 8 diagnose 26 333 n_diag27 Num 8 diagnose 27 334 n_diag28 Num 8 diagnose 28 335 n_diag29 Num 8 diagnose 29 336 n_diag30 Num 8 diagnose 30 337 n_indic1 Num 8 opname-indicatie 1 338 n_indic2 Num 8 opname-indicatie 2 339 n_indic3 Num 8 opname-indicatie 3 340 n_cgm1 Num 8 cong afwijking 1 341 n_cgm2 Num 8 cong afwijking 2 342 n_cgm3 Num 8 cong afwijking 3 343 n_cgm4 Num 8 cong afwijking 4 344 n_cgm5 Num 8 cong afwijking 5 345 n_cgm6 Num 8 cong afwijking 6 346 n_cgm7 Num 8 cong afwijking 7 347 n_cgm8 Num 8 cong afwijking 8 348 n_cgm9 Num 8 cong afwijking 9 349 n_cgm10 Num 8 cong afwijking 10 350 n_cgm11 Num 8 cong afwijking 11 351 n_cgm12 Num 8 cong afwijking 12 352 n_cgm13 Num 8 cong afwijking 13 353 n_cgm14 Num 8 cong afwijking 14 354 n_cgm15 Num 8 cong afwijking 15 355 n_cgm16 Num 8 cong afwijking 16 356 n_cgm17 Num 8 cong afwijking 17 41

357 n_cgm18 Num 8 cong afwijking 18 358 n_cgm19 Num 8 cong afwijking 19 359 n_cgm20 Num 8 cong afwijking 20 360 n_beh1 Num 8 behandeling 1 361 n_beh2 Num 8 behandeling 2 362 n_beh3 Num 8 behandeling 3 363 n_beh4 Num 8 behandeling 4 364 n_beh5 Num 8 behandeling 5 365 n_beh6 Num 8 behandeling 6 366 n_beh7 Num 8 behandeling 7 367 n_beh8 Num 8 behandeling 8 368 n_beh9 Num 8 behandeling 9 369 n_beh10 Num 8 behandeling 10 370 n_beh11 Num 8 behandeling 11 371 n_beh12 Num 8 behandeling 12 372 n_beh13 Num 8 behandeling 13 373 n_beh14 Num 8 behandeling 14 374 n_beh15 Num 8 behandeling 15 375 n_beh16 Num 8 behandeling 16 376 n_beh17 Num 8 behandeling 17 377 n_beh18 Num 8 behandeling 18 378 n_beh19 Num 8 behandeling 19 379 n_beh20 Num 8 behandeling 20 380 n_beh21 Num 8 behandeling 21 381 n_beh22 Num 8 behandeling 22 382 n_beh23 Num 8 behandeling 23 383 n_beh24 Num 8 behandeling 24 384 n_beh25 Num 8 behandeling 25 385 n_beh26 Num 8 behandeling 26 386 n_beh27 Num 8 behandeling 27 387 n_beh28 Num 8 behandeling 28 388 n_beh29 Num 8 behandeling 29 389 n_beh30 Num 8 behandeling 30 390 n_restver1 Num 8 restverschijnsel 1 391 n_restver2 Num 8 restverschijnsel 2 392 n_restver3 Num 8 restverschijnsel 3 42

393 n_restver4 Num 8 restverschijnsel 4 394 n_restver5 Num 8 restverschijnsel 5 395 n_restver6 Num 8 restverschijnsel 6 396 n_dd1000g Char 6 datum 1000 g 397 n_dag1000g Char 2 datum 1000 g, dag 398 n_mnd1000g Char 2 datum 1000 g, maand 399 n_jr1000g Char 2 datum 1000 g, jaar 400 n_icdg Num 8 dagen ic 401 n_hcdg Num 8 dagen hc 402 n_cpapdg Num 8 dagen cpap 403 n_ippvdg Num 8 dagen ippv 404 n_pvoedg Num 8 dagen parent voeding 405 n_o2dg Num 8 dagen O2 406 n_couvdg Num 8 dagen couveuse 407 n_monitdg Num 8 dagen monitor 408 n_infdg Num 8 dagen infuus 409 n_fotodg Num 8 dagen fototherapie 410 n_ddont Char 6 ontslagdatum 411 n_dagont Char 2 ontslagdatum, dag 412 n_mndont Char 2 ontslagdatum, maand 413 n_jront Char 2 ontslagdatum, jaar 414 n_wijzeont Num 8 wijze van ontslag 415 n_lnrovpl Num 8 zkhs overplaatsing 416 n_redovpl Num 8 reden overpl naar NICU door NICU 417 n_mort Num 8 kind overleden 418 n_obductie Num 8 obductie verricht 419 n_patid Char 12 patiendidentificatie 420 n_jaar Num 8 jaar (2001) 421 n_opnvolg2 Num 8 volgnr kind praktijk (sig) 422 n_recid Char 20 LNR record identificatie -LinKID 423 n_ddgebkind Num 8 geboortedatum kind, date -LinKID 424 n_ddgebmoe Num 8 geboortedatum moeder, date -LinKID 425 n_ddopname Num 8 opnamedatum, date -LinKID 426 n_dd1000gram Num 8 datum 1000g, date -LinKID 427 n_ddontslag Num 8 datum ontslag, date -LinKID 428 her Num 8 hoeveelste LNR opname van het kind_linkid 43

429 n_kindovl Num 8 kind in LNR overleden 430 kind Num 8 kind identificatie nummer_linkid 44