Statistisch Analyse Plan: deelstudie pasgeborenen

Maat: px
Weergave met pagina beginnen:

Download "Statistisch Analyse Plan: deelstudie pasgeborenen"

Transcriptie

1 Vlaams Humaan Biomonitoringsprogramma Milieu & Gezondheid ( ) Monitoring voor actie Statistisch Analyse Plan: deelstudie pasgeborenen Het Vlaams Humaan Biomonitoringsprogramma wordt uitgevoerd in opdracht van de Vlaamse Overheid door het Steunpunt Milieu en Gezondheid Juni 2005

2 1 Doelstelling Referentiewaarden Statistische technieken Exploratieve en voorbereidende verwerkingen Beschrijving van de populaties in de verschillende onderzoeksgebieden Beschrijvende statistiek voor de merkers Totalen Interpretatie van ruwe gegevens Datareductie Datamining Inferentiële Statistiek (Niet-gecorrigeerde) gebiedsvergelijkingen (onderzoekshypothesen 1 en 2) Regressie Eenvoudige Regressie Meervoudig Regressie Gebiedsverschillen voor de continue merkers Response Gecorrigeerde gemiddelden Gebiedsverschillen Verschillen tussen de gebieden Gebiedsverschillen voor de binaire merkers Gecorrigeerde proporties Gebiedsverschillen Verschillen tussen de gebieden Andere verklarende parameters Confounding Andere covariaten Modelbouw Selectie van een goed model Multicollineariteit Modelvalidatie Meervoudig toetsen Model met meerdere blootstellingsmerkers Dosis-effect relaties Bijkomende verwerkingen Het industriegebied Verbrandingsovens Percentiel Indicatoren... 19

3 6.1 Blootstellingsmerkers Effectmerkers pasgeborenen Effectmerkers moeder Covariaten en confounders Confounders Covariaten Samengestelde covariaten Covariaten voor de blootstellingsmerkers Covariaten voor de effectmerkers Effectmerkers luchtwegklachten & allergie bij moeder Effectmerkers fertiliteit moeder Effectmerkers kind Blootstellings-effect relaties Motivatie voor de te onderzoeken effectmerkers en blootstellingsmerkers (relaties merkers van blootstelling en effect) Dioxineachtige stoffen PCBs...45 Gechloreerde pesticiden Lood Cadmium Voorstelling van de resultaten

4 Het analyseplan specificeert de voornaamste onderzoeksvragen en bevat een verantwoording voor de gekozen statistische methodologie. Eerst geven we een overzicht van de verschillende statistische technieken die gebruikt zullen worden. Vervolgens beschrijven we de gekozen indicatoren voor de blootstellings- en effectmerkers en de covariaten. 1 DOELSTELLING De labodata en de vragenlijsten zullen geïntegreerd verwerkt worden met als doeleinde de volgende a-priori opgestelde onderzoekshypothesen te bestuderen: 1. Gebiedsvergelijking van de blootstellingmerkers in Vlaanderen: dioxineachtige stoffen, PCBs, gechloreerde pesticiden, lood en cadmium. 2. Gebiedsvergelijking van de effectmerkers in Vlaanderen: astma, allergie, infecties en fertiliteit als effectmerkers voor de moeder en APGAR score, biometrie en schildklierfunctie als effectmerkers voor de pasgeborene. 3. Verband blootstelling- en effectmerkers bij de moeders en de pasgeborenen ( dosis-effect relatie ). 2 REFERENTIEWAARDEN De gemiddelde waarden van de blootstellingmerkers van de 8 gebieden worden niet enkel met elkaar vergeleken maar ook met een vergelijkingswaarde. Als vergelijkings- of referentiewaarde werd een waarde berekend die een beeld geeft van de gemiddelde blootstelling van de 8 onderzoeksgebieden in de studie opgenomen. De waarde is representatief voor de noemer van de 8 gebieden doordat het een gewogen gemiddelde van de 8 gebieden is; waarbij het gewicht van elk gebied in de berekening van dit gemiddelde evenredig is met de grootte van het gebied uitgedrukt in bevolkingsaantallen. Dit gemiddelde is dus geen maat voor de gemiddelde blootstelling van een inwoner in Vlaanderen daar de 8 onderzoeksgebieden slechts 20% van Vlaanderen bedekken. Verder is het maar een vergelijkingswaarde. Het is niet zo dat waarden boven deze referentiewaarde duiden op een vervuild gebied; en omgekeerd kunnen waarden onder deze referentiewaarden nog steeds relatief hoog zijn. 4

5 3 STATISTISCHE TECHNIEKEN De statistische verwerkingen kunnen in twee groepen ondergebracht worden. I. Exploratieve en voorbereidende verwerkingen II. Hypothese toetsen 3.1 EPLORATIEVE EN VOORBEREIDENDE VERWERKINGEN Beschrijving van de populaties in de verschillende onderzoeksgebieden De onderzoekspopulaties van de verschillende gebieden worden beschreven naar o.a. leeftijd van de moeder, geslacht van het kind, rookgedrag van de moeder, socio-economische status, voedingsgewoonten en verkeersblootstelling van de moeder. Het is belangrijk om een zicht te hebben op eventuele verschillen in de onderzoekspopulaties daar deze aan de basis kunnen liggen van verschillen waargenomen in effectmerkers en blootstellingmerkers Beschrijvende statistiek voor de merkers Samenvattende statistieken en grafische presentaties zullen gebruikt worden om de blootstelling- en effectmerkers te beschrijven. De gekozen statistiek en figuur wordt bepaald door het type merker: continue, ordinaal of binair. Categorische merker Continue merker Samenvattende statistiek Proportie, tabel Gemiddelde, standaard deviatie, mediaan, interkwartiel range Figuur Staafdiagram, taartdiagram Boxplot, Totalen De samenvattende ruwe statistieken worden gepresenteerd voor elk van de onderzoeksgebieden afzonderlijk. Verder worden er nog 3 totalen berekend: Een (ongewogen) studiegemiddelde: het ongewogen gemiddelde van alle beschikbare metingen. Het belang van elk gebied in dit gemiddelde is evenredig met het aantal stalen van het gebied in de studie. Dus de gebieden waar er veel metingen plaats vonden bepalen dit gemiddelde sterker dan de gebieden waar er relatief weinig metingen waren. 5

6 Een gewogen totaal gemiddelde, waarbij het gewicht van elk gebied in de berekening van dit totaal gemiddelde evenredig is met het aantal inwoners in het gebied (op populatieniveau). Daar het belang van elk gebied evenredig is met de grootte van het gebied (volgens bevolkingsaantal) is dit gemiddelde een maat voor de blootstelling waar een inwoner van de 8 onderzoeksgebieden gemiddeld aan blootgesteld is. Merken we nogmaals op dat er niet in heel Vlaanderen bloedstalen werden afgenomen. Het gemiddelde is dus niet de gemiddelde blootstelling voor een Vlaming. Dit gemiddelde is de referentiewaarde zoals die in Sectie 2 werd geïntroduceerd. Een gewogen totaal gemiddelde, waarbij elk gebied even belangrijk is. Gebieden met minder stalen krijgen dus een gewicht groter dan 1; en gebieden met meer stalen krijgen een gewicht kleiner dan Interpretatie van ruwe gegevens De interpretatie van deze ruwe gegevens moet voorzichtig gebeuren en steeds goed gekaderd worden; vandaar dat de ruwe gegevens steeds naast de gecorrigeerde data geplaatst zullen worden. Statistisch significante verschillen tussen de gebieden kunnen immers mogelijks verklaard worden door verschillen in de samenstelling van de populatie van de onderzoeksgebieden (bijv. verschillen in leeftijdsverdeling, ). Een vlot haalbare vorm van correctie is stratificatie. Per onderzoeksgebied worden de gegevens dan apart voorgesteld voor verschillende strata bijvoorbeeld de leeftijd van de moeder in klassen van 5 jaar. Maar een grondiger correctie voor verscheidene parameters gelijktijdig, (o.a. leeftijd en roken) kan uitgevoerd worden via een regressie analyse (Sectie 3.3). Laatst vernoemde techniek werd in deze studie toegepast Datareductie Bij een datareductieprobleem wordt o.a. de vraag gesteld of variabelen die onderling correleren kunnen worden gesynthetiseerd door een beperkt aantal variabelen. Principale componentenanalyse (PCA) is één van de klassieke multivariate technieken die hiervoor aangewend wordt. Deze techniek zal toegepast worden op de set van onafhankelijke variabelen en confounders. Door middel van de PCA kan de dimensionaliteit van deze set van variabelen verkleind worden. De luiken met betrekking tot verkeer, arbeid en hobby s uit de algemene vragenlijst zullen aan een PCA onderworpen worden. Indien uit deze verwerkingen blijkt dat de PCA componenten een substantieel deel van de variabiliteit in de oorspronkelijke parameters verklaren en een logische interpretatie hebben, zullen ze in de verdere analyses meegenomen worden. Anders worden de oorspronkelijke vragen behouden. 6

7 3.1.6 Datamining Datamining kan gedefinieerd worden als het proces van het zoeken naar impliciete, voorheen onbekende en potentieel bruikbare informatie uit zeer grote databases door gebruik te maken van efficiënte 'kennis-zoeksystemen'. Specifiek zullen classificatie- en regressiebomen aangewend worden om relaties, structuren en interacties te ontdekken. Daar dit een niet-parametrische techniek is moeten er geen assumpties over de response variabele gemaakt worden. Ook de vorm van de relatie (lineair, kwadratisch,...) moet niet gespecificeerd worden. Bovendien wordt er op een elegante manier om gegaan met ontbrekende gegevens. Voor elke merker zal een boom ontwikkeld worden. 3.2 INFERENTIËLE STATISTIEK Bij de keuze van de aangewezen statistische techniek om de eerder geformuleerde onderzoekshypothesen te onderzoeken, dient er rekening gehouden te worden met het opzet van de studie, type gegevens en de doeleinde van de verwerkingen. We bespreken hier de consequenties van het type gegevens en het doeleinde van de verwerking (Niet-gecorrigeerde) gebiedsvergelijkingen (onderzoekshypothesen 1 en 2) - Vergelijken van de onderzoeksgebieden voor continue gegevens: o Indien de gegevens binnen elk onderzoeksgebied (bij benadering) normaal verdeeld zijn (boxplots, histogram, Shapiro Wilk test, ) en indien de varianties voor elke onderzoeksgebied gelijk zijn (Levene-test) kunnen parametrische methoden toegepast worden: variantie analyse (ANOVA). o Indien de ruwe gegevens niet aan deze voorwaarden voldoen kan men gebruik maken van een transformatie. Er zal geopteerd worden voor een natuurlijke logaritmische transformatie daar deze ook vaak in de literatuur gebruikt wordt voor dit type blootstellingmerkers. o Anders moet een niet-parametrische methode uitgevoerd worden: Kruskall-Wallis test. - Vergelijken van de onderzoeksgebieden voor ordinale/binaire gegevens: o Voor het vergelijken van proporties tussen de onderzoeksgebieden zal de Chikwadraat toets gebruikt worden. o Indien meer dan 80% van de cellen in de kruistabel een verwachte celfrequentie van minder dan 5 heeft, zal Fisher s Exact test gebruikt worden. Omwille van de grote steekproeven is dit praktisch niet haalbaar zijn. 7

8 De interpretatie van deze resultaten moet voorzichtig gebeuren. Statistisch significante verschillen tussen de gebieden kunnen mogelijks verklaard worden door verschillen in de samenstelling van de populatie van de onderzoeksgebieden (bijv. verschillen in leeftijdsverdeling). Tal van factoren waaronder leeftijd, geslacht, levensstijlfactoren, beroep, sociaal-economische status,... kunnen een invloed hebben op de gezondheid en op de biomerkers. Deze factoren kunnen verschillen tussen de onderzochte gebieden. Wanneer deze risicofactoren de bestudeerde relatie vertekenen, worden ze verstorende variabelen genoemd (zie Sectie 3.6.1) Bij vergelijking van de merkers tussen de gebieden evenals bij de blootsteling-effectrelaties moet rekening gehouden worden met deze confounding factoren. Meervoudige regressie technieken zullen aangewend worden om dit te onderzoeken (zie Sectie 3.3). 3.3 REGRESSIE Meervoudige regressie technieken zullen gebruikt worden om de afhankelijkheid van de uitkomstparameter met twee of meer variabelen gelijktijdig te onderzoeken. Deze technieken kunnen dus toegepast worden om: 1. de relatie tussen enerzijds een effectmerker (of blootstellingsmerker) en anderzijds het onderzoeksgebied en andere verklarende parameters te onderzoeken (onderzoekshypothese 1 en 2). 2. de relatie tussen enerzijds een blootstellingsmerker en anderzijds een effectmerker te onderzoeken (onderzoekshypothese 3) Eenvoudige Regressie In een eerste fase van de verwerkingen worden regressiemodellen met slechts één parameter als verklarende parameter gefit (enkelvoudige regressies), namelijk het gebied. Voor het opstellen van de relatie voor een continue merker (blootstelling- of effectmerker) maken we gebruik van lineaire regressie modellen. Indien de gegevens (bij benadering) niet normaal verdeeld zijn zal gebruik gemaakt worden van een natuurlijke log-transformatie. Indien de merker een binaire merker is, worden logistische regressie modellen gebruikt. a) Lineaire regressie Regressie-analyse is een techniek die gebruikt wordt om het verband te bestuderen tussen een respons stochastische veranderlijke Y en een regressor veranderlijke (onafhankelijke veranderlijke) x. Het verband dat bestudeerd wordt is een functioneel verband. Dit wil zeggen dat het verband 8

9 vastgelegd wordt door een wiskundige functie f(x). Deze functie beschrijft hoe de gemiddelde response varieert met x: E(Y x ) = f(x) De meest eenvoudig situatie is deze waarbij f een lineaire functie is: f(x)= α+β x. Dus E(Y x ) = α+β x We spreken van enkelvoudige regressie omdat we slechts één regressor variabele meenemen. De waarden van α en β worden geschat door middel van het criterium der kleinste kwadraten. Deze methode berust er op dat men hiermee de meest nauwkeurige te verwachte verandering van de respons-variabele Y kan schatten, bij een zekere constante waarde van de onafhankelijke x-variabele. Indien we veronderstellen dat de E i ~N(0,σ 2 ), met andere woorden dat de storingstermen normaal verdeeld zijn met gemiddelde 0 en met dezelfde variantie, dan kunnen betrouwbaarheidsintervallen voor β opgesteld worden; en kunnen hypothesen getoetst worden. - Is β = 0 dan is sprake van een monotone horizontale lijn, evenwijdig met de -as. Er is dus geen verband tussen en Y. - Is β < 0 dan is sprake van een omgekeerd evenredig (dalend),y verband. - Is β > 0 dan is sprake van een evenredig (stijgend),y verband. b) Logistische regressie Indien de response binair is werkt men met kansverhoudingen, die meestal met het Engelse woord odds wordt aangeduid. De odds is de verhouding tussen de fracties bij twee mogelijke uitkomsten. Als p de kans op de eerste uitkomst is, dan is 1 p de kans op de tweede uitkomst en is de ODDS = p/(1 p) Bij logistische regressie zijn we geïnteresseerd in het modelleren van de kans p in termen van de verklarende variabele x. We zouden dit kunnen proberen met de relatie p = α + βx. Helaas is dit geen goed model. Zolang β 0 geven zeer hoge of lage waarden van x voor α + βx een waarde die niet in overeenstemming is met het gegeven dat 0 p 1. De bij logistische regressie gekozen oplossing voor dit probleem is het transformeren van de kansverhouding p/(1 p) met behulp van de natuurlijke logaritme. We gebruiken voor deze transformatie de term logaritmische kansverhouding of log odds. Deze modelleren we als een lineaire functie van de verklarende variabele: Log[p/(1 p)] = α + βx De helling in dit logistische regressiemodel is het verschil tussen de log(odds) voor een eenheid toename in x (dus bijvoorbeeld het verschil tussen de log(odds) van x en x+1). De interpretatie van de resultaten in termen van de helling van de regressielijn is moeilijk. Gewoonlijk wordt een transformatie toegepast die de situatie verduidelijkt. Met enige algebra kan worden aangetoond dat 9

10 ODDS x+1 / ODDS x = e β. De transformatie e β maakt de logaritme ongedaan en transformeert de helling van de regressielijn tot een odds-ratio. Dit betekent dat de kansverhouding voor x+1 kan worden berekend door de kansverhouding voor x met de odds-ratio te vermenigvuldigen. Merk op dat het type regressie model bepaald wordt de response parameter en niet de verklarende parameter. Bij het bestuderen van de relatie tussen de blootstelling- en effectmerkers kan een merker in het ene model de rol van een response parameter hebben terwijl in een ander model dezelfde merker als covariaat wordt opgenomen. De interpretatie van deze eenvoudige regressie modelen moet uiterst voorzichtig gebeuren. Verscheidene onafhankelijke variabelen kunnen immers gelijktijdig een invloed uitoefenen op de merker. Statistisch significante relaties tussen bijvoorbeeld een blootstellingmerker en een gebied 1 kunnen mogelijk verklaard worden door verschillen in de samenstelling van de populatie (bijv. verschillen in leeftijdsverdeling, ). Meervoudige regressie technieken zullen aangewend worden om dit te onderzoeken Meervoudig Regressie Bij meervoudige (multipele) regressie komt er méér dan een onafhankelijke variabele in het model voor. Met meervoudige regressie heeft men dus de mogelijkheid om het effect van één onafhankelijke variabele op een afhankelijke variabele Y te bestuderen, terwijl men de overige variabelen gefixeerd (constant) houdt. De algemene vergelijking voor de meervoudige regressie luidt: E(Y x ) = α+β 1 x 1 + β 2 x 2 +β 3 x 3 voor lineaire regressie log(p/(1 p) =α+β 1 x 1 + β 2 x 2 +β 3 x 3 voor logistische regressie β 1 geeft het effect van 1 op Y (op p indien logistische regressie), na correctie voor 2 en 3. Uiteraard is het niet mogelijk om de relatie tussen de merkers en alle opgemeten/bevraagde parameters te bestuderen. Voorafgaand aan de verwerkingen dient men voor elke merker te specificeren welke onafhankelijke variabelen nog in het model worden opgenomen. Deze keuze is gebaseerd op literatuuronderzoek en discussies tijdens de veldwerkcommitévergaderingen. We verwijzen naar Secties 7, 0 en 0 voor een overzicht. 1 De theoretische uitleg is in termen van een continue verklarende parameter, maar dit model kan eenvoudig toegepast worden voor een nominale parameters zoals gebied; door middel van het gebruik van dummy variabelen. 10

11 Bovenstaande modellen kunnen gebruikt worden om gemiddelden en kansen te voorspellen. Op basis van de verzamelde data schat men de parameters in het model (α, β 1, β 2, β 3, ). Vervolgens kan men door middel van deze parameter-schatters een voorspelling doen voor de gemiddelde waarden van Y (of de kans p) voor specifieke waarden van x 1, x 2 en x 3. Indien bijvoorbeeld x 1 de leeftijd van de moeder is, x 2 het aantal sigaretten gemiddeld dagelijks gerookt voor de zwangerschap en x 3 het aantal sigaretten dagelijks gerookt tijdens de zwangerschap dan kan men voor elke combinatie van x 1, x 2 en x 3 de gemiddelde verwachtte waarde van Y berekenen. Gemiddelden voor de blootstellingmerkers die zo bekomen worden op basis van een meervoudige regressie model waar naast het gebied ook de leeftijd en actief rookgedrag voor en tijdens de zwangerschap opgenomen zijn, noemen we gecorrigeerde gemiddelden. 3.4 GEBIEDSVERSCHILLEN VOOR DE CONTINUE MERKERS Response De blootstellingmerkers worden volgens de natuurlijke logaritmische functie getransformeerd. Deze getransformeerde gegevens worden in de regressie modellen als response variabelen gebruikt. De reden hiervoor is dat de oorspronkelijke gegevens niet normaal verdeeld zijn Gecorrigeerde gemiddelden Met gecorrigeerde gegevens bedoelen we dat we gemiddelden/proporties per gebied berekenen waarbij we rekening houden de samenstelling van het gebied. In feite voorspellen we het gemiddelde (de proportie) dat we in een bepaald gebied verwachten voor een bepaalde moeder. En dit doen we voor elk gebied voor dezelfde moeder. M.a.w. de verschillen die we dan nog tussen de gebieden zien, kunnen niet te wijten zijn aan verschillen in de populaties van de gebieden. Merk op dat dit niet helemaal correct is; we corrigeren immers slecht voor enkele populatiekenmerken. De factoren waarvoor we corrigeren verschillen van merker tot merker (zie hiervoor sectie 7). Voor de blootstellingmerkers corrigeren we steeds voor de leeftijd van de moeder en het actief rookgedrag voor en tijdens de zwangerschap van de moeder. De gecorrigeerde gemiddelden worden bekomen op basis van een meervoudig regressie model waar vier parameters als verklarende variabelen zijn opgenomen: - Leeftijd: in 5 klassen. - Pakjaren = totaal aantal sigaretten ooit gerookt (berekend op basis van gemiddelden): in 3 klassen. - Roker tijdens zwangerschap : ja/nee. Het aandeel vrouwen dat tijdens de zwangerschap rookt is gelukkig laag. Maar hierdoor hebben we niet zoveel informatie over de relatie tussen de blootstellingmerker en het aantal sigaretten dat dagelijks gerookt wordt tijdens de 11

12 zwangerschap. Vandaar dat er gekozen werd om de parameter als een binaire parameter in het model op te nemen. - Gebied Door leeftijd van de moeder en pakjaren niet als een continue parameter op te nemen in het model is de vorm van de relatie tussen leeftijd (pakjaren) en de blootstellingmerker niet echt een aandachtspunt. Anders zou voor elke blootstellingmerker de relatie (lineair, kwadratisch, ) tussen de leeftijd van de moeder en pakjaren afzonderlijk bestudeerd moeten worden. Vervolgens wordt op basis van dit model, per gebied, het gemiddelde van de blootstellingmerker voorspeld voor een populatie met volgende samenstelling: Leeftijd moeder % < 25 jaar Roken voor zwangerschap (pakjaren) Nooit gerookt 65,3 Minder dan dagelijks 1 pakje en dit gedurende 5 jaren ( totaal minder dan sigaretten) 18,2 Meer dan dagelijks 1 pakje en dit gedurende 5 jaren ( totaal >= sigaretten) 16,4 Roken tijdens zwangerschap Ja 16,1 Nee 83,9 Verschillen tussen de gebieden zijn dus niet meer te wijten aan verschillen in leeftijdsverdeling en rookgedrag. Voor alle blootstellingmerkers worden de gemiddelden, en 95% betrouwbaarheidsintervallen gepresenteerd. Er zijn tabellen voor de gemiddelden op de natuurlijke logaritmische schaal en de oorspronkelijke schaal (na transformatie via de exponentiele functie van de gemiddelden bekomen op basis van het model voor de natuurlijke logaritmische data). Het 95% betrouwbaarheidsinterval werd bekomen als: Gemiddelde +- t(.0975, n-1) STDERR We kozen ervoor om de percentiel van de t-verdeling te gebruiken (en niet 1.96) omdat dit voor de kleine gebieden toch een verschil maakt. 12

13 3.4.3 Gebiedsverschillen Om te toetsen of er een verschil is tussen de 8 gebieden, na rekening te houden met effecten van leeftijd en het actief rookgedrag voor en tijdens de zwangerschap werd gekeken naar de significantie van gebied in het multiple model (op basis van een F - test). Indien we volgens deze toets de nul hypothese niet mogen verwerpen (m.a.w we besluiten dat er geen verschil is tussen de 8 gebieden) dan zijn de vergelijkingen met enerzijds het laagste gebied en anderzijds met de referentiewaarde niet aan de orde (tenzij exploratief en hypothese genererend) Verschillen tussen de gebieden Indien de F test voor het gebied in het meervoudig regressie model hierboven besproken statistisch significant is op het 5% significantieniveau wordt er verder nagegaan of volgende vergelijkingen statistisch significant zijn: - De gemiddelde waarde van elk gebied wordt vergeleken met de waarde van het gebied met de laagste gemiddelde waarde. - De gemiddelde waarde van elk gebied wordt vergeleken met de referentiewaarde. De referentiewaarde is dus een gewogen gemiddelde van de gebieden; gewogen naar bevolkingsaantal (zie Sectie 2). De significanties van deze verschillen worden alle bepaald op basis van het meervoudige regressie model hierboven beschreven. Contrasten werden hiervoor gebruikt. Om het verschil tussen gebied x en vlaanderen te toetsen werd het contrast berekend tussen enerzijds gebied x en anderzijds een combinatie van alle gebieden. In deze combinatie van de 8 gebieden is het belang van het gebied evenredig met het aantal inwoners in het gebied. De vergelijking tussen gebied x en het laagste gebied is een eenzijdige vergelijking. 3.5 GEBIEDSVERSCHILLEN VOOR DE BINAIRE MERKERS Gecorrigeerde proporties Voor de binaire merkers worden per gebied, proporties en 95% betrouwbaarheidsintervallen gepresenteerd. Het betrouwbaarheidsinterval werd bekomen op basis van een logistisch regressie model met als verklarende parameters de confounders en de parameter gebied. De confounders verschillen van merker tot merker (zie Sectie 7). De voorspelde proportie is de kans op het effect (bijv. astma) voor een gemiddelde moeder/bevalling. Hiermee bedoelen we dat indien bijv. leeftijd van de moeder als confounder in het model is opgenomen dat dan de predictie gedaan wordt voor een moeder met een leeftijd gelijk aan de gemiddelde leeftijd van alle moeders in de studie. Indien 13

14 bijvoorbeeld wijze van bevalling (vaginaal of niet) als confounder is opgenomen wordt de predictie gedaan voor een bevalling die 0.90% vaginaal is. Dit omdat 90% van de bevallingen in de studie vaginaal waren. Uiteraard bestaat zo een moeder/bevalling niet; maar het is een fictieve moeder/bevalling die ons toestaat om proporties over de verschillende gebieden te vergelijken Gebiedsverschillen Om te toetsen of er een verschil is tussen de 8 gebieden, na rekening te houden met confounding effecten, werd gekeken naar de significantie van gebied in het meervoudig logistisch regressie model (op basis van een type III chikwadraat test) Verschillen tussen de gebieden Indien de chikwadraat test voor het gebied in het meervoudig regressie model hierboven besproken statistisch significant is op het 5% significantieniveau wordt er verder nagegaan of volgende vergelijkingen statistisch significant zijn: - De kans op een effect van elk gebied wordt vergeleken met de waarde van het laagste gebied. - De kans op een effect voor elk gebied wordt vergeleken met de referentiewaarde. Deze referentiewaarde is een gewogen kans van de gebieden; gewogen naar bevolkingsaantal. De berekening is analoog als deze van het populatie gewogen gemiddelde (sectie 2); maar nu is het dus een kans. De significanties van deze verschillen worden alle bepaald op basis van het meervoudige regressie model hierboven beschreven. Contrasten werden hiervoor gebruikt. Om het verschil tussen gebied x en vlaanderen te toetsen werd het contrast berekend tussen enerzijds gebied x en anderzijds een combinatie van alle gebieden. In deze combinatie van de 8 gebieden is het belang van het gebied evenredig met het aantal inwoners in het gebied. De vergelijking tussen gebied x en het laagste gebied is een eenzijdige vergelijking. De verschillen tussen gebieden worden in termen van odds-ratios en de bijbehorende 95% betrouwbaarheidsintervallen gepresenteerd (referentie gebied is ofwel het laagste gebied of wel het populatie gewogen gebied afhankelijk van de gemaakte vergelijking). 14

15 3.6 ANDERE VERKLARENDE PARAMETERS Confounding Zoals reeds aangehaald kunnen tal van factoren waaronder leeftijd, geslacht, levensstijlfactoren, beroep, sociaal-economische status,... een invloed hebben op de gezondheid en op de biomerkers. Deze factoren kunnen verschillen tussen de onderzochte gebieden. Wanneer deze risicofactoren de bestudeerde relatie verteken, worden ze verstorende variabelen genoemd. Bij vergelijking van de merkers tussen de gebieden evenals bij de blootsteling-effectrelaties moet rekening gehouden worden met deze confounding factoren. Een confounder heeft de volgende kenmerken: een confounder is een bekende en belangrijke risicofactor voor de ziekte/betreffende gezondheidseffect een confounder is geassocieerd met de blootstelling een confounder wordt niet beïnvloed door de blootstelling of door de ziekte (geen intermediare stap in het oorzakelijk pad). Men kan niet testen of een verklarende parameter een confouder is, enerzijds omwille van statistisch vermogen en anderzijds omdat confounding een systematische (niet random) fout is. De verklarende parameters opgelijst in Secties 7, 0 en 0 spelen niet allemaal dezelfde rol in de verwerkingen. De belangrijkste risicofactoren (confounders) zullen consequent in de modellen verrekend worden, onafhankelijk van hun significantieniveau (zie Sectie 7) Andere covariaten Voor alle overige covariaten wordt de volgende procedure gevolgd: - Voor elke verklarende parameter opgelijst in tabellen wordt een eenvoudig regressie model gefit. - Alle verklarende parameters significant op het 0.10 procent significantie niveau worden, tezamen met de confounders, in een meervoudig regressie model opgenomen. - Voor elke uitkomstparameter (blootstellingsmerker of effectmerker) wordt vervolgens een zo zuinig mogelijk model gebouwd door middel van een stapsgewijze selectieprocedure (zie Sectie7). De confounders blijven echter steeds in het model. Enkel de verklarende parameters significant op het 0.05 procent significantieniveau blijven in het model. - Vervolgens wordt aan het vereenvoudigde model de parameter gebied toegevoegd. De significantie van het gebied werd bestudeerd in dit model. 15

16 3.7 MODELBOUW Selectie van een goed model. Uit de verzameling van kandidaat regressoren (covariaten) willen we een deelverzameling kiezen die het beste de variabiliteit in de uitkomstparameter verklaart. Helaas is er geen éénduidig antwoord op de vraag wat de beste deelverzameling is. Er zijn verschillende criteria en die leiden niet noodzakelijk tot dezelfde conclusie. We opteren voor gebruik van automatische selectie procedures. De stapsgewijze procedure zal toegepast worden. De methode waarbij alle mogelijke regressiemodellen vergeleken worden (bijv de R-square of Cp,...) is omwille van het groot aantal verklarende parameters niet aangewezen. Toepassing van automatische selectieprocedures moet wel voorzichtig gebeuren; er dient bijv. opgelet te worden dat de hoofdeffecten in het model opgenomen zijn indien de interactieterm significant is Multicollineariteit Men spreekt van multicollineariteit indien de onafhankelijke variabelen onderling gecorreleerd zijn. Multicollineariteit heeft een effect op de interpretatie en het gebruik van een gefit regressie model. De techniek van Variance Inflation Factors (VIF) zal toegepast worden om dit probleem te onderzoeken Modelvalidatie Indien beschikbaar zullen de resultaten vergeleken worden met theoretische verwachtingen en empirische resultaten. In een tweede verwerkingsfase zal cross-validatie gebruikt worden om het regressiemodel te valideren. Bij cross-validatie wordt de dataset in twee sets verdeeld. De eerste, model-building, set wordt gebruikt om het model te ontwikkelen. De tweede set, validatie of predictie set, wordt als onafhankelijke data gebruikt om de predictieve waarde van het geselecteerde model te bestuderen. 3.8 MEERVOUDIG TOETSEN Enkel indien de globale vergelijking van de onderzoeksgebieden statistisch significant is op het 5% significantieniveau, zullen verschillen met het laagste onderzoeksgebieden en de gewogen referentiewaarde op hun significantie getest worden. Door deze twee-traps-procedure toe te passen is het niet nodig bij deze vergelijkingen te corrigeren voor de type I fout. 3.9 MODEL MET MEERDERE BLOOTSTELLINGSMERKERS Om het effect van het samenspel van de verschillende blootstellingsmerkers op een effectmerker in beeld te brengen worden in een tweede verwerkingsfaze meervoudige regressie modellen opgesteld 16

17 die alle blootstellingmerkers bevatten. Dit model wordt vervolgens vereenvoudigd met de procedure voordien beschreven. 4 DOSIS-EFFECT RELATIES Een dosis-effect relatie geeft de samenhang tussen een effectmerker (effect) en een blootstellingmerkers (dosis) weer. Een argumentatie voor de onderzochte verbanden is opgenomen in Sectie 8 Om deze verbanden te kwantificeren wordt gebruik gemaakt van lineaire regressiemodellen voor continue effectmerker en logistische regressiemodellen voor binaire effectmerkers. Elk model bevat steeds de confounders die reeds eerder geïdentificeerd werden voor de effectmerker; daarnaast is ook de blootstellingmerker opgenomen in het model. Om de functionele vorm van de blootstellingmerker in het model te onderzoeken wordt vertrokken van een model waar de blootstellingmerker in zijn kubische vorm wordt opgenomen. Vervolgens wordt de functionele vorm van de blootstellingmerker vereenvoudigd (kwadratisch of lineair). Hoofdeffecten van gebied en interacties tussen gebied en de blootstellingmerker worden niet beschouwd. Dit betekent dat we veronderstellen dat de relatie tussen de effectmerker en de blootstellingmerker in de 8 gebieden hetzelfde is. De blootstellingmerkers worden in hun logaritmisch getransformeerde vorm mee genomen. Hierdoor is de interpretatie van het effect van de blootstellingmerker in het model niet eenvoudig. Indien de functionele vorm van de blootstellingmerker x lineair is dan ziet het model er zo uit voor een binaire effectmerker (c i zijn de confounders): log(p/(1 p) = α + β ln (x) + γ 1 c 1 + γ 2 c 2 + De odds na een verdubbeling van de waarde van de blootstellingmerker x; is gelijk aan [e β ] ln(2) keer de odds. Dus de odds voor 2*x is gelijk aan [e β ] ln(2) keer de odds voor x. 5 BIJKOMENDE VERWERKINGEN 5.1 HET INDUSTRIEGEBIED Het industriegebied omvat enerzijds het Antwerps havengebied en de Gentse kanaalzone. In de verwerkingen voorzien in dit analyseplan worden de gegevens van beide havengebieden steeds als één onderzoeksgebied verwerkt en gepresenteerd. Beide gebieden hebben echter sterk verschillende industriële activiteiten. Er valt dus te argumenteren dat het industriegebied niet echt een type- 17

18 gebied. Vandaar dat er voor de blootstellingmerkers ad hoc en exploratief verwerkingen gepresenteerd worden waarbij de havengebieden gesplitst en afzonderlijk verwerkt worden. Op basis van een regressie en door middel van contrasten worden identieke hypothesen onderzocht als voordien. Er werd met andere woorden nagegaan of er een statistisch significant verschil is tussen het havengebied (afzonderlijk voor Gents en Antwerps havengebied) en het laagste gebied; en het gewogen populatiegemiddelde. Merk op dat het model wat gebruikt wordt bijna volledig identiek is aan dat beschreven in Sectie 3.4. Het enige verschil is dat er nu negen in plaats van 8 gebieden beschouwd worden. Dit betekent wel dat ook de effecten van leeftijd en het effect van het actief rookgedrag van de moeder kunnen veranderen. Anderzijds werd het havengebied gesplitst in twee gebieden elk met een eigen gewicht in de berekening van het populatie gewogen gemiddelde. Dit gemiddelde kan hierdoor verschillen van het gemiddelde bekomen op basis van 8 gebieden. Verder worden nog volgende bijkomende hypothesen onderzocht: - Is er een verschil tussen de twee industriegebieden? - Is er een verschil tussen de Gentse kanaalzone en de Gente agglomeratie? - Is er een verschil tussen de Antwerpse haven en de Antwerpse agglomeratie? Ook hiervoor wordt er gebruik gemaakt van contrasten. 5.2 VERBRANDINGSOVENS Het aantal stalen in het gebied van de verbrandingsovens is veel lager dan geanticipeerd; namelijk 25 in plaats van 200. De resultaten voor dit gebied zijn hierdoor uiteraard zeer onnauwkeurig; wat zich vertaalt in grote standaardfouten op het gemiddelde en brede betrouwbaarheidsintervallen. Bovendien komen meer dan de helft van de moeders van het gebied verbrandingsovens uit Menen. De stalen zijn ook niet representatief voor het gebied verbrandingsovens. Indien de steekproef opnieuw gedaan zou worden is het mogelijk dat de resultaten (zelfs in Menen) in de andere richting gaan. Anderzijds viel op de gemiddelden voor de moeders in het verbrandingsovengebied; en in Menen relatief hoge waarden hadden. Daarom dat ook dit gebied in twee werd opgesplitst om zo een beeld te krijgen van de 14 moeders uit Menen. Op basis van regressie modellen werd een gemiddelde waarde en 95% betrouwbaarheidsinterval voor elke blootstellingmerker berekend voor een moeder met kenmerken zoals beschreven in Sectie3.4.2; en dit indien deze moeder in Menen zou wonen of niet-menen. Merken we nogmaals op dat deze resultaten zeker niet veralgemeenbaar zijn. 5.3 PERCENTIEL 90 Er werd niet enkel gekeken naar het gemiddelde van de blootstellingmerkers, maar aanvullend ook naar de 90ste percentiel. Op basis van quantiel regressie werd een populatie gewogen 90 ste percentiel 18

19 berekend; volledig analoog aan het populatie gewogen gemiddelde voor de 8 gebieden. Verder werd op basis van de quantiel regressie nagegaan of de 90 ste percentiel van de 8 gebieden statistisch significant is. Indien dit het geval is werd nagegaan of de 90 ste percentiel van gebied x significant verschilt van de populatie gewogen percentiel; en significant hoger is dat de 90 ste percentiel van het laagste gebied. De procedure QUANTREG in SAS is nog experimenteel en niet zo flexibel als de REG procedure. Vandaar dat er ook gebruik gemaakt werd logistische regressies. Voor elke meting werd bepaald of ze boven of onder de populatie gewogen 90 ste percentiel viel. Hierdoor werden de continue blootstellingmerkers dus binair gemaakt. Vervolgens werd door middel van logistische regressies per gebied de kans geschat dat de merker boven de P90 referentie waarde valt. Indien het betrouwbaarheidsinterval volledig rechts van de waarde 10 ligt besluiten we dat er in het gebied relatief meer verhoogde waarnemingen zijn. 6 INDICATOREN De volgende indicatoren voor blootstelling en effecten zullen in de analyses opgenomen worden. 6.1 BLOOTSTELLINGSMERKERS - dioxineachtige stoffen o Calux assay (pg CALU-TEQ/g vet) - PCB merkers o PCB merker 138 (ng/g vet) o PCB merker 153 (ng/g vet) o PCB merker 180 (ng/g vet) o Som van PCB merkers 138, 153 en 180 (ng/g vet) - Pesticiden o HCB (ng/g vet) o DDE (ng/g vet) - Zware metalen o Cadmium (μg/l) o Lood (μg/l) 6.2 EFFECTMERKERS PASGEBORENEN - Biometrie (kindfiches) o Lengte (cm) o Gewicht (g) o Hoofdomtrek (cm) 19

20 - Zwangerschapsduur (kindfiches): enkel indien spontane bevalling o Zwangerschapsduur (weken) o Preterme geboorte: zwangerschapsduur < 37 weken. OPM: definitie vroeggeboorte: Studiecentrum Perinatale Epidemiologie (SPE): < 37 weken; ad term :>= 37 weken). - APGAR score (uit gegevens kindfiches): o APGAR score 10 minuten na de bevalling. Ontbrekende 'Apgar 10 minuten' aanvullen met cijfer '10', indien Apgar na 1 en/of 5 minuten wel gekend. Apgar niet gebruiken bij vroeggeboorte (prematuur < 37 weken). o APGAR binair: score 10 of minder dan 10 - Thyroïd Stimulerend Hormoon o TSH bepaald in navelstrengbloed (miu/l). o TSH van hielprik (miu/l): uit gegevens van Centra voor Metabole Aandoeningen. 6.3 EFFECTMERKERS MOEDER - Astma (uit algemene vragenlijst). De vragen uit de algemene vragenlijst worden gecombineerd tot een indicator voor: o Huidig astma 'Current asthma': defnitie volgens European Community Health Respiratory Survey, (ECHRS): positief, indien positief geantwoord op één van volgende vragen: Laatste 12 m astma aanvallen (vraag 50) Laatste 12 m geneesmiddelen voor astma (vraag 51) Laatste 12 m wakker geworden door aanval van kortademigheid (vraag 47) of wakker geworden door piepen/fluiten in de borstkas (vraag 46) o Doctor diagnosed astma Positief, indien positief geantwoord op volgende vraag: Ooit astma gehad (vraag 49) o Ooit astma Positief, indien positief geantwoord op één van volgende vragen: Laatste 12 m astma aanvallen (vraag 50) Laatste 12 m geneesmiddelen voor astma (vraag 51) Laatste 12 m wakker geworden door aanval van kortademigheid (vraag 47) of wakker geworden door piepen/fluiten in de borstkas (vraag 46) Laatste 12 m last van piepen of fluiten in borstkas (vraag 44) gecombineerd met: kortademigheid (vraag 44au) én voorkomen buiten periode van verkoudheid (vraag 44bu) Ooit astma gehad (vraag 49) 20

21 Ooit beklemming of piepende ademhaling op het werk (vraag 57) Hoesten, piepende ademhaling, kortademigheid bij contact met huisdieren (vraag 60) - Allergie (uit algemene vragenlijst) o Hooikoorts Positief, indien positief geantwoord op één van volgende vragen: Enige vorm van neusallergie/hooikoorts (vraag 52) Laatste 12 m geneesmiddelen tegen hooikoorts, neusklachten (vraag 53) o Voedselallergie Positief, indien positief geantwoord op één van volgende vragen: Laatste 12 m allergie voor voedsel, geneesmiddelen of insectenbeten (vraag 54) o Huidallergie Laatste 12 m eczeem gehad (vraag 55) o Dierenallergie Positief, indien positief geantwoord op één van volgende vragen: Last van niezen/tranende ogen bij contact met huisdieren (vraag 59) Hoesten, piepende ademhaling, kortademigheid bij contact met huisdieren (vraag 60) Ooit huisdier weggedaan omdat allergisch (vraag 61) - Infecties tijdens zwangerschap o Luchtweginfecties: griep, infectie bovenste luchtwegen, longen (vraag 31) - Fertiliteit (uit algemene vragenlijst) o Tijd tot zwangerschap (time to pregnancy) Van huidige zwangerschap, enkel indien zwangerschap van eerste kind o Zwangerschapsstimulatie Heeft moeder ooit een behandeling ondergaan om zwanger te worden? o Miskraam Voor alle zwangerschappen samen: is er ooit een miskraam of abortus op medische indicatie geweest (geboorte van kind vooraleer het levensvatbaar is)? Parameter op basis van vragenlijst: dood geboren < 22 weken (vraag 62a/b/c 2-2) spontane miskraam of abortus op medische indicatie (vraag 62a/b/c/.2-3). OPM: Definitie van levensvatbaar is variabel: Angelsaksische landen: geboorte kind bij < 28 weken; Nederland: geboorte kind bij < 16 weken, SPE: geboorte kind < 22 weken 2. 2 Definitie Studiecentrum Perinatale Epidemiologie (SPE): geboorte = geboorte van één kind, levend of dood van >= 500 gram of van >= 22 weken. Zijn gewicht en de zwangerschapsduur onbekend dan geldt een lengte van >= 25 cm als criterium. 21

22 7 COVARIATEN EN CONFOUNDERS 7.1 CONFOUNDERS Confounders worden in de statistische modellen mee opgenomen om te corrigeren voor factoren die het onderzoek naar gebiedsverschillen in biomerkers of de relatie tussen blootstellings- en effectmerkers kunnen verstoren. Deze confounders zullen consequent in de modellen opgenomen worden onafhankelijk van hun significantieniveau. Voor de blootstellingsmerkers zijn de confounders: leeftijd van de moeder (in 5 klassen) roken tijdens de zwangerschap (ja/neen) roken vóór de zwangerschap (aantal pakjaren; in 3 klassen) Voor de effectmerkers zullen volgende confounders worden meegenomen in de modellen: Effectmerker Confounders Effectmerkers pasgeborenen Lengte kind Gewicht kind Schedelomtrek kind Zwangerschapsduur; preterme geboorte APGAR 10 min (score of binair) Geslacht kind Roken tijdens de zwangerschap (ja/neen) Leeftijd moeder Lengte moeder Lengte vader Pariteit Zwangerschapsduur Geslacht kind Roken tijdens de zwangerschap (ja/neen) Leeftijd moeder Gewicht moeder Pariteit Zwangerschapsduur Meerlingzwangerschap Geslacht kind Roken tijdens de zwangerschap (ja/neen) Leeftijd moeder Pariteit Zwangerschapsduur Meerlingzwangerschap Roken tijdens de zwangerschap (ja/neen) Leeftijd moeder Complicaties tijdens zwangerschap Meerlingzwangerschap Small for gestational age Meerlingzwangerschap Aard bevalling (vaginaal vs. keizersnede) 22

23 Effectmerker TSH in navelstrengbloed Confounders Small for gestational age Zwangerschapsduur Aard bevalling (vaginaal vs. keizersnede) Effectmerkers moeder Astma (huidig, doctor diagnosed, ooit) Hooikoorts Familiaal astma Roken vóór de zwangerschap (pakjaren) Roken vóór de zwangerschap (pakjaren) Voedselallergie / Huidallergie / Dierenallergie / Luchtweginfecties Tijd tot zwangerschap Zwangerschapsstimulatie Aantal miskramen Roken vóór de zwangerschap (pakjaren) Leeftijd moeder bij eerste zwangerschap Roken vóór eerste zwangerschap (pakjaren) Leeftijd moeder Roken vóór de zwangerschap (pakjaren) Leeftijd moeder Roken vóór de zwangerschap (pakjaren) Pariteit 7.2 COVARIATEN Covariaten zijn invloedsparameters die niet vooraf gedefinieerd werden als confouders en welke bij gebiedsvergelijkingen in het model worden gefit indien ze significant zijn. Het grootste gedeelte van de gegevens werd bekomen op basis van antwoorden in vragenlijsten bestemd voor de deelnemers. 7.3 SAMENGESTELDE COVARIATEN De vragenlijsten voor de deelnemers bevatten een aantal luiken met heel wat vragen. Sommige van die vragen werden gecombineerd tot één of meerdere samengestelde parameters voor: A. Blootstelling via beroep Codering aantal maanden uit vraag 3 en 4: < 6 maanden: score 3 maanden 6 maanden 1 jaar: score 9 maanden 1-5 jaar: score 36 maanden > 5 jaar: score 60 maanden 23

24 Overzicht van de beroepssectoren en blootstellingen van vraag 3 en 4, met bijbehorende indicatie van contacten met vervuilende stoffen: S: Solventen H: Gehalogeneerde koolwaterstoffen M: Zware metalen P: Polycyclische aromatische koolwaterstoffen (PAKs) Tabel a: Overzicht van beroepssectoren uit vraag 3 en overeenkomstige blootstelling aan vervuilende stoffen Gewerkt in Telt voor blootstelling aan Textielnijverheid S, H Chemische of petroleumindustrie S, H Metaalverwerkende nijverheid M, P Rubber of plastic nijverheid S, H Houtverwerkende nijverheid S, H Papierindustrie S, H Bouwindustrie S, H Tuinbouw H Andere landbouwsector H Auto-industrie of garage P, S Afvalverwerking P, S, H, M Laboratorium S, H S: solventen; H: gehalogeneerde koolwaterstoffen; P: polycyclische aromatische koolwaterstoffen (PAKs); M: zware metalen Tabel b Overzicht van inhoud van vraag 4 en overeenkomstige blootstelling aan vervuilende stoffen Beroepshalve contact met Telt voor blootstelling aan Carosserie voertuigen S Chemische sterilisatie S, H Contact met reinigingsmiddelen S, H Contatct met pesticiden of houtbewaarmiddelen S, H Contact met kleurstoffen of verven S, H Contact met oplosmiddelen S Contact met uitlaatgassen P Contact met benzinedampen S Contact met haarverzorgingsproducten S, H Contact met droogkuisproducten S, H S: solventen; H: gehalogeneerde koolwaterstoffen; P: polycyclische aromatische koolwaterstoffen (PAKs); M: zware metalen Samenstelling van de variabelen: - Aantal maanden gewerkt in bepaalde sector : Voor alle sectoren vermeld in vraag 3 (zie tabel a): tel aantal maanden gewerkt in bepaalde sector als arbeider of laborante op. Voor codering aantal maanden zie tabellen boven. - Aantal maanden gewerkt met : Solventen (S): Neen: nooit gewerkt met = 0. Ja: als positief geantwoord op één van de vragen 3, 4 : sectoren of contact met (zie tabel a,b) waarbij S vermeld staat. Of als ja-antwoord op vraag 6! Tel aantal maanden 24

25 gewerkt met S van vraag 3 op (codering zie boven). Doe hetzelfde voor vraag 4. Neem het maximum van beide aantal maanden. Let op! Niet de som, wel de hoogste van beide waarden. Let op: Indien nergens S werd aangeduid én op vraag 6 toch ja werd geantwoord dan telt dit voor 12 maanden. Indien wel ergens S werd aangeduid én op vraag 6 ja werd geantwoord (12 maanden) dan wordt maximum van deze aantallen maanden genomen. Gehalogeneerde koolwaterstoffen (H): Neen: nooit gewerkt met = 0. Ja: als positief op één van de vragen 3, 4 : sectoren of contact met (zie tabel a,b) waarbij H vermeld staat. Tel aantal maanden gewerkt met H van vraag 3 op (codering zie boven). Doe hetzelfde voor vraag 4. Neem het maximum van beide aantal maanden (= Niet de som, wel de hoogste van beide waarden). Zware metalen (M): Neen: nooit gewerkt met = 0. Ja: als positief op één van de vragen 3, 4 : sectoren of contact met (zie tabel a,b) waarbij M vermeld staat. Tel aantal maanden gewerkt met M van vraag 3 op (codering zie boven). Doe hetzelfde voor vraag 4. Neem het maximum van beide aantal maanden (= Niet de som, wel de hoogste van beide waarden). PAKs (P): Neen: nooit gewerkt met = 0. Ja: als positief op één van de vragen 3, 4 : sectoren of contact met (zie tabel a,b) waarbij M vermeld staat. Tel aantal maanden gewerkt met P van vraag 3 op (codering zie boven). Doe hetzelfde voor vraag 4. Neem het maximum van beide aantal maanden. (=Niet de som, wel de hoogste van beide waarden). - Laboratoriumwerk (ja/neen): ja, indien ergens laborante aangekruist in vraag 3. B. Blootstelling via hobby s Vraag 16 Hobbyblootstelling aan solventen (S) (Ja/neen): ja, indien ergens ja geantwoord op item S (zie tabel onderaan) Hobbyblootstelling aan gehalogeneerde koolwaterstoffen (H) (Ja/neen): ja, indien ergens ja geantwoord op item H (zie tabel) Hobbyblootstelling aan PAKs (P) (Ja/neen): ja, indien ergens ja geantwoord op item P (zie tabel) Via hobby meer dan 1 uur per week Telt voor blootstelling aan blootstelling aan Verf of kleurstoffen S Pesticiden of houtbewaarmiddelen S, H Uitlaatgassen: carting, motorcross, P Oplosmiddelen: tinner, lijm,.. S Reinigingsmiddelen S, H S: solventen; H: gehalogeneerde koolwaterstoffen; P: polycyclische aromatische koolwaterstoffen (PAKs); M: zware metalen C. Pesticidengebruik via beroep (vraag 3 en 4) (ja/neen): ja, indien werken in tuinbouw OF werken in andere landbouwsector OF Contact met pesticiden of houtbewaarmiddelen.via beroep (aantal maanden): aantal maanden werken in tuinbouw OF werken in andere landbouwsector OF Contact met pesticiden of houtbewaarmiddelen 25

26 in huis (vraag 15) (semiquantitatief -> aantal maal per maand): Aantal maal per maand gebruik van pesticide in huis (in zomerperiode) Aantal maal per maand: codering dagelijks 30 meerdere malen per week 20 eenmaal per week 8 meerdere malen per maand 3 éénmaal per maand of minder 1 nooit 0.bij hobby (vraag 16) (ja/neen).in tuin (categorisch): 0= neen, 1= indien ja bij vraag 39.2 en 2 = indien uzelf sproeit/strooit bij vraag 39.3 D. Verkeer - Aantal minuten (of uren) in verkeer per week : = [minuten op weg op werkdag (vraag19) x aantal werkdagen (vraag 10)] + [minuten op weg op vrije dag (vraag 19) x [7-aantal werkdagen]]!!met minuten op weg = te voet+ per fiets in stedelijke omgeving + auto,bus,tram(vraag 19) - matig-druk verkeer in buurt van woning: Matig-druk verkeer < 50 m van woning (ja/neen): ja, indien verkeerslicht of rond punt op minder dan 50 m of indien druk verkeer minder dan 50 m. Matig-druk verkeer m van woning (ja/neen): ja, indien verkeerslicht of rond punt op m of indien druk verkeer op m. Matig-druk verkeer >100 m van woning (ja/neen): ja, indien verkeerslicht of rond punt op >100 m of indien druk verkeer op >100m. - Autobus/vrachtverkeer op minder dan 50 m van woning (vraag 20): aantal per dag: Aantal bussen/vrachtwagens per dag Aantal: codering veronderstelling dag = 12h (overdag) Minder dan 1 per uur 6 Meer dan 1 per uur 24 Meer dan 1 per kwartier 48 Meer dan 1 per 5 minuten 144 E) Voeding in algemene vragenlijst - huidige voedingsgewoonte (vraag 36): geen vlees (ja/neen), ja =geen vlees, wel vis,... vegetariër(ja/neen), ja = geen vlees, geen vis, wel zuivel veganist (ja/neen), ja = geen vlees, geen vis, geen eieren, geen kaas-of melkproducten excl. zuivel (ja/neen), ja = geen vlees, geen vis, enkel eieren, kaas of zuivelproducten 26

Biomerkers van effect. Analyse van covariabelen

Biomerkers van effect. Analyse van covariabelen Biomerkers van effect Analyse van covariabelen De analyse van confounders heeft tot doel om de gebieden te vergelijken na correctie voor confounders én covariabelen. Selectie van covariabelen In het analyseplan

Nadere informatie

Biomerkers van blootstelling. Analyse van covariabelen

Biomerkers van blootstelling. Analyse van covariabelen Biomerkers van blootstelling Analyse van covariabelen De analyse van covariabelen heeft 2 doelstellingen: 1. Significante covariabelen selecteren om na te gaan welke factoren bijdragen tot de variabiliteit

Nadere informatie

Biomerkers van effect bij de moeder gebiedsvergelijking. Gecorrigeerde gegevens (gecorrigeerd voor confounders)

Biomerkers van effect bij de moeder gebiedsvergelijking. Gecorrigeerde gegevens (gecorrigeerd voor confounders) Biomerkers van effect bij de moeder gebiedsvergelijking Gecorrigeerde gegevens (gecorrigeerd voor confounders) Voor elke effect merkers werden confounders gedefiniëerd op basis van de literatuur (zie analyseplan).

Nadere informatie

Biomerkers van effect bij het kind gebiedsvergelijking. Ruwe gegevens (niet gecorrigeerd voor confounders)

Biomerkers van effect bij het kind gebiedsvergelijking. Ruwe gegevens (niet gecorrigeerd voor confounders) Biomerkers van effect bij het kind svergelijking Ruwe gegevens (niet gecorrigeerd voor confounders) De statistische analyse van de gegevens gebeurt op verschillende wijze, al naargelang het gaat om een

Nadere informatie

VLAAMS HUMAANBIOMONITORINGSPROGRAMMA 2012-2015 ANALYSES INVLOED SOCIAAL-ECONOMISCHE STATUS EN ETNISCHE HERKOMST RAPPORT PASGEBORENEN

VLAAMS HUMAANBIOMONITORINGSPROGRAMMA 2012-2015 ANALYSES INVLOED SOCIAAL-ECONOMISCHE STATUS EN ETNISCHE HERKOMST RAPPORT PASGEBORENEN VLAAMS HUMAANBIOMONITORINGSPROGRAMMA 2012-2015 ANALYSES INVLOED SOCIAAL-ECONOMISCHE STATUS EN ETNISCHE HERKOMST RAPPORT PASGEBORENEN Ann Colles, Bert Morrens, Liesbeth Bruckers, Greet Schoeters en Ilse

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Blootstelling per gebied overzicht van resultaten

Blootstelling per gebied overzicht van resultaten Blootstelling per gebied overzicht van resultaten In onderstaande tabellen worden de gebiedsverschillen samengevat. Tabel 1: Gemiddelde (95% betrouwbaarheidsinterval) blootstelling per gebied. Deze tabel

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Vlaams Humaan Biomonitoringsprogramma 2007-2011: Blootstelling-effect relaties bij moeder-kind koppels en jong volwassenen

Vlaams Humaan Biomonitoringsprogramma 2007-2011: Blootstelling-effect relaties bij moeder-kind koppels en jong volwassenen Verspreiding: Algemeen Eindrapport Vlaams Humaan Biomonitoringsprogramma 2007-2011: Blootstelling-effect relaties bij moeder-kind koppels en jong volwassenen Eva Govarts 1, Liesbeth Bruckers 2, Melissa

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Gegevensverwerving en verwerking

Gegevensverwerving en verwerking Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie

Nadere informatie

mlw stroom 2.2: Biostatistiek en Epidemiologie

mlw stroom 2.2: Biostatistiek en Epidemiologie mlw stroom 2.2: Biostatistiek en Epidemiologie Hoorcollege 1: Onderzoeksopzet en risikomaten Rosner 13.1-13.4 Capaciteitsgroep Methodologie en Statistiek tul / UM 10 januari 2006 Methodologie en Statistiek

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Fetal Origins of Socioeconomic Inequalities. in Early Childhood Health. The Generation R Study. Lindsay Marisia Silva SAMENVATTING

Fetal Origins of Socioeconomic Inequalities. in Early Childhood Health. The Generation R Study. Lindsay Marisia Silva SAMENVATTING Fetal Origins of Socioeconomic Inequalities in Early Childhood Health The Generation R Study Lindsay Marisia Silva SAMENVATTING Sociaal-economische gezondheidsverschillen vormen een groot maatschappelijk

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor 4 juni 2012 Het voorkomen van ziekte kan op drie manieren worden weergegeven: - Prevalentie - Cumulatieve incidentie - Incidentiedichtheid In de

Nadere informatie

beoordelingskader zorgvraagzwaarte

beoordelingskader zorgvraagzwaarte 1 beoordelingskader zorgvraagzwaarte In dit document geven we een beoordelingskader voor de beoordeling van de zorgvraagzwaarte-indicator. Dit beoordelingskader is gebaseerd op de resultaten van de besprekingen

Nadere informatie

5 Technische aspecten i.v.m. de statistische verwerking

5 Technische aspecten i.v.m. de statistische verwerking 5 Technische aspecten i.v.m. de statistische verwerking 5.1 Gebruikte technieken: frequentietabellen en regressie De bekomen data werden uitgezuiverd aan de hand van strikte regels (Nuyts & Zwerts 2001b),

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

6.7.1.1. Inleiding. Bespreking 5.3.7.1.2. pagina 1

6.7.1.1. Inleiding. Bespreking 5.3.7.1.2. pagina 1 6.7.1.1. Inleiding Algemeen wordt erkend dat de prenatale consultaties een fundamentele rol spelen inzake de gezondheid van de moeder en het toekomstige kind, maar de rol van respectievelijk de huisarts,

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN INLEIDING Als je geïnteresseerd bent in de vraag welke van twee behandelingen of geneesmiddelen het beste werkt, zijn er grofweg twee manieren om dat te onderzoeken: experimenteel en observationeel. Bij

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent. Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26 Regressielijn Vraag : vind het

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

Binnenmilieu en luchtwegklachten bij jonge kinderen; analyse van gegevens uit een prospectief cohort onderzoek in de regio Westelijke Mijnstreek

Binnenmilieu en luchtwegklachten bij jonge kinderen; analyse van gegevens uit een prospectief cohort onderzoek in de regio Westelijke Mijnstreek Binnenmilieu en luchtwegklachten bij jonge kinderen; analyse van gegevens uit een prospectief cohort onderzoek in de regio Westelijke Mijnstreek Paola Esser, Milieugezondsheidkundige, afdeling SIM Evelien

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

Les 2: Toetsen van één gemiddelde

Les 2: Toetsen van één gemiddelde Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing

Nadere informatie

Samenvatting. Het Terneuzen Geboortecohort. Detectie en Preventie van Overgewicht en Cardiometabool Risico vanaf de Geboorte

Samenvatting. Het Terneuzen Geboortecohort. Detectie en Preventie van Overgewicht en Cardiometabool Risico vanaf de Geboorte Het Terneuzen Geboortecohort Detectie en Preventie van Overgewicht en Cardiometabool Risico vanaf de Geboorte In Hoofdstuk 1 worden de achtergrond, relevantie, gebruikte definities en concepten, en de

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

Resultaten voor Vlaamse Gemeenschap Prenatale opvolging Gezondheidsenquête, België, 1997

Resultaten voor Vlaamse Gemeenschap Prenatale opvolging Gezondheidsenquête, België, 1997 6.7.1.1. Inleiding Algemeen wordt erkend dat de prenatale consultaties een fundamentele rol spelen inzake de gezondheid van de moeder en het toekomstige kind, maar de rol van respectievelijk de huisarts,

Nadere informatie

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Hoofdstuk 3 : Numerieke beschrijving van data Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Numerieke beschrijving van data p 1/31 Beschrijvende

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00 3de bach TEW KBM Theorie Q www.quickprinter.be uickprinter Koningstraat 13 2000 Antwerpen 168 6,00 Online samenvattingen kopen via www.quickprintershop.be BOEK 1: ENKELVOUDIGE EN MEERVOUDIGE REGRESSIE

Nadere informatie

Dessel, Mol & Retie. Uw regio, uw gezondheid, uw baby.

Dessel, Mol & Retie. Uw regio, uw gezondheid, uw baby. Uw regio, uw gezondheid, uw baby. Dessel, Mol & Retie U vindt het goed wonen in Dessel, Mol en Retie? Maar met een baby op komst stelt u zich toch soms vragen over de kwaliteit van ons milieu? Wilt u de

Nadere informatie

CHAPTER 12. Samenvatting

CHAPTER 12. Samenvatting CHAPTER 12 Samenvatting Samenvatting 177 In hoofdstuk 1 wordt een toegenomen overleving gerapporteerd van zeer vroeggeboren kinderen, gerelateerd aan enkele nieuwe interventies in de perinatologie. Uitkomsten

Nadere informatie

Nationaal geluksonderzoek. Deel 3: opvoeding en onderwijs

Nationaal geluksonderzoek. Deel 3: opvoeding en onderwijs Nationaal geluksonderzoek. Deel 3: opvoeding en onderwijs TECHNISCH RAPPORT 30 augustus 2018 Dit document is een technisch rapport van het onderzoek naar het verband tussen kenmerken van de jeugdjaren

Nadere informatie

Veel vrouwen gebruiken medicijnen tijdens hun zwangerschap. Van veel van deze medicijnen zijn de mogelijke teratogene effecten vaak nog niet goed beke

Veel vrouwen gebruiken medicijnen tijdens hun zwangerschap. Van veel van deze medicijnen zijn de mogelijke teratogene effecten vaak nog niet goed beke 107 Veel vrouwen gebruiken medicijnen tijdens hun zwangerschap. Van veel van deze medicijnen zijn de mogelijke teratogene effecten vaak nog niet goed bekend. Onderzoek naar welke medicijnen gebruikt worden

Nadere informatie

Hoofdstuk 3 hoofdstuk 4

Hoofdstuk 3 hoofdstuk 4 126 Uit talrijke studies blijkt dat blootstelling aan luchtverontreiniging veroorzaakt door verkeer leidt tot schade aan de gezondheid van hart, bloedvaten en luchtwegen. In de meeste van deze studies

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

Inhoudsopgave. Deel I Schatters en toetsen 1

Inhoudsopgave. Deel I Schatters en toetsen 1 Inhoudsopgave Deel I Schatters en toetsen 1 1 Hetschattenvanpopulatieparameters.................. 3 1.1 Inleiding:schatterversusschatting................. 3 1.2 Hetschattenvaneengemiddelde..................

Nadere informatie

Beschrijvend statistiek

Beschrijvend statistiek 1 Beschrijvend statistiek 1. In een school werd het intelligentiequotiënt gemeten van de leerlingen van het zesde jaar (zie tabel). De getallen werden afgerond tot op de eenheid. De berekeningen mogen

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Kansverdelingen Inductieve statistiek met Geogebra 4.2 Kansverdelingen Inductieve statistiek met Geogebra 4.2 Brecht Dekeyser Pedic 20 november 2013 Gent 1 Inhoud Nieuw in Geogebra 4.2 Kansverdelingen: Berekeningen en grafische voorstellingen Manueel in rekenblad

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Resultaten voor Brussels Gewest Prenatale Opvolging Gezondheidsenquête, België, 1997

Resultaten voor Brussels Gewest Prenatale Opvolging Gezondheidsenquête, België, 1997 6.7.1.1. Inleiding Algemeen wordt erkend dat de prenatale consultaties een fundamentele rol spelen inzake de gezondheid van de moeder en het toekomstige kind, maar de rol van respectievelijk de huisarts,

Nadere informatie

Beschrijvende statistiek

Beschrijvende statistiek Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend

Nadere informatie

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen. Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

Statistische variabelen. formuleblad

Statistische variabelen. formuleblad Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete

Nadere informatie

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn Statistiek: Spreiding en dispersie 6/12/2013 dr. Brenda Casteleyn dr. Brenda Casteleyn www.keu6.be Page 2 1. Theorie Met spreiding willen we in één getal uitdrukken hoe verspreid de gegevens zijn: in hoeveel

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni 2011 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE SCHATTINGEN VAN SIGNIFICANTE GOLFHOOGTE

VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE SCHATTINGEN VAN SIGNIFICANTE GOLFHOOGTE Rapport aan isterie van de Vlaamse Gemeenschap Departement Leefmilieu en Infrastructuur Administratie Waterwegen en Zeewezen AFDELING WATERWEGEN KUST VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items 1. Gegeven zijn de itemsores van 8 personen op een test van 3 items item Persoon 1 2 3 1 1 0 0 2 1 1 0 3 1 0 0 4 0 1 1 5 1 0 1 6 1 1 1 7 0 0 0 8 1 1 0 Er geldt: (a) de p-waarden van item 1 en item 2 zijn

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995 Schriftelijk examen statistiek, data-analyse en informatica Maandag 29 mei 1995 Tweede jaar kandidaat arts + Tweede jaar kandidaat in de biomedische wetenschappen Naam: Voornaam: Vraa Kengetal g Blad 1

Nadere informatie

Rapport. Rapportage Bijzondere Bijstand 2013

Rapport. Rapportage Bijzondere Bijstand 2013 w Rapport Rapportage Bijzondere Bijstand 2013 T.J. Slager en J. Weidum 14 november 2014 Samenvatting In 2013 is er in totaal 374 miljoen euro door gemeenten uitgegeven aan bijzondere bijstand. Het gaat

Nadere informatie

RESULTATENRAPPORT PASGEBORENEN

RESULTATENRAPPORT PASGEBORENEN VLAAMS HUMAANBIOMONITORINGSPROGRAMMA 2012-2015 RESULTATENRAPPORT PASGEBORENEN Samenvatting Kadering De derde cyclus van het humaanbiomonitoringsnetwerk wordt uitgevoerd in het kader van het Steunpunt Milieu

Nadere informatie

20. Multilevel lineaire modellen

20. Multilevel lineaire modellen 20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze

Nadere informatie

Resultaten voor België Ongevallen Gezondheidsenquête, België, 1997

Resultaten voor België Ongevallen Gezondheidsenquête, België, 1997 6.10.1. Inleiding De term ongeval kan gedefinieerd worden als 'elk onverwacht en plots voorval dat schade berokkent of gevaar oplevert (dood, blessures,...) of als ' een voorval dat onafhankelijk van de

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Verschillenanalyse effect nieuwe BKR. Samenvatting. Inleiding. datum Directie Kinderopvang, Ministerie SZW. aan

Verschillenanalyse effect nieuwe BKR. Samenvatting. Inleiding. datum Directie Kinderopvang, Ministerie SZW. aan Verschillenanalyse effect nieuwe BKR datum 15-8-2018 aan van Directie Kinderopvang, Ministerie SZW Lucy Kok en Tom Smits, SEO Economisch Onderzoek Rapportnummer 2018-78 Copyright 2018 SEO Amsterdam. Alle

Nadere informatie

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4 statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

De interpretatie van interactieeffecten in regressiemodellen. Jan Pickery

De interpretatie van interactieeffecten in regressiemodellen. Jan Pickery De interpretatie van interactieeffecten in regressiemodellen Jan Pickery Samenstelling Diensten voor het Algemeen Regeringsbeleid Studiedienst van de Vlaamse Regering Jan Pickery Verantwoordelijke uitgever

Nadere informatie

Resultaten voor Brussels Gewest Ongevallen Gezondheidsenquête, België, 1997

Resultaten voor Brussels Gewest Ongevallen Gezondheidsenquête, België, 1997 6.10.1. Inleiding De term ongeval kan gedefinieerd worden als 'elk onverwacht en plots voorval dat schade berokkent of gevaar oplevert (dood, blessures,...) of als ' een voorval dat onafhankelijk van de

Nadere informatie

MISSING DATA van gatenkaas naar valide uitkomsten

MISSING DATA van gatenkaas naar valide uitkomsten MISSING DATA van gatenkaas naar valide uitkomsten Sander M.J. van Kuijk Afdeling Klinische Epidemiologie en Medical Technology Assessment sander.van.kuijk@mumc.nl Inhoud Masterclass Theorie over missing

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Verbanden tussen demografische kenmerken, gezondheidsindicatoren en gebruik van logopedie

Verbanden tussen demografische kenmerken, gezondheidsindicatoren en gebruik van logopedie Notitie De vraag naar logopedie datum 24 mei 2016 aan van Marliek Schulte (NVLF) Robert Scholte en Lucy Kok (SEO Economisch Onderzoek) Rapport-nummer 2015-15 Kunnen ontwikkelingen in de samenstelling en

Nadere informatie