Het schatten van directe en indirecte eecten op een binaire uitkomst

Maat: px
Weergave met pagina beginnen:

Download "Het schatten van directe en indirecte eecten op een binaire uitkomst"

Transcriptie

1

2 Faculteit Wetenschappen Vakgroep Toegepaste Wiskunde en Informatica Het schatten van directe en indirecte eecten op een binaire uitkomst Katrien De Troeyer Promotor: Prof. Dr. S. Vansteelandt Masterproef ingediend tot het behalen van de academische graad van master in de wiskunde, afstudeerrichting toegepaste wiskunde. Academiejaar

3 Voorwoord Geachte lezer, Deze masterproef vormt een eindpunt van vijf jaar als studente wiskunde. De voorbije vijf jaar waren niet altijd even makkelijk, er waren momenten van stress en twijfel. Maar nu, dankzij genoeg doorzettingsvermogen, het einde in zicht is, krijg ik toch een beetje spijt dat het bijna voorbij is. Het waren immers ook vijf boeiende jaren, waarin ik enorm veel heb geleerd en waarin mijn interesse voor wiskunde enkel is toegenomen. Graag wil ik iedereen bedanken die direct of indirect heeft bijgedragen tot het creëren van deze masterproef. Eerst en vooral mijn promotor professor Stijn Vansteelandt voor het wekken van mijn interesse voor het beschouwde onderwerp, het verschaen van nuttige literatuur, het bijsturen en verbeteren waar nodig en voor zijn vele bruikbare tips en adviezen. Verder verdienen ook mijn ouders een dankwoord, voor de allerlaatste correcties en omdat ze mij de kansen en de vrijheid gaven om te studeren. Tenslotte bedank ik iedereen die bemoedigende woorden sprak en mij zo doorheen de stressmomenten hielp. Katrien De Troeyer De auteur geeft de toelating deze masterproef voor consultatie beschikbaar te stellen en delen van de masterproef te kopiëren voor persoonlijk gebruik. Elk ander gebruik valt onder de beperkingen van het auteursrecht, in het bijzonder met betrekking tot de verplichting de bron uitdrukkelijk te vermelden bij het aanhalen van resultaten uit deze masterproef. 2 juni 2010

4 Inhoudsopgave 1 Inleiding 1 2 Denities en identicatie van directe en indirecte eecten Counterfactuals en denities op risk dierence schaal Denities op odds ratio schaal Totaal eect Controlled direct eect Natuurlijk direct eect Natuurlijk indirect eect Veronderstellingen om causale eecten te identiceren Consistentie Compositie Geen ongemeten confounders Veronderstelling Identicatie van de odds ratio's Controlled direct eect Natuurlijk direct eect Natuurlijk indirect eect Schattingsmethodes Odds ratio methode Veronderstellingen Regressie analyse voor odds ratio's van directe en indirecte eecten Standaard errors en betrouwbaarheidsintervallen Voor- en nadelen Methode van Baron en Kenny Regressie analyse voor indirecte eecten Standaard errors en betrouwbaarheidsintervallen Veronderstellingen Voor- en nadelen Alternatieve methoden wanneer de uitkomst niet zeldzaam is Loglineair model i

5 3.3.2 Probit model Natural eect model Veronderstellingen Voor- en nadelen Algemene methode Veronderstellingen Schattingsmethode Voor- en nadelen Theoretische vergelijking van de schattingsmethoden Toepassingen Pancreasvoorbeeld Beschrijvende statistieken Veronderstellingen Methode van Baron en Kenny Odds ratio methode Loglineair model Probit model Natural eect model Algemene methode Overzicht De Jobs II dataset Beschrijvende statistieken Baron en Kenny methode Odds ratio methode Loglineair model Probit model Natural eect model Overzicht ii

6 5 Simulatiestudie Experiment Experiment Experiment Experiment Experiment Experiment Experiment Bespreking Experiment Experiment Experiment Experiment Conclusies 85 Appendix 88 Logistische verdeling Odds ratio methode Standaard errors in eenvoudig model Natural eect model Standaard errors en betrouwbaarheidsintervallen Toepassingen Methodes en uitdrukkingen in een eenvoudig geval Referenties 93 L¼st van guren 1 Causaal diagram Confounder voor de relatie mediator-uitkomst, die zelf een gevolg is van de blooststelling Totaal eect Direct en indirect eect iii

7 5 Ongemeten confounder voor de relatie mediator-uitkomst Pancreasvoorbeeld: normale QQ-plot van het gehalte aan vetzuren in het bloed Probleem 1: het eect van jobworkshops op mentale gezondheid, al dan niet via het vinden van werk Probleem 2: het eect van jobworkshops op het vinden van werk, al dan niet via het zoeken naar werk Histogram van de mate waarin men op zoek is naar werk QQ-plot van de geschatte log odds ratio's via de Baron en Kenny methode in experiment 2, indirect eect QQ-plot van de geschatte log odds ratio's via de odds ratio methode in experiment 2, indirect eect QQ-plot van de geschatte log odds ratio's via het loglineair model in experiment 2, indirect eect QQ-plot van de geschatte log odds ratio's via het probit model in experiment 2, indirect eect QQ-plot van de standaard errors van het probit model in experiment 2, indirect eect QQ-plot van de standaard errors van de Baron en Kenny methode in experiment 2, direct eect QQ-plot van de standaard errors van de odds ratio methode in experiment 2, direct eect QQ-plot van de standaard errors van het loglineair model in experiment 2, direct eect QQ-plot van de standaard errors van het probit model in experiment 2, direct eect QQ-plot van de standaard errors van het natural eect model in experiment 2, direct eect QQ-plot van de geschatte log odds ratio's via de Baron en Kenny methode in experiment 4, indirect eect QQ-plot van de geschatte log odds ratio's via de odds ratio methode in experiment 4, indirect eect QQ-plot van de geschatte log odds ratio's via het probit model in experiment 4, indirect eect QQ-plot van de geschatte log odds ratio's via het natural eect model in experiment 4, indirect eect Boxplot van de gewichten uit het natural eect model in experiment 4, direct eect iv

8 L¼st van tabellen 1 Resultaten van de verschillende methoden voor het eect van het eten van gegrild vlees op pancreaskanker, al dan niet via het vetzuurgehalte in het bloed Resultaten van de verschillende methoden voor het eect van workshops op mentale gezondheid, al dan niet via het vinden van werk Resultaten van de verschillende methoden voor het eect van workshops op het vinden van werk, al dan niet via het zoeken naar werk Resultaten simulatie, experiment 1, indirect eect Resultaten simulatie, experiment 1, direct eect Resultaten simulatie, experiment 2, indirect eect Resultaten simulatie, experiment 2, direct eect Resultaten simulatie, experiment 2, indirect eect, n = Resultaten simulatie, experiment 2, direct eect, n = Resultaten simulatie, experiment 3, indirect eect Resultaten simulatie, experiment 3, direct eect Resultaten simulatie, experiment 4, indirect eect Resultaten simulatie, experiment 4, direct eect Resultaten simulatie, experiment 5, indirect eect Resultaten simulatie, experiment 5, direct eect Resultaten simulatie, experiment 6, indirect eect Resultaten simulatie, experiment 6, direct eect Resultaten simulatie, experiment 7, indirect eect Resultaten simulatie, experiment 7, direct eect Resultaten natural eect model experiment 1, indirect eect Resultaten natural eect model experiment 1, direct eect Resultaten natural eect model experiment 2, indirect eect Resultaten natural eect model experiment 2, direct eect Resultaten natural eect model experiment 3, indirect eect Resultaten natural eect model experiment 3, direct eect Resultaten natural eect model experiment 4, indirect eect Resultaten natural eect model experiment 4, direct eect v

9 1 Inleiding 1 Inleiding In vele studies, vooral in de sociale wetenschappen en de epidemiologie, is men geïnteresseerd in het eect van een bepaalde blootstelling op een uitkomst. Het is nagenoeg altijd zo dat de blootstelling een rechtstreeks eect heeft op de uitkomst, maar het is eveneens mogelijk dat de blootstelling de uitkomst beïnvloedt via een derde, intermediaire variabele. Mediation betreft het schatten van directe en indirecte eecten van een bepaalde blootstelling, oorzaak of behandeling op een gegeven uitkomst. Om het belang van deze problematiek aan te tonen, een idee te geven waar de interesse in dit onderwerp vandaan komt en waarom het relevant is, gaan we hier eerst dieper in op de redenen waarom mediation analyse nuttig is en geven we enkele voorbeelden van studies of situaties waarin men geïnteresseerd is in het loskoppelen van directe en indirecte eecten. Enerzijds kan het informatie verschaen voor beleidsbeslissingen. Wanneer het eect van de blootstelling op de uitkomst geheel of gedeeltelijk verloopt via een intermediaire variabele, kan men nadenken over maatregelen om deze intermediaire variabele te manipuleren en zo het eect op de uitkomst te beïnvloeden. In sommige gevallen kan men onderzoeken welk eect een bepaalde manipulatie met zich meebrengt. We verduidelijken dit aan de hand van een voorbeeld, namelijk de `MIRA'-studie. In de `MIRA' (Methods for improving reproductive health in Africa)-studie tracht men te onderzoeken of het gebruik van een pessarium en vaginale gel helpt om HIV-infectie bij vrouwen te voorkomen. Er is echter nog een derde variabele die op het causale pad tussen behandeling en uitkomst ligt, namelijk het gebruik van condooms. Zowel in de behandelings- als in de controlegroep kregen de vrouwen adviezen omtrent condoomgebruik. In de behandelingsgroep bleek het condoomgebruik echter veel lager te liggen dan in de controlegroep. De aanwezige mediator maakt het op deze manier moeilijk om het echte eect van de behandeling op de preventie van HIV-infectie correct in te schatten. Men hanteert een direct eect analyse om de rol van condoomgebruik als mediator van het eect van behandeling op HIV-infectie beter te begrijpen. Om een beter beeld te krijgen van de eectiviteit van de voorgestelde behandeling, wil men immers te weten komen wat het eect van de interventie zou geweest zijn, indien vrouwen hun condoomgebruik niet hadden gewijzigd in reactie op de behandeling. Daarvoor is het gebruik van een direct eect analyse nuttig. De analyses van directe en indirecte eecten spelen dus een rol in de poging om betere oplossingen te bieden voor problemen in verband met de volksgezondheid [24]. Een tweede reden waarom intermediaire eecten zeer interessant zijn, is omdat ze een belangrijk hulpmiddel vormen in de discussie rond surrogate endpoints. Wanneer men een variabele gebruikt als surrogate endpoint voor de uitkomst waarin men werkelijk geïnteresseerd is, dan gaat men in de analyse de echte uitkomst vervangen door deze variabele. Stel bijvoorbeeld dat men het eect van een AIDS-behandeling op de overlevingsduur wil inschatten en het blijkt dat het aantal CD4 cellen een surrogate endpoint vormt voor de overlevingsduur. Dan kan men dat aantal als uitkomst nemen, in plaats van de overlevingsduur, om het eect van de behandeling op de overlevingsduur te schatten. Dit is handig omdat dergelijke studies, waarin het eect van nieuwe behandelingen op een bepaalde klinische uitkomst zoals overlevingsduur, vaak vereisen dat een groot aantal mensen gedurende een lange periode worden gevolgd vooraleer er een voldoende aantal 1

10 1 Inleiding sterftes is om over voldoende power te beschikken. Het meten van een surrogate endpoint kan meestal veel vroeger in de studie, de meting van het aantal CD4 cellen kan bijvoorbeeld maandelijks gebeuren, waardoor men sneller een inzicht krijgt in het feit of de behandeling al dan niet een eect heeft op de overlevingsduur. Het ontdekken van een surrogate endpoint kan met andere woorden zowel de kosten, het aantal patiënten als de lengte van een studie sterk reduceren [6]. Opdat een variabele echter een geldige vervanging zou zijn voor een welbepaalde uitkomst, moet die variabele aan een aantal voorwaarden voldoen. Een veel voorkomend misverstand is dat, wanneer een variabele gecorreleerd is met de uitkomst waarin men echt geïnteresseerd is, deze variabele kan gebruikt worden als een geldig surrogate endpoint [6]. Men mag de uitkomst echter enkel vervangen door een andere variabele wanneer het eect van de behandeling op het surrogate endpoint, het eect van de behandeling op de uitkomst voorspelt, wat een veel sterkere eis is. Er zijn verschillende redenen waarom een variabele mogelijk niet geschikt is om de uitkomst te vervangen. Ook al is de variabele gecorreleerd met de uitkomst, de ziekte heeft niet altijd hetzelfde eect op deze variabele als op de uitkomst. Verder kan het zijn dat de ziekte een eect heeft op de uitkomst, dat niet via het surrogate endpoint verloopt. Wanneer de behandeling enkel een invloed heeft op het pad dat via het surrogate endpoint verloopt of enkel op het directe pad van de ziekte naar de uitkomst, vormt het surrogate endpoint geen geldige vervanging voor de uitkomst. Tot slot is het ook mogelijk dat de behandeling de echte uitkomst beïnvloedt via paden die niets te maken hebben met de ziekte. De behandeling op zich heeft dan een extra eect op de uitkomst. In dit geval kan het eect van de behandeling op de uitkomst via de gekende paden (via het surrogate endpoint en rechtstreeks) sterk verstoord worden door dit extra eect. De situatie waarin een surrogate endpoint het meeste kans heeft om geldig te zijn is deze waarin het enige causale pad van de ziekte naar de uitkomst via het surrogate endpoint verloopt en waarin het volledige eect van de behandeling op de uitkomst verloopt via het surrogate endpoint. Zelfs in deze situatie kunnen surrogate endpoints echter leiden tot misleidende conclusies [6]. Hiermee is het duidelijk dat bij het evalueren van de geldigheid van een surrogate endpoint het erg belangrijk is te begrijpen welke eecten er allemaal een rol spelen en op welke manier de verschillende variabelen elkaar beïnvloeden. Het analyseren van directe en indirecte eecten kan daarbij een zeer nuttig hulpmiddel zijn. Tenslotte kunnen intermediaire variabelen nuttig zijn om bepaalde mechanismen bloot te leggen. In de epidemiologie en psychologie bijvoorbeeld wil men niet enkel onderzoeken of er een eect is van de blootstelling op de uitkomst, maar ook hoe dat eect precies in elkaar zit en waarom dergelijk eect ontstaat. Het identiceren van causale mechanismen is nuttig om verschillende theorieën rond eenzelfde causaal probleem te testen. Terwijl beleidsmakers misschien enkel geïnteresseerd zijn in de causale eecten van beleidsbeslissingen, zijn sociale wetenschappers vooral geïnteresseerd in het begrijpen van de mechanismen achter deze causale eecten en het testen van alternatieve theorieën die deze kunnen verklaren. Wanneer men bijvoorbeeld ontdekt dat sociaal-economische status (SES) een verklarende factor is voor de overlevingsduur bij hartpatiënten, is niet enkel de associatie op zich van belang maar zeker ook de manier waarop SES de overlevingsduur beïnvloedt. Een interessante vraag is dan: wordt de relatie tussen SES en overlevingsduur volledig bepaald door gekende risicofactoren zoals onder andere alcoholconsumptie, rookgedrag, mate van depressie, aanwezigheid van sociale steun,... of bestaat er een di- 2

11 1 Inleiding rect eect, onafhankelijk van deze risicofactoren? [15]. In dergelijke studies wil men dus verder gaan dan enkel aantonen dat er een verband is tussen SES en overlevingsduur, het hoofddoel is om te verklaren hoe deze relatie ontstaat. Mediation analyse is op deze manier een belangrijk hulpmiddel `om the black box te openen' [11]. VanderWeele [30] beschrijft hieromtrent het onderscheid tussen counterfactualgebaseerde causaliteit (ook wel de `black box' benadering genoemd [11]) en mechanistische causaliteit dat Aalen en Frigessi [1] maken in hun overzicht van causaliteit in de statistische literatuur. Daarbij houdt counterfactual-gebaseerde causaliteit zich essentieel bezig met eecten van een bepaalde interventie of blootstelling, zonder daarbij geïnteresseerd te zijn in de mechanismen waardoor die eecten ontstaan. Men trekt dan conclusies in verband met causale eecten ofwel door middel van gerandomiseerde studies, ofwel door middel van design en nauwgezette analyse van observationele data, waarbij de onderzoeker tracht te controleren voor alle variabelen die een confounder vormen voor de blootstelling-uitkomst relatie. Aalen en Frigessi [1] beschrijven deze benadering ook als `black box'-causaliteit aangezien de methoden die gebruikt worden om causale eecten te schatten geldig kunnen zijn, ongeacht hoe de blootstelling haar eect veroorzaakt. Mechanistische causaliteit daarentegen probeert de mechanismen te begrijpen, die aan de basis liggen van de verschillende processen waaruit bepaalde uitkomsten ontstaan. Het beoordelen van mechanistische causaliteit vraagt diepgaandere observaties en heel wat wetenschappelijke kennis. Het model voor mechanistische causaliteit is de natuurwetenschappen, waarin men probeert de natuurwetten en de mechanismen achter de fenomenen die we observeren, te identiceren. In de mechanistische benadering tracht men `in the black box' te kijken. Het loskoppelen van directe en indirecte eecten is een eerste stap in deze richting, wat zou moeten leiden tot verbeterde causale inferentie. VanderWeele [30] merkt op dat een indeling in counterfactual en mechanistische benadering nuttig kan zijn, maar waarschijnlijk het best wordt beschouwd als een spectrum in plaats van als een absoluut onderscheid. Zoals opgemerkt door Aalen en Frigessi [1], is, zelfs bij de counterfactual-gebaseerde aanpak, toch enige wetenschappelijke kennis vereist om te kunnen bepalen voor welke variabelen men moet controleren om dan de schattingen causaal te kunnen interpreteren. Het gebruik van direct acyclic graphs om na te denken over confounding duidt ook op de relatie tussen de counterfactual-gebaseerde benadering in observationele studies en wetenschappelijke theorie of kennis. Bovendien hebben de theorie en de methoden in de statistische en epidemiologische literatuur rond medation het onderscheid tussen de counterfactual-gebaseerde en mechanistische causaliteit doen vervagen. Recent werk in de causale inferentie over de identicatie en het schatten van directe en indirecte eecten komt voort uit de counterfactual-gebaseerde aanpak van causaliteit gebaseerd op het nauwgezet controleren voor confounders en op verschillende veronderstellingen die nodig zijn om de eecten te kunnen identiceren. Het soort van conclusies die de onderzoeker kan trekken op basis van dergelijk werk zijn echter mechanistisch van aard; het gaat immers over het feit of het eect van de ene variabele op de andere verloopt via een derde intermediaire variabele. Men zou dus kunnen zeggen dat dit recent werk rond mediation ergens in het midden van het counterfactual causaliteit-mechanistische causaliteit spectrum ligt. In die zin is de interpratie van Cox en Wermuth [5] interessant, die spreken over niveaus van causaliteit. Een welbepaalde studie kan misschien enkel 3

12 1 Inleiding het gemiddelde causale eect van een interventie identiceren, terwijl een andere studie misschien een deel van de onderliggende mechanismen kan blootleggen, waarbij een ander deel nog onbekend blijft. Enkel geleidelijk aan en met veel meer beschikbare data zal dan additionele kennis over de mechanismen mogelijk zijn. We hebben nu drie aantrekkelijke en praktische redenen aangehaald die het nut van mediation analyse bewijzen. Allemaal tonen ze aan dat het loskoppelen van directe en indirecte eecten het voordeel biedt dat complexere theorieën getest kunnen worden, waardoor men een dieper inzicht krijgt op de relatie tussen blootstelling/behandeling en uitkomst [11]. Belangrijke vragen zijn nu enerzijds hoe men kan bepalen of er al dan niet een intermediair eect aanwezig is, en als het aanwezig is, hoe men dan de grootte ervan kan inschatten en anderzijds hoe men kan bepalen of er een direct eect aanwezig is en opnieuw hoe men dan de grootte ervan kan inschatten. Er zijn verschillende methoden bekend. In deel twee worden totale, directe en indirecte eecten gedenieerd en geïdenticeerd aan de hand van een aantal veronderstellingen. Vervolgens geven we in deel drie een overzicht van de verschillende schattingsmethoden voor een binaire uitkomst, hoe deze te werk gaan om bepaalde eecten te schatten, welke veronderstellingen er moeten gemaakt worden om onvertekende schattingen te krijgen en wat de voor- en nadelen van elk van de methoden zijn. Op basis hiervan maken we een vergelijking van de verschillende benaderingen. Daarna bekijken we twee toepassingen die de werking van de methoden verduidelijken. Verder voeren we een simulatiestudie uit, enerzijds om te onderzoeken in welke mate de resultaten vertekend worden wanneer één of meerdere veronderstellingen niet opgaan en anderzijds om uit te zoeken welke methode men het best gebruikt in verscheidene situaties. In het laatste deel worden tot slot nog enkele algemene besluiten geformuleerd. 4

13 2 Denities en identicatie van directe en indirecte eecten 2 Denities en identicatie van directe en indirecte effecten Eerst wordt kort het idee van counterfactuals of potentiële uitkomsten uiteengezet en hoe men met behulp daarvan directe en indirecte eecten kan deniëren op de risk dierence schaal, zowel als op de odds ratio schaal. Vervolgens wordt beschreven welke veronderstellingen er nodig zijn om het directe en indirecte eect te kunnen indenticeren. Tenslotte wordt met behulp van deze veronderstellingen aangetoond hoe de gedenieerde odds ratio's kunnen geïdenticeerd worden. In het bijzonder richten wij ons op situaties waarbij de uitkomst binair is. De volgende notatie wordt telkens gehanteerd: A is de binaire blootstelling, Y de binaire uitkomst en M de intermediaire variabele of mediator. C is een verzameling van baseline variabelen die niet beïnvloed worden door de blootstelling. De onderlinge relaties worden voorgesteld aan de hand van een causaal diagram of causal directed acyclic graph [17] (causal DAG) in guur 1. Een DAG is een systeem van pijlen tussen variabelen, waarbij er geen lussen mogen voorkomen. Men spreekt van een causal DAG wanneer voldaan is aan twee voorwaarden: (i) wanneer er geen rechtstreekse pijl aanwezig is van een variabele X naar een variabele Y, dan is er geen direct eect van X op Y en (ii) alle gemeenschappelijke oorzaken van elke twee variabelen zijn opgenomen als een variabele in de DAG. De eerste voorwaarde stelt dat de afwezigheid van pijlen causale veronderstellingen impliceert, de tweede dat er geen ongemeten confounders mogen optreden. Voor het causaal diagram in guur 1 betekent de tweede voorwaarde dat er, naast C, geen andere confounders meer zijn voor het eect van zowel A op M, als het eect van M op Y, als het eect van A op Y. Met een pad van A naar Y bedoelt men elke aaneenschakeling van pijlen die A en Y verbinden (het maakt niet uit of de pijlen in dezelfde richting wijzen of niet). In guur 1 bijvoorbeeld vormt A M Y een pad, maar ook A C Y en A M C Y vormen een pad van A naar Y. Verder zeggen we dat de variabele Y een nakomeling is van variabele X als er een pad van X naar Y bestaat dat enkel bestaat uit pijlen die in dezelfde richting wijzen (van X naar Y ). In guur 1 bijvoorbeeld is Y een nakomeling van A. Voor meer details omtrent DAGs, zie [9] en [17]. Figuur 1: Causaal diagram Wanneer men op zoek is naar het eect van een blootstelling op een uitkomst is de grasche voorstelling aan de hand van een causaal diagram zeer nuttig om beter te begrijpen welke 5

14 2 Denities en identicatie van directe en indirecte eecten variabelen mogelijke confounders vormen voor dit eect en of de eecten die men tracht te schatten causaal zijn of niet. Een pad van X naar Y wordt als causaal beschouwd wanneer alle pijlen op het pad van X naar Y wijzen. Wanneer minstens één pijl in de tegenovergestelde richting wijst, spreekt men van een niet-causaal (spurious) pad. In het causaal diagram van guur 1 bijvoorbeeld is het pad A M Y causaal, terwijl A C Y een niet-causaal pad vormt. Wanneer men een associatie vindt tussen twee variabelen X en Y, gebruikt men een regel die d-seperation [17] wordt genoemd om in te zien wat nu eigenlijk de associatie tussen deze variabelen veroorzaakt. Beschouw een DAG als een elektrisch circuit met colliders en non-colliders die werken als schakelaars [33]. Een variabele Z wordt een collider genoemd op een bepaald pad wanneer er twee pijlen toekomen in Z langs dat pad, terwijl Z een non-collider is op een bepaald pad wanneer er twee pijlen vertrekken of wanneer er één pijl toekomt en één pijl vertrekt langs dat pad. In guur 1 bijvoorbeeld vormt M een collider op het pad A M C Y, terwijl M een non-collider is op het pad A M Y. Een noncollider kan beschouwd worden als een actieve schakelaar; de stroom kan er dus passeren. Een collider is inactief en blokkeert dus de stroom. Komen op een pad enkel non-colliders voor, dan krijgt men een actief pad waar de stroom vrij kan lopen, komt er minstens één collider voor, dan wordt de stroom hierdoor geblokkeerd. Wanneer men nu bij het controleren voor confounders controleert voor een non-collider door te conditioneren op deze non-collider dan verandert deze van actief (er kan stroom passeren) naar inactief (de stroom wordt geblokkeerd). Wanneer men controleert voor een collider of één van zijn nakomelingen, verandert deze van inactief naar actief. Indien er geen elektrische stroom loopt van X naar Y, dan zijn X en Y onafhankelijk. Als er minstens één actief pad bestaat van X naar Y, dan is er mogelijks een associatie tussen X en Y. 2.1 Counterfactuals en denities op risk dierence schaal Een counterfactual of potentiële uitkomst Y (a) is de waarde die zou geobserveerd worden voor de uitkomst Y indien, mogelijk in tegenstelling tot de werkelijkheid, de blootstelling A werd vastgelegd op de waarde a door middel van een interventie of manipulatie. Wanneer we werken met een binaire blootstelling A, i.e. A = 0 bij niet-blootstelling en A = 1 bij blootstelling, heeft elke persoon in een studie twee potentiële uitkomsten: Y (0) en Y (1). Het causale eect van de blootstelling op de uitkomst wordt dan gedenieerd als Y (1) Y (0). Aangezien voor elke persoon uit de populatie slechts één van de twee counterfactuals wordt geobserveerd, ofwel Y (1), ofwel Y (0), kan men het causale eect voor elke persoon afzonderlijk niet berekenen. Bovendien is men vaak ook niet geïnteresseerd in het eect bij een speciek individu. Daarom wordt het gemiddelde causale eect van de blootstelling op de uitkomst, E[Y (1) Y (0)], genomen. Bij een niet-gerandomiseerde studie kan dit verschillend zijn van E[Y A = 1] E[Y A = 0]. De laatste uitdrukking vergelijkt immers twee groepen binnen de populatie: de groep die wel blootgesteld werd en de groep die niet blootgesteld werd. In een niet-gerandomiseerde studie is het echter mogelijk dat deze twee groepen niet vergelijkbaar zijn, met andere woorden dat de ene groep substantieel verschilt van de andere wat betreft één of een aantal variabelen. Dit is het probleem van confounding. Wanneer je gebruik maakt van counterfactuals stelt dit probleem zich 6

15 2 Denities en identicatie van directe en indirecte eecten niet, omdat je twee maal dezelfde populatie vergelijkt: één keer wanneer iedereen werd blootgesteld en één keer wanneer iedereen niet werd blootgesteld, waardoor inderdaad een causale interpretatie mogelijk is. Om nu indirecte eecten te kunnen deniëren, wordt het concept van de counterfactuals uitgebreid. Y (a, m) wordt gedenieerd als de uitkomst die zou geobserveerd worden indien de blootstelling A werd vastgelegd op de waarde a en de intermediaire variabele M werd vastgelegd op de waarde m. Analoog kunnen we de potentiële variabele M(a) beschouwen, die de waarde voorstelt van de intermediaire variabele indien de blootstelling A werd vastgelegd op de waarde a. Voor een binaire uitkomst denieert men het controlled direct eect van het verhogen van de blootstelling met één eenheid op de uitkomst, terwijl men de mediator vasthoudt op waarde m, als Y (1, m) Y (0, m). Analoog aan het totale eect kan men ook hier enkel het gemiddelde controlled direct eect, E[Y (1, m) Y (0, m)], identiceren onder de veronderstellingen in het causaal diagram van guur 1. Dit geeft weer wat het eect is van het verhogen van de blootstelling met één eenheid op de uitkomst indien men de intermediaire variabele vasthoudt op een bepaalde waarde m voor iedereen in de populatie. Deze uitdrukking geeft ons het direct eect van de blootstelling op de uitkomst. Wanneer men dit aftrekt van het totale causale eect heeft dit verschil echter niet altijd de interpretatie van een indirect eect [20]. Inderdaad, zelfs wanneer A geen eect heeft op M en er dus geen mediation kan zijn, is het mogelijk dat het controlled direct eect E[Y (1, m) Y (0, m)] verschilt van het totale eect E[Y (1) Y (0)], waardoor men zou kunnen denken dat een deel van het totale eect verloopt via een mediator. Stel bijvoorbeeld dat A geen eect heeft op M zodat er geen intermediair eect kan zijn van A op Y via M, maar veronderstel dat er een interactie is tussen A en M in hun eect op Y. Als er interactie is tussen de eecten van A en M op Y, dan zal E[Y (1, m) Y (0, m)] verschillen voor verschillende nivaus van m. Er bestaat dus een m waarvoor E[Y (1, m) Y (0, m)] verschilt van het totale eect E[Y (1) Y (0)]. Wanneer men dus een controlled direct eect krijgt dat verschilt van het totale eect, vormt dit niet automatisch een bewijs voor mediation. Men kan het indirecte eect daarom beter deniëren met behulp van natuurlijke directe en indirecte eecten zoals in volgende paragraaf. Het (gemiddeld) natuurlijk direct eect [19] van de blootstelling op de uitkomst wordt gedenieerd als E[Y (a, M(0)) Y (0, M(0))]. Het drukt uit wat het eect is van een toename van de blootstelling van 0 naar a, terwijl op één of andere manier het eect van de blootstelling op de intermediaire variabele werd geblokkeerd. Soms maakt men het onderscheid tussen het totaal direct eect E[Y (1, M(1)) Y (0, M(1))] en het puur direct eect E[Y (1, M(0)) Y (0, M(0))]. Het (gemiddeld) natuurlijk indirect eect [19] wordt dan gedenieerd als E[Y (a, M(a)) Y (a, M(0))]. Dit drukt uit hoeveel de uitkomst gemiddeld zou veranderen indien de blootstelling werd vastgehouden op niveau a en de intermediaire variabele werd veranderd van niveau M(0) naar M(a), waardoor het inderdaad de interpretatie krijgt van een indirect eect. Ook hier kan men een onderscheid maken tussen totaal indirect eect E[Y (1, M(1)) Y (1, M(0))] en puur indirect eect E[Y (0, M(1)) Y (0, M(0))]. Totale eecten, controlled directe eecten en natuurlijke directe en indirecte eecten kunnen ook gedenieerd worden zodat blootstellingsniveaus a en a vergeleken worden 7

16 2 Denities en identicatie van directe en indirecte eecten (i.p.v. a en 0). Het totale eect wordt dan E[Y (a) Y (a )], het controlled direct eect E[Y (a, m) Y (a, m)], het natuurlijk direct eect E[Y (a, M(a )) Y (a, M(a ))] en het natuurlijk indirect eect E[Y (a, M(a)) Y (a, M(a ))]. Indien er geen interactie is tussen de eecten van A en M op Y dan heeft Robins [23] aangetoond dat het controlled direct eect, het totaal direct eect en het puur direct eect samenvallen. Wanneer er geen interactie aanwezig is, betekent dit dat de omvang van het eect van A op Y dezelfde is, voor elk niveau van M. We kunnen dit uitdrukken als: Y (a, m) Y (a, m) = f(a, a ) met f een functie die onafhankelijk is van m. Bijgevolg is het verschil Y (a, m) Y (a, m) voor om het even welke waarde van m dezelfde functie. Hieruit volgt dat E[Y (a, m) Y (a, m)] = E[Y (a, M(a)) Y (a, M(a))] = E[Y (a, M(a )) Y (a, M(a ))] = f(a, a ). Bovendien zijn ze allemaal gelijk aan het totaal eect als er geen natuurlijke indirecte eecten zijn. In dit geval kan men controlled directe eecten en totale eecten wel gaan vergelijken om te oordelen of er al dan niet sprake is van mediation. Met andere woorden, enkel onder de veronderstelling dat er geen interactie aanwezig is, kan men controlled directe eecten gebruiken om mediation te onderzoeken. Een mooie eigenschap van natuurlijke eecten is dat het totale (causale) eect kan opgesplitst worden in een natuurlijk direct en indirect eect: E[Y (a) Y (a )] = E[Y (a, M(a)) Y (a, M(a ))] = E[Y (a, M(a)) Y (a, M(a ))] + E[Y (a, M(a )) Y (a, M(a ))]. Hiervoor is wel de compositieveronderstelling nodig, die in sectie 2.3 aan bod komt. 2.2 Denities op odds ratio schaal Aangezien wij vooral geïnteresseerd zijn in situaties met een binaire uitkomst, is een uitbreiding naar een odds ratio schaal interessanter. Deze werd geïntroduceerd door VanderWeele en Vansteelandt [32] Totaal eect Het totaal eect, conditioneel op C = c, waarbij blootstellingsniveau a en a vergeleken worden, wordt gedenieerd als: OR T E a,a c = P (Y (a) = 1 c)/ {1 P (Y (a) = 1 c)} P (Y (a ) = 1 c)/ {1 P (Y (a ) = 1 c)}. Het vergelijkt de odds van uitkomst Y = 1 in stratum C = c indien A werd vastgelegd op a met de odds van uitkomst Y = 1 in stratum C = c indien A werd vastgelegd op a. 8

17 2 Denities en identicatie van directe en indirecte eecten Controlled direct eect Het controlled direct eect, conditioneel op C = c, waarbij blootstellingsniveau a en a vergeleken worden en de intermediaire variabele wordt vastgelegd op m wordt gedenieerd als: OR CDE a,a c(m) = P (Y (a, m) = 1 c)/ {1 P (Y (a, m) = 1 c)} P (Y (a, m) = 1 c)/ {1 P (Y (a, m) = 1 c)}. Het beschrijft het eect van de blootstelling A op de uitkomst Y, wanneer men de intermediaire variabele M vaststelt op m Natuurlijk direct eect Het natuurlijk direct eect, conditioneel op C = c, waarbij blootstellingsniveau a en a vergeleken worden en de intermediaire variabele wordt vastegelegd op de waarde die zij zou aannemen indien het blootstellingsniveau zou vastgelegd zijn op a, wordt gedenieerd als: OR NDE a,a c(a ) = P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)} P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)}. Dit kan geïnterpreteerd worden als een vergelijking van de odds, conditioneel op C = c, van de uitkomst Y indien de blootstelling a was en indien de intermediaire variabele vastgelegd was op M(a ) en de odds, conditioneel op C = c, van de uitkomst indien de blootstelling a was en indien de intermediaire variabele vastgelegd was op M(a ) Natuurlijk indirect eect Het natuurlijk indirect eect, conditioneel op C = c, waarbij de niveaus M(a) en M(a ) van de intermediaire variabele vergeleken worden en waarbij de blootstelling vastgelegd wordt op a, wordt gedenieerd als: OR NIE a,a c(a) = P (Y (a, M(a)) = 1 c)/ {1 P (Y (a, M(a)) = 1 c)} P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)}. Dit kan geïnterpreteerd worden als een vergelijking van de odds, conditioneel op C = c, van de uitkomst Y indien de blootstelling a was en indien de intermediaire variabele was vastgelegd op M(a) en de odds, conditioneel op C = c, van de uitkomst Y indien de blootstelling a was en de intermediaire variabele was vastgelegd op M(a ). Op de risk dierence schaal hebben natuurlijke directe en indirecte eecten de eigenschap dat het conditionele eect E [Y (a) Y (a ) c] uiteenvalt in een conditioneel natuurlijk direct en indirect eect: E [Y (a) Y (a ) c] = E[Y (a, M(a)) Y (a, M(a )) c] = E[Y (a, M(a)) Y (a, M(a )) c] + E[Y (a, M(a )) Y (a, M(a )) c]. 9

18 2 Denities en identicatie van directe en indirecte eecten Op de odds ratio schaal, zal de odds ratio voor het totaal eect uiteenvallen in een product van odds ratio's voor het natuurlijk direct en indirect eect: OR T E a,a c = = = P (Y (a) = 1 c)/ {1 P (Y (a) = 1 c)} P (Y (a ) = 1 c)/ {1 P (Y (a ) = 1 c)} P (Y (a, M(a)) = 1 c)/ {1 P (Y (a, M(a)) = 1 c)} P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)} P (Y (a, M(a)) = 1 c)/ {1 P (Y (a, M(a)) = 1 c)} P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)} P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)} P (Y (a, M(a )) = 1 c)/ {1 P (Y (a, M(a )) = 1 c)} = OR NIE a,a c(a) OR NDE a,a c(a ). Hierbij werd gebruik gemaakt van de compositievoorwaarde die in sectie 2.3 wordt uiteengezet. Over het algemeen zeggen we dat `M een mediator is voor het eect van A op Y ' (op de risk dierence schaal) als voor een bepaald individu één van de natuurlijke indirecte eecten E[Y (0, M(1)) Y (0, M(0))] (puur) of E[Y (1, M(1)) Y (1, M(0))] (totaal) verschillend is van nul. Als er geen mediation is (i.e. als het puur indirect eect en het totaal indirect eect beiden nul zijn voor iedereen) dan zullen het puur en totaal direct eect beiden samenvallen met het totaal direct eect van A op Y. We weten al dat het totaal eect E[Y (1) Y (0)] kan geschreven worden als de som van een totaal direct eect en een puur indirect eect: E[Y (1) Y (0)] = E[Y (1, M(1)) Y (0, M(1))] + E[Y (0, M(1)) Y (0, M(0))], of als de som van een totaal indirect eect en een puur direct eect: E[Y (1) Y (0)] = E[Y (1, M(1)) Y (1, M(0))] + E[Y (1, M(0)) Y (0, M(0))]. Stel nu dat zowel het puur indirect eect als het totaal indirect eect nul zijn, i.e. als zowel E[Y (0, M(1)) Y (0, M(0))] = 0 als E[Y (1, M(1)) Y (1, M(0))] = 0, dan krijgen we dat E[Y (1) Y (0)] = E[Y (1, M(1)) Y (0, M(1))] en E[Y (1) Y (0)] = E[Y (1, M(0)) Y (0, M(0))]. Dit betekent dat het totaal eect, het totaal direct eect en het puur direct eect allen samenvallen. We zeggen dus dat M een mediator is voor het eect van A op Y van zodra één van de natuurlijke indirecte eecten verschillend is van nul. Wanneer ze immers beiden nul zijn, dan vallen het totaal eect en de natuurlijke directe eecten samen. Hetzelfde kunnen we zeggen op de odds ratio schaal. De odds ratio van het totaal eect kan geschreven worden als het product van de odds ratio van het natuurlijk indirect eect en de odds ratio van het natuurlijk direct eect. Als er geen mediation aanwezig is, i.e als de odds ratio van het indirect eect gelijk is aan één, dan valt de odds ratio van het totaal eect samen met de odds ratio van het natuurlijk direct eect. M vormt dus een mediator voor het eect van A op Y van zodra de odds ratio van het natuurlijk indirect eect verschillend is van één. 10

19 2 Denities en identicatie van directe en indirecte eecten We merken nogmaals op dat we in de praktijk niet beschikken over volledige informatie over de counterfactuals. Voor elk individu kan immers hoogstens één counterfactual geobserveerd worden. Daarom wordt in de praktijk steeds het gemiddelde eect geschat. Als er, gemiddeld genomen, een indirect eect is van A op Y via M dan moeten er individuen zijn waarvoor het eect van A op Y verloopt via M. 2.3 Veronderstellingen om causale eecten te identiceren Om de hierboven gedenieerde eecten te kunnen identiceren, zijn er een aantal veronderstellingen nodig. Hiermee bedoelen we dat deze veronderstellingen het mogelijk maken de formele denities om te zetten in uitdrukkingen die kunnen worden afgeleid uit de data Consistentie De consistentievoorwaarde [19] wordt formeel uitgedrukt als: Y (a) = Y als A = a M(a) = M als A = a Y (a, m) = Y als A = a en M = m. Consistentie veronderstelt dat wanneer de blootstelling vastgelegd wordt op niveau a en de intermediaire variabele vastgelegd wordt op niveau m, de uitkomst dezelfde waarde aanneemt als diegene die geobserveerd wordt wanneer A `op natuurlijke wijze' gelijk is aan a en M `op natuurlijke wijze' gelijk is aan m. Er wordt met andere woorden verondersteld dat de interventies die nodig zijn om A op niveau a te zetten en M op niveau m te zetten op zich geen extra eect hebben op de uitkomst. Hierdoor wordt het mogelijk om een counterfactual te gaan observeren. Deze veronderstelling zegt immers dat wanneer een persoon in de dataset de waarde a heeft voor A en de waarde m voor M, hetgeen we observeren voor zijn uitkomst Y, de waarde is van de counterfactual Y (a, m) Compositie De compositievoorwaarde [19] stelt dat, voor alle a Y (a, M(a)) = Y (a). Bij de analyse van directe en indirecte eecten is deze veronderstelling belangrijk, omdat ze ervoor zorgt dat het totaal eect kan geschreven worden als een verschil van een natuurlijk direct en indirect eect op de risk dierence schaal en als een product van een natuurlijk direct en indirect eect op de odds ratio schaal. Toch wordt de compositieveronderstelling vaak slechts impliciet gemaakt omdat ze, conceptueel gezien, geen extra problemen geeft bovenop diegene van de consistentievoorwaarde. Deze laatste eist immers dat zowel de interventie op A als de interventie op M geen extra eect heeft op de uitkomst Y, terwijl compositie enkel eist dat de interventie op M geen extra eect heeft op Y. 11

20 2 Denities en identicatie van directe en indirecte eecten Geen ongemeten confounders Deze veronderstelling zegt dat er geen ongemeten confounders mogen bestaan voor: de blootstelling-uitkomst relatie de mediator-uitkomst relatie de blootstelling-mediator relatie Y (a, m) A C (1) Y (a, m) M A, C (2) M(a) A C, (3) voor alle a en m. Bovendien wordt verondersteld dat voor elke relatie de verzameling van confounders C dezelfde is. Veronderstelling (1) zegt dat conditioneren op C voldoende is om te controleren voor confounders van de relatie tussen de blootstelling en de uitkomst. Er wordt met andere woorden verondersteld dat er, naast C, geen variabelen zijn die zowel een invloed hebben op A als op Y. Beschouw het voorbeeld waarin men het eect van roken (A) op longkanker (Y ) wil onderzoeken, waarbij A = 0 staat voor niet roken, A = 1 voor roken, Y = 0 voor geen longkanker en Y = 1 voor longkanker. Stel men heeft twee vergelijkbare groepen, niet-rokers en rokers. Voor de niet-rokers kennen we de waarde van Y (0) wegens consistentie, wat de waarde van Y (1) is weten we niet. Maar aangezien de twee groepen volledig vergelijkbaar zijn is het enige verschil tussen de groepen dat de ene groep rookt en de andere niet. Dus we verwachten dat de waarde van Y voor de niet-rokers, indien ze wel zouden roken, gelijk is aan de waarde van Y van de rokers. Met andere woorden we verwachten dat Y (1) voor de niet-rokers dezelfde waarde heeft als Y (1) voor de rokers. Dus of men nu in de rokers of de niet-rokers groep zit, de waarde van Y (1) blijft dezelfde. Analoog voor Y (0). Wanneer er geen confounders aanwezig zijn, geldt dus dat Y (a) onafhankelijk is van A voor alle a. Dit om aan te geven dat veronderstelling (1) inderdaad de interpretatie heeft dat er, naast C, geen confounders meer zijn voor de relatie tussen de blootstelling en de uitkomst. Veronderstelling (2) zegt dat conditioneren op A en C voldoende is om te controleren voor confounders van de relatie tussen de intermediaire variabele en de uitkomst. Men veronderstelt dus dat er, conditioneel op A en C geen verdere confounders zijn van de relatie tussen de intermediaire variabele en de uitkomst. Indien veronderstellingen (1) en (2) gelden kunnen controlled directe eecten geïdenti- ceerd worden zoals wordt aangetoond in sectie 2.4. Wanneer veronderstelling (1) geldt, maar veronderstelling (2) niet, dan zullen zowel het controlled direct eect, het natuurlijk direct eect als het natuurlijk indirect eect over het algemeen niet identiceerbaar zijn. Veronderstelling (3) is nodig om natuurlijke eecten te kunnen identiceren en kan geïnterpreteerd worden als: conditioneel op C zijn er geen ongemeten confounders voor de 12

21 2 Denities en identicatie van directe en indirecte eecten relatie tussen de blootstelling A en de intermediaire variabele M. Er wordt dus met andere woorden verondersteld dat er, naast C, geen andere variabelen zijn die zowel A als M beïnvloeden. Om natuurlijke directe en indirecte eecten te kunnen identiceren is er nog een vierde veronderstelling [19] nodig Veronderstelling 4 Voor alle a, a en m: Y (a, m) M(a ) C. (4) Indien er een variabele L bestaat, die een gevolg is van A en een confounder vormt voor de relatie tussen M en Y, dan zal veronderstelling (4) niet voldaan zijn, ongeacht er beschikbare data over L aanwezig is [19]. Als veronderstelling (4) niet voldaan is, dan is er aangetoond dat natuurlijke directe en indirecte eecten niet algemeen geïdenticeerd kunnen worden [2]. Figuur 2: Confounder voor de relatie mediator-uitkomst, die zelf een gevolg is van de blooststelling Deze veronderstellingen zijn in de praktijk moeilijk te testen en het is vaak moeilijk om aannemelijke situaties te bedenken waarin de veronderstellingen plausibel zijn. Om de odds ratio's van natuurlijke directe en indirecte eecten te kunnen identiceren, moeten veronderstellingen (1)-(4) gelden. Vooral veronderstellingen (2) en (4) vormen strenge eisen. Wanneer er een gevolg van de blootstelling bestaat die op zijn beurt zowel de intermediaire variabele als de uitkomst beïnvloedt, zal voorwaarde (4) niet voldaan zijn, ongeacht er data voorhanden is over deze confounder. Dit in tegenstelling tot veronderstellingen (1)-(3) die zouden kunnen voldaan zijn, of toch tenminste bij benadering, wanneer er meer en meer data wordt verzameld over confounders C. Vandaar dat men voorwaarden (1)-(3) `geen ongemeten confounders' voorwaarden noemt. Er mogen met andere woorden wel confounders aanwezig zijn, maar ze moeten gemeten worden om ze dan te kunnen opnemen in het model. Voorwaarde (4) daarentegen eist dat er helemaal geen gevolg van de blootstelling bestaat, die een confounder vormt voor de relatie tussen intermediaire variabele en uitkomst. Of er nu data voorhanden is over een dergelijke confounder of niet, maakt geen verschil; voorwaarde (4) zal sowieso niet voldaan zijn. Het probleem is dat in vele contexten voorwaarde (4) niet realistisch is. Stel bijvoorbeeld dat 13

22 2 Denities en identicatie van directe en indirecte eecten we in de JOBS II dataset, die later nog aan bod zal komen, het eect van jobworkshops (A) op mentale gezondheid (Y ), al dan niet via het vinden van werk (M), bekijken. Dan is het niet ondenkbaar dat het zoeken naar werk, wat zelf een gevolg is van de interventie, zowel een invloed heeft op het vinden van werk als op de mentale gezondheid. Het zoeken naar werk zou dan de variabele L zijn, zoals voorgesteld in guur 2. Veronderstelling (4) is meer aannemelijk in situaties waarin de intermediaire variabele onmiddellijk na of niet veel later dan de blootstelling wordt gemeten [29]. We merken op dat voorwaarden (1)-(3) niet uit het oog mogen verloren worden. Vaak wordt er te weinig aandacht besteed aan het opsporen van confounders met vertekende schatters als gevolg. Om geldige schatters te krijgen, moet men alle confounders van zowel de blootstelling-uitkomst relatie, blootstelling-mediator relatie als de mediator-uitkomst relatie opsporen en er data over verzamelen. In de praktijk is dit niet zo eenvoudig. Het is met andere woorden erg belangrijk voldoende na te denken over mogelijke confounding, eerder dan de bekomen resultaten zomaar aan nemen. Wanneer men de odds ratio van het controlled direct eect wil schatten, zijn enkel veronderstellingen (1) en (2) vereist. Indien er echter een variabele L aanwezig is die een gevolg is van de blootstelling A en een confounder vormt voor de relatie tussen M en Y, moet voorwaarde (2) aangepast worden tot (2*): Y (a, m) M {A, C, L}. Hierbij veronderstellen we dat er data over L voorhanden is. Bovendien zal de voorgestelde schattingstechniek geen geldige schattingen geven van de controlled direct eect odds ratio, zelfs al is er data over L en gelden voorwaarden (1) en (2*). Andere statistische benaderingen zoals marginal structural models [22], [27], [31] of structural nested models [8], [21], [26], [34] kunnen dan aangewend worden om deze odds ratio te kunnen schatten. Verder kunnen er problemen onstaan rond de zogenaamde interventies. We verwijzen hier naar het controlled direct eect. De interpretatie van een dergelijk eect vereist immers dat men nadenkt over interventies die voor alle personen de intermediaire variabele M op dezelfde waarde m zet. Vaak is het niet realistisch iedereen in de studie dezelfde waarde voor M te geven. Bovendien vereist de consistentievoorwaarde dat het vastleggen van M op een vaste waarde geen bijkomend eect heeft op de uitkomst Y. Het is moeilijk om in de praktijk dergelijke geloofwaardige interventies te vinden. Ofwel omdat de intermediaire variabele niet manipuleerbaar is, ofwel omdat elke aannemelijke manipulatie de uitkomst bijkomend beïnvloedt. Dit is zeker het geval in psychologische studies, waarin indirecte eecten vaak aan bod komen, omdat het daar vaak gaat over gedragingen, meningen of reacties die moeilijk te manipuleren zijn. Maar zelfs in gevallen waarin het niet mogelijk is om een aannemelijke interventie te bedenken om de intermediaire variabele vast te leggen, kan de denitie van het controlled direct eect toch nuttig zijn, omdat dit eect weergeeft wat het blootstellingseect zou zijn als men niets anders zou doen dan de intermediaire variabele een vaste waarde geven in de ganse populatie. Deze problemen treden minder op bij de interpretatie van natuurlijke directe en indirecte eecten. Ten eerste moet men de intermediaire variabele vaststellen op een waarde die `natuurlijk' voorkomt, bijvoorbeeld M(a) of M(a ), in plaats van op een willekeurig niveau m dat voor bepaalde personen misschien nooit voorkomt voor om het even welke blootstelling a. Ten tweede, als men bij de denitie van het natuurlijk direct eect a gelijkstelt aan 0 is het eenvoudiger om aannemelijke interventies te bedenken. Men kan 14

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Examen Kansrekening en Wiskundige Statistiek: oplossingen Examen Kansrekening en Wiskundige Statistiek: oplossingen S. Vansteelandt Academiejaar 006-007 1. Een team van onderzoekers wil nagaan of een bepaald geneesmiddel Triptan meer effectief is dan aspirine

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Kun je met statistiek werkelijk alles bewijzen?

Kun je met statistiek werkelijk alles bewijzen? Kun je met statistiek werkelijk alles bewijzen? Geert Verbeke Biostatistisch Centrum, K.U.Leuven International Institute for Biostatistics and statistical Bioinformatics geert.verbeke@med.kuleuven.be http://perswww.kuleuven.be/geert

Nadere informatie

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN INLEIDING Als je geïnteresseerd bent in de vraag welke van twee behandelingen of geneesmiddelen het beste werkt, zijn er grofweg twee manieren om dat te onderzoeken: experimenteel en observationeel. Bij

Nadere informatie

Examen Data Analyse II - Deel 2

Examen Data Analyse II - Deel 2 Examen Data Analyse II - Deel 2 Tweede Bachelor Biomedische Wetenschappen 10 januari 2011 Naam....................................... 1. De systolische bloeddruk (in mmhg) van 21 mannen is weergegeven

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Examen Statistiek II: Project

Examen Statistiek II: Project Examen Statistiek II: Project S. Vansteelandt Academiejaar 2014-2015 U krijgt 2 uur 30 minuten voor het examen, inclusief het mondelinge examen dat maximaal 15 min duurt. Het examen is relatief lang omdat,

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Summery. Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers

Summery. Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers ummery amenvatting Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers 207 Algemene introductie Werkgerelateerde arm-, schouder- en nekklachten zijn al eeuwen

Nadere informatie

Gegevensverwerving en verwerking

Gegevensverwerving en verwerking Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Hoofdstuk 2 Hoofdstuk 3 Hoofdstuk 4. Hoofdstuk 3 Hoofdstuk 4

Hoofdstuk 2 Hoofdstuk 3 Hoofdstuk 4. Hoofdstuk 3 Hoofdstuk 4 Samenvatting SAMENVATTING 189 Depressie is een veelvoorkomende psychische stoornis die een hoge ziektelast veroorzaakt voor zowel de samenleving als het individu. De Wereldgezondheidsorganisatie (WHO)

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

Advies van de Wetenschappelijke Commissie Wijkaanpak

Advies van de Wetenschappelijke Commissie Wijkaanpak Advies van de Wetenschappelijke Commissie Wijkaanpak De Wetenschappelijke Commissie Wijkaanpak is in 2010 ingesteld door de Minister van Wonen, Wijken en Integratie met als opdracht de Minister te adviseren

Nadere informatie

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016 Causale modellen: Confounding en mediatie Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016 Correlatie en causatie Een standaard wijsheid in methodologie is dat correlatie (samenhang)

Nadere informatie

mlw stroom 2.2: Biostatistiek en Epidemiologie

mlw stroom 2.2: Biostatistiek en Epidemiologie mlw stroom 2.2: Biostatistiek en Epidemiologie Hoorcollege 1: Onderzoeksopzet en risikomaten Rosner 13.1-13.4 Capaciteitsgroep Methodologie en Statistiek tul / UM 10 januari 2006 Methodologie en Statistiek

Nadere informatie

Methoden van het Wetenschappelijk Onderzoek: Deel II Vertaling pagina 83 97

Methoden van het Wetenschappelijk Onderzoek: Deel II Vertaling pagina 83 97 Wanneer gebruiken we kwalitatieve interviews? Kwalitatief interview = mogelijke methode om gegevens te verzamelen voor een reeks soorten van kwalitatief onderzoek Kwalitatief interview versus natuurlijk

Nadere informatie

Gezondheidsverwachting volgens socio-economische gradiënt in België Samenvatting. Samenvatting

Gezondheidsverwachting volgens socio-economische gradiënt in België Samenvatting. Samenvatting Verschillende internationale studies toonden socio-economische verschillen in gezondheid aan, zowel in mortaliteit als morbiditeit. In bepaalde westerse landen bleek dat, ondanks de toegenomen welvaart,

Nadere informatie

EFFECTEN VAN VERANDERING VAN ONDERWIJSVORM OP SCHOOLSE PRESTATIES & ACADEMISCH ZELFCONCEPT

EFFECTEN VAN VERANDERING VAN ONDERWIJSVORM OP SCHOOLSE PRESTATIES & ACADEMISCH ZELFCONCEPT EFFECTEN VAN VERANDERING VAN ONDERWIJSVORM OP SCHOOLSE PRESTATIES & ACADEMISCH ZELFCONCEPT Dockx J, De Fraine B. & Vandecandelaere M. EFFECTEN VAN VERANDERING VAN ONDERWIJSVORM OP SCHOOLSE PRESTATIES &

Nadere informatie

Causaliteit en de paradoxen van Simpson en Berkson (Engelse titel: Causality and the paradoxes of Simpson and Berkson)

Causaliteit en de paradoxen van Simpson en Berkson (Engelse titel: Causality and the paradoxes of Simpson and Berkson) Technische Universiteit Delft Faculteit Elektrotechniek, Wiskunde en Informatica Delft Institute of Applied Mathematics Causaliteit en de paradoxen van Simpson en Berkson (Engelse titel: Causality and

Nadere informatie

4. Resultaten. 4.1 Levensverwachting naar geslacht en opleidingsniveau

4. Resultaten. 4.1 Levensverwachting naar geslacht en opleidingsniveau 4. Het doel van deze studie is de verschillen in gezondheidsverwachting naar een socio-economisch gradiënt, met name naar het hoogst bereikte diploma, te beschrijven. Specifieke gegevens in enkel mortaliteit

Nadere informatie

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox Bram Ramaekers Bianca de Greef KEMTA Masterclass Inhoud Data Kaplan-Meier curve Hazard rate Log-rank test Hazard ratio Cox regressie

Nadere informatie

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden een handreiking 71 hoofdstuk 8 gegevens analyseren Door middel van analyse vat je de verzamelde gegevens samen, zodat een overzichtelijk beeld van het geheel ontstaat. Richt de analyse in de eerste plaats

Nadere informatie

VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE SCHATTINGEN VAN SIGNIFICANTE GOLFHOOGTE

VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE SCHATTINGEN VAN SIGNIFICANTE GOLFHOOGTE Rapport aan isterie van de Vlaamse Gemeenschap Departement Leefmilieu en Infrastructuur Administratie Waterwegen en Zeewezen AFDELING WATERWEGEN KUST VERGELIJKENDE STUDIE VAN ALTERNATIEVE ONTWERPWAARDE

Nadere informatie

Labo IDP. In dit labo gaan we IDP gebruiken voor het analyseren van logische circuits. XOR Q AND. Figuur 1: Een logisch circuit.

Labo IDP. In dit labo gaan we IDP gebruiken voor het analyseren van logische circuits. XOR Q AND. Figuur 1: Een logisch circuit. Labo IDP In dit labo gaan we IDP gebruiken voor het analyseren van logische circuits. K L A XOR N B XOR P M D AND Q AND C O OR E R R Tuesday 15 December 2009 Figuur 1: Een logisch circuit. Veronderstel

Nadere informatie

risicocommunicatie, planning & mechanismen van gezondheidsgedragsverandering in een populatie met een verhoogd risico op hart- en vaatziekten

risicocommunicatie, planning & mechanismen van gezondheidsgedragsverandering in een populatie met een verhoogd risico op hart- en vaatziekten risicocommunicatie, planning & mechanismen van gezondheidsgedragsverandering in een populatie met een verhoogd risico op hart- en vaatziekten Hart- en vaatziekten vormen een grote bedreiging voor de volksgezondheid.

Nadere informatie

Exponentiële Functie: Toepassingen

Exponentiële Functie: Toepassingen Exponentiële Functie: Toepassingen 1 Overgang tussen exponentiële functies en lineaire functies Wanneer we werken met de exponentiële functie is deze niet altijd gemakkelijk te herkennen. Daarom proberen

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Hoofdstuk 2: Verbanden

Hoofdstuk 2: Verbanden Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze

Nadere informatie

Rapport voor deelnemers M²P burgerpanel

Rapport voor deelnemers M²P burgerpanel Rapport voor deelnemers M²P burgerpanel Weergaven van publieke opinie in het nieuws en hun invloed op het publiek Dit rapport beschrijft de resultaten van een onderzoek over weergaven van publieke opinie

Nadere informatie

Bijlage 1: het wetenschappelijk denk- en handelingsproces in het basisonderwijs 1

Bijlage 1: het wetenschappelijk denk- en handelingsproces in het basisonderwijs 1 Bijlage 1: het wetenschappelijk denk- en handelingsproces in het basisonderwijs 1 Bijlage 1: Het wetenschappelijk denk- en handelingsproces in het basisonderwijs: Stadium van het instructie model Oriëntatiefase

Nadere informatie

het laagste niveau van psychologisch functioneren direct voordat de eerste bestraling begint. Zowel angstgevoelens als depressieve symptomen en

het laagste niveau van psychologisch functioneren direct voordat de eerste bestraling begint. Zowel angstgevoelens als depressieve symptomen en Samenvatting In de laatste 20 jaar is er veel onderzoek gedaan naar de psychosociale gevolgen van kanker. Een goede zaak want aandacht voor kanker, een ziekte waar iedereen in zijn of haar leven wel eens

Nadere informatie

MANTELZORG, GOED GEVOEL

MANTELZORG, GOED GEVOEL UITKOMSTEN ONDERZOEK: MANTELZORG, GOED GEVOEL Inhoud: Theorie & Vragen Methode Theoretische achtergrond: Mantelzorgers zijn iets minder gelukkig dan de rest van de bevolking (CBS, 2016). Mantelzorg brengt

Nadere informatie

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee Methodologie voor onderzoek in de verpleegkunde Foeke van der Zee Inhoudsopgave 1. Onderzoek, wat is dat eigenlijk... 1 1.1 Hoe is onderzoek te omschrijven... 1 1.2 Is de onderzoeker een probleemoplosser

Nadere informatie

Volkert Siersma. Statistiek in de Deense gezondheidszorg

Volkert Siersma. Statistiek in de Deense gezondheidszorg Volkert Siersma Statistiek in de Deense gezondheidszorg Forskningsenheden Mijn Ziektekostenverzekeringsbewijs XXXX CPR nummer Centraal PersoonsRegistratie nummer Wordt gebruikt in alle kontakten met: Het

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

2 n 1. OPGAVEN 1 Hoeveel cijfers heeft het grootste bekende Mersenne-priemgetal? Met dit getal vult men 320 krantenpagina s.

2 n 1. OPGAVEN 1 Hoeveel cijfers heeft het grootste bekende Mersenne-priemgetal? Met dit getal vult men 320 krantenpagina s. Hoofdstuk 1 Getallenleer 1.1 Priemgetallen 1.1.1 Definitie en eigenschappen Een priemgetal is een natuurlijk getal groter dan 1 dat slechts deelbaar is door 1 en door zichzelf. Om technische redenen wordt

Nadere informatie

In artikel 23 van dezelfde wet, worden de onderdelen b), c), d) en f) opgeheven.

In artikel 23 van dezelfde wet, worden de onderdelen b), c), d) en f) opgeheven. HOOFDSTUK 1 Geestelijke gezondheidszorg-beroepen Afdeling 1 Wijziging van de wet van 4 april 2014 tot regeling van de geestelijke gezondheidszorgberoepen en tot wijziging van het koninklijk besluit nr.78

Nadere informatie

Doelstelling: Bijsturing van de opvattingen van de leerlingen met betrekking tot magnetische eigenschappen

Doelstelling: Bijsturing van de opvattingen van de leerlingen met betrekking tot magnetische eigenschappen 6-8 jaar Wetenschappelijk inhoud: Natuurkunde Beoogde concepten: Magnetische eigenschappen van verschillende voorwerpen, intensiteit van een magnetisch vel. Beoogde leeftijdsgroep: Leerlingen van 8 jaar

Nadere informatie

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi Inhoudsopgave Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi INTRODUCTIE... 1 1. Wat is onderzoek... 2 1.1 Een definitie van onderzoek... 2 1.2 De onderzoeker

Nadere informatie

Steeds betere benadering voor het getal π

Steeds betere benadering voor het getal π Wiskunde & Onderwijs 38ste jaargang (2012 Steeds betere benadering voor het getal π Koen De Naeghel Samenvatting. We bespreken een oplossing voor de (veralgemeende opgave Noot 4 uit Wiskunde & Onderwijs

Nadere informatie

Evidence piramide. Gecontroleerde studies. Welk studie type? 19/02/2013. 3 me ta.eu. Niet dezelfde piramide voor elke vraag. me ta.eu. me ta.

Evidence piramide. Gecontroleerde studies. Welk studie type? 19/02/2013. 3 me ta.eu. Niet dezelfde piramide voor elke vraag. me ta.eu. me ta. Niet dezelfde piramide voor elke vraag Evidence piramide Gecontroleerde studies Welk studie type? 3 1 Effect van roken op longkaner Richard Doll 1951: prospectieve studie 2/3 mannelijke Britse artsen Goede

Nadere informatie

Ternaire relaties in ERDs zijn lastig

Ternaire relaties in ERDs zijn lastig Ternaire relaties in ERDs zijn lastig Maarten M. Fokkinga Versie van 3 juni 2002, 9:54 Inleiding In het afgelopen tentamen OIS (Ontwerpen van Informatiesystemen; 233026) stond onderstaande opgave over

Nadere informatie

17/04/2013. 1. Epidemiologische studies. Children should not be treated as miniature men and women Abraham Jacobi

17/04/2013. 1. Epidemiologische studies. Children should not be treated as miniature men and women Abraham Jacobi Aanpak en interpretatie van een epidemiologische studie Aanpak en interpretatie van een epidemiologische studie Katia Verhamme, MD, PhD Epidemioloog OLV Ziekenhuis-Aalst Erasmus MC Rotterdam 20 april 2013

Nadere informatie

Ecologische Monitoring Kustverdedigingsproject Oostende. (t 0 -situatie, fase 3) AANVULLENDE STUDIE:

Ecologische Monitoring Kustverdedigingsproject Oostende. (t 0 -situatie, fase 3) AANVULLENDE STUDIE: Ecologische Monitoring Kustverdedigingsproject Oostende (t 0 -situatie, fase 3) AANVULLENDE STUDIE: KWANTIFICERING EN KWALIFICERING VAN ORGANISCH MATERIAAL IN MARIENE SEDIMENTEN: HUN ONDERLINGE RELATIES

Nadere informatie

Getallenleer Inleiding op codeertheorie. Cursus voor de vrije ruimte

Getallenleer Inleiding op codeertheorie. Cursus voor de vrije ruimte Getallenleer Inleiding op codeertheorie Liliane Van Maldeghem Hendrik Van Maldeghem Cursus voor de vrije ruimte 2 Hoofdstuk 1 Getallenleer 1.1 Priemgetallen 1.1.1 Definitie en eigenschappen Een priemgetal

Nadere informatie

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor 4 juni 2012 Het voorkomen van ziekte kan op drie manieren worden weergegeven: - Prevalentie - Cumulatieve incidentie - Incidentiedichtheid In de

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Toetsen van hypothesen 1 Het probleem 25 maart 2003 De busmaatschappij De Lijn heeft gemiddeld per dag 20000 reizigers in de stad Antwerpen. Tegenwoordig zijn er heel wat reizigers die proberen met de

Nadere informatie

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation.

Cover Page. The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Cover Page The handle http://hdl.handle.net/1887/20358 holds various files of this Leiden University dissertation. Author: Witsenburg, Tijn Title: Hybrid similarities : a method to insert relational information

Nadere informatie

Samenvatting Nederlands

Samenvatting Nederlands Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.

Nadere informatie

Nederlandse Samenvatting

Nederlandse Samenvatting Nederlandse Samenvatting Het aantal mensen met een gestoorde nierfunctie is de afgelopen decennia sterk toegenomen. Dit betekent dat er steeds meer mensen moeten dialyseren of een niertransplantatie moeten

Nadere informatie

Overgangsverschijnselen

Overgangsverschijnselen Hoofdstuk 5 Overgangsverschijnselen Doelstellingen 1. Overgangsverschijnselen van RC en RL ketens kunnen uitleggen waarbij de wiskundige afleiding van ondergeschikt belang is Als we een condensator of

Nadere informatie

Over Plantinga s argument voor de existentie van een noodzakelijk bestaand individueel ding. G.J.E. Rutten

Over Plantinga s argument voor de existentie van een noodzakelijk bestaand individueel ding. G.J.E. Rutten 1 Over Plantinga s argument voor de existentie van een noodzakelijk bestaand individueel ding G.J.E. Rutten Introductie In dit artikel wil ik het argument van de Amerikaanse filosoof Alvin Plantinga voor

Nadere informatie

Projectieve Vlakken en Codes

Projectieve Vlakken en Codes Projectieve Vlakken en Codes 1. De Fanocode Foutdetecterende en foutverbeterende codes. Anna en Bart doen mee aan een spelprogramma voor koppels. De ene helft van de deelnemers krijgt elk een kaart waarop

Nadere informatie

Voorwoord... iii Verantwoording... v

Voorwoord... iii Verantwoording... v Inhoudsopgave Voorwoord... iii Verantwoording... v INTRODUCTIE... 1 1. Wat is onderzoek... 2 1.1 Een definitie van onderzoek... 2 1.2 De onderzoeker als probleemoplosser of de onderzoeker als adviseur...

Nadere informatie

Hoofdstuk 1 is de algemene inleiding van dit proefschrift. Samenvattend, depressie is een veelvoorkomende stoornis met een grote impact op zowel het

Hoofdstuk 1 is de algemene inleiding van dit proefschrift. Samenvattend, depressie is een veelvoorkomende stoornis met een grote impact op zowel het Samenvatting Hoofdstuk 1 is de algemene inleiding van dit proefschrift. Samenvattend, depressie is een veelvoorkomende stoornis met een grote impact op zowel het individu als op populatieniveau. Effectieve

Nadere informatie

5. Discussie. 5.1 Informatieve waarde van de basisgegevens

5. Discussie. 5.1 Informatieve waarde van de basisgegevens 5. 5.1 Informatieve waarde van de basisgegevens Relevante conclusies voor het beleid zijn pas mogelijk als de basisgegevens waaruit de samengestelde indicator berekend werd voldoende recent zijn. In deze

Nadere informatie

hoofdstuk 2 een vergelijkbaar sekseverschil laat zien voor buitenrelationeel seksueel gedrag: het hebben van seksuele contacten buiten de vaste

hoofdstuk 2 een vergelijkbaar sekseverschil laat zien voor buitenrelationeel seksueel gedrag: het hebben van seksuele contacten buiten de vaste Samenvatting Mensen zijn in het algemeen geneigd om consensus voor hun eigen gedrag waar te nemen. Met andere woorden, mensen denken dat hun eigen gedrag relatief vaak voorkomt. Dit verschijnsel staat

Nadere informatie

Gezondheidsenquête, België Inleiding. Wetenschap ten dienste van Volksgezondheid, Voedselveiligheid en Leefmilieu.

Gezondheidsenquête, België Inleiding. Wetenschap ten dienste van Volksgezondheid, Voedselveiligheid en Leefmilieu. Inleiding Wetenschap ten dienste van Volksgezondheid, Voedselveiligheid en Leefmilieu. Inleiding 1. Context De vergrijzing van de bevolking in onze samenleving is een heuse uitdaging op het gebied van

Nadere informatie

Eigenschappen en Axioma s van de E 6 -meetkunde

Eigenschappen en Axioma s van de E 6 -meetkunde Faculteit Wetenschappen Vakgroep Wiskunde Eigenschappen en Axioma s van de E 6 -meetkunde Magali Victoor Promotor: Prof. dr. Hendrik Van Maldeghem Masterproef ingediend tot het behalen van de academische

Nadere informatie

SAMENVATTING Hoofdstuk 1

SAMENVATTING Hoofdstuk 1 SAMENVATTING Dit proefschrift gaat over een onderwerp waaraan veel mensen een groot gedeelte van hun leven besteden, namelijk het werken in teams. De omstandigheden in deze teams kunnen een grote invloed

Nadere informatie

Seksuele inhibitie en excitatie: een verkennende studie van factoren die samenhangen met variatie in excitatie en inhibitie

Seksuele inhibitie en excitatie: een verkennende studie van factoren die samenhangen met variatie in excitatie en inhibitie Seksuele inhibitie en excitatie: een verkennende studie van factoren die samenhangen met variatie in excitatie en inhibitie Wouter Pinxten (contact: Wouter.Pinxten@UGent.be) Prof. Dr. John Lievens Achtergrond

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Populatie: een intuïtieve definitie.... Een

Nadere informatie

Nederlandse samenvatting

Nederlandse samenvatting Nederlandse samenvatting 119 120 Samenvatting 121 Inleiding Vermoeidheid is een veel voorkomende klacht bij de ziekte sarcoïdose en is geassocieerd met een verminderde kwaliteit van leven. In de literatuur

Nadere informatie

waardoor een beroerte kan worden gezien als een chronische aandoening.

waardoor een beroerte kan worden gezien als een chronische aandoening. amenvatting Elk jaar krijgen in Nederland zo n 45.000 mensen een beroerte, ook wel CVA (Cerebro Vasculair Accident) genoemd. Ongeveer 60% van hen keert na opname in het ziekenhuis of revalidatiecentrum

Nadere informatie

2016_1. Studie design - Patiënt-controle of cohort: wanneer doe ik wat, hoe kies ik en waar moet ik aan denken

2016_1. Studie design - Patiënt-controle of cohort: wanneer doe ik wat, hoe kies ik en waar moet ik aan denken Tele-ARENA (Telefonisch Aangenaam Refereren En Netwerken AMPHI) 2016_1. Studie design - Patiënt-controle of cohort: wanneer doe ik wat, hoe kies ik en waar moet ik aan denken Host: Ellen van Jaarsveld

Nadere informatie

Technische fiche: indicatoren Relatieve vijfjaarsoverleving

Technische fiche: indicatoren Relatieve vijfjaarsoverleving Technische fiche: indicatoren Relatieve vijfjaarsoverleving Overzicht van de indicatoren Relatieve vijfjaarsoverleving voor alle patiënten Relatieve vijfjaarsoverleving voor patiënten die radicale resectie

Nadere informatie

Zelfstudiefiches M&T: Deel 2 (H6-7)

Zelfstudiefiches M&T: Deel 2 (H6-7) Zelfstudiefiches M&T: Deel 2 (H6-7) Hoofdstuk 6 1. Bekijk figuur 6.2. Het meetproces (p. 133 cursus). Dit schema en bijhorende tekst moet je heel goed begrijpen, heel vaak komen tijdens de colleges termen

Nadere informatie

De opgave voor de publieke gezondheid verandert. en dus ook die voor onderzoekers! Karien Stronks Sociale Geneeskunde AMC/UvA

De opgave voor de publieke gezondheid verandert. en dus ook die voor onderzoekers! Karien Stronks Sociale Geneeskunde AMC/UvA De opgave voor de publieke gezondheid verandert. en dus ook die voor onderzoekers! Netwerkdag 1 februari 2018 Karien Stronks Sociale Geneeskunde AMC/UvA Mijn betoog Wij willen als onderzoekers evidence

Nadere informatie

STEEDS BETERE BENADERING VOOR HET GETAL π

STEEDS BETERE BENADERING VOOR HET GETAL π STEEDS BETERE BENADERING VOOR HET GETAL KOEN DE NAEGHEL Samenvatting. We bespreken een oplossing voor de (veralgemeende) opgave Noot 4 uit Wiskunde & Onderwijs nr.139. Onze inspiratie halen we uit het

Nadere informatie

Vreugde, positieve emoties, geluk, tevredenheid, sereniteit, enzovoort zijn enkele

Vreugde, positieve emoties, geluk, tevredenheid, sereniteit, enzovoort zijn enkele De positieve psychologie is een recente stroming in de psychologie die een sterke opmars kent. Ze onderzoekt op een wetenschappelijke manier de positieve ontwikkeling en het welzijn van mensen en organisaties,

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Versnellen melkproducten de ziekte van Huntington? Je bent wat je eet

Versnellen melkproducten de ziekte van Huntington? Je bent wat je eet Wetenschappelijk nieuws over de Ziekte van Huntington. In eenvoudige taal. Geschreven door wetenschappers. Voor de hele ZvH gemeenschap. Versnellen melkproducten de ziekte van Huntington? Is er een verband

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert VOOR HET SECUNDAIR ONDERWIJS Kansmodellen 4. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg . Een concreet voorbeeld.... Een kansmodel

Nadere informatie

Hardell: mobiel bellen en hersentumoren aan de belzijde

Hardell: mobiel bellen en hersentumoren aan de belzijde Hardell: mobiel bellen en hersentumoren aan de belzijde Kennisbericht over een publicatie in een wetenschappelijk tijdschrift: Hardell L, Carlberg M, Söderqvist F, Hansson Mild K, Meta-analysis of long-term

Nadere informatie

Samenvatting (Dutch summary)

Samenvatting (Dutch summary) Samenvatting (Dutch summary) Deze studie onderzocht seksueel risicogedrag van homoseksuele mannen in vaste relaties, voornamelijk onder mannen die deelnemen aan de Amsterdamse Cohort Studies onder Homoseksuele

Nadere informatie

Statistische variabelen. formuleblad

Statistische variabelen. formuleblad Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete

Nadere informatie

Geven en ontvangen van steun in de context van een chronische ziekte.

Geven en ontvangen van steun in de context van een chronische ziekte. Een chronische en progressieve aandoening zoals multiple sclerose (MS) heeft vaak grote consequenties voor het leven van patiënten en hun intieme partners. Naast het omgaan met de fysieke beperkingen van

Nadere informatie

Nederlandse samenvatting (Dutch Summary)

Nederlandse samenvatting (Dutch Summary) Nederlandse samenvatting (Dutch Summary) 87 Appendix Inleiding Diabetes mellitus gaat een steeds belangrijkere rol spelen in onze gezondheidszorg. Het aantal patiënten met diabetes zal naar verwachting

Nadere informatie

SUMMARY. Samenvatting

SUMMARY. Samenvatting SUMMARY Samenvatting 165 166 SAMENVATTING Overgewicht en obesitas bij kinderen is een steeds groter wordend probleem. Eén van de gevolgen ervan is het ontstaan van hypertensie (een te hoge bloeddruk).

Nadere informatie

1 Transportproblemen. 1.1 Het standaard transportprobleem

1 Transportproblemen. 1.1 Het standaard transportprobleem 1 Transportproblemen 1.1 Het standaard transportprobleem Dit is het eenvoudigste logistieke model voor ruimtelijk gescheiden vraag en aanbod. Een goed is beschikbaar in gekende hoeveelheden op verscheidene

Nadere informatie

Meten en experimenteren

Meten en experimenteren Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie

Nadere informatie

S a m e n v a t t i n g 149. Samenvatting

S a m e n v a t t i n g 149. Samenvatting S a m e n v a t t i n g 149 Samenvatting 150 S a m e n v a t t i n g Dit proefschrift richt zich op de effectiviteit van een gezinsgerichte benadering (het DMOgespreksprotocol, gebruikt binnen het programma

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

Sociale en culturele factoren in evacuatie simulaties. Dr. Natalie van der Wal

Sociale en culturele factoren in evacuatie simulaties. Dr. Natalie van der Wal Sociale en culturele factoren in evacuatie simulaties Dr. Natalie van der Wal Uit de praktijk blijkt dat weinig mensen direct overgaan tot actie als het brandalarm afgaat. Het zal wel een oefening zijn,

Nadere informatie

Effecten van perinatale blootstelling aan foliumzuur op de ontwikkeling van lichaamgewicht

Effecten van perinatale blootstelling aan foliumzuur op de ontwikkeling van lichaamgewicht Briefrapport 350020010/2009 L.T.M. van der Ven M.E.T. Dollé Effecten van perinatale blootstelling aan foliumzuur op de ontwikkeling van lichaamgewicht Voorstel voor een dierproef RIVM Briefrapport 350020010

Nadere informatie

Samenvatting. Samenvatting

Samenvatting. Samenvatting 100 Samenvatting Cognitieve achteruitgang en depressie komen vaakvooropoudere leeftijd.zijbeïnvloeden de kwaliteit van leven van ouderen in negatieve zin.de komende jaren zalhet aantalouderen in onze maatschappijsneltoenemen.het

Nadere informatie

nederlandse samenvatting Dutch summary

nederlandse samenvatting Dutch summary Dutch summary 211 dutch summary De onderzoeken beschreven in dit proefschrift zijn onderdeel van een grootschalig onderzoek naar individuele verschillen in algemene cognitieve vaardigheden. Algemene cognitieve

Nadere informatie

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van Extra Opgaven 1. Een persoon doet een HIV-test. Helaas is de uitslag positief. De test is echter niet perfect. De persoon vraagt zich af wat de kans is dat hij nu ook echt HIV heeft. Gegeven is: de kans

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Combinaties van risicofactoren

Combinaties van risicofactoren Achtergronddocument Combinaties van risicofactoren Vóórkomen van risicofactoren en clustering Zowel overgewicht als roken clusteren met zwaar alcoholgebruik Zowel overgewicht als dagelijks roken gaan samen

Nadere informatie

Les 1: de normale distributie

Les 1: de normale distributie Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en

Nadere informatie

1.1 Achtergrond. 1.2 Doelstelling van het onderzoek

1.1 Achtergrond. 1.2 Doelstelling van het onderzoek 1.1 Achtergrond Sinds 1994 voert de Vlaamse Overheid onderzoek uit naar het verplaatsingsgedrag van Vlamingen. Dit onderzoek wordt het Onderzoek VerplaatsingsGedrag of OVG genoemd. In het OVG worden een

Nadere informatie

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Ton Kuijpers, Epidemioloog

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Ton Kuijpers, Epidemioloog Evidence based richtlijnontwikkeling (EBRO) training voor patiënten Ton Kuijpers, Epidemioloog Guru based medicine Inhoud Voorbeeld van een wetenschappelijk onderzoeksdesign (RCT) Mate van bewijs Conclusies

Nadere informatie

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus Dat economie in essentie geen experimentele wetenschap is maakt de econometrie tot een onmisbaar

Nadere informatie