Voorwoord. Lijst van figuren. Lijst van tabellen



Vergelijkbare documenten
Samenvatting Nederlands

Lijst van figuren. Lijst van tabellen

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN

1. Reductie van error variantie en dus verhogen van power op F-test

Een Statistische Analyse van Recidive Cijfers

MISSING DATA van gatenkaas naar valide uitkomsten

College 3 Meervoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie

(slope in het Engels) en het snijpunt met de y-as, b 0

College 6 Eenweg Variantie-Analyse

2.9 Het adolescentieonderzoek Opgaven 72

DEEL 1 Probleemstelling 1

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Kansrekening en Statistiek

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox

Statistiek voor A.I. College 2. Donderdag 13 September 2012

Criminaliteit van ouders en de kans op letsel of sterfte van kleine kinderen

Oefenvragen bij Statistics for Business and Economics van Newbold

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Nederlandse samenvatting

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

11. Multipele Regressie en Correlatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Beschrijvende statistieken

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

College Week 4 Inspecteren van Data: Verdelingen

Kansrekening en Statistiek

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inkomens- en arbeidsmarktpositie van de jongere partners van AOW-gerechtigden

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Spelen gemeentekenmerken een rol bij participatie?

College 4 Inspecteren van Data: Verdelingen

Statistische methoden en technieken tentamen

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Hoofdstuk 5 Een populatie: parametrische toetsen

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

1. Statistiek gebruiken 1

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom

Data analyse Inleiding statistiek

SPSS. Statistiek : SPSS

10. Moderatie, mediatie en nog meer regressie

DAGELIJKS WERKBOEK DEEL #1

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Hoe analyseer je paneldata?

X covarieert ook met Y, indien de invloed van confounders Z constant wordt gehouden (no confounding).

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Oplossingen hoofdstuk XI

Hoofdstuk 5: Steekproevendistributies

20. Multilevel lineaire modellen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Voortgezette regressie- en variantieanalyse

Voorbeeld regressie-analyse

Statistiek ( ) ANTWOORDEN eerste tentamen

SOCIALE STATISTIEK (deel 2)

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

9. Lineaire Regressie en Correlatie

Logistische regressie analyse: een handleiding Inge Sieben 1 Liesbeth Linssen

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

Samenvatting (Summary in Dutch)

NEDERLANDSE SAMENVATTING

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Survival Analyse. Help! Statistiek! Survival Analyse: Overzicht. Voorbeeld: Whiplash onderzoek. Voorbeeld: Intensive Care Unit data

Item-responstheorie (IRT)

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Professionaliseringstraject onderzoeksvaardigheden voor docenten. prof. dr. Saskia Brand-Gruwel

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:

tul Moleculaire Levenswetenschappen Stroom Statistisch modelleren Werkboek

MULTIPELE IMPUTATIE IN VOGELVLUCHT

Enkelvoudige lineaire regressie

Missing Data in Clinical Trials. Kristien Wouters Statisticus - Onderzoekscel

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

mlw stroom 2.1: Statistisch modelleren

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

Zelf opzetten en uitvoeren van wetenschappelijk onderzoek

Hoofdstuk 2: Verbanden

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

Inhoudsopgave. Deel I Schatters en toetsen 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

11. Meerdere gemiddelden vergelijken, ANOVA

Verband tussen twee variabelen

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

College 4 Experimenteel Onderzoek en Experimentele Controle

Meervoudige lineaire regressie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Inleiding Applicatie Software - Statgraphics

Fasen in het onderzoeksproces

1 Basisbegrippen, W / O voor waar/onwaar

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Transcriptie:

Inhoudsopgave Voorwoord Lijst van figuren Lijst van tabellen v xiii xvii 1 Inleiding 1 1.1 Causaliteit 1 1.2 Causaliteitsonderzoek: het klassieke experiment 6 1.3 Waarom een experiment soms niet haalbaar is 12 1.4 Methodologische problemen van niet-experimenten 20 1.5 Organisatie van dit boek 25 1.5.1 De voorbeelddataset 27 1.5.2 SPSS en Stata 29 1.5.3 Notatie 31 2 Regressie-analyse 33 2.1 Multipele regressie 33 2.1.1 Het model van multipele regressie 33 2.1.2 Model fit 36 2.1.3 Aantal en keuze van predictoren 37 2.1.4 Toetsen 39 2.2 Assumpties 40 2.3 Regressie met een dichotome afhankelijke variabele: logistische regressie 42 2.4 Regressie met een afhankelijke count-variabele 49 2.4.1 Poisson regressie 51 2.4.2 Negatieve binomiaalregressie 58 2.4.3 Zero-inflated toevoeging aan modellen 62 2.5 Regressiemodellen met nog anders verdeelde afhankelijke variabelen 64 ix

x Inhoudsopgave 2.6 Nog wat statistische basics 65 2.6.1 Variantie en bias 66 2.6.2 Consistentie en efficiëntie van schatters 68 3 Propensity score matching 71 3.1 Het idee van matching 71 3.1.1 Een voorloper van propensity score matching: Mahalanobis metric matching 73 3.2 Propensity score matching 76 3.2.1 Overwegingen bij het gebruik van propensity score matching 78 3.3 Diverse matchingsmethoden 78 3.3.1 Nearest neighbour matching 79 3.3.2 Caliper en radius matching 81 3.3.3 Stratification of interval matching 83 3.3.4 Kernel matching 83 3.3.5 De performance van de verschillende matchingsmethoden 87 3.4 Controle op robuustheid en sensitiviteitsanalyse 88 3.5 Voorwaarden voor propensity score matching 89 3.5.1 Grote steekproeven 90 3.5.2 Een voldoende area of common support 90 3.5.3 Niet te veel missende waarden 91 3.5.4 De juiste functional form van het logistische regressiemodel 91 3.5.5 Geen (resterende) ongemeten bias 92 3.6 Voorbeeld: Behandeling en zedenrecidive 92 3.7 Zelf geknutselde propensity score analyse met SPSS 95 3.7.1 Stap 1: logistische regressie 96 3.7.2 Stap 2: matchen 99 3.7.3 Stap 3: analyse van de gematchte groepen 103 3.8 Propensity score analyse met Stata: caliper matching 103 3.9 Propensity score analyse met Stata: kernel matching 111 3.10 Software 112 3.11 Uitbreidingen 112 3.12 Verder lezen 114 4 Instrumentele variabelen 117 4.1 Inleiding 117 4.2 Instrumentele variabelen 119 4.2.1 De methode van instrumentele variabelen 119 4.2.2 Als oplossing voor verstorende variabelen 122 4.2.3 Als oplossing voor simultane causaliteit 128

Inhoudsopgave xi 4.2.4 Als oplossing voor meetfouten in de interventievariabele 132 4.2.5 Zwakke instrumenten 137 4.2.6 Overwegingen bij het gebruik van instrumentele variabelen 138 4.3 Voorbeeld: Reclasseringstoezicht en algemene recidive 140 4.3.1 De keuze van de instrumentele variabele 142 4.3.2 Het instrumentele variabelen model 147 4.3.3 Instrumentele variabelen met SPSS 148 4.3.4 Instrumentele variabelen met Stata 151 4.4 Software 153 4.5 Voordelen en beperkingen 156 4.6 Verder lezen 157 5 Het regression discontinuity design 161 5.1 Het regression discontinuity design 161 5.2 Illustratie van het regression discontinuity design 163 5.3 Voorbeeld: Behandeling en aantal aanhoudingen 168 5.3.1 Het onderliggend continuüm 171 5.3.2 Regression discontinuity design met SPSS 172 5.3.3 Regression discontinuity design met Stata 182 5.4 Sterke en zwakke punten van het regression discontinuity design 182 5.5 Uitbreidingen 184 6 Fixed effects panelmodellen 185 6.1 Inleiding 185 6.2 Analysetechniek voor longitudinale data 185 6.3 Een naïeve analyse van paneldata 189 6.4 Het fixed effects panelmodel 190 6.5 Software 194 6.6 Voorbeeld: Effecten van huwelijk, ouderschap en werk op criminaliteit 198 6.6.1 Periode-effecten: Two-way fixed effects panelmodellen 202 6.6.2 Een random effects panelmodel 203 6.6.3 Fixed effects versus random effects panelmodellen 207 6.7 Beperkingen van fixed effects panelmodellen 209 6.8 Afsluiting 210 6.9 Verder lezen 211 7 Trajectory modellen 213 7.1 Trajectory model 214 7.2 Het trajectory model nader beschouwd 217 7.2.1 Voorbeeld van trajectory model 219

xii Inhoudsopgave 7.3 Modelselectie 221 7.4 Posterior probabilities voor groepslidmaatschap 224 7.5 Onafhankelijke variabelen toevoegen aan het trajectory model 226 7.5.1 Statistische predictoren 226 7.5.2 Tijdvariërende covariaten 227 7.6 Censoring, missing data en exposure 228 7.7 Voorbeeld: Invloed van werk op criminaliteit 229 7.7.1 Het trajectory model 230 7.7.2 Het trajectory model met covariaten 236 7.8 Beperkingen en voordelen 239 7.9 Verder lezen 241 8 Tot besluit 243 Bijlage A Appendix: Complete SPSS syntax 251 Bijlage B Appendix: Complete Stata syntax 259 Bibliografie 269 Register van onderwerpen 276 Register van auteurs 280

Lijst van figuren 1.1 Grafische voorstelling van een direct causaal verband tussen X en Y 2 1.2 Grafische voorstelling van een spurieus verband tussen X en Y 3 1.3 Grafische voorstelling van een spurieus ketenverband tussen X en Y 4 1.4 Grafische voorstelling van multipele oorzaken van een afhankelijke variabele 4 1.5 Grafische voorstelling van een reciproke causale relatie 5 1.6 Grafische voorstelling van een suppressorvariabele 5 1.7 Voorbeeld van vertekening door verschil in motivatie 24 1.8 Voorbeeld van vertekening door verschil in risico 26 2.1 Voorbeeld van regressie bij dichotome afhankelijke variabele 44 2.2 Voorbeeld van de verdeling van politiecontacten in de Nederlandse bevolking 50 2.3 Siméon-Denis Poisson (1781-1840) 53 2.4 Poissonverdeling van kansen op k = 0, 1, 2, 3,... bloeiende bloemen voor λ = 2 54 2.5 Poissonverdelingen met λ = 1, 2, 4 en 10 55 2.6 Ladislaus von Bortkiewicz (1868-1931) 56 2.7 Negatieve binomiaalverdeling van kansen voor N = 2, 3, 4, 5,... pogingen om 2 successen te krijgen, bij p = 0.4 60 2.8 Schets van bias en noise van schatters 67 3.1 Prasanta Chandra Mahalanobis (1893 1972) 74 3.2 Schematische voorstelling van nearest neighbour matching 80 3.3 Schematische voorstelling van caliper matching en de area of common support 82 3.4 Schematische voorstelling van stratification matching 84 3.5 Kruistabel van de variabelen behandeld en type dader 93 3.6 Kruistabel van variabelen behandeld en recidive zeden 95 xiii

xiv Lijst van figuren 3.7 Odds ratio van de variabelen behandeld en recidive zeden 96 3.8 Voorspellers en hun significantie uit de logistische regressie 98 3.9 Boxplot van propensity scores in de behandelde en onbehandelde groep 99 3.10 SPSS-bestand met verplaatste, gesorteerde variabele PRE 1, en variabele caliper 1 100 3.11 SPSS-bestand gesorteerde propensity scores (donkerder kolom) en daarvoor variabele caliper 1 met gematchten 102 3.12 Kruistabel van behandeld en recidive zeden alleen voor de propensity gematchten 104 3.13 Odds ratio van behandeld en recidive zeden alleen voor de propensity gematchten) 104 3.14 Resultaat van logistische regressie met Stata 106 3.15 Resultaat van caliper (.05) propensity score matching met Stata 108 3.16 Resultaat van caliper (.01) propensity score matching met Stata 108 3.17 Overzicht van matching bij caliper (.05) propensity score matching met Stata 109 3.18 Overzicht van matching bij caliper (.01) propensity score matching met Stata 109 3.19 Resultaat van kernel matching met Stata met 22% trimming 113 4.1 Philip Green Wright (1861-1934) 120 4.2 Voorbeeld van verstorende variabele bij verband tussen roken en gezondheid 123 4.3 Instrumentele variabelen model voor de relatie tussen rookgedrag en gezondheid 124 4.4 Sewall Green Wright (1889-1988) 126 4.5 Voorbeeld van verstorende variabele bij verband tussen werk en jeugdcriminaliteit 127 4.6 Instrumentele variabelen model voor de relatie tussen werk en jeugdcriminaliteit 127 4.7 Voorbeeld van simultane causaliteit bij verband tussen het aanbod en de prijs van spruitjes 129 4.8 Instrumentele variabelen model voor de relatie tussen het aanbod en de prijs van spruitjes 130 4.9 Voorbeeld van simultane causaliteit bij verband tussen de prijs van rogge en vermogenscriminaliteit 131 4.10 Instrumentele variabelen model voor het verband tussen de prijs van rogge en vermogenscriminaliteit 132

Lijst van figuren xv 4.11 Voorbeeld van endogeneity bias door meetfouten bij verband tussen de culturele participatie van ouders en kinderen 133 4.12 Instrumentele variabelen model voor het verband tussen de culturele participatie van ouders en kinderen 134 4.13 Endogeneity bias bij het verband tussen geweldscriminaliteit en huizenprijzen 135 4.14 Instrumentele variabelen model voor het verband tussen geweldscriminaliteit en huizenprijzen 136 4.15 Frequenties van categorieën reclasseringstoezicht 141 4.16 Verdeling van reclasseringstoezicht 141 4.17 Logistische regressie van recidive op de lengte van reclasseringstoezicht 142 4.18 Fitmaten van logistische regressie van recidive op de lengte van reclasseringstoezicht 142 4.19 Endogenity bias bij het verband tussen de lengte van het reclasseringstoezicht en recidive 143 4.20 Lengte toezicht per type zedendader 144 4.21 Lengte van reclasseringstoezicht per arrondissement 146 4.22 Regressie-analyse in de eerste stap: fitmaten 148 4.23 Regressie-analyse in de eerste stap: F-toets 149 4.24 Regressie-analyse in de eerste stap: regressiemodel 149 4.25 Regressie-analyse in de tweede stap: fitmaten 150 4.26 Regressie-analyse in de tweede stap: regressiemodel 150 4.27 Stata-output van ivprobit 153 4.28 Stata-output van ivreg2: eerste deel van de 2SLS 155 4.29 Stata-output van ivreg2: tweede deel van de 2SLS 155 5.1 Donald Campbell (1916-1996) 164 5.2 Illustratie van regression discontinuity design: aantallen nieuwe delicten tegen snelheidsovertredingen 165 5.3 Bepalen van het effect van de interventie op de threshold 166 5.4 Voorbeeld van een niet toevallige verdeling om de threshold 167 5.5 Voorbeeld van misspecificatie van regression discontinuity model 168 5.6 Donald Thistlethwaite (1922-1997) 169 5.7 Histogram van de variabele aanhoudingen 170 5.8 t-toets voor verband tussen aantal aanhoudingen en behandeling 171 5.9 Descriptives van de variabele JSOAP 172 5.10 Scatterplot van aanhoudingen en JSOAP 173 5.11 Histogram van de variabele JSOAP 175

xvi Lijst van figuren 5.12 Resultaat van de regressie-analyse voor de onbehandelde zedendelinquenten 177 5.13 Resultaat van de regressie-analyse voor de behandelde zedendelinquenten 178 5.14 Resultaat van de regressie-analyse voor de behandelde zedendelinquenten 179 5.15 Resultaat van de directe methode voor RDD analyse 181 6.1 Longitudinale data aantal delicten naar werk 189 6.2 Grafische illustratie van fixed effects schatting 196 6.3 Resultaat logistisch fixed effects panelmodel 200 6.4 Resultaat two-way logistisch fixed effects panelmodel 204 6.5 Resultaat logistisch random effects panelmodel 206 6.6 Resultaat Hausman-test 208 7.1 Gemiddeld verloop van de frequentie van delicten plegen 215 7.2 Verloop van de frequentie van delicten plegen voor twee homogene subgroepen 216 7.3 Daniel Nagin (1948) 218 7.4 Trajecten van criminele carrières bij hoog-risico jongeren (Van der Geest et al., 2011): Adolescence-limited daders (AL), Laatbloeiers (LB), Laag frequente dalers (LFD), Hoog frequente dalers (HFD), Hoog frequent chronische daders (HFC) 220 7.5 Coëfficiënten van het model met één groep 231 7.6 Grafische weergave van de oplossing 232 7.7 Coëfficiënten van het model met vijf groepen 233 7.8 Grafische weergave van de gevonden trajecten voor het vijf groepen-model 234 7.9 Mean group probabilities van het model met vijf groepen 235 7.10 Coëfficiënten van het model met vijf groepen met IQ als covariaat 238 7.11 Coëfficiënten van het model met vijf groepen met werk als tijdvariërend covariaat 240

Lijst van tabellen 2.1 Regressiemodellen met linkfunctie en assumptie over errortermen 62 3.1 Dossiervariabelen in SPSS bestand VM-JSO.sav 94 4.1 Criminologische studies met instrumentele variabelen 159 6.1 Voorbeeld van longitudinale data 188 6.2 Voorbeeld van longitudinale data inclusief individu-specifieke gemiddelden 193 6.3 Voorbeeld van longitudinale data inclusief individu-specifieke gemiddelden en gecentreerde variabelen 195 6.4 Evaluatie resultaat Hausman-test 208 7.1 Behandelkenmerken per trajectgroep Van der Geest et al. (2007) 221 7.2 Criteria om het beste model te kiezen bij trajectory analyse 224 7.3 BIC-waarden bij oplopend aantal groepen 232 8.1 Overzicht van gebruikte technieken 245 xvii