X covarieert ook met Y, indien de invloed van confounders Z constant wordt gehouden (no confounding).

Maat: px
Weergave met pagina beginnen:

Download "X covarieert ook met Y, indien de invloed van confounders Z constant wordt gehouden (no confounding)."

Transcriptie

1 CAUSALE ANALYSE Een handreiking Harry B.G. Ganzeboom (Deze versie: 2 maart 2015). Het belang van causaliteit Wetenschap is erop gericht om uit te vinden hoe de wereld werkt. In het onderzoek dienen daarom causale vraagstellingen (Wat veroorzaakt Y? Is X een (de) oorzaak van Y? Hoe ontstaat de invloed van X op Y?) centraal te staan. Als je je daarmee niet wilt bezighouden, moet je geen wetenschappelijk studie willen volgen. Causaliteit We besluiten tot causaliteit als aan drie (twee?) voorwaarden voldaan is: X gaat aan Y vooraf (meer algemeen: X was er eerder dan Y; no reversed causation); X covarieert met Y ( als er meer van X is, is er ook meer Y ); X covarieert ook met Y, indien de invloed van confounders Z constant wordt gehouden (no confounding). In een experimentele opzet is aan de voorwaarden van causale volgorde en het constant houden van confounders voldaan door het onderzoeksdesign; daarom is een experiment zo gemakkelijk en informatief om causale conclusies te trekken. In een observatie-opzet waarop we meestal in maatschappijwetenschappelijk onderzoek zijn aangewezen -- is het aan de onderzoeker om aan de voorwaarden inhoud te geven (en deze overtuigend te beargumenteren). Effect De meest eenvoudige manier om een effect van X op Y te laten zien, is naar het verschil in gemiddelde Y tussen groepen van X te laten zien. Dit werkt het beste als X van nature uit twee groepen bestaat (bv. sekse). Je kunt een meerwaardige X (bv. opleiding, leeftijd) ook altijd in (twee) groepen verdelen, maar dat levert informatieverlies op. De bijbehorende manipulatie in SPSS is means. Meer algemeen is een effect gedefieerd als een slope coefficient in een regressiemodel. Je kunt een regressie-coefficient ook zien als een samenvartting van de gemiddelde van Y voor verschillende categorieën van X. Constant houden via tabelsplitsing Het constant houden van een Z-variabele gaat het gemakkelijkst door Z in (twee) groepen te verdelen en naar X Y te kijken binnen elke groep van Z. Ook dit gaat het gemakkelijkst als je als Z uit twee groepen 1

2 bestaat. Als Z van nature meerwaardig (opleiding) of continu (leeftijd) is, dan gaat er op deze manier informatie en onderscheidingsvermogen 1 verloren. Bij tabel-splitsing krijg je in de subtabellen mogelijk verschillende effect-sterktes X Y te zien. De samenhang tussen X en Y hangt dan af van Z. In dat geval spreken we van interactie (of moderatie). Dat je deze onmiddellijk te zien krijgt in tabel-splitsing, kun je zowel als een voordeel als een nadeel beschouwen. PS: in methodologie-boeken (zoals Babbie: CH15) vind je tabel-splitsing ( tabel-elaboratie ) vaak beschreven in een vorm waarin ook de Y-variabele discreet is gemaakt (bv. percentage ja). Dat is onnodig en meestal een afrader omdat ook op deze manier onderscheidingsvermogen verdwijnt. Constant houden in regressie-analyse Een alternatief voor causale analyse via tabel-splitsing is regressie-analyse. In een regressie-model beschrijf je verwachte (=gemiddelde) Y op basis van variaties in X (enkelvoudige regressie) of met het constant houden van een of meerdere covariaten (meervoudige of multipele regressie). Regressieanalyse heeft de volgende voordelen boven tabel-splitsing: In regressie-analyse kun je zowel dichotome als meerwaardige en continue X-variabelen gebruiken. In regressie-analyse is het geen probleem om meerdere (zelfs: veel) variabelen constant te houden. Statistische evaluatie (significantietesten, betrouwbaarheidsintervallen) is veel gemakkelijker in regressie-analyse dan bij tabel-splitsing. Anders dan bij tabelsplitsing krijg je in regressie-analyse niet automatisch interactie-effecten te zien: regressie-analyse gaat ervan uit dat het effect van X in alle condities van Z hetzelfde is: je kunt het dus zien als een soort gemiddeld effect. Interactie-effecten in regressie-analyse verkrijg je door multiplicatieve interactietermen toe te voegen. Hoe houdt regressie-analyse constant? In tabelsplitsing is het wel duidelijk wat het betekent dat Z constant wordt gehouden: je kijken binnen een conditie van Z (bv. vrouwen) hoe X en Y covariëren. Maar hoe doet het regressiemodel dat? Een inzichtelijke methode is om dat te zien: Bereken Z X en Z Y en neem de residuen. Je hebt dan de variatie in X en Y die niet door Z wordt veroorzaakt. 1 Onderscheidend vermogen = power = 1 de kans dat je de H0 ten onrechte niet verwerpt. Oftewel: dat je onderzoekshypothese Ha opgaat, maar jouw onderzoek het niet opmerkt. Dan heb je je onderzoek slecht gedaan! Zie Agresti, pp

3 Als je de twee residuen in een enkelvoudige regressie met elkaar in verband brengt, zie je de partiële regressiecoefficient verschijnen. Een partiële coefficient is dus de invloed van dat de variatie in X die niet door Z wordt veroorzaakt, op de variatie in Y die niet door Z wordt veroorzaakt. Causale volgorde Tabelsplitsing en regressie-analyse ontlenen beiden hun causale interpretatie aan veronderstellingen van causale volgorde. Op de een of andere manier moet je reversed causation (Y Z) en confounding (Z X; Z Y) weten uit te sluiten. De enige empirische stappen hierin zijn het constant houden van de effecten van de confounders en het vervolgens berekenen van de samenhang tussen X en Y. Waar een variabele staat in een causaal model (dwz of een variabele een confounder of een mediator is), is een assumptie die beargumenteerd moet worden, bij voorkeur uit het research design. De meeste argumenten over causale volgorde berusten op volgorde in de tijd: wat komt eerst wat komt later? Om deze reden heeft het veel voordelen om je gegevens in een paneldesign (herhaalde waarneming bij dezelfde eenheden) te doen. Maar er zijn meer argumenten mogelijk over causale volgorde: Retrospectieve ondervraging Levensloopargumenten Assumptie over relatief stabiele kenmerken (persoonlijkheid): stabiele kenmerken kunnen van invloed zijn op relatief veranderlijke kenmerken, andersom is onaannemelijk.. Het is echter ook zaak om op dit punt kritisch te zijn. Je zien in de literatuur bv. veelvuldig de impliciete veronderstelling dat attitudes of motivaties vooraf gaan aan gedragskeuzes. Dit is een omstreden assumptie. 3

4 DIRECTE, INDIRECTE EN CONFOUNDING EFFECTEN Het meest elementaire causale model kun je op twee manieren bekijken: In het elementaire causale model kijken we naar drie variabelen, waartussen drie correlaties bestaan. Deze correlaties kunnen we als volgt decomponeren (uiteenleggen) in causale effecten: r13 = a + b*c r12 = b r23 = a*b + c [direct + indirect effect] [direct effect] [confounding + direct effect] Algemeen geldt de regel van pad-decompositie van correlaties: Correlatie = direct effect + indirecte effecten + confounding effecten We noemen een effect spurious ( schijnverband ) als het directe effect [c] nul wordt bij constant houden van confounders Z. We noemen een effect indirect als het directe effect [a] nul wordt bij constant houden van mediators M. De causale interpretatie is radicaal verschillend! NB1: Op basis van deze regels en de correlatiematrix kun je de sterkte van effecten uitrekenen. Je hebt hiervoor geen regressieanalyse nodig! NB2: het is gebruikelijk om de effecten mbv regressie-analyse te berekenen. NB3: Pad-analyse werkt doorgaans met correlaties (en gestandaardiseerde regressie-coefficienten), maar noodzakelijk is dat niet; het gaat ook op met covarianties en ongestandaardiseerde regressiecoefficienten. 4

5 Indirecte effecten / mediatie Het totaal effect van X op Y is gedefinieerd als: Totaal effect = Directe effect + indirecte effecten = correlatie confounding effecten Indirecte effecten kunnen we daarom als een percentage van het totaal effect berekenen. In een mediatiemodel is doorgaans het doel om het directe effect tot 0% te reduceren; dan is het totaal effect volledig verklaard. Meestal is hier een mate van en aan we alleen maar in de richting van de 0%. Vaak zijn we al tevreden als mediatie een beetje optreedt. Daarom doet zich ook de vraag naar significantie van indirecte (en ook confounding) effecten voor. De voor deze berekening vereiste standard errors vind je niet in je SPSS output: indirecte en confounding effecten zijn een product van twee afzonderlijke directe effecten en de berekening van de bijbehorende steekproefvariatie blijkt een complexe zaak te zijn. Voor de berekening van de standard error en statistische significantie kun je terecht bij de sobel-test: Je dient daarvoor te beschikken op de omvang, standard error en/of t-value van de betrokken directe effecten. Baron, R. M., & Kenny, D. A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of Personality and Social Psychology, 51, Sobel, M. E. (1982). Asymptotic intervals for indirect effects in structural equations models. In S. Leinhart (Ed.), Sociological methodology 1982 (pp ). San Francisco: Jossey-Bass. De berekeningen beperken zich tot indirecte effect die uit twee stappen bestaan. Voor ingewikkelder situaties kun je terecht bij simultaneous equation models (Lisrel, Mplus, Stata). 5

6 SPSS syntax* ****GET FILE='U:\)Research\ISSP \issp_2010_2011_NL_def.sav'. freq sex age degree nl_rinc isco88. recode sex (1=0)(2=1) into FEMALE. recode age (25 thru 64=1)(else=0) into ADULT. recode nl_rinc (0 thru 5500=copy)(else=sysmiss) into PINC. RECODE ISCO88 (100 THRU 5999=1)(6000 THRU 9939=0) INTO NONMANUAL. recode degree (0 thru 6=copy)(else=sysmiss) into EDUC. ISEI!enddefine. isco88!enddefine. include file='u:\)ismf\incl\ískoisei88.sps'. ** CORRELATIES **. corr female age educ nonmanual isei pinc. ** STAPSGEWIJZE REGRESSIES **. regress /dep=pinc /enter=female. regress /dep=pinc /enter=educ /enter=female age. regress /dep=pinc /enter=nonmanual /enter=educ /enter=age female. regress /dep=pinc /enter=isei /enter=educ /enter=age female. ** INTERACTIES **. COMP ISEI_FEM = ISEI*FEMALE. comp EDUC_FEM = EDUC*FEMALE. regress /des=corr def /stat=change /dep=pinc /enter=isei /enter=educ /enter=age female /enter=isei_fem /enter=educ_fem. ** Z-standaardisatie van beroep en opleiding **. desc educ isei /save. COMP ZISEI_FEM = ZISEI*FEMALE. comp ZEDUC_FEM = ZEDUC*FEMALE. regress /des=corr def /stat=def change 6

7 /dep=pinc /enter=zisei /enter=zeduc /enter=age female /enter=zisei_fem /enter=zeduc_fem. 7

8 STAPPENPLAN CAUSALE ANALYSE Stap 1: Bepaal de causale volgorde van je variabelen Causale analyse begint voordat je je gegevens verzamelt: de indeling van variabelen in Y (het gevolg, de te verklaren variatie), X (oorzaken), Z (confounders) en M (mediatoren) berust op je theorie, maar vooral ook op je onderzoeksdesign. Denk met name om de potentie van retrospectieve vraagstellingen en levensloopmodellen. Het is bij de beschrijving van je onderzoeksdesign van groot belang dat je je veronderstelde causale volgorde expliciet argumenteert. Stap 2: Goed meten Het goed meten van al je variabelen is cruciaal voor een adequate causale analyse, maar het is nog belangrijker voor je X, M en Z variabelen dan voor je Y variabele. Denk bij goed meten ook om: Zoveel mogelijk variatie in alle variabelen (aannemende dat die variatie echt iets betekent). Zorg ervoor dat je zo dicht mogelijk bij een metrisch (interval) meetniveau terecht komt. Stap 3: Bereken en bestudeer de correlaties tussen alle variabelen Hoewel ze niet het eindpunt van een analyse zijn, is weinig zo informatief als het bestuderen van een bivariate correlatie-matrix tussen al je variabelen. Je ziet in correlaties je uiteindelijke causaal model al opdoemen, je kunt er ook aan zien welke variabelen je niet constant hoeft te houden. Omdat correlaties pairwise kunnen worden berekend, geven de correlatiematrix ook een eerste inzicht in het optreden van missing values. Stap 4: Tabelsplitsing Hoewel niet noodzakelijk, kan tabelsplitsing een goede manier zijn om de relatie X Y in beeld te brengen. Als X meer dan twee categorieën heeft, is een grafiek van deze relatie (met bv. box & whiskers) een goed idee. Stap 5: Enkelvoudig regressiemodel Begin met de invloed van X Y zonder dat iets anders constant wordt gehouden (in feit een formule voor het plaatje uit de vorige stap). Stap 6: Toevoegen van confounders In de volgende modellen voeg je de confounders toe. Dat kan je een voor een doen, af allemaal in een klap (blockwise). Stapsgewijze toevoeging geeft je vaak veel inzicht in de werking van het volledige causale model. 8

9 Stap 7: Toevoegen van mediators Een volgende stap kan zijn om een of meerdere mediators aan het model toe te voegen, maar voor het vaststellen van de relatie X Y is dat niet nodig, het geeft alleen inzicht in hoe deze causaliteit tot stand komt. Stap 8: Toevoegen van interacties tussen Z en X (moderatie) Naar interacties hoef je alleen maar te kijken wanneer je daarin geïnteresseerd bent en dat kan heel goed je centrale onderzoekshypothese zijn. Interacties modelleer en interpreteer je het gemakkelijksy als: Zowel X als Z gemeten zijn met een interpreteerbaar 0-punt en eenheid. Voor de hand liggende keuzes zijn: Z-standaardisatie (M=0 en SD=1), range-standaardisatie (min = 0, max=1) of percentielstandaardisatie (min=0, max=1, M=0.50). Interactie bestudeer je het gemakkelijkst in stapsgewijs opgebouwde modellen, waarbij je de F- change gebruikt om over significantie te besluiten. Stap 9 (optioneel): Toevoegen van interacties tussen X en M (moderated mediation) Dit betekent dat je op zoek gaat naar hoe X Y afhangt van M. Voorbeeld: is het effect van sekse op inkomen verschillend tussen hoger en lager opgeleiden? Merk op dat je deze vraag ook kunt stellen als: is het effect van opleiding op inkomen hetzelfde voor mannen en vrouwen. In deze formulering heb je de causale focus van X naar M verschoven. Het hangt af van je theorie en probleemstelling of je in zulke vragen geinteresseerd bent. Stap 10a: Sensitiviteitsanalyse missing values Missing values zijn in de praktijk van onderzoek een zeer groot probleem en aandachtspunt. Regressieanalyse (in SPSS) staat schatting via pairwise deletion en listwise deletion toe. Het is zaak om beide schattingen te vergelijken. Stap 10b: Sensitiviteitsanalyse non-lineariteit In regressie-analyse veronderstel je dat samenhangen tussen variabelen goed kunnen worden samengevat een lineair model. Dit is een heel krachtige en gemakkelijk vereenvoudiging van de werkelijkheid, maar ze gaat niet altijd op. Je kunt op verschillende manieren naar non-lineairiteit kijken. Het gemakkelijkst is om de voorspellende variabelen zowel een keer in continue als discrete vorm op te nemen (vergelijk zowel R2 als effecten). 9

10 VEEL VOORKOMENDE MISVERSTANDEN OVER CAUSALE ANALYSE Correlatie is geen causatie Dat is waar, maar correlatie duidt wel op causatie. Als twee variabelen A en B met elkaar samenhangen, komt dat door een van drie mogelijkheden: (a) A veroorzaakt B, (b) B veroorzaakt A, (c) Z (een confounder) veroorzaakt zowel A als B. Zonder correlatie geen causatie. Causatie kun je alleen testen met experimentele onderzoeksopzetten Als dat zo was, zouden we heel weinig van de wereld om ons heen begrijpen. Ook uit observatie-studies kun je tot causaliteit besluiten, al is dat wel moeilijker en vaak met meer onzekerheden omgeven dan bij experimenten. Als je een lage verklaarde variantie heb, kun je niet meer zeggen over hoe Y tot stand komt Nee, bekijk het anders. Een causale analyse gaat over de invloed van een X op Y. Als die invloed er niet is, heb je ook geen verklaarde variantie en is dat de goede conclusie. Als die invloed klein is, heb je weinig verklaarde variantie, dan is dat de goede conclusie (en heb je een grote N of een scherp onderzoeksdesign nodig om het effect op te merken.) Het belangrijke aan een statistisch model is of het gevonden verschil met de werkelijkheid overeenstemt, niet of het een groot verschil is. Causale analyse in observatie-designs kun je alleen doen in panels (herhaalde meting bij dezelfde eenheden). Panels hebben voordelen voor causale analyse, maar ze hebben niet het alleenvertoningsrecht. Een belangrijk voordeel van panels is dat causale volgorde relatief onomstreden is, maar er zijn ook andere situaties waarin we goed plausibele aannames kunnen maken over de volgorde van events. Een tweede voordeel van panels is dat je via zgn. fixed effect models of first difference models de invloed van individueel stabiele confounders (bv. geslacht, geboortejaar, opleiding, persoonlijkheid) constant kan houden, zelfs zonder over metingen van die variabelen te beschikken. Causale analyse in observatie-designs kun je alleen doen via matching-designs ( quasiexperimenteel ). In matching designs hou je de variabelen waarop je matched constant. Maar omdat matching alleen maar met gemeten variabelen kunt doen, kun je die variabelen ook altijd constant houden via een regressiemodel. Het verschil is dat je bij een regressiemodel ook gebruik maakt van X groepen waarin de Z niet varieert en dat kan zowel een voordeel als een nadeel zijn. Het is overigens onjuist om een matching design quasi-experimenteel te noemen, want ook in experimenten kun je matchen (naast randomiseren), maar doe je het meestal niet. Om tot causaliteit (effect van X op Y) te kunnen besluiten, moet je alle variabelen die op Y van invloed zijn, constant houden 10

11 Nee, dat is niet nodig, in experimenten doe je dat ook niet. Je moet alleen variabelen constant houden als ze een confounder zijn, nl. zowel op X als Y van invloed kunnen zijn (dus voorafgaan aan zowel X als Y). Als een effect in een groep significant is, en in een ander groep niet, verschillen die effecten Nee, groepsverschillen in effect moet je testen via een interactie-term, waarbij de H0 is dat in beide groepen het effect even sterk is. Als een effect in een groep niet significant is, en in een andere groep ook niet, dient de H0 geaccepteerd te worden. Nee, in een gepoolde analyse kan het effect best wel significant zijn. De H0 wordt nooit geaccepteerd, hij wordt niet verworpen. Dit maakt werkelijk verschil! Als een effect niet significant is, bestaat het niet (in de populatie). Nee, niet-significantie betekent dat de H0 niet verworpen is. Dat zegt vaak nog heel erg weinig over je onderzoekshypothese (de Ha), waarin je echt geinteresseerd bent. Het kan heel goed aan je onderzoeksdesign liggen dat er niets uitkomt, bv. te kleine steekproef of slechte metingen. Variantie-analyse en regressie-analyse zijn verschillende modellen Nee, variantie-analyse en regressie-analyse zijn echt hetzelfde. Het misverstand komt voort uit het feit dat variantie-analyse meestal bij experimentele designs worden gebruikt en regressie-analyse bij observatie-designs. Statistische programma s (in SPSS: REGRESSION en UNIANOVA) hebben wel lichtelijk verschillende opties, maar dat is meer toeval dan principe. Variantie-analytische programma s zijn van nature geconcentreerd op groepsverschillen ( factoren ) en continue variabelen ( covariaten ) spelen daarbij een secundaire rol. Regressie-analytische programma hebben soms (zoals in SPSS) stapsgewijze opties en opties om analyse te doen met pairwise deletion of missing values. Om tot causaliteit (van X op Y) te besluiten moet je alle variabelen constant houden die zowel met X als Y te maken hebben. Nee, je moet die variabelen onderscheiden in confounders (Z) en mediators (M). Om X Y te toetsen, moet je Z-variabelen constant houden en M-variabelen juist niet. Het constant houden van M- variabelen heeft ook een belangrijke interpretatie, maar niet dat X Y niet optreedt: mediatie-analyse legt bloot hoe de causale relatie tot stand komt, confounding legt bloot dat de causale relatie niet bestaat. Het verschil tussen confounders en mediators is zeer fundamenteel voor causale conclusies. Causale analyse kun je alleen doen met kwantitatieve gegevens Nee hoor, causaliteit is hoe de wereld werkt, en hangt niet af van hoe je ernaar kijkt. Ook in kwalitatieve analyses gaat het om covariatie tussen X en Y, het uitsluiten van invloed van Z, en moet je nadenken over causale volgorde. In geformaliseerde kwalitatieve methoden (QCA die zich beroept op de 11

12 methoden van JS Mill (method of difference / method of agreement) en verwante zaken als most similar / most different designs) draait het in feite om deze covariatie en constant houden. 12

13 EEN VOORBEELD In het navolgende bestuderen we het volgende causaal model: Leeftijd Opleiding Beroep Inkomen Sekse 13

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016 Causale modellen: Confounding en mediatie Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016 Correlatie en causatie Een standaard wijsheid in methodologie is dat correlatie (samenhang)

Nadere informatie

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom Analyse van confounders en mediatoren Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom 1 AGENDA Nabespreking Practicum 2. Terug naar College 2: regressie met dummyvariabelen. Confounding en

Nadere informatie

Mediatie-analyse College 4+ Cursus PMC Statistiek Plus. Harry Ganzeboom 1 maart 2019

Mediatie-analyse College 4+ Cursus PMC Statistiek Plus. Harry Ganzeboom 1 maart 2019 Mediatie-analyse College 4+ Cursus PMC Statistiek Plus Harry Ganzeboom 1 maart 2019 Hoofdpunten Wat is mediatie? Wat is confounding? Waarschuwing: Mediatie is geen moderatie!! Multipele regressie: hoe

Nadere informatie

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1 Regressie-analyse Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom Regressie-model en mediatie-analyse 1 Agenda Lineaire regressie-model (herhaling) Enkelvoudig (simple) Meervoudig (multiple)

Nadere informatie

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'. ** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE=''. ** EERST MAKEN WE EEN OVERZICHT VAN DE DATA **. freq nl_rinc wrkhrs sex. Frequencies Statistics N Valid Missing NL_RINC Resp:

Nadere informatie

Moderatie-analyse met continue moderator (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 5 Harry B.G. Ganzeboom

Moderatie-analyse met continue moderator (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 5 Harry B.G. Ganzeboom Moderatie-analyse met continue moderator (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 5 Harry B.G. Ganzeboom 1 AGENDA Responsiecollege a.s. vrijdag Nabespreking Practicum 4: moderatie met

Nadere informatie

Valid N Missing N

Valid N Missing N Tabel 1: Frequentieverdelingen, gemiddelden en spreiding van opleidingen van respondenten en partners (naar geslacht) en vaders en moeders van de respondent. Respondenten Partners Ouders Mannen Vrouwen

Nadere informatie

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom AGENDA Omgang met SPSS (tijdens het tentamen). Gebruik van Excel. Factoranalyse en betrouwbaarheidsanalyse

Nadere informatie

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit Kwantitatieve modellen voor BCO PMC Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit Drie colleges Validiteits- en betrouwbaarheidsanalyse Causale analyse met confounding en mediatie Causale

Nadere informatie

10. Moderatie, mediatie en nog meer regressie

10. Moderatie, mediatie en nog meer regressie 10. Moderatie, mediatie en nog meer regressie Voordat je moderatie en mediatie analyses gaat uitvoeren in, kun je het best een extra dialog box installeren, PROCESS. Volg hiervoor de stappen op pagina

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens Waar waren we? BCO ANALYSEPLAN Harry Ganzeboom 14 april 2005 Probleemstelling, deelvragen, theorie Definities, conceptueel model Hypothesen Onderzoekzoeksopzet, operationalisatie Dataverzameling Data-analyse

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA 16. MANOVA MANOVA Multivariate variantieanalyse (MANOVA) kan gebruikt worden in een situatie waarin je meerdere afhankelijke variabelen hebt. Met MANOVA kan er 1 onafhankelijke variabele gebruikt worden

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Hoofdstuk 8: Multipele regressie Vragen

Hoofdstuk 8: Multipele regressie Vragen Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april 2009 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het

Nadere informatie

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011 Meten: algemene Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011 OPZET College 1: Algemene College 2: Meting van attitudes (ISSP) College 3: Meting van achtergrondvariabelen via MTMM College 4:

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Experimenteel Onderzoek en Experimentele Controle

Experimenteel Onderzoek en Experimentele Controle Experimenteel Onderzoek en Experimentele Controle ECO 2011-2012 Hemmo Smit Wilhelm Wundt en William James 3 criteria voor Causaliteit (herhaling) 1. Covariantie: samenhang tussen variabelen aantonen 2.

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli 2012 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Wat te doen met die lange variabele- labels in SPSS?

Wat te doen met die lange variabele- labels in SPSS? Wat te doen met die lange variabele- labels in SPSS? (Hulp bij Onderzoek, Groningen, versie 8 april 2014) mag zowel met als zonder streepjes Voorwoord In onze white papers behandelen we onderwerpen die

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

Experimenteel en Correlationeel Onderzoek

Experimenteel en Correlationeel Onderzoek Experimenteel en Correlationeel Onderzoek In veel onderzoek is het doel: Het vaststellen van oorzaak-gevolg (causale) relaties Criteria voor causaliteit 1. Samenhang (correlatie, covariantie) 2. Opeenvolging

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Hoofdstuk 2: Verbanden

Hoofdstuk 2: Verbanden Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

DEEL 1 Probleemstelling 1

DEEL 1 Probleemstelling 1 DEEL 1 Probleemstelling 1 Hoofdstuk 1 Van Probleem naar Analyse 1.1 Notatie 4 1.1.1 Types variabelen 4 1.1.2 Types samenhang 5 1.2 Sociaalwetenschappelijke probleemstellingen en hun basisformat 6 1.2.1

Nadere informatie

Theorie en Empirisch Onderzoek. Werkcollege 4.3 Experimenteel onderzoek Rijken & Merz. 2014

Theorie en Empirisch Onderzoek. Werkcollege 4.3 Experimenteel onderzoek Rijken & Merz. 2014 Theorie en Empirisch Onderzoek Werkcollege 4.3 Experimenteel onderzoek Rijken & Merz. 2014 Te bespreken Rijken & Merz Wat is hier de hoofdvraag? Wat is een double standard en hoe is het hier gemodelleerd?

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie. Toetsen van hypothesen Bijvoorbeeld: nagaan of het gemiddeld IQ bij een bepaalde steekproef groter/kleiner is als in de populatie. µ = 100 Normaalverdeling, waarbij we de score van de steekproef gaan vergelijken

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

(slope in het Engels) en het snijpunt met de y-as, b 0

(slope in het Engels) en het snijpunt met de y-as, b 0 8. Regressie Een introductie Al vaak is genoemd dat statistische modellen allemaal neerkomen op uitkomst = model + error. Dit model kun je ook gebruiken om de uitkomst te voorspellen, met een correlatie

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

20. Multilevel lineaire modellen

20. Multilevel lineaire modellen 20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

MISSING DATA van gatenkaas naar valide uitkomsten

MISSING DATA van gatenkaas naar valide uitkomsten MISSING DATA van gatenkaas naar valide uitkomsten Sander M.J. van Kuijk Afdeling Klinische Epidemiologie en Medical Technology Assessment sander.van.kuijk@mumc.nl Inhoud Masterclass Theorie over missing

Nadere informatie

Statistiek ( ) eindtentamen

Statistiek ( ) eindtentamen Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op

Nadere informatie

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011 Het samenstellen van een multipele indicator index Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011 Indices voor attituden Attittuden (opvattingen) zijn complexe kenmerken Moeilijk te meten met

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 29 juni 2011 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 6 mei 2010 1 1 Introductie De Energiekamer

Nadere informatie

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze Regressie-analyse Regressie-analyse is gericht op het voorspellen van één (numerieke) afhankelijke variabele met behulp van een of meerdere onafhankelijke variabelen (numerieke en/of dummy-variabelen).

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

Theorie en Empirisch Onderzoek [TEO] Werkcollege 1.3: Cultuurparticipatie Harry Ganzeboom 2016/02/04

Theorie en Empirisch Onderzoek [TEO] Werkcollege 1.3: Cultuurparticipatie Harry Ganzeboom 2016/02/04 Theorie en Empirisch Onderzoek [TEO] Werkcollege 1.3: Cultuurparticipatie Harry Ganzeboom 2016/02/04 Bespreekpunten Twee theorieën Cognitieve vaardigheid Statusmotivatie Highbrow lowbrow Complexiteit /

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee Methodologie voor onderzoek in de verpleegkunde Foeke van der Zee Inhoudsopgave 1. Onderzoek, wat is dat eigenlijk... 1 1.1 Hoe is onderzoek te omschrijven... 1 1.2 Is de onderzoeker een probleemoplosser

Nadere informatie

College 4 Experimenteel Onderzoek en Experimentele Controle

College 4 Experimenteel Onderzoek en Experimentele Controle College 4 Experimenteel Onderzoek en Experimentele Controle - Leary: Hoofdstuk 9 en 10 - MM&C: Hoofdstuk 2.4 (p.129-130), 2.6 en 3.1 - Aanvullende tekst 4 Jolien Pas ECO 2012-2013 Doel experimenteel onderzoek:

Nadere informatie

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00 3de bach TEW KBM Theorie Q www.quickprinter.be uickprinter Koningstraat 13 2000 Antwerpen 168 6,00 Online samenvattingen kopen via www.quickprintershop.be BOEK 1: ENKELVOUDIGE EN MEERVOUDIGE REGRESSIE

Nadere informatie

Random en systematische meetfouten. Harry B.G. Ganzeboom ADEK UvS College 3 5 maart 2011

Random en systematische meetfouten. Harry B.G. Ganzeboom ADEK UvS College 3 5 maart 2011 Random en systematische meetfouten Harry B.G. Ganzeboom ADEK UvS College 3 5 maart 2011 Recap Je hebt random en systematische meetfouten: onbetrouwbaarheid en invaliditeit. Random meetfouten spoor je op

Nadere informatie

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Figuren en formules

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

DATA-ANALYSEPLAN (20/6/2005)

DATA-ANALYSEPLAN (20/6/2005) DATA-ANALYSEPLAN (20/6/2005) Inleiding De manier waarop data georganiseerd, gecodeerd en gescoord (getallen toekennen aan observaties) worden en welke technieken daarvoor nodig zijn, dient in het ideale

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 17-11-2003 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een zakrekenmachine.

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan

Nadere informatie

Toegepaste Statistiek, Dag 7 1

Toegepaste Statistiek, Dag 7 1 Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek

Nadere informatie

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit College 7 Regressie-analyse en Variantie verklaren Inleiding M&T 2012 2013 Hemmo Smit Neem mee naar tentamen Geslepen potlood + gum Collegekaart (alternatief: rijbewijs, ID-kaart, paspoort) (Grafische)

Nadere informatie

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013 7.2.4 Voorbeeld van een kwantitatieve analyse (fictief voorbeeld) In onderstaand voorbeeld werken we met fictieve data. Doel van dit voorbeeld is dat je inzicht krijgt in hoe een onderzoeksrapport van

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 5 februari - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 9 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN INLEIDING Als je geïnteresseerd bent in de vraag welke van twee behandelingen of geneesmiddelen het beste werkt, zijn er grofweg twee manieren om dat te onderzoeken: experimenteel en observationeel. Bij

Nadere informatie

beoordelingskader zorgvraagzwaarte

beoordelingskader zorgvraagzwaarte 1 beoordelingskader zorgvraagzwaarte In dit document geven we een beoordelingskader voor de beoordeling van de zorgvraagzwaarte-indicator. Dit beoordelingskader is gebaseerd op de resultaten van de besprekingen

Nadere informatie