Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

Vergelijkbare documenten

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

Moderatie-analyse met continue moderator (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 5 Harry B.G. Ganzeboom

11. Multipele Regressie en Correlatie

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Mediatie-analyse College 4+ Cursus PMC Statistiek Plus. Harry Ganzeboom 1 maart 2019

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

mlw stroom 2.1: Statistisch modelleren

(slope in het Engels) en het snijpunt met de y-as, b 0

Voorbeeld regressie-analyse

Hoofdstuk 8: Multipele regressie Vragen

9. Lineaire Regressie en Correlatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom

10. Moderatie, mediatie en nog meer regressie

HOOFDSTUK VII REGRESSIE ANALYSE

College 2 Enkelvoudige Lineaire Regressie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

X covarieert ook met Y, indien de invloed van confounders Z constant wordt gehouden (no confounding).

College 3 Meervoudige Lineaire Regressie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens

Valid N Missing N

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Enkelvoudige lineaire regressie

1. Reductie van error variantie en dus verhogen van power op F-test

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen:

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Oplossingen hoofdstuk XI

Meervoudige lineaire regressie

Theorie en Empirisch Onderzoek. Werkcollege 4.3 Experimenteel onderzoek Rijken & Merz. 2014

Hoofdstuk 10: Regressie

11. Meerdere gemiddelden vergelijken, ANOVA

DEEL 1 Probleemstelling 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

2.9 Het adolescentieonderzoek Opgaven 72

Bijlage 3: Multiple regressie analyse

Hoofdstuk 2: Verbanden

Data analyse Inleiding statistiek

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Wat gaan we doen? Help! Statistiek! Wat is een lineaire relatie? De rechte-lijn-vergelijking: Y = a + b X. Relatie tussen gewicht en lengte

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Verband tussen twee variabelen

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Classification - Prediction

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Dummyvariabelen in meervoudige regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Experimenteel en Correlationeel Onderzoek

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

Hoofdstuk 12: Eenweg ANOVA

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

Toegepaste Statistiek, Dag 7 1

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

20. Multilevel lineaire modellen

LES 2: Data-cleaning en -transformatie 1. Frequentietabel

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Statistiek II. Sessie 4. Feedback Deel 4

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Statistiek II. Sessie 5. Feedback Deel 5

Algemeen lineair model

Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie

Disclosure Belangen Spreker

College 6 Eenweg Variantie-Analyse

HOOFDSTUK 2: VERBANDEN

Bachelorproject II College 1: Validiteit en betrouwbaarheid: factor- en betrouwbaarheidsanalyse. Harry BG Ganzeboom 5 januari 2016 Bijgewerkt in rood

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Opgave 1: (zowel 2DM40 als 2S390)

6 De relatie tussen de intentie tot exploratie, binding en delinquent gedrag

SPSS. Statistiek : SPSS

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Toegepaste data-analyse: oefensessie 2

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Voorbeeldtentamen Statistiek voor Psychologie

Rapport. Rapportage Bijzondere Bijstand 2013

1 Basisbegrippen, W / O voor waar/onwaar

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

Logistische regressie analyse: een handleiding Inge Sieben 1 Liesbeth Linssen

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Transcriptie:

Regressie-analyse Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom Regressie-model en mediatie-analyse 1

Agenda Lineaire regressie-model (herhaling) Enkelvoudig (simple) Meervoudig (multiple) Regressie met dummy variabelen / lineariteit. Valkuilen (regression diagnostics) Relatie regressie- en factoranalyse Invloed van onbetrouwbaarheid Regressie-model en mediatie-analyse 2

Pallant Ch. 13 is een mooie en korte inleiding in regressieanalyse. De collegestof geeft diepere achtergronden. In deze cursus doen we niet veel met Regression Diagnostics (164-166). Lees ze voorzichtig door. Je moet deze begrippen in het kopje van 164 wel kunnen uitleggen! Lees de rest zeer grondig. Merk op verschil in terminologie: Hierarchical multiple regression stepwise (blockwise) forward. Standard regression Multiple regression. Regressie-model en mediatie-analyse 3

Model: simple regression X1 B1 /beta1 Y residu Regressie-model en mediatie-analyse 4

Model: multiple regression X1 B1 /beta1 Corr r Y residu X2 B2 /beta2 Regressie-model en mediatie-analyse 5

Korte demonstratie in SPSS ** MULTIPLE REGRESSIE STAPSGEWIJS **. regr /dep=ident /enter=respect /enter=pride. regr /stat=def change tol /dep=ident /enter=respect /enter=pride. Regressie-model en mediatie-analyse 6

Het multipele regressiemodel Het meest gangbare model voor samenhangen tussen twee of meer variabelen is het meervoudige (multipele) lineaire regressiemodel: Y = B0 + B1*X1 + B2*X2 +.. + Bk*Xk + e In woorden: hoe meer X1, X2.. Xp, des te meer Y. Ook: als X1, X2, dan meer Y (discrete variant). Regressie-model en mediatie-analyse 7

Het enkelvoudige regressiemodel In de meest eenvoudige variant wordt slechts één X met de Y in verband gebracht: Y = B0 + B1*X1 + residu Y X1 B0 B1 e Afhankelijke variabele Onafhankelijke variabele Intercept, constante Slope, hellingshoek, effect Error, residu. Het enkelvoudige (simple) regressiemodel heeft niet veel directe toepassing, maar als je dit eenmaal begrijpt, is meervoudige regressie een eitje. Regressie-model en mediatie-analyse 8

Y B0 B1. X B0 = intercept: de waarde van Y als X 0 is B1 = slope: de helling van de lijn. Dus de hoeveelheid Y die erbij komt als X één eenheid omhoog gaat Regressie-model en mediatie-analyse 9

Wat is het intercept? En wat is de slope? Intercept: bij X = 0, Y = 5. Het intercept is dus 5 Slope: bij X = 35 stijgt Y met 5 (van 5 naar 10). 5/35 is 0.14. De slope is dus 0.14 Regressie-model en mediatie-analyse 10

Kleinste Kwadraten, Least Squares De coefficienten van het model (B0 en B1) worden berekend door minimalisering van de kwadratensom: Y Y^ = residu OLS: Sum(Y-Y^)**2 minimaal. Voor deze minimalisering bestaat maar één oplossing en deze kan zonder iteraties worden berekend. Dat doet SPSS voor je. Regressie-model en mediatie-analyse 11

12

13

14

15

16

Gestandaardiseerde regressie In gestandaardiseerde regressie worden Y en X allebei gestandaardiseerd tot Z-variabelen ZX = (X M(X)) / SD(X) ZY = (Y M(Y)) / SD(Y) ZY = 0 + beta*zx + residu -1 < beta < 1 Het voordeel van beta boven B is dat je onmiddellijk de sterkte van een invloed ziet. Bij enkelvoudige regressie is beta gelijk aan de correlatie. Het blijft een regressiecoefficient: beta is een slope die aangeeft hoeveel SD(Y) je krijgt voor 1 SD(X). De intercept van een gestandaardiseerde regressie is altijd 0. Regressie-model en mediatie-analyse 17

Demonstratie in SPSS ** gestandaardiseerd **. desc respect pride ident /save. desc Zrespect Zpride Zident. regr /dep=zident /enter=zpride Zrespect Regressie-model en mediatie-analyse 18

Hoe te lezen? Van onder naar boven.. Het model: Ongestandaardiseerde regressie-coefficienten B (als je de eenheden van X en Y inhoudelijk kunt interpreteren) Gestandaardiseerde regressie-coefficienten BETA (als de eenheden feitelijk betekenisloos zijn) Significantie: Standard Error (SE): geschatte steekproeffluctuatie T-waarde = B/SE: hoeveel SE ligt de B van 0 af! 0 is de bij de nulhypothese veranderstelde waarde. Sig.: Kans dat je deze B zou verkrijgen als H0 waar is. Confidence interval: 95% kans dat de populatiecoefficient in dit interval valt. Regressie-model en mediatie-analyse 19

ANOVA en R2 De ANOVA-tabel geeft de opdeling van de kwadraatsommen SS: SS-Total SS-Regression SS-Residual SS-total = SS-regression + SS-residual Verklaarde variantie: R2 = SS-regression / SS-Total R = R2 Adj. R2: R2 rekening houdend met aantal X-variabelen. Vrijheidsgraden DF: DF-total = N-1 DF-regression = aantal B-coeffienten DF-residu = DF-total DF-regression Mean squares MS = SS / ndf. F-test: MS-regression / MS-residual. (DF1, DF2). SPSS zoekt de significantie voor je op. De F-test toetst de significantie van de verandering in R2. Dit is met name interessant bij stapsgewijze regressie, waarin je meerdere modellen vergelijkt Regressie-model en mediatie-analyse 20

Multipele regressie Bij multipele regressie komen er gewoon meer X- variabelen en evenveel B-coefficienten bij. De coëfficiënten B staan nu voor partiële effecten. Dit betekent dat je B1 nu het effect van X1 op Y is terwijl X2 constant wordt gehouden. Evenzo is B2 het effect van X2 op Y als X1 constant wordt gehouden. Aan deze partiële interpretatie dankt het regressie-model zijn kracht en bruikbaarheid. Regressie-model en mediatie-analyse 21

Hoe houdt multiple regressie constant? (1) De interpretatie van multipele regressiecoefficienten is partieel: B1 geeft de invloed van X1 op Y, terwijl X2 constant wordt gehouden; B2 geeft de invloed van X2 op Y terwijl X1 constant wordt gehouden. Regressie-analyse is daarmee geschikt om de invloed van met elkaar correleren X-vars op Y te bestuderen. Maar hoe doet regressie dat eigenlijk? Constant houden van X1 betekent eigenlijk: terwijl we binnen vaste waarden van X2 kijken. Regressie-model en mediatie-analyse 22

Hoe houdt regressie-analyse constant? (2) Multipele regressie werkt eigenlijk als volgt: X2 = BB0 + BB1*X1 ResX1 = X2 - BB0 + BB1*X1 X1 = BB0 + BB2*X2 ResX2 = X1 - BB0 + BB1*X2 ResX1 en ResX2 zijn de residuen van X1 (resp. X2) uit de voorspelling van X2 (resp. X1). Het zijn de stukjes van X1 (resp. X2) die NIET beinvloed worden door X2 (resp. X1). Regr /dep=y /enter=resx1. Regr /dep=y /enter=resx2. Dit geeft dezelfde coefficienten als: Regr /dep=y /enter=x1 X2. Illustratie in SPSS. Regressie-model en mediatie-analyse 23

Demonstratie in SPSS ** Hoe houdt regressie analyse constant? **. regr /dep=pride /enter=respect /save=residual(respride). regr /dep=respect /enter=pride /save=residual(resrespect). regr /dep=ident /enter=respride. regr /dep=ident /enter=resrespect. regr /dep=ident /enter=pride Respect. Regressie-model en mediatie-analyse 24

Valkuil 1: Intercept Interpretatie van het intercept B0. Dit is de verwachte waarde van Y als alle X-variabelen 0 zijn. Dit is alleen maar een zinvolle grootheid als 0 inderdaad een geldige waarde van X is. Het is goede praktijk om de X-variabelen zo te coderen dat je weet wat 0 is. Bv: codeer de variabele Sekse als (0) man en (1) vrouw. Leeftijd: trek gemiddelde leeftijd af (centreren). Regressie-model en mediatie-analyse 25

Valkuil 2: (multi)collineariteit Collineariteit is de mate waarin de X-variabelen met elkaar samenhangen: Collineariteit: correlatie tussen twee X-variabelen Multi-collineariteit: voorspelbaarheid van één X uit alle andere X-variabelen. Multi-collineariteit kun je niet (direct) zien aan de correlaties tussen de X-vars!! Als de X-variabelen sterk met elkaar samenhangen worden de schattingen van B instabiel: SE worden heel groot Verklaarde variantie R2 neemt juist niet toe Regressie-model en mediatie-analyse 26

Valkuil 2: multi-collineariteit SPSS geeft diagnostische toetsen of de collineariteit niet te sterk is: TOL (tolerance): onverklaarde variantie van een X uit andere X- en. VIF: 1/Tolerance. Advies: VIF < 10. TOL >.10. Problemen van multi-collineariteit zijn echter afhankelijk van N: bij grote N krijg je wel stabiele schattingen, ook al is er sterke samenhang tussen X-vars. Merk op dat multipele regressie-analyse juist bedoeld is om collineaire situaties te analyseren: als de X-vars niet zouden correleren, kun je net zo goed enkelvoudige regressie doen! Regressie-model en mediatie-analyse 27

Valkuil 3: perfecte collineariteit (singulariteit) Als X-variabelen perfect uit elkaar voorspelbaar zijn, kun je de B-coefficienten niet schatten. Ook niet als je heel veel data hebt! Voorbeelden: Leeftijd en geboortejaar Mannen versus vrouwen (dummy-variabelen): je vergelijkt dan met een referentie (=weggelaten) categorie! Regressie-model en mediatie-analyse 28

Valkuil 4: Lineariteitsaanname Regressie-modellen zouden beter lineaire modellen kunnen heten: relaties worden samengevat via een rechte lijn: y = a + b.x. Maar lang niet alle relaties zijn lineair. Denk aan: Historisch trends met breuken en golven Verschillen tussen leeftijdsgroepen Regressie-model en mediatie-analyse 29

Lineariteitstest Means levert een test of linearity voor het geval je X categorisch (gemaakt) is (AgeCat). Je kunt deze test of linearity ook zelf maken via dummy variabelen. De test bij means is een nuttig en snel begin, maar als je het via dummy variabelen zelf doet, heb je meer mogelijkheden. Regressie-model en mediatie-analyse 30

Dummy-variabelen Een set dummyvariabelen wordt afgeleid van een categorische variabelen: Recode Educat (1=1)(else=0) into EduCat1. Recode Educat (2=1)(else=0) into EduCat2. Recode Educat (3=1)(else=0) into EduCat3. Recode Educat (4=1)(else=0) into EduCat4. Recode Educat (5=1)(else=0) into EduCat5. Dit levert vijf 0/1 variabelen op die we in een multiple regressie als voorspeller gebruiken ipv de oorspronkelijke EduCat. Y = B0 + B1*Educat1 + B2*Educat2 + B3*Educat3 + B4*Educat4 + B5*Educat5 Regressie-modEel en mediatie-analyse 31

Demonstratie in SPSS regr /dep=pinc /enter=educat1 educat2 educat3 educat4 educat5. regr /dep=pinc /enter=educat2 educat3 educat4 educat5. Regressie-model en mediatie-analyse 32

Regressie met dummy-variabelen Dummy-variabelen zijn perfect collineair! Ze moeten dat ook zijn!! Je kunt de regressievergelijking goed interpreteren als je één dummy-var weglaat. Het is heel belangrijk te weten welke deze referentie is. SPSS kiest meestal voor de dummy-variabele die hoort bij de categorie met de grootste N. Soms is het handiger om een andere te kiezen. De effecten van de dummy-variabelen moet je interpreteren als een verschil met de intercept die de verwachte waarde voor de referentie voorstelt. Regressie-model en mediatie-analyse 33

Valkuil 5: Onbetrouwbaarheid van de X-variabelen (niet behandeld) Het regressiemodel veronderstelt dat je X- variabelen volledig betrouwbaarheid gemeten zijn. Als er toch onbetrouwbaarheid in de onafhankelijke variabelen is overgebleven, verzwakt dat de B- en Beta-coefficienten. De gevolgen kunnen met name dramatisch zijn, wanneer je onderzoeksvraag gaat over de relatieve sterkte van B- of Beta-coefficienten. Regressie-model en mediatie-analyse 34

Onbetrouwbaarheid van Y Als je je Y met onbetrouwbaarheid gemeten is: Vermindert dat de verklaarde variantie Verzwakt dat de Beta-coefficienten Vergroot dat de SE, Maar blijven de B-coefficienten (ongeveer) hetzelfde! Regressie-model en mediatie-analyse 35

Demonstratie in SPSS ** EFFECT VAN ONBETROUWBAARHEID IN **. set seed 180453. compute loting1=uniform(1). compute loting2=uniform(1). sort cases by loting1. compute xpride=pride. if (loting2 >.80) xpride=lag(pride). regr /dep=ident /enter=xpride Respect. Regressie-model en mediatie-analyse 36

Nog wat meer valkuilen (Pallant) Pallant bediscussieert: N of cases (??) Outliers (niet behandeld) Normaliteit (van residuen) Homoskedasticiteit Onafhankelijkheid van waarnemingen Het zijn allemaal belangrijke problemen, maar er is een belangrijke kanttekening bij: vertekeningen treden met name op in de schatting van de SE s, niet zozeer bij de B s. Het doet er allemaal veel toe, bij de significantietesten. Regressie-model en mediatie-analyse 37

Nogmaals: gestandaardiseerd of ongestandaardiseerd? Gestandaardiseerde modellen zijn een herberekening van het ongestandaardiseerde model. Ongestandaardiseerde coefficienten van twee X-vars kun je alleen vergelijken als de meeteenheid dezelfde is, bv. tussen stapsgewijze modellen, of tussen groepen (mannen en vrouwen). Gestandaardiseerde coëfficiënten kun (ook) vergelijken tussen variabelen: je kunt er de relatieve sterkte van effecten mee bepalen. Gestandaardiseerde effecten zijn niet gemakkelijk te interpreteren bij 0/1 X-variabelen zoals dummy variabelen. Regressie-model en mediatie-analyse 38

Regressie- en Factor-analyse Factoranalyse is weinig anders dan een verzameling van meerdere multipele regressiemodellen, waarbij de onafhankelijke variabelen ongemeten (latent) zijn. In de praktijk gebruiken we hier bijna altijd gestandaardiseerde coefficienten; de intercepten zijn dan altijd 0 en blijven onvermeld. Regressie-model en mediatie-analyse 39

Factor- en regressieanalyse Y1 = B11*F1 + B12*F2 + residu Y2 = B21*F1 + B22*F2 + residu Y3 = B31*F1 + B32*F2 + residu Y4 = B41*F1 + B42*F2 + residu Met simple structure: Y1 = B11*F1 + 0*F2 + residu Y2 = B21*F1 + B22*F2 + residu Y3 = 0*F1 + B32*F2 + residu Y4 = 0*F1 + B42*F2 + residu Regressie-model en mediatie-analyse 40

Regressie en causaliteit Regressie-coefficienten worden vaak binnen een causaal (oorzaak-gevolg) model geinterpreteerd. Causale interpretatie is alleen geldig als aan twee voorwaarden voldaan is: No reversed causation = causale volgorde: X kan oorzaak van Y zijn = X gaat vooraf aan Y (en niet andersom) No confounding: X en Y worden niet beinvloed door een achterliggende variabele Z. Causale volgorde volgt uit je design of theoretische overwegingen; confounders moet je meten en via regressie constant houden. Regressie-model en mediatie-analyse 41

Waarom heet regressie zo? Regressiemodel is een niet zo duidelijke naam. Beter zou zijn lineaire modellen of least-squares modellen. De term regressie is afkomstig uit de biologie, waarin het model oorspronkelijke ontwikkeld is om de samenhang in lengte tussen ouders en kinderen te modelleren. Kinderen worden niet even lang als hun ouders: lange ouders hebben kinderen die gemiddeld korter zijn dan zijzelf, korte ouders hebben kinderen die gemiddeld langer zijn dan zijzelf. De regressie -coeffecient meet dan de mate waarin dit verband niet perfect (1.0) is, i.e. de lengte van kinderen regresseert naar het gemiddelde. Regressie-model en mediatie-analyse 42

Stappenplan regressie-analyse Stap 1: Check variabelen: meetniveau, missing values? Codeer categorische variabelen als 0/1 (dummy) variabelen. Zorg voor 0-punt bij andere variabelen duidelijk is (centreren). Stap 2: Causale volgorde: wat is X en wat is Y? Stap 3: Bereken de regressiemodellen, bij voorkeur stapsgewijs (regress /enter=). Stap 4: Interpreteer eerst het ongestandaardiseerde en gestandaardiseerde regressie-model, daarna de significantie. Stap 5: Rapporteer B en SE, en/of beta/t en R2. Regressie-model en mediatie-analyse 43

Mediatie en moderatie Volgende week mediatie-analyse, derde week moderatie analyse: Mediatie: verloopt de invloed van X op Y via M? Moderatie: hangt de invloed van X op Y af Z? Baron & Kenny beginnen met Moderatie, wij doen het andersom. Over geen van beide geeft Pallant directe informatie. Beide maken gebruik van het multipele regressie-model zoals besproken in Pallant, CH 13. Regressie-model en mediatie-analyse 44