Toetsen van hypothesen Bijvoorbeeld: nagaan of het gemiddeld IQ bij een bepaalde steekproef groter/kleiner is als in de populatie. µ = 100 Normaalverdeling, waarbij we de score van de steekproef gaan vergelijken met de distributie van de populatie. We gaan teksten of het gemiddelde in de steekproef significant verschilt van het gemiddelde in de populatie = UNIVARIAAT TOETSEN Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie. Taal Rekenen Blauwe lijnen: multivariaat toetsen als meerdere keren univariaat toetsen vierkant aanvaardingsgebied Kans op type 2 fout grotere door herhaaldelijk univariaat te toetsen Multivariaat toetsen hogere power Dus: multivariaat toetsen rond aanvaardingsgebied Bovendien vermijd je met multivariaat toetsen ook het maken van een type I fout Door multivariaat toetsen kunnen we ook de correlaties in rekening brengen, waardoor het aanvaardingsgebied kan wijzigen, ifv de correlaties (rode ellipsen)
Lineaire modellen Univariaat lineair model Y = x.β + e voorbeeld: stress = β0 + β1.lft + β2.gewicht + e Verwachting: gemiddelde e = 0! β0 β-matrix β = β1 β3 Multivariaat lineair model Y = x.β + e Voorbeeld: stress = β01 + β11.lft + β21.gewicht + e subscript toegevoegd om depressie = β02 + β12.lft + β22.gewicht + e aan te tonen over welke variabele het gaat β01 β02 intercept β-matrix β = β11 β12 leeftijd rij = OV, kolom = AV β31 β32 gewicht stress depressie Oefeningen: Kijken naar de multivariate toetsen - We kijken hierbij altijd naar Wilks Labda (ook altijd vermelden in rapport dat je daarnaar kijkt!) - Hoofdeffecten niet eenduidig te interpreteren als het interactie-effect significant is - Interacties tussen categorische variabelen worden automatisch weergegeven, tussen continue moet je zelf ingeven Oefeningen: Kijken naar de univariate toetsen Leeftijd significant effect op stres, niet op depressie. Wel beide rapporteren. Oefeningen: Kijken naar de richting en de grootte van het effect (parameters) Leeftijd op stress.
Oefening 1 bij Het Multivariaat Lineair Model Datasets opslaan: - Diskette aanduiden (opslaan) - Opslaan op H-schijf! Pas op!: Op examen goed lezen welke versie van SPSS je moet gebruiken, want dit zou andere resultaten kunnen geven. Dependent = afhankelijke Fixed = categorische onafhankelijke variabelen Covariates = continue onafhankelijke variabelen
Effect van psych dem op gezondheid (F3,369)=25.444, p<.05 Effect van skilutt op gezondheid (F3,369)=0.835, p=.476 (rapportage bij significant) (rapportage bij ns) 3 = Hypothesis df en 369 = Error df
Educlev op chi F(2,371)=7.248, p<.05 Als psychological demands stijgt met 1 eenheid, komt er bij chi 0.114 bij. Opleidingsniveau is categorische variabele werken met referentieniveau. Referentieniveau is educlev = 3 (hoogste opleidingsniveau). Wat is nu het verschil tussen en gemiddeld en een hoog opleidingsniveau? = 0.381 Hoe hoger het opleidingsniveau, hoe lager uw gezondheid. Immers: chi gaat terug op een gezondheidsindex waarbij geldt hoe hoger, hoe meer gezondheidsklachten. Als we de parameters van elk opleidingsniveau met de referentie vergelijken, zien we dat een hoger opleidingsniveau de score op chi hoger maakt = meer klachten = lagere gezondheid
Oefening 2 bij Het Multivariaat Lineair Model 1) Parameters oplijsten 3 afhankelijke variabelen 3 kolommen in β-matrix b01 b02 b03 intercept b11 b12 b13 psydem b21 b22 b23 skillut b31 b32 b33 age2 b41 b42 b43 educ=1 b51 b52 b53 educ=2 b61 b62 b63 educ=3 chi str depr 1 rij per continue variabelen 1 rij per niveau categorische variabelen 2) Nulhypothese H0: LbM = 0 OV: H0: educlev1=educlev3 b4. = b6.. = gemiddeld over de 3 AV s b4. b6. = 0 AV: enkel stress depressie 3) L en M-matrix L matrix legt restricties op aan OV B0. B1. B2. B3. B4. B5. B6. L = (0 0 0 0 1 0-1) Hier verwijzen de kolommen naar de OV (draaien matrix bij vermenigvuldiging)
Nu kunnen we b4. En b6. Toetsen, maar wel voor ALLE AV s en we zijn enkel geïnteresseerd in stress en depressie. De M-matrix legt daarom restricties op aan de AV 1 0 0 b.1=chi We gaan de eerste kolom weg- M = 0 1 0 b.2=stress laten, want we zijn enkel 0 0 1 b.3=depressie geïnteresseerd in stress en depr. Hier verwijzen de rijen naar de OV (draaien matrix bij vermenigvuldiging) Syntax bekijken en kopiëren, omdat dit garandeert dat je altijd hetzelfde aan het doen bent! L en M matrix ingeven Groene play knop indrukken.
Hier kan je jezelf controleren: - Staan de variabelen in de juiste volgorde? - Is de nulhypothese juist geëxpliciteerd in de L-matrix? Er is inderdaad een verschil tussen de hoogste en de laagste scholingsgraad in stress en depressie. Oefening 3 bij Het Multivariaat Lineair Model 1) Parameters hetzelfde als bij de vorige oefening 2) Nulhypothese Persoons-gerelateerde variabelen = educlev en age2 OV: geen invloed van educlev geen invloed van leeftijd DEZE KAN JE NIET SAMENNEMEN!!! Geen invloed van educlev b4. = b5. = b6. 2 contrasten opspitsen b4. = b5. b4. b5. = 0 b5. = b6. b5. b6. = 0 b4. = b6. (redundant; je moet er maar 2 doen) Geen invloed van age2 b3. = 0
H0: b4. = b5. = b6. b3. = 0 SIMULTAAN TOETSEN AV: gezondheid = alle 3 de AV 3) L en M matrix b0. B1. B2. B3. B4. B5. B6. L = 0 0 0 0 1-1 0 0 0 0 0 0 1-1 0 0 0 1 0 0 0 1 0 0 M = 0 1 0 Gezondheid = alle 3 de variabelen 0 0 1 Geen restricties! M-matrix = identiteitsmatrix Repeated Measires ANOVA Invloed van een bepaald medicijn op depressie herhaaldelijke metingen om na te gaan welk effect een bepaalde dosis (tussen subject variabele) op depressie heeft. b01 b02 b03 intercept b11 b12 b13 dosis = 1 b21 b22 b23 dosis = 2 varieert tssn subjecten b31 b32 b33 dosis = 3 de1 de2 de2 Nieuwe variabele: meetmoment. Elk subject heeft 3x een bepaalde meting van de mate van subjectiviteit gehad (binnen subject variabele) Meetmoment varieert dus binnen subjecten! Hiervoor deden we de toetsen apart. Je kan niet het gemiddelde nemen van iemand leeftijd en gewicht. Gewicht veel grotere schaal dan leeftijd, dus als je daar het gemiddelde van neemt, heeft dit een veel grotere invloed dan leeftijd. Je meet niet op dezelfde schaal, dus je kan het niet samen toetsen. Vermits het hier gaat over variabelen die bij alle subjecten op dezelfde schaal gemeten zijn, kunnen we dit hier wel doen. We kunnen vragen: Wat is de gemiddelde invloed van dosis over de 3 meetmomenten heen?. Als je de M-matrix (1/3 1/3 1/3) vermenigvuldigd met de gekozen L-matrix, zal je het gemiddelde over de verschillende meetmomenten nemen.
We kunnen nu ook het verschil berekenen tussen meetmomenten. Dan kunnen we ook een contrast maken in de M-matrix (contrast herkennen doordat de som van de matrix dan 0 moet zijn!). M-matrix dan bvb (1 0-1). Je kan bvb niet zeggen Is gewicht gelijk aan leeftijd?, maar wel Is gewicht op meetmoment 1 gelijk aan het gewicht op meetmoment 2?. Oefening 1: oeps, gemist Oefening 2
Repeated Measures Anova beter dan deze multivariate test, omdat de ANOVA voor herhaaldelijke metingen een beter power heeft. Hiervoor moet echter voldaan zijn aan de sphericiteitsassumptie. Er is correlatie tussen de metingen, maar de correlaties zijn gelijk (= sphericiteitsassumptie). Dit blijkt uit het feit dat de h0 niet kan verworden worden en de sphericiteitsassumptie dus voldaan is (p=0.836). Rapportage: χ² (2) =.358, p=.836 Interactie-effect hoofdeffect niet eenduidig te interpreteren, maar dit betekent niet dat je het niet moet rapporteren!
Er wordt in deze tabel nagegaan of er een GEMIDDELD effect is van dosis op depressiviteit. Er is inderdaad een effect van dosering op depressiviteit over de 3 meetmomenten heen. Oefening 3 Leeftijd ook een tussen subject factor en wordt dus ook daar ingevoegd. Leeftijd hier in 3 categorieën ingedeeld en daarom als categorische variabele beschouwd.
Interactie-effect tussen leeftijd en dosis is niet significant. Het effect van dosis hangt niet af van de leeftijd! In modelanalyse zou je beter leeftijd eruit laten. Oefening 4 Tussen tijd en dosis is er een significant interactie-effect. Oefening 5 1) Parameters b01 b02 b03 intercept b11 b12 b13 dosis = 1 b21 b22 b23 dosis = 2 b31 b32 b33 dosis = 3 de1 de2 de2 2) Nulhypothese OV: dosis 2 = dosis 3 ofwel dosis 2 dosis 3 = 0 b2. b3. = 0 AV: meetmoment 1 = meetmoment 3 ofwel MM1 MM3 = 0 b.1 b.3 = 0
3) L- en M-matrix b0. b1. b2. b3. L = 0 0 1-1 1 M = 0-1 specialleke: altijd maar 1 kolom bij repeated measures + hier een contrast omdat het een within subject factor is! Als het zou zijn: een verschil tussen dosissen over de 3 meetmomenten dan : 1/3 M 1/3 1/3 Leeftijd eruit mits daarnet geen significant interactie-effect!