Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

Vergelijkbare documenten
Toegepaste data-analyse: oefensessie 2

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Toegepaste data-analyse: sessie 3

11. Multipele Regressie en Correlatie

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

20. Multilevel lineaire modellen

9. Lineaire Regressie en Correlatie

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

8. Analyseren van samenhang tussen categorische variabelen

Statistiek II. Sessie 5. Feedback Deel 5

Onderzoeksmethoden II: overzicht en herhaling interpretatie output

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 10: Regressie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

1. Reductie van error variantie en dus verhogen van power op F-test

Oplossingen hoofdstuk XI

DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR Feedback Praktische Proef

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Toetsen van hypothesen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Hoofdstuk 5 Een populatie: parametrische toetsen

Feedback examen Statistiek II Juni 2011

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Beschrijvende statistiek

College 2 Enkelvoudige Lineaire Regressie

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid

Toegepaste Statistiek, Dag 7 1

A. Week 1: Introductie in de statistiek.

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Onderzoeksmethoden II: het multivariaat lineair

Op de productpagina van dit boek op vind je onder andere de data van computeropgaven.

College 7 Tweeweg Variantie-Analyse

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Examen G0N34 Statistiek

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

gemiddelde politieke interesse van hoger opgeleide mensen)

Uitvoer van analyses (SPSS 16) voor het Faalfeedback en Oriëntatie voorbeeld in hoofdstuk 7 (Herhaalde metingen) >

De bijbel der SPSS procedures

Statistiek II. Sessie 4. Feedback Deel 4

Hoofdstuk 3 Statistiek: het toetsen

Les 1: Waarschijnlijkheidrekening

Meervoudige variantieanalyse

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Hoofdstuk 6 Twee populaties: parametrische toetsen

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Bijlage 1: Gezondheidsdoelstellingen Vlaamse Overheid

College 6 Eenweg Variantie-Analyse

Gegevensverwerving en verwerking

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

11. Meerdere gemiddelden vergelijken, ANOVA

Les 7-8: Parameter- en Vergelijkingstoetsen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Tabel 2.1 Overzicht van de situatie op de arbeidsmarkt van de onderzochte personen op 30/06/97. Deelpopulatie 1996

Hoofdstuk 12: Eenweg ANOVA

Meten en experimenteren

Voorbeeldtentamen Statistiek voor Psychologie

Online bijlage 5. Model ter verklaring van xenofobie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

DATA-ANALYSEPLAN (20/6/2005)

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Voorbeeld regressie-analyse

Eindtoets Toegepaste Biostatistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Pagina 0 van 49. Webshop Bol.com. Onderzoeksvaardigheid Hogeschool Inholland Muilwijk, Sammy

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

Statistiek ( ) eindtentamen

Toegepaste Statistiek, Week 3 1

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

2.9 Het adolescentieonderzoek Opgaven 72

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

Supplement Wiskunde 2017/2018. Inhoudsopgave

Onderzoek. B-cluster BBB-OND2B.2

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Transcriptie:

Toetsen van hypothesen Bijvoorbeeld: nagaan of het gemiddeld IQ bij een bepaalde steekproef groter/kleiner is als in de populatie. µ = 100 Normaalverdeling, waarbij we de score van de steekproef gaan vergelijken met de distributie van de populatie. We gaan teksten of het gemiddelde in de steekproef significant verschilt van het gemiddelde in de populatie = UNIVARIAAT TOETSEN Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie. Taal Rekenen Blauwe lijnen: multivariaat toetsen als meerdere keren univariaat toetsen vierkant aanvaardingsgebied Kans op type 2 fout grotere door herhaaldelijk univariaat te toetsen Multivariaat toetsen hogere power Dus: multivariaat toetsen rond aanvaardingsgebied Bovendien vermijd je met multivariaat toetsen ook het maken van een type I fout Door multivariaat toetsen kunnen we ook de correlaties in rekening brengen, waardoor het aanvaardingsgebied kan wijzigen, ifv de correlaties (rode ellipsen)

Lineaire modellen Univariaat lineair model Y = x.β + e voorbeeld: stress = β0 + β1.lft + β2.gewicht + e Verwachting: gemiddelde e = 0! β0 β-matrix β = β1 β3 Multivariaat lineair model Y = x.β + e Voorbeeld: stress = β01 + β11.lft + β21.gewicht + e subscript toegevoegd om depressie = β02 + β12.lft + β22.gewicht + e aan te tonen over welke variabele het gaat β01 β02 intercept β-matrix β = β11 β12 leeftijd rij = OV, kolom = AV β31 β32 gewicht stress depressie Oefeningen: Kijken naar de multivariate toetsen - We kijken hierbij altijd naar Wilks Labda (ook altijd vermelden in rapport dat je daarnaar kijkt!) - Hoofdeffecten niet eenduidig te interpreteren als het interactie-effect significant is - Interacties tussen categorische variabelen worden automatisch weergegeven, tussen continue moet je zelf ingeven Oefeningen: Kijken naar de univariate toetsen Leeftijd significant effect op stres, niet op depressie. Wel beide rapporteren. Oefeningen: Kijken naar de richting en de grootte van het effect (parameters) Leeftijd op stress.

Oefening 1 bij Het Multivariaat Lineair Model Datasets opslaan: - Diskette aanduiden (opslaan) - Opslaan op H-schijf! Pas op!: Op examen goed lezen welke versie van SPSS je moet gebruiken, want dit zou andere resultaten kunnen geven. Dependent = afhankelijke Fixed = categorische onafhankelijke variabelen Covariates = continue onafhankelijke variabelen

Effect van psych dem op gezondheid (F3,369)=25.444, p<.05 Effect van skilutt op gezondheid (F3,369)=0.835, p=.476 (rapportage bij significant) (rapportage bij ns) 3 = Hypothesis df en 369 = Error df

Educlev op chi F(2,371)=7.248, p<.05 Als psychological demands stijgt met 1 eenheid, komt er bij chi 0.114 bij. Opleidingsniveau is categorische variabele werken met referentieniveau. Referentieniveau is educlev = 3 (hoogste opleidingsniveau). Wat is nu het verschil tussen en gemiddeld en een hoog opleidingsniveau? = 0.381 Hoe hoger het opleidingsniveau, hoe lager uw gezondheid. Immers: chi gaat terug op een gezondheidsindex waarbij geldt hoe hoger, hoe meer gezondheidsklachten. Als we de parameters van elk opleidingsniveau met de referentie vergelijken, zien we dat een hoger opleidingsniveau de score op chi hoger maakt = meer klachten = lagere gezondheid

Oefening 2 bij Het Multivariaat Lineair Model 1) Parameters oplijsten 3 afhankelijke variabelen 3 kolommen in β-matrix b01 b02 b03 intercept b11 b12 b13 psydem b21 b22 b23 skillut b31 b32 b33 age2 b41 b42 b43 educ=1 b51 b52 b53 educ=2 b61 b62 b63 educ=3 chi str depr 1 rij per continue variabelen 1 rij per niveau categorische variabelen 2) Nulhypothese H0: LbM = 0 OV: H0: educlev1=educlev3 b4. = b6.. = gemiddeld over de 3 AV s b4. b6. = 0 AV: enkel stress depressie 3) L en M-matrix L matrix legt restricties op aan OV B0. B1. B2. B3. B4. B5. B6. L = (0 0 0 0 1 0-1) Hier verwijzen de kolommen naar de OV (draaien matrix bij vermenigvuldiging)

Nu kunnen we b4. En b6. Toetsen, maar wel voor ALLE AV s en we zijn enkel geïnteresseerd in stress en depressie. De M-matrix legt daarom restricties op aan de AV 1 0 0 b.1=chi We gaan de eerste kolom weg- M = 0 1 0 b.2=stress laten, want we zijn enkel 0 0 1 b.3=depressie geïnteresseerd in stress en depr. Hier verwijzen de rijen naar de OV (draaien matrix bij vermenigvuldiging) Syntax bekijken en kopiëren, omdat dit garandeert dat je altijd hetzelfde aan het doen bent! L en M matrix ingeven Groene play knop indrukken.

Hier kan je jezelf controleren: - Staan de variabelen in de juiste volgorde? - Is de nulhypothese juist geëxpliciteerd in de L-matrix? Er is inderdaad een verschil tussen de hoogste en de laagste scholingsgraad in stress en depressie. Oefening 3 bij Het Multivariaat Lineair Model 1) Parameters hetzelfde als bij de vorige oefening 2) Nulhypothese Persoons-gerelateerde variabelen = educlev en age2 OV: geen invloed van educlev geen invloed van leeftijd DEZE KAN JE NIET SAMENNEMEN!!! Geen invloed van educlev b4. = b5. = b6. 2 contrasten opspitsen b4. = b5. b4. b5. = 0 b5. = b6. b5. b6. = 0 b4. = b6. (redundant; je moet er maar 2 doen) Geen invloed van age2 b3. = 0

H0: b4. = b5. = b6. b3. = 0 SIMULTAAN TOETSEN AV: gezondheid = alle 3 de AV 3) L en M matrix b0. B1. B2. B3. B4. B5. B6. L = 0 0 0 0 1-1 0 0 0 0 0 0 1-1 0 0 0 1 0 0 0 1 0 0 M = 0 1 0 Gezondheid = alle 3 de variabelen 0 0 1 Geen restricties! M-matrix = identiteitsmatrix Repeated Measires ANOVA Invloed van een bepaald medicijn op depressie herhaaldelijke metingen om na te gaan welk effect een bepaalde dosis (tussen subject variabele) op depressie heeft. b01 b02 b03 intercept b11 b12 b13 dosis = 1 b21 b22 b23 dosis = 2 varieert tssn subjecten b31 b32 b33 dosis = 3 de1 de2 de2 Nieuwe variabele: meetmoment. Elk subject heeft 3x een bepaalde meting van de mate van subjectiviteit gehad (binnen subject variabele) Meetmoment varieert dus binnen subjecten! Hiervoor deden we de toetsen apart. Je kan niet het gemiddelde nemen van iemand leeftijd en gewicht. Gewicht veel grotere schaal dan leeftijd, dus als je daar het gemiddelde van neemt, heeft dit een veel grotere invloed dan leeftijd. Je meet niet op dezelfde schaal, dus je kan het niet samen toetsen. Vermits het hier gaat over variabelen die bij alle subjecten op dezelfde schaal gemeten zijn, kunnen we dit hier wel doen. We kunnen vragen: Wat is de gemiddelde invloed van dosis over de 3 meetmomenten heen?. Als je de M-matrix (1/3 1/3 1/3) vermenigvuldigd met de gekozen L-matrix, zal je het gemiddelde over de verschillende meetmomenten nemen.

We kunnen nu ook het verschil berekenen tussen meetmomenten. Dan kunnen we ook een contrast maken in de M-matrix (contrast herkennen doordat de som van de matrix dan 0 moet zijn!). M-matrix dan bvb (1 0-1). Je kan bvb niet zeggen Is gewicht gelijk aan leeftijd?, maar wel Is gewicht op meetmoment 1 gelijk aan het gewicht op meetmoment 2?. Oefening 1: oeps, gemist Oefening 2

Repeated Measures Anova beter dan deze multivariate test, omdat de ANOVA voor herhaaldelijke metingen een beter power heeft. Hiervoor moet echter voldaan zijn aan de sphericiteitsassumptie. Er is correlatie tussen de metingen, maar de correlaties zijn gelijk (= sphericiteitsassumptie). Dit blijkt uit het feit dat de h0 niet kan verworden worden en de sphericiteitsassumptie dus voldaan is (p=0.836). Rapportage: χ² (2) =.358, p=.836 Interactie-effect hoofdeffect niet eenduidig te interpreteren, maar dit betekent niet dat je het niet moet rapporteren!

Er wordt in deze tabel nagegaan of er een GEMIDDELD effect is van dosis op depressiviteit. Er is inderdaad een effect van dosering op depressiviteit over de 3 meetmomenten heen. Oefening 3 Leeftijd ook een tussen subject factor en wordt dus ook daar ingevoegd. Leeftijd hier in 3 categorieën ingedeeld en daarom als categorische variabele beschouwd.

Interactie-effect tussen leeftijd en dosis is niet significant. Het effect van dosis hangt niet af van de leeftijd! In modelanalyse zou je beter leeftijd eruit laten. Oefening 4 Tussen tijd en dosis is er een significant interactie-effect. Oefening 5 1) Parameters b01 b02 b03 intercept b11 b12 b13 dosis = 1 b21 b22 b23 dosis = 2 b31 b32 b33 dosis = 3 de1 de2 de2 2) Nulhypothese OV: dosis 2 = dosis 3 ofwel dosis 2 dosis 3 = 0 b2. b3. = 0 AV: meetmoment 1 = meetmoment 3 ofwel MM1 MM3 = 0 b.1 b.3 = 0

3) L- en M-matrix b0. b1. b2. b3. L = 0 0 1-1 1 M = 0-1 specialleke: altijd maar 1 kolom bij repeated measures + hier een contrast omdat het een within subject factor is! Als het zou zijn: een verschil tussen dosissen over de 3 meetmomenten dan : 1/3 M 1/3 1/3 Leeftijd eruit mits daarnet geen significant interactie-effect!