ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

Vergelijkbare documenten
Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Uitvoer van analyses (SPSS 16) voor het Faalfeedback en Oriëntatie voorbeeld in hoofdstuk 7 (Herhaalde metingen) >

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige variantieanalyse

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

1. Reductie van error variantie en dus verhogen van power op F-test

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Antwoordvel Versie A

Pilot vragenlijst communicatieve redzaamheid

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:

College 2 Enkelvoudige Lineaire Regressie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

11. Multipele Regressie en Correlatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Hoofdstuk 12: Eenweg ANOVA

De primaire link op gemeentelijke websites, Bijlagen. over efficiëntie, effectiviteit en gebruiksvriendelijkheid

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Voorbeeld regressie-analyse

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

Tabel 2: Stemgedrag van respondenten bij de TK verkiezingen in 2010 VVD xx % PvdA PVV CDA SP D66 CU PvdD SGP GL Te jong om te stemmen Niet gestemd

* de percentages goed per klas en volgorde van afnemen. sort cases by klas volgorde. split file by klas volgorde. des var=goedboekperc.

TECHNISCHE UNIVERSITEIT EINDHOVEN

Statistiek 1 Blok 6, Werkgroepopdrachten

Hoofdstuk 5 Een populatie: parametrische toetsen

Oplossingen hoofdstuk 9

Hoofdstuk 10: Regressie

MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek

11. Meerdere gemiddelden vergelijken, ANOVA

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

Toegepaste data-analyse: oefensessie 2

Verband tussen twee variabelen

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

Les 5: Analysis of variance

Residual Plot for Strength. predicted Strength

20. Multilevel lineaire modellen

Statistiek ( ) eindtentamen

variantie: achtergronden en berekening

toetskeuze schema verschillen in gemiddelden

Bijlage 3: Multiple regressie analyse

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

ANTWOORDEN Statistiek

Oplossingen hoofdstuk XI

College 7 Tweeweg Variantie-Analyse

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

antwoorden bij tentamen Statistiek

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

Analyse van kruistabellen

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Statistiek in HBO scripties

Hoofdstuk 6 Twee populaties: parametrische toetsen

Eindtoets Toegepaste Biostatistiek

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Toegepaste data-analyse: sessie 3

Statistiek II. Sessie 4. Feedback Deel 4

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015,

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Experimenteel Onderzoek en Experimentele Controle

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Adviseren over onderzoeksmethoden: Het meten en analyseren van verandering

Opgave 1: (zowel 2DM40 als 2S390)

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Faculteit der Wiskunde en Informatica

duidelijk. Welke groepen verschillen wel/niet van elkaar?wat zijn je hypothesen?

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

2.9 Het adolescentieonderzoek Opgaven 72

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Transcriptie:

ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan http://www.ruf.rice.edu/~mickey/psyc339/notes/rmanova.html). De afhankelijke variabele IQ is gemeten bij 5 deelnemers op 3 leeftijden. Is er een verschil in de gemiddelde IQ s gemeten op de verschillende leeftijden 1 (is er een effect van leeftijd op IQ)? 2 fixed model Indien alle factoren fixed zouden zijn, dan zouden we het commando ANOVA kunnen gebruiken. In het Syntax-venster van SPSS gaat dat als volgt: * fixed two-way ANOVA. ANOVA iq BY Age(1,3) Subj(1,5). 1 Omdat MANOVA eist dat de factor-waarden aansluiten, zijn de niet-aansluitende waarden van Age (5,25,45) veranderd in aansluitende waarden (1,2,3). 1

Hierbij heeft de eerste factor Age 3 verschillende waarden (nivo s, levels ), en de tweede factor Subj heeft 5 verschillende nivo s. Bij dit commando wordt altijd een factorieel design verondersteld, en alle effecten worden getoetst tegen de within-cell variantie. Met andere woorden: de noemer van de F- ratio (de zogeheten error term) is altijd de variantie binnen cellen (residual, within-cell variance). In dit geval is die variantie echter nul, omdat er maar één observatie is in iedere combinatie van Age en Subj. Er kunnen dan ook geen F ratio s berekend worden. Voor dit onderzoek is deze analyse duidelijk niet geschikt. Sum of Sq df Mean Sq Main Effects AGE 12.133 2 6.067 SUBJ 23.333 4 5.833 2-Way Interactions AGE * SUBJ 1.867 8.233 Model 37.333 14 2.667 Residual 0.000 0. Total 37.333 14 2.667 3 mixed model, univariate Bij andere designs zijn soms niet alle factoren fixed, of het design is niet factorieel. Je mag dan niet zomaar de within-variantie (variantie binnen cellen, residual) gebruiken als error term. Je moet dan aangeven welke effecten getoetst moeten worden tegen welke error terms. Dat kan niet met ANOVA; je moet daarvoor het commando MANOVA gebruiken, met een expliciete specificatie van het design. * mixed ANOVA, univariate. MANOVA IQ BY Subj(1,5) Age(1,3) /METHOD ESTIMATION (NOCONSTANT) /PRINT=HOMOGENEITY (COCHRAN) /DESIGN Subj BY Age = 1, Age VS 1. Bij het laatste sub-commando /DESIGN wordt eerst de interactie vermeld, omdat deze later ook gebruikt moet worden als error term. Deze interactie wordt afgekort als 1 voor later gebruik. Deze interactie hoeft zelf niet te worden getoetst; we vermelden dus geen error term erbij. Het hoofdeffect van Age wordt getoetst tegen het interactie-effect, zojuist afgekort als 1. Het hoofdeffect van Subj, de random factor, wordt hier niet getoetst omdat er geen geschikte error term voor is. 2

Bovenstaande commando levert o.a. de volgende uitvoer op, hier lichtelijk aangepast: Tests of Significance for IQ using UNIQUE sums of squares Source of Variation SS DF MS F Sig of F Error 1 1.87 8.23 AGE 12.13 2 6.07 26.00.000 We zien op de laatste regel van deze uitvoer dat het fixed effect van Age getoetst is tegen error term 1, daarboven gedefinieerd (en niet getoetst), en we zien ook dat dit hoofdeffect van leeftijd significant is, F (2, 8) = 26,p<.001. Voor deze univariate analyse is de assumptie van sphericiteit vereist. Informeel gezegd komt dat erop neer dat alle leeftijdsverschillen gelijke variantie hebben. Op grond van de herhaalde metingen op 3 tijdstippen kunnen we twee nieuwe verschil-variabelen uitrekenen 2. Hebben die twee verschilvariabelen dezelfde variantie? COMPUTE D1 = IQ2-IQ1. COMPUTE D2 = IQ3-IQ2. DESCRIPTIVES VARIABLES=d1 d2 /STATISTICS=MEAN STDDEV VARIANCE SEMEAN. De uitvoer hieronder laat zien dat de varianties van deze verschillen niet gelijk zijn. Door de zeer kleine omvang van de steekproef kunnen we echter H0 :s D1 = s D2 niet verwerpen. Descriptive Statistics N Mean Std.Error Std.Dev. Variance of Mean D1 5 1.0000.3162.7071.500 D2 5 1.2000.2000.4472.200 Desalniettemin lijkt het beter om geen sphericiteit te veronderstellen voor deze gegevens. We moeten daarom onze toevlucht nemen tot een multivariate ANOVA. 4 repeated measures, multivariate Een nog betere toets, met meer power, maakt gebruik van Repeated Measures ANOVA. Hierbij wordt niet aangenomen dat de verschillen gelijke variantie 2 Hier zijn die bepaald voor de multivariate dataset, zie hierna. 3

hebben. Het effect van de fixed factor Age wordt niet vergeleken als hoofdeffect, buiten de deelnemers om, maar uitsluitend binnen deelnemers (within subjects). In de meeste gevallen is dat de beste keuze! Door deze within-subjects-vergelijking is er dus ook geen interactie mogelijk tussen Age en Subj, of algemener, tussen het hoofdeffect en de observation units. Deze interactie is immers feitelijk niet meer te scheiden van de residual variantie, of meetfout. Dat zagen we al bij het fixed model hierboven. Helaas kan je een Repeated Measures ANOVA niet zomaar uitvoeren. Die analyse maakt in SPSS gebruik van een zgn. multivariate data layout. Dat wil zeggen dat alle gegevens van één deelnemer (observation unit) op één regel moeten staan. Binnen iedere proefpersoon zijn de observaties geordend volgens de within-subject factors. Dat levert het volgende arrangement op: 2 4 5 5 6 7 3 3 4 1 2 4 2 3 4 Het bijbehorende commando voor Repeated Measures ANOVA is als volgt, als je het opgeeft via het Syntax venster: * mixed ANOVA, multivariate. MANOVA iq1 iq2 iq3 /WSFACTOR age(3) /MEASURE = iq /ANALYSIS (REPEATED). Dit geeft aan dat de 3 observaties voor iedere deelnemer opgevat moeten worden als verdeeld over 3 condities van de fixed within-subject factor Age. De afhankelijke variabele krijgt het label IQ, en dit moet geanalyseerd worden als een Repeated Measures ANOVA. De omvangrijke uitvoer is als volgt; we zullen die (hier wat aangepaste) uitvoer in porties bespreken. Tests of Between-Subjects Effects. Tests of Significance for T1 using UNIQUE sums of squares Source of Variation SS DF MS F Sig of F WITHIN CELLS 23.33 4 5.83 CONSTANT 201.67 1 201.67 34.57.004 4

Zijn er verschillen tussen deelnemers? In deze studie zijn er geen betweensubject factoren; anders zouden die hier getoetst worden. In deze analyse heb ik ook afgezien van het toetsen van verschillen tussen deelnemers, gezien het geringe aantal deelnemers. De enige term die dan overblijft is de constante, d.w.z. de grand mean. Deze wordt getoetst tegen de verschillen tussen deelnemers, met F (1, 4) = 34.6,p =.004. De grand mean is dus significant afwijkend van nul. Niet bijster interessant, dus we gaan verder. Tests involving AGE Within-Subject Effect. Mauchly sphericity test, W =.61224 Chi-square approx. = 1.47187 with 2 D. F. Significance =.479 Greenhouse-Geisser Epsilon =.72059 Huynh-Feldt Epsilon = 1.00000 Lower-bound Epsilon =.50000 Hier wordt de sphericity assumption onderzocht met een gerichte toets, Mauchly s W. Dat hebben we hierboven al informeel gedaan. Ook deze toetsisnietsignificant,p =.479, wegens de kleine steekproef. Er is dus geen correctie nodig op de resulterende F ratio s. Als Mauchly s W wèl significant zou zijn geweest, dan hadden we de vrijheidsgraden van de gevonden F ratio s moeten vermenigvuldigen met de Huynh-Feldt ɛ, een getal tussen 1/(k 1) (hier 1/2) en 1. De toetsing wordt daardoor conservatiever. Maar dat is nu niet nodig. Eerst zien we de resultaten van de multivariate ANOVA: EFFECT.. AGE Multivariate Tests of Significance (S = 1, M = 0, N = 1/2) Test Name Value Exact F Hypoth. DF Error DF Sig. of F Pillais.92000 17.25000 2.00 3.00.023 Hotellings 11.50000 17.25000 2.00 3.00.023 Wilks.08000 17.25000 2.00 3.00.023 Roys.92000 Note.. F statistics are exact. De F ratio voor het within-subject effect van Age kan op meerdere manieren berekend worden, hier zie je ze allemaal, en ze komen allemaal tot dezelfe uitkomst. Meestal is Wilks F ratio het beste bruikbaar. De resultaten spreken duidelijke taal: F (2, 3) = 17.25,p =.023, dus we mogen H 0 verwerpen. De IQ-scores zijn niet op alle leeftijden gelijk. 5

Voor de volledigheid krijg je bij dit commando ook de uitvoer van een univariate analyse. Die zou dus hetzelfde moeten zijn als in de vorige sectie, en dat is ook zo: F (2, 8) = 26,p<.001. AVERAGED Tests of Significance that follow multivariate tests are equivalent to univariate or split-plot or mixed-model approach to repeated measures. Epsilons may be used to adjust d.f. for the AVERAGED results. Tests involving AGE Within-Subject Effect. AVERAGED Tests of Significance for IQ using UNIQUE sums of squares Source of Variation SS DF MS F Sig of F WITHIN CELLS 1.87 8.23 AGE 12.13 2 6.07 26.00.000 6