Meervoudige variantieanalyse



Vergelijkbare documenten
Meervoudige ANOVA Onderzoeksvraag Voorwaarden

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

Verband tussen twee variabelen

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Antwoordvel Versie A

Enkelvoudige lineaire regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Hoofdstuk 5 Een populatie: parametrische toetsen

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

College 6 Eenweg Variantie-Analyse

TECHNISCHE UNIVERSITEIT EINDHOVEN

Voorbeeld regressie-analyse

Hoofdstuk 12: Eenweg ANOVA

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Meervoudige lineaire regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Verdelingsvrije statistiek

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

1. Reductie van error variantie en dus verhogen van power op F-test

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

Opgave 1: (zowel 2DM40 als 2S390)

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

11. Multipele Regressie en Correlatie

Analyse van kruistabellen

Residual Plot for Strength. predicted Strength

Toegepaste data-analyse: oefensessie 2

MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

mlw stroom 2.1: Statistisch modelleren

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes

11. Meerdere gemiddelden vergelijken, ANOVA

Fasen in het onderzoeksproces

toetskeuze schema verschillen in gemiddelden

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Betrouwbaarheid, validiteit en overeenstemming

Hoofdstuk 10: Regressie

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

20. Multilevel lineaire modellen

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

Statistiek 1 Blok 6, Werkgroepopdrachten

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Vergelijken van twee groepen (SPSS)

Beschrijvende statistieken

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

College 2 Enkelvoudige Lineaire Regressie

tul Moleculaire Levenswetenschappen Stroom Statistisch modelleren Werkboek

10. Moderatie, mediatie en nog meer regressie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

College 7 Tweeweg Variantie-Analyse

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Eindtoets Toegepaste Biostatistiek

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015,

Basishandleiding SPSS

De primaire link op gemeentelijke websites, Bijlagen. over efficiëntie, effectiviteit en gebruiksvriendelijkheid

DE IMPACT VAN (CONSUMENTEN)RACISME OP DE EFFECTIVITEIT VAN BLANKE EN NIET- BLANKE (CELEBRITY) ENDORSERS IN RECLAME

12. VARIANTIEANALYSE

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

9. Lineaire Regressie en Correlatie

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

gemiddelde politieke interesse van hoger opgeleide mensen)

Pilot vragenlijst communicatieve redzaamheid

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

Hoofdstuk 6 Twee populaties: parametrische toetsen

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

(slope in het Engels) en het snijpunt met de y-as, b 0

Introductie SPSS. Hogeschool Gent. Mei Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test Two-sample T-test Paired T-test 18

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Beschrijvende statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag ,

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Faculteit der Wiskunde en Informatica

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:

Transcriptie:

Meervoudige variantieanalyse Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken kunnen worden. In eerdere hoofdstukken is de t-toets, waar gemiddelden van twee groepen met elkaar werden vergeleken uitvoerig aan de orde geweest. Een generalisatie van de t-toets voor twee onafhankelijke steekproeven met gepoolde varianties is variantieanalyse. Heeft men te maken met één factor die uit meer dan twee waarden bestaat dan wordt een éénweg variantieanalyse uitgevoerd. In SPSS is dit de procedure One-Way Anova. Als er sprake is van meerdere factoren dan wordt een meerweg variantieanalyse toegepast. In SPSS heet dit de Univariate procedure. De procedure One-Way Anova Bij variantieanalyse met één factor worden op basis van één variabele groepen onderscheiden. SPSS gebruikt hiervoor de procedure One-Way ANOVA, zoals eerder besproken in hoofdstuk I-8. Aan de hand van het onderzoek waarin onderzocht werd in welke mate moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden (bestand MENTAL.SAV, zie hoofdstuk II-12 voor een beschrijving van dit onderzoek) wordt de procedure One-Way ANOVA duidelijk gemaakt. Via de menu-optie Analyze Compare Means One-Way ANOVA kom je in het dialoogvenster van de One-way ANOVA. Geef in het dialoogvenster onder Dependent List op voor welke variabele de gemiddelden getoetst moeten worden, in het voorbeeld is dit de variabele SCORE. De variabele met de groepsindeling wordt in het kader onder Factor geplaatst, in het voorbeeld is dit de variabele METHODE. De procedure One-Way ANOVA kent verder de drukknoppen Contrasts, Post Hoc en Options. De eerste drukknop die gebruikt wordt om specifieke hypotheses omtrent groepsgemiddelden te toetsen wordt niet besproken. Post Hoc Multiple Comparisons Variantieanalyse toetst de nulhypothese dat de gemiddelden van alle te onderscheiden groepen aan elkaar gelijk zijn. De nulhypothese wordt verworpen als er minstens twee gemiddelden van elkaar verschillen. Als uit de variantieanalyse blijkt dat er minstens twee gemiddelden van elkaar verschillen wordt vervolgens onderzocht waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). In de theorie zijn drie van deze toetsen besproken, nl. Bonferroni, Tukey en Scheffé. Deze toetsen zijn terug te vinden in het Post Hoc dialoogvenster. II12-1

Options Met de drukknop Options kunnen o.a. kengetallen berekend worden. Gebruik hiervoor Descriptive in het kader onder Statistics van het venster Options. SPSS vermeldt voor het totaal aantal cases en voor elke groep het aantal waarnemingen, gemiddelde, standaarddeviatie, standaardfout, 95% betrouwbaarheidsinterval voor het gemiddelde, minimum en maximum. De overige opties in dit venster worden niet behandeld. Naar aanleiding van een uitvoer van het moeder instructie onderzoek worden de belangrijkste zaken van een eenweg variantieanalye nog eens toegelicht. SPSS uitvoer One-Way ANOVA: ANOVA score Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 41.722 2 1670.861 6.17.005 8727.917 264.482 12069.69 5 Post Hoc Tests Multiple Comparisons Dependent Variable: score Tukey HSD Scheffe Bonferroni (I) methode.00.00.00 (J) methode.00.00.00.00.00.00 *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -14.25000 6.691.096-0.5415 2.0415-2.41667* 6.691.004-9.7082-7.1252 14.25000 6.691.096-2.0415 0.5415-9.16667 6.691.62-25.4582 7.1248 2.41667* 6.691.004 7.1252 9.7082 9.16667 6.691.62-7.1248 25.4582-14.25000 6.691.116-1.2677 2.7677-2.41667* 6.691.005-40.44-6.990 14.25000 6.691.116-2.7677 1.2677-9.16667 6.691.96-26.184 7.8510 2.41667* 6.691.005 6.990 40.44 9.16667 6.691.96-7.8510 26.184-14.25000 6.691.118-0.9957 2.4957-2.41667* 6.691.004-40.1624-6.6709 14.25000 6.691.118-2.4957 0.9957-9.16667 6.691.50-25.9124 7.5791 2.41667* 6.691.004 6.6709 40.1624 9.16667 6.691.50-7.5791 25.9124 II12-2

Homogeneous Subsets Tukey HSD a Scheffe a methode.00 Sig..00 Sig. score Subset for alpha =.05 N 1 2 12 7.7500 12 500 500 12 61.1667.096.62 12 7.7500 12 500 500 12 61.1667.116.96 Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10. In de bovenstaande uitvoer wordt getoetst: H 0 : μ 1 =μ 2 =μ H a : minstens één van de gemiddelden is ongelijk aan de anderen waarbij: μ 1 = populatiegemiddelde van de standaardmethode μ 2 = populatiegemiddelde van experimentele methode 1 μ = populatiegemiddelde van experimentele methode 2 SPSS berekent de ANOVA tabel met de kwadratensommen (SS en MS), de vrijheidsgraden (df), de F-toets (F) en de bijbehorende overschrijdingskans (Sig.). Uit de overschrijdingskans blijkt dat de nulhypothese wordt verworpen (Sig.=.005). Vervolgens wordt geanalyseerd waar de verschillen tussen de groepsgemiddelden zitten (Post Hoc Tests). De hypothesen die getoetst worden met een overall α van 5% zijn : H 01 : μ 1 =μ 2 versus H a1 : μ 1 μ 2 H 02 : μ 1 =μ versus H a2 : μ 1 μ H 0 : μ 2 =μ versus H a : μ 2 μ N.B. Als bij het toetsen van de genoemde hypothesen gebruik gemaakt zou worden van afzonderlijke t-toetsen met een α van 5%, levert het vinden van minstens één significant toetsingsresultaat een overall type I fout op, groter dan 5%. Dit probleem wordt bij variantieanalyse omzeild! Uit de tabel Multiple Comparisons is af te lezen tussen welke groepen een significant verschil gevonden wordt middels de verschillende post hoc test methoden. Tukey (Honestly Significant Difference), Scheffé en Bonferroni vinden alledrie een significant verschil tussen groep 1 en (Sig. <.05). In de tabel staan verder voor elke combinatie van twee groepen het gemiddelde verschil plus de standaard error, en het 95% betrouwbaarheidsinterval van het gemiddelde verschil tussen de betreffende twee groepen vermeld. Tenslotte worden combinaties van groepen (zg. subsets) die op grond van de Tukey en Scheffé methode niet van elkaar verschillen weergegeven onder Homogeneous Subsets in de uitvoer. II12-

Met Scheffé wordt het breedste betrouwbaarheidsinterval verkregen, ga dit na! Hierdoor leidt deze methode minder snel tot het verwerpen van de nulhypothese in vergelijking met Bonferroni en Tukey. Omdat het betrouwbaarheidsinterval bij Tukey het smalst is, valt deze methode te verkiezen boven de andere methoden. Voor de verdere inhoudelijke aspecten verwijzen wij naar hoofdstuk II-12. De procedure Univariate ANOVA: meerweg variantieanalyse Het belangrijkste verschil tussen One-Way ANOVA en Univariate ANOVA is dat met de laatsgenoemde ook meerweg variantieanalyse schema's, d.w.z. schema's met meerdere factoren (= onafhankelijke variabelen), geanalyseerd kunnen worden. Het dialoogvenster van deze procedure wordt opgeroepen via Analyze General Linear Model Univariate. Ter instructie maken we wederom gebruik van het voorbeeld van de instructie-methoden (Mental.sav), maar nu wordt naast de variable METHODE tevens rekening gehouden met de variabele Sociaal economische klasse van de moeders (variabele SEK met 1=laag, 2 =midden en =hoog): Evenals in het dialoogvenster van One-Way ANOVA wordt de afhankelijke variabele (hier: SCORE) geplaatst onder Dependent Variable. De groepsindeling wordt nu gevormd op basis van meerdere variabelen (hier: METHODE en SEK) die geplaatst worden onder Fixed of Random Factor(s), afhankelijk van het type (voor uitleg type factoren zie hoofdstuk II-12). In het kader onder Covariates kunnen continue variabelen worden opgegeven. Onder WLS Weight kunnen variabelen geselecteerd worden die aan de observaties een verschillend gewicht toekennen. Het dialoogvenster van de Univariate ANOVA kent 6 drukknoppen: Model, Contrasts, Plots, Post Hoc, Save en Options. De drukknoppen Contrasts (om specifieke hypotheses omtrent groepsgemiddelden te toetsen) en Save (om voorspelde waarden, residuen, Cook s distances en andere gerelateerde maten te verkrijgen) worden hier niet besproken. II12-4

Model Met deze drukknop kan men het gewenste model specificeren: full factorial of custom. Het full factorial model bevat álle hoofdeffecten en alle factor-factor interactiemogelijkheden. Wanneer je alleen geïnteresseerd bent in de hoofdeffecten of in de hoofdeffecten plus een bepaalde subset van interactiemogelijkheden kies je voor Custom. Deze optie is dus nodig om de top-down procedure te kunnen voeren. Om een factor als hoofdeffect in het model te selecteren kies je onder Build Term(s) voor Main effects. Klik vervolgens de gewenste factor links onder Factors & Covariates aan en plaats deze via een druk op de pijl onder Build Term(s) naar rechts onder Model. Om een interactie tussen factoren te selecteren kies je eerst onder Build Term(s) voor Interaction. Vervolgens klik je de betreffende factoren links onder Factors & Covariates middels de Ctrl-knop samen aan en plaats je ze tegelijk naar rechts onder Model met een druk op de pijl. Linksonder kan men het type Sum of Squares kiezen welke default op type III staat. Dit is het meest gebruikte type SS bij modellen zonder ontbrekende cellen. Plots Met deze optie kunnen de effecten van een bepaalde factor A op een afhankelijke variabele Y voor verschillende (storende) niveaus van factor B in een (profile-)plot worden weergegeven. Selecteer factor A op de Horizontal Axis en B onder het kopje Separate Lines. Onder Separate Plots kan eventueel een variabele geselecteerd worden waarvoor aparte plots per waarde van die variabele gemaakt moeten worden. Voorbeeld: het onderzoek naar de mate waarin moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden kan mogelijk verstoord worden door de sociaal economische klasse (SEK) van de moeders. Om dit in beeld te brengen middels een profile plot selecteer je METHODE onder Horizontale axis en SEK onder Separate Lines: Vergeet niet op Add te klikken om de selectie actief te maken!! Het resultaat is dat er voor elk niveau van SEK een lijn getrokken wordt die het verband weergeeft tussen METHODE en SCORE (zie grafiek op II12-8). Post Hoc Net als bij de One-Way ANOVA kan ook hier onderzocht worden waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc II12-5

kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). De in de theorie besproken toetsen Bonferroni, Tukey en Scheffé zijn terug te vinden in het Post Hoc dialoogvenster.tevens moet nu in het kader onder Post Hoc Tests for: aangeven worden voor welke factoren de multiple comparisons uitgevoerd dienen te worden. Options In het kader Display kan onder Descriptive statistics het gemiddelde, de standaard deviatie en de aantallen van alle cellen worden opgevraagd. De overige mogelijkheden van deze drukknop worden verder niet besproken. SPSS uitvoer Univariate ANOVA met hoofdeffecten en eerste orde interactie (full factorial): Between-Subjects Factors methode sek.00.00 N 12 12 12 12 12 12 Descriptive Statistics Dependent Variable: score methode sek Mean Std. Deviation N 400 12.5584 4.7500 1.04799 4.00 8.5000 5.97216 4 Total 7.7500 10.7589 12.2500 9.21502 4 500 6.2456 4.00 71.7500 12.57975 4 Total 500 18.6525 12.00 41.2500 10.24288 4 76.0000 6.58281 4.00 66.2500 15.704 4 Total 61.1667 18.9878 12 Total 8.5000 10.41415 12 5.58 19.979 12.00 58.8 18.6669 12 Total 50.056 18.57005 6 De uitvoer onder Descriptive Statistics (resultaat van Options Display Descriptive statistics) bevat het gemiddelde, de standaard deviatie en het aantal van elke cel. II12-6

Dependent Variable: score Source Corrected Model Intercept methode sek methode * sek Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 8990.889 a 8 112.861 9.856.000 9110.61 1 9110.61 798.958.000 41.722 2 1670.861 14.65.000 2674.056 2 17.028 11.725.000 2975.111 4 74.778 6.52.001 078.750 27 114.028 1017.000 6 12069.69 5 a. R Squared =.745 (Adjusted R Squared =.669) Uit deze ANOVA tabel (Test of Between-Subjects Effects) valt het volgende af te lezen: Verklaarde variantie (SS(Corrected Model) = SS(METHODE) + SS(SEK) + SS(METHODE*SEK) = 41.722 + 2674.056 + 2975.111 = 8990.889 Onverklaarde variantie (SS(Error)) = 078.750 Totale variantie (SS(Corrected Total)) = SS(verklaard) + SS(onverklaard) = 8990.889 + 078.75 = 12069.69 Proportie verklaarde variantie ( R Squared) = SS(verklaard)/SS(totaal) = 8990.889/12069.69 = 0.745 Verder staan in de tabel uiteraard het aantal vrijheidsgraden (df), de Mean Squares, de F-waarde (F) en de bijbehorende overschrijdingskans (Sig.) vermeld. De overige gegevens vermeld in de ANOVA tabel worden verder niet behandeld. Opm. F en Sig. kunnen alleen worden weergegeven als er sprake is van meer dan 1 waarneming per cel! Uit de variantieanalyse tabel volgt dat de interactieterm significant is op 5 % niveau (Sig.=.001). II12-7

De profile plot ziet er als volgt uit: Estimated Marginal Means of score 80,00 sek.00 70,00 Estimated Marginal Means 60,00 50,00 40,00 0,00 methode.00 Het celgemiddelde voor de lage sociaal economische klasse bij methode 2 is aanzienlijk lager dan de gemiddelden bij methode 1 en methode. Bij de middenklasse is methode duidelijk de beste methode en bij de hoogste klasse geeft methode 2 het beste resultaat. Het effect van de verschillende methoden is dus afhankelijk van de sociaal economische klasse (interactie). Univariate procedure voor variantieanalyse met een continu covariaat: ANCOVA In het statistiekboek is covariantieanalyse (ANCOVA) behandeld in termen van een regressieanalyse (zie hoofdstuk II-11.9, deel 2). We zullen hier zien dat deze analyse ook kan worden uitgevoerd als een variant van variantieanalyse. De uitgangssituatie bij ANCOVA is een vergelijkende studie, waarbij er sprake is van twee of meer groepen die zich van elkaar onderscheiden op basis van een bepaalde discrete (categorische) variabele. Bovendien moet er rekening gehouden worden met een continue storende variabele (de covariaat). Als voorbeeld gaan we uit van een studie over voedingsgewoonten, waarbij o.a. wordt onderzocht of er bij kinderen een verband aanwezig is tussen voedingsgewoonten en lichaamslengte. Als indicatie voor voedingsgewoonten wordt het onderscheid tussen stads- en plattelandskinderen gehanteerd (file: NUTRITIO.SAV, zie ook hoofdstuk II-11.9 voor een beschrijving van dit onderzoek). Daarnaast moet er rekening worden gehouden met de continue variabele LEEFTIJD die de relatie tussen voedingsgewoonten en lengte kan II12-8

verstoren (covariaat). Om te kijken of er een significant verschil in lengte is tussen de stads- en plattelandskinderen zonder rekening te houden met andere variabelen, kan er een twee steekproeven t-test worden uitgevoerd. Als er echter sprake zou zijn van meer dan 2 groepen moet er een één-weg variantieanalyse uitgevoerd worden onder de aanname van gelijke varianties in alle groepen. Ook in ons voorbeeld zullen we de lengte van de stads- en plattelandskinderen vergelijken middels één-weg variantieanalyse, wat overeenkomt met de twee steekproeven t-test mits er sprake is van gelijke populatievarianties. Deze één-weg variantieanalyse kan worden uitgevoerd middels de procedure One-Way Anova of Univariate Anova. We kiezen voor de laatste optie omdat deze meer mogelijkheden biedt. Kies Analyze General Linear Model Univariate met LENGTE als afhankelijke variabele en SCHOOL als Fixed Factor. Vraag onder de drukknop Options de paarsgewijze vergelijkingen op via het aanvinken van Compare main effects en vraag om de schattingen van de regressiecoëfficiënten via het aanvinken van Parameter Estimates, zoals is aangegeven in onderstaand scherm: Klik op Continue en vervolgens op OK. Een deel van de uitvoer staat hieronder: II12-9

SPSS uitvoer Univariate ANOVA: Descriptive Statistics Dependent Variable: LENGTE SCHOOL.00 platteland stad Total Mean Std. Deviation N 141.6714 6.12051 14 144.5444 8.58612 18 14.2875 7.6112 2 De geobserveerde gemiddelde lengte van de plattelandskinderen is 141.67cm, met een standaard deviatie van 6.12cm (n=14) en van stadskinderen 144.54 met een standaard deviatie van 8.59 (n=18). Dependent Variable: LENGTE Source Corrected Model Intercept SCHOOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 65.002 a 1 65.002 1.121.298 645116.267 1 645116.267 11121.077.000 65.002 1 65.002 1.121.298 1740.25 0 58.008 658807.100 2 1805.255 1 a. R Squared =.06 (Adjusted R Squared =.004) Uit bovenstaande ANOVA tabel (Test of Between-Subjects Effects) blijkt dat er geen significant verschil in lengte bestaat tussen de stads- en plattelandskinderen (SCHOOL, F=1.12, Sig.=.298). Dependent Variable: LENGTE Parameter Intercept [SCHOOL=.00] [SCHOOL=] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound 144.544 1.795 80.518.000 140.878 148.211-2.87 2.714-1.059.298-8.416 2.670 0 a..... a. This parameter is set to zero because it is redundant. Uit bovenstaande tabel kunnen de gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0) LENGTE = 144.544 2.87 = 141.67 Voor stadskinderen (SCHOOL = 1) LENGTE = 144.54. Het geschatte verschil tussen de 2 groepen bedraagt 2.87cm. De gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means: II12-10

Estimated Marginal Means SCHOOL Dependent Variable: LENGTE SCHOOL.00 platteland stad Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound 141.671 2.06 17.514 145.829 144.544 1.795 140.878 148.211 In de Pairwise Comparisons tabel in de uitvoer staan alle paarsgewijze vergelijkingen (in dit geval dus alleen de vergelijking stads- en plattelandskinderen). Deze zijn zinvol wanneer de F-toets (zie bovenstaande Test of Between-Subjects Effects tabel) een significant resultaat oplevert en er meer dan 2 groepen zijn. In ons geval is deze test niet significant, dus we zullen verder niet toetsen op paarsgewijze verschillen. Vervolgens gaan we controleren voor de variabele LEEFTIJD. Aangezien dit een continue variabele is, moet deze in de analyse worden meegenomen als covariaat (covariantie-analyse, ANCOVA). Hierbij moet op de eerste plaats worden gecontroleerd of leeftijd lineair gerelateerd is aan lengte zowel bij de stads- als bij de plattelandskinderen. Daarvoor maken we een puntenwolk van LEEFTIJD tegen LENGTE voor beide groepen apart. Daartoe splitst men de datafile eerst in 2 groepen middels Data Split File. Kies voor de optie Organize output by groups; Groups Based on: SCHOOL, zoals hieronder is weergegeven: Vraag nu een puntenwolk op middels: Graphs Legacy Dialogs Scatter/Dot. Kies voor Simple Scatter en klik op Define. Zet LEEFTIJD op de x-as en LENGTE op y-as: II12-11

SPSS uitvoer puntenwolk: school: platteland 150,00 145,00 lengte 140,00 15,00 10,00 120,00 125,00 10,00 15,00 140,00 leeftijd school: stad 170,00 160,00 lengte 150,00 140,00 10,00 110,00 120,00 10,00 140,00 leeftijd Alhoewel het lineaire verband bij de plattelandskinderen niet duidelijk in de puntenwolk te zien is (kleine steekproef?) nemen we toch aan dat het verband tussen leeftijd en lengte in beide groepen lineair is. Let op: Als er in het model naast LEEFTIJD nog andere variabelen waren meegenomen dan had men het lineaire verband tussen LEEFTIJD en LENGTE moeten beoordelen in partiële plots, waarin de zuivere relatie wordt weergegeven tussen de afhankelijke variabele (LENGTE) en een onafhankelijke variabele (LEEFTIJD) gecorrigeerd voor alle andere onafhankelijke variabelen die in het model zitten (zie hoofdstuk II11). Deze kunnen in SPSS alleen maar geproduceerd worden via de procedure Linear Regression. Een andere voorwaarde van covariantie-analyse is dat het verband tussen LEEFTIJD en LENGTE voor elke groep hetzelfde is (evenwijdige regressielijnen). Dit wordt onderzocht middels meervoudige variantieanalyse waarin de variabele LEEFTIJD in categorieën wordt opgesplitst. We splitsen de variabele LEEFTIJD middels Analyze Recode (zie het boek SPSS in Praktische Stappen van blok 1.2b) in gelijke groepen (tertielen) en noemen deze gecategoriseerde variabele LFTCAT. Kies Analyze General Linear II12-12

Model Univariate, selecteer LENGTE als Dependent Variable en LFTCAT en SCHOOL als Fixed Factors. Klik op Model en kies het Custom model. Selecteer daarin LFTCAT en SCHOOL als hoofdeffecten door Build Terms op Main effects te zetten en de 2 onafhankelijke variabelen met de pijltoets naar de rechterbox over te brengen. Zet Build Terms vervolgens op Interaction, selecteer middels de Ctrl-knop zowel LFTCAT als SCHOOL en breng ze samen met de pijltjestoets over naar de rechterbox: Opm. Omdat er slechts sprake is van 2 onafhankelijke variabelen (LFTCAT en SCHOOL) en we geïnteresseerd zijn in het model met beide hoofdeffecten en hun onderlinge interactie zouden we in dit geval ook gekozen kunnen hebben voor het full factorial model wat automatisch alle hoofdeffecten en alle factorfactor interactiemogelijkheden bevat. Klik op Continue. Vraag onder Plots een plot aan van LENGTE (automatisch op de y-as!) tegen LFTCAT (horizontal axis) met aparte lijnen voor SCHOOL (Separate lines). Klik op Add, Continue, en vervolgens op OK. De volgende uitvoer verschijnt: SPSS uitvoer Univariate ANOVA (controleren voorwaarden ANCOVA): Between-Subjects Factors LFTCAT SCHOOL.00.00 Value Label N 11 11 10 platteland 14 stad 18 II12-1

Dependent Variable: LENGTE Source Corrected Model Intercept LFTCAT SCHOOL LFTCAT * SCHOOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 686.46 a 5 17.287.190.022 54516.89 1 54516.89 12421.526.000 26.582 2 16.291.795.06 174.645 1 174.645 4.059.054 146.274 2 7.17 1.700.202 1118.819 26 4.01 658807.100 2 1805.255 1 a. R Squared =.80 (Adjusted R Squared =.261) Er is geen sprake van interactie tussen LFTCAT en SCHOOL (LFTCAT*SCHOOL, F=1.7, Sig.=.202). Het verband tussen LFTCAT en LENGTE is voor beide groepen (stads- en plattelandskinderen) hetzelfde. Estimated Marginal Means of lengte 155,00 school platteland stad Estimated Marginal Means 150,00 145,00 140,00 15,00 lftcat Alhoewel de lijnen in bovenstaande plot niet evenwijdig lopen, is er volgens de variantieanalyse geen interactie tussen SCHOOL en LFTCAT en mogen we dus wel uitgaan van evenwijdige regressielijnen in de populatie. Er is dus aan de voorwaarden van covariantie-analyse voldaan (lineariteit en evenwijdige regressielijnen), en kunnen we deze uitvoeren. Kies Analyze General Linear Model Univariate. Selecteer LENGTE als Dependent Variable, SCHOOL als Fixed Factor en LEEFTIJD als Covariate:.00 II12-14

Kies onder Model voor Full factorial en vraag onder Options om Compare main effects van de variabele SCHOOL en Parameter estimates. We krijgen de volgende resultaten: SPSS uitvoer ANCOVA: Between-Subjects Factors SCHOOL.00 Value Label N platteland 14 stad 18 Tests of Between-Subjects Effects Dependent Variable: LENGTE Source Corrected Model Intercept LEEFTIJD SCHOOL Error Total Corrected Total Type III Sum of Squares df Mean Square F Sig. 467.28 a 2 2.619 5.06.01 1088.957 1 1088.957 2.602.000 402.26 1 402.26 8.718.006 207.9 1 207.9 4.507.042 18.017 29 46.19 658807.100 2 1805.255 1 a. R Squared =.259 (Adjusted R Squared =.208) We zien dat er een significant verschil in lengte bestaat tussen de groepen (SCHOOL, F=4.507, Sig.=.042), wanneer er gecorrigeerd wordt voor de leeftijd van de kinderen. Dependent Variable: LENGTE Parameter Intercept LEEFTIJD [SCHOOL=.00] [SCHOOL=] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound 91.817 17.929 5.121.000 55.147 128.487.416.141 2.95.006.128.704-5.466 2.575-2.12.042-10.7 -.200 0 a..... a. This parameter is set to zero because it is redundant. II12-15

Uit bovenstaande tabel kunnen de voor leeftijd gecorrigeerde gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0) LENGTE = 91.871+ 0.4161*LEEFTIJD 5.466 = 86.405141.67 + 0.416*LEEFTIJD Voor stadskinderen (SCHOOL = 1) LENGTE = 91.871+ 0.416*LEEFTIJD Het gemiddelde aangepaste verschil tussen de 2 groepen bij een constante leeftijd bedraagt 5.466cm, waarbij de plattelandskinderen kleiner zijn dan de stadskinderen. De voor leeftijd gecorrigeerde gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means: Estimated Marginal Means SCHOOL Estimates Dependent Variable: LENGTE 95% Confidence Interval SCHOOL Mean Std. Error Lower Bound Upper Bound.00 platteland 140.21 a 1.881 16.65 144.061 stad 145.679 a 1.646 142.12 149.046 a. Covariates appearing in the model are evaluated at the following values: LEEFTIJD = 129.5625. Dependent Variable: LENGTE (I) SCHOOL.00 platteland stad (J) SCHOOL stad.00 platteland Mean Difference Pairwise Comparisons 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -5.466* 2.575.042-10.7 -.200 5.466* 2.575.042.200 10.7 Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Het aangepaste verschil (5.466cm) tussen de 2 groepen is significant (Sig. =.042). Geconcludeerd kan worden dat dit lengte verschil groter is dan het niet voor leeftijd gecorrigeerde verschil van 2.87cm (zie pagina II12-10). Dus als stadsen plattelandskinderen even oud zouden zijn, bedraagt het verschil in lengte gemiddeld 5.466cm in plaats van het waargenomen verschil van 2.87cm. Merk op dat er nu dus wel sprake is van een significant effect van SCHOOL (Sig. =.042) in tegenstelling tot bij de ANOVA, waarbij niet gecorrigeerd is voor LEEFTIJD (Sig. =.298). II12-16

Univariate (mixed model) procedure voor herhaalde metingen: eenweg within-subject design Wanneer tijdens een onderzoek dezelfde proefpersonen meerdere keren worden gemeten hebben we te maken met herhaalde metingen. Deze kunnen geanalyseerd worden via de procedure Univariate, mits de datafile univariaat is opgebouwd (zie hieronder). We gaan uit van de datafile GVO_BRUG_UNIVARIAAT.SAV. Het betreft een onderzoek naar de effectiviteit van verschillende vormen van voorlichting op het gebied van groenteconsumptie, waarbij groepen met elkaar worden vergeleken. Een groep die advies-op-maat heeft gekregen (advies); GROEP=2 Een groep die alleen algemene voorlichting heeft gekregen (brochure); GROEP=1 Een groep die geen voorlichting heeft gekregen (controle); GROEP=0 Deze file is univariaat van opzet, d.w.z., per persoon zijn er records/rijen in het datascherm, waarbij iedere rij overeenkomt met een meettijdstip. Hieronder beschouwen wij voorlopig alleen GROEP= 0 (de controlegroep). Verder is er één voormeting (TIJD=1) en twee nametingen (TIJD=2 resp.) wat betreft de groenteconsumptie: SPSS datavenster bij een univariate opzet van de data: Opmerking: Middels Data -> Select Cases selecteert men de personen van GROEP= 0! In alle de records per persoon is de afhankelijke variabele hetzelfde, nl. GROENTE. De variabele TIJD geeft voor elke persoon het tijdstip van de meting aan, de feitelijke within-subject (WS) factor. We hebben te maken met een eenweg within-subject (WS) design met herhaalde metingen (TIJD=1 t/m II12-17

TIJD=). De variabele TIJD kunnen wij zien als een fixed factor, de variabele PERSNO (persoonsnummer) daarentegen is een random factor waarmee we in de analyse rekening moeten houden! Vandaar dat de univariate methode ook wel wordt aangeduid als mixed model methode (ofwel een tweeweg ANOVA met een fixed en een random factor). Ter analyse van deze data kiezen we Analyze General Linear Model Univariate. In het venster dat volgt worden de afhankelijke variabele en zowel de fixed als de random factoren gedefinieerd: Klik vervolgens op de drukknop Model, en kies voor een Custom Model met beide factoren in het model zonder interactieterm. We hebben immers maar 1 observatie per persno*tijd cel, zodat het interactie effect niet berekend kan worden. Tussen de haakjes achter de factor namen zie je een F voor Fixed en een R voor Random: Klik op Continue, en vervolgens op de drukknop Plots. In het Profile Plots scherm vragen we een plot voor de fixed factor TIJD (Horizontal Axis). De Dependent Variable GROENTE komt automatisch op de y-as: II12-18

Klik op Add, en Continue. Via de drukknop Options vragen we Descriptive statistics (onder Display) en Estimated Marginal Means voor de WS factor TIJD op. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (hier ) en bijbehorende betrouwbaarheidsintervallen: Klik op OK, en de volgende uitvoer verschijnt: II12-19

SPSS uitvoer univariate methode eenweg within-subject design met herhaalde metingen: Between-Subjects Factors TIJD PERSNO 1 2 1050 1100 1110 1120 1121 1122 112 1125 1126 1127 110 111 112 11 114 115 116 117 118 119 1140 1141 1142 Value Label N voormeting 219 eerste 218 nameting tweede 215 nameting 2 Bovenstaande tabel (ingekort!) laat zien dat er sprake is van tijdstippen (TIJD) met het aantal valide waarnemingen per tijdstip en persoon (N) erbij. In totaal zijn er 220 personen in de controlegroep, maar niet elke persoon is keer gemeten (missing values). Tests of Between-Subjects Effects Dependent Variable: GROENTE Type III Sum Source of Squares df Mean Square F Sig. Intercept Hypothesis 709.244 1 709.244 1910.278.000 Error 81.80 219.188.71 a TIJD Hypothesis.484 2.242 8.941.000 Error 11.65 40.027 b PERSNO Hypothesis 81.756 219.7 1.797.000 Error 11.65 40.027 b a..994 MS(PERSNO) +.006 MS(Error) b. MS(Error) Uit de bovenstaande Tests of Between-Subjects Effects tabel valt af te lezen dat de WS factor TIJD significant is (F= 8.941, Sig.=.000); De groenteconsumptie verschilt ten minste tussen 2 van de tijdstippen (metingen). Welke metingen precies van elkaar verschillen kan men niet uit II12-20

deze tabel afleiden maar wel uit de Pairwise Comparisons tabel hieronder. De factor PERSNO is ook significant (F= 1.797, Sig.=.000). De groenteconsumptie (gemiddeld over de tijdstippen) verschilt significant tussen de verschillende personen. Vervolgens staan in onderstaande tabel de geschatte gemiddelden van de metingen, inclusief de standaard error en hun betrouwbaarheidsinterval: Estimated Marginal Means TIJD Estimates Dependent Variable: GROENTE 95% Confidence Interval TIJD Mean Std. Error Lower Bound Upper Bound voormeting 1.01.011.992 1.05 eerste nameting 1.044.011 1.02 1.066 tweede nameting 1.080.011 1.058 1.10 De overall F-toets in de Tests of Between-Subjects Effects tabel laat zien dat de WS factor TIJD significant is. In de Pairwise Comparisons tabel kan men zien welke metingen significant van elkaar verschillen. In dit geval hebben we te maken met metingen en dus paarsgewijze vergelijkingen: Dependent Variable: GROENTE (I) TIJD voormeting eerste nameting tweede nameting (J) TIJD eerste nameting tweede nameting voormeting tweede nameting voormeting eerste nameting Pairwise Comparisons Mean Difference 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.01*.016.050 -.062-5.904E-05 -.067*.016.000 -.098 -.06.01*.016.050 5.904E-05.062 -.06*.016.024 -.067 -.005.067*.016.000.06.098.06*.016.024.005.067 Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Alle de tijdstippen (metingen) verschillen significant van elkaar. De tabel laat ook zien hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). II12-21

Onderstaande plot geeft de situatie grafisch weer: Estimated Marginal Means of groente 1,08 Estimated Marginal Means 1,06 1,04 1,02 voormeting eerste nameting tijd tweede nameting Zoals duidelijk te zien is, neemt de groenteconsumptie toe over de tijd. Opmerking: De vermelde standard errors van.016 zijn gelijk vanwege de aannname van sphericity (d.w.z. gelijke variantie van de verschilscores). Multivariate procedure voor herhaalde metingen: eenweg within-subject design In de vorige paragraaf was er sprake van een univariate opzet van de data. Deze data werden geanalyseerd middels de univariate (mixed model) methode, waarbij er sprake was van zowel een fixed als een random factor. Een belangrijke aanname bij deze methode is sphericity (= varianties van de verschilscores die voor ieder 2-tal tijdstippen berekend kunnen worden, zijn gelijk). De univariate procedure is echter wat verouderd, in de regel verdient de multivariate procedure de voorkeur. De aanname van sphericity is dan niet noodzakelijk en bovendien geeft SPSS bij de multivariate procedure dezelfde resultaten als de univariate procedure, met en zonder epsilon-correctie van de vrijheidsgraden. We analyseren dezelfde data als in de vorige paragraaf, met het verschil dat onze file, GVO_BRUG.SAV multivariaat van opzet is, d.w.z., er is één record (regel) per persoon, met aparte kolommen (variabelen) voor de verschillende (herhaalde) metingen. We gaan weer uit van GROEP= 0 (de controlegroep), éen voormeting (GROENV) en twee nametingen wat betreft de groenteconsumptie op 2 verschillende tijdstippen: GROENNA1 en GROENNA2: II12-22

SPSS datavenster bij een multivariate opzet van de data: Het verschil tussen de metingen vormt de within-subject (WS) factor. We hebben net zoals in de vorige paragraaf weer te maken met een eenweg withinsubject (WS) design. Nu gaan we echter de multivariate procedure uitvoeren die ook meer complexe WS designs aan kan. Hiervoor kiezen we onder Analyze->General Linear Model ->Repeated Measures. Het eerste scherm dat gepresenteerd wordt vraagt een naam voor de Within-Subject Factor Name en de Number of Levels. We kiezen bijvoorbeeld de naam TIJDSTIP voor de WS Factor Name om aan te geven dat het gaat om het verschil tussen de metingen GROENV, GROENNA1 en GROENNA2, en voor Number of Levels omdat de WS factor niveaus kent. Vervolgens klikken wij op Add: II12-2

Als we op Define klikken krijgen we het tweede scherm, Repeated Measures, waarin we de variabelen kunnen aangeven die de WS metingen representeren (GROENV, GROENNA1 en GROENNA2). Between-Subjects (BS) Factor(s) en Covariates zijn hier (nog) niet aan de orde, dus die velden laten we leeg: Onder aan het scherm Repeated Measures staan een zestal knoppen. Via de derde knop, Plots, komt het venster Repeated Measures: Profile Plots te voorschijn. We kiezen voor de WS factor TIJDSTIP op de horizontale as, en klikken op Add om die keuze te actualiseren: Met Continue keren we terug naar het voorgaande scherm. Tenslotte kunnen wij via de drukknop Options diverse aanvullende uitvoer aanvragen, zoals Descriptive statistics (onder Display) en Estimated Marginal Means voor de factor TIJDSTIP. Via Compare main effects krijgen we ook nog paarsgewijze vergelijkingen van ieder 2-tal tijdstippen (hier ), en de bijbehorende betrouwbaarheidsintervallen. II12-24

De belangrijkste SPSS uitvoer van de analyse zal hieronder worden besproken. SPSS uitvoer multivariate procedure eenweg within-subject design met herhaalde metingen: Within-Subjects Factors Measure: MEASURE_1 Dependent TIJDSTIP Variable 1 GROENV 2 GROENNA1 GROENNA2 De WS factor TIJDSTIP kent metingen, GROENV, GROENNA1 en GROENNA2 Descriptive Statistics GROENV GROENNA1 GROENNA2 Mean Std. Deviation N 1.0195.6442 212 1.0485.7495 212 1.0856.4062 212 Deze tabel geeft het geobserveerde gemiddelde en de standaarddeviatie weer van de metingen. II12-25

De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Effect TIJDSTIP Pillai's Trace a. Exact statistic Wilks' Lambda Hotelling's Trace Roy's Largest Root b. Design: Intercept Within Subjects Design: TIJDSTIP Multivariate Tests b Value F Hypothesis df Error df Sig..061 6.850 a 0 210.000.001.99 6.850 a 0 210.000.001.065 6.850 a 0 210.000.001.065 6.850 a 0 210.000.001 De H 0 luidt: De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. Het beste kan de toetsingsgrootheid Pillai s Trace worden genomen, welke het meest robuust is tegen modelschendingen. Aangezien de p-waarde<.05 is, wordt de H 0 verworpen (F=6.850, Sig.=.001). Er is minstens 1 paar metingen dat van elkaar verschilt. Vervolgens volgt de uitvoer van de univariate methode. Allereerst wordt er in de tabel Mauchly s Test of Sphericity gekeken of er sprake is van sphericity. Daarbij wordt de H 0 : Er is sphericity (i.e. varianties van de verschilscores zijn gelijk), getest: Measure: MEASURE_1 Mauchly's Test of Sphericity b Epsilon a Approx. Greenhous Within Subjects Effect Mauchly's W Chi-Square df Sig. e-geisser Huynh-Feldt Lower-bound TIJDSTIP.940 1.071 2.001.94.951.500 Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: TIJDSTIP De p-waarde is kleiner dan.05 (Sig.=.001) dus de H 0 wordt verworpen, er is geen sprake van sphericity. Er zal een epsilon correctie moeten plaatsvinden van het aantal vrijheidsgraden. Wij zullen de Greenhouse-Geisser correctie gebruiken. II12-26

Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares df Mean Square F Sig..465 2.22 8.478.000.465 1.886.246 8.478.000.465 1.90.244 8.478.000.465 0.465 8.478.004 11.56 422.027 11.56 97.984.029 11.56 401.459.029 11.56 210.055 Bovenstaande tabel test wederom de H 0 : De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. We kunnen niet uitgaan van sphericity en passen de Greenhouse-Geisser correctie toe, F=8.478, Sig.=.000, de H 0 wordt verworpen. We komen dus tot dezelfde conclusie als bij de multivariate analyse, dwz dat groente consumptie verschilt op minstens 2 van de tijdstippen. Estimated Marginal Means Estimates Measure: MEASURE_1 95% Confidence Interval TIJDSTIP Mean Std. Error Lower Bound Upper Bound 1 1.020.025.970 1.069 2 1.049.026.998 1.099 1.086.028 1.01 1.141 Het gemiddelde van de metingen apart, inclusief standaard error en betrouwbaarheidsinterval. Measure: MEASURE_1 (I) TIJDSTIP 1 2 II12-27 (J) TIJDSTIP 2 1 1 2 Mean Difference Pairwise Comparisons 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.029.015.059 -.059.001 -.066*.018.000 -.101 -.01.029.015.059 -.001.059 -.07*.015.01 -.066 -.008.066*.018.000.01.101.07*.015.01.008.066 Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). De Pairwise Comparisons tabel geeft de paarsgewijze vergelijkingen van de metingen. Als de overall F-toets van de WS factor significant is (zie Multivariate Tests tabel en Tests of Within-Subjects Effects tabel) kan men in deze tabel zien welke metingen van elkaar verschillen. In dit geval hebben

we te maken met metingen en paarsgewijze vergelijkingen. We kunnen zien dat de groenteconsumptie op tijdstip 1 en, en tijdstip 2 en significant van elkaar verschillen (p-waarde kleiner dan.05). Tussen tijdstip 1 en 2 is er (net) geen significant verschil (Sig.=.059). Merk op dat, in tegenstelling tot bij de univariate methode, elk paar zijn eigen standaard error heeft (geen shericity aanname bij deze multivariate procedure). In deze tabel staat ook hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). Een grafische weergave van de situatie staat in onderstaande plot. Profile Plots Estimated Marginal Means of MEASURE_1 1,150 Estimated Marginal Means 1,125 1,100 1,075 1,050 1 2 tijdstip Opmerking: De univariate (mixed model) procedure zoals beschreven in de vorige paragraaf en de univariate uitvoer zoals hier verkregen middels een multivariate analyse geven niet precies hetzelfde resultaat. Dit is het gevolg van het feit dat SPSS bij de multivariate procedure zg. Listwise Deletion toepast, d.w.z. dat alleen die personen meegenomen worden in de analyse die geen ontbrekende waarden kennen voor de metingen samen. Zoals je in het begin van de uitvoer kunt aflezen zijn dit 212 personen (zie pagina II12-25). In de univariate procedure van de vorige paragraaf worden net zoveel personen geanalyseerd als er beschikbaar zijn voor elke meting apart, in dit geval zijn dat 219 personen voor GROENV, 218 voor GROENNA1 en 215 voor GROENNA2 (zie paginaii12-20). Zou er geen sprake zijn van ontbrekende waarden, dan zouden de resultaten van de univariate (mixed model) procedure van de vorige paragraaf en de univariate uitvoer zonder epsilon correctie binnen de multivariate procedure aan elkaar gelijk zijn. II12-28

Multivariate procedure voor herhaalde metingen: Split-plot design met drie groepen en een voormeting In plaats van de voormeting GROENV als een nivo van de WS variabele in de analyse mee te nemen, kunnen we deze ook als covariaat beschouwen. Dan hebben we dus te maken met een model met twee herhaalde nametingen (GROENNA1 en GROENNA2, de WS factor) en een voormeting (GROENV, de Covariaat). Bovendien breiden we ons voorbeeld uit met experimentele groepen (GROEP=0, GROEP= 1 en GROEP= 2, de BS factor). Men noemt dit een zg. Split-plot design met een covariaat. Kies Analyze -> General Linear Model -> Repeated Measures. In het eerste scherm (Define Factor(s)) vul je een WS factor naam in, bijv. TIJDSTIP met Number of Levels = 2. Via Add en Define krijgen we het bekende Repeated Measures venster dat als volgt wordt ingevuld. Let op de BS factor en de covariaat!: Van de knoppen onderaan slaan we Model, Contrasts en Save over. Onder Plots zetten we de WS factor TIJDSTIP op de horizontale as en de BS factor GROEP in het kader Separate Lines. Klik op Add: II12-29

Met Continue keren we terug naar het voorgaande scherm. Via Options vragen we Descriptive statistics op en Estimated Marginal Means voor de factoren TIJDSTIP en GROEP. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (WS factor) en groepen (BS factor), en bijbehorende betrouwbaarheidsintervallen, maar deze zijn alleen interpreteerbaar wanneer er geen sprake is van interactie tussen de WS factor en BS factor!! (Opm. De Post-hoc knop (voor post-hoc vergelijkingen tussen groepen) is niet beschikbaar indien er een covariaat in het model zit. Maar via Options -> Compare main effects kan men deze vergelijkingen toch krijgen, eventueel met Bonferroni correctie). Hieronder volgt de belangrijkste uitvoer. SPSS uitvoer Split Plot design met drie groepen en een voormeting: Within-Subjects Factors Measure: MEASURE_1 Dependent TIJDSTIP Variable 1 GROENNA1 2 GROENNA2 De WS factor TIJDSTIP kent 2 metingen, GROENNA1 en GROENNA2. Between-Subjects Factors GROEP.00 N 212 201 205 De BS factor GROEP kent groepen, 0, 1 en 2, waarbij de omvang van ieder van de groepen gegeven staat in de kolom N. Descriptive Statistics GROENNA1 GROENNA2 GROEP.00 Total.00 Total Mean Std. Deviation N 1.0485.7495 212 1.108.4174 201 1.166.7751 205 1.1045.900 618 1.0856.4062 212 1.1514.40749 201 1.2042.571 205 1.146.955 618 II12-0

Deze tabel geeft verder de geobserveerde gemiddelden en standaard deviaties weer van GROENNA1 en GROENNA2 per GROEP De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Effect TIJDSTIP TIJDSTIP * GROENV TIJDSTIP * GROEP a. Exact statistic Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root b. Design: Intercept+GROENV+GROEP Within Subjects Design: TIJDSTIP Multivariate Tests b Value F Hypothesis df Error df Sig..019 11.629 a 0 614.000.001.981 11.629 a 0 614.000.001.019 11.629 a 0 614.000.001.019 11.629 a 0 614.000.001.006.968 a 0 614.000.047.994.968 a 0 614.000.047.006.968 a 0 614.000.047.006.968 a 0 614.000.047.007 2.186 a 0 614.000.11.99 2.186 a 0 614.000.11.007 2.186 a 0 614.000.11.007 2.186 a 0 614.000.11 Allereerst kijken we of er sprake is van interactie tussen de WS factor en de BS factor (TIJDSTIP*GROEP). De H 0 luidt: Geen interactie. De p-waarde is >.05 (F=2.186, Sig.=.11). De H 0 kan niet worden verworpen, we gaan uit van geen interactie. Er is wel sprake van interactie tussen de WS factor en de voormeting (TIJDSTIP*GROENV, F=.968, Sig. =.047). Het gevolg hiervan is dat we het effect van de WS factor (TIJDSTIP) niet kunnen interpreteren. In dit voorbeeld is er sprake van slechts 2 herhaalde metingen en dus maar 1 verschilscore. In deze situatie gaat sphericity (=gelijkheid van de varianties van de verschilscores) altijd op. Er is in dat geval geen correctie van de univariate resultaten nodig, zie onderstaande tabel, waarin de resultaten voor sphericity assumed en de Greenhouse-Geisser hetzelfde zijn: II12-1

Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP TIJDSTIP * GROENV TIJDSTIP * GROEP Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares df Mean Square F Sig..14 1.14 11.629.001.14 0.14 11.629.001.14 0.14 11.629.001.14 0.14 11.629.001.107 1.107.968.047.107 0.107.968.047.107 0.107.968.047.107 0.107.968.047.118 2.059 2.186.11.118 0.059 2.186.11.118 0.059 2.186.11.118 0.059 2.186.11 16.57 614.027 16.57 614.000.027 16.57 614.000.027 16.57 614.000.027 Measure: MEASURE_1 Transformed Variable: Average Source Intercept GROENV GROEP Error Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig. 1.962 1 1.962 145.659.000 111.528 1 111.528 116.494.000 1.140 2.570 5.947.00 58.856 614.096 Bovenstaande tabel geeft het effect van de BS factor (GROEP) weer, de H 0 luidt: Er is geen verschil tussen de groepen. Deze moet worden verworpen (F=5.947, Sig.=.00). Er is dus wel verschil tussen de groepen wat betreft gemiddelde groenteconsumptie over beide nametingen (GROENNA1 en GROENNA2). Verder staat er ook een toets voor de relatie tussen de voormeting (GROENV) en het gemiddelde van de 2 nametingen wat betreft de groenteconsumptie. Aangezien er sprake is van een significante interactie TIJDSTIP*GROENV mogen we deze echter niet interpreteren. Estimated Marginal Means 1. TIJDSTIP Measure: MEASURE_1 TIJDSTIP 1 2 Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound 1.105 a.009 1.086 1.124 1.147 a.010 1.126 1.167 a. Covariates appearing in the model are evaluated at the following values: GROENV = 1.0444. Hier zien wij het geschatte gemiddelde van beide nametingen apart, inclusief standaard error en betrouwbaarheidsinterval. II12-2

Pairwise Comparisons Measure: MEASURE_1 (I) TIJDSTIP 1 2 (J) TIJDSTIP 2 1 Mean Difference Based on estimated marginal means *. The mean difference is significant at the.05 level. 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.042*.009.000 -.060 -.02.042*.009.000.02.060 a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Aangezien er sprake is van interactie tussen TIJDSTIP*GROENV mogen we het effect van TIJDSTIP en dus ook de paarsgewijze vergelijkingen in de tabel Pairwise Comparisons niet interpreteren. 2. conditie: aantal keren advies op maat Measure: MEASURE_1 conditie: aantal keren advies op maat.00 Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound 1.086 a.015 1.057 1.116 1.11 a.015 1.101 1.162 1.160 a.015 1.10 1.190 a. Covariates appearing in the model are evaluated at the following values: GROENV = 1.0444. Het gemiddelde van de groenteconsumptie over beide tijdstippen (nametingen) voor de groepen apart, inclusief standaard error en betrouwbaarheidsinterval. Measure: MEASURE_1 (I) conditie: aantal keren advies op maat.00 (J) conditie: aantal keren advies op maat.00.00 Pairwise Comparisons Mean Difference 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.045*.022.08 -.087 -.002 -.07*.021.001 -.116 -.01.045*.022.08.002.087 -.029.022.190 -.071.014.07*.021.001.01.116.029.022.190 -.014.071 Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Aangezien er geen sprake is van interactie tussen TIJDSTIP*GROEP en de overall F-toets van de BS factor GROEP significant is (zie Multivariate Tests tabel en Tests of Between-Subjects Effects tabel) kan men in de bovenstaande Pairwise Comparisons tabel zien hoe de groepen van elkaar verschillen. GROEP 0 en 1 en GROEP 0 en 2 verschillen significant van elkaar (Sig.<.05), terwijl er geen verschil is tussen GROEP 1 en 2 (Sig.=.19). II12-

Het geheel is als volgt grafisch weergegeven: Profile Plots Estimated Marginal Means of MEASURE_1 1,20 1,175 conditie: aantal keren advies op maat.00 Estimated Marginal Means 1,15 1,125 1,10 1,075 1 tijdstip Als er sprake zou zijn van interactie tussen GROEP en TIJDSTIP, moet het groepseffect apart per tijdstip (nameting) worden geanalyseerd met een eenweg ANCOVA. Bijvoorbeeld voor de analyse op tijdstip 1 (GROENNA1): kies Analyze -> General Linear Model-> Univariate. Het scherm dat nu verschijnt, wordt als volgt ingevuld: 2 De variabele GROENNA1 plaatsen we onder Dependent (afhankelijke) Variable, de BS factor GROEP onder Fixed Factor, en de voormeting (GROENV) onder Covariate(s). Via de drukknop Plots wordt een profile plot aangevraagd met GROEP op de horizontale as: II12-4