Meervoudige variantieanalyse

Maat: px
Weergave met pagina beginnen:

Download "Meervoudige variantieanalyse"

Transcriptie

1 Meervoudige variantieanalyse Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken kunnen worden. In eerdere hoofdstukken is de t-toets, waar gemiddelden van twee groepen met elkaar werden vergeleken uitvoerig aan de orde geweest. Een generalisatie van de t-toets voor twee onafhankelijke steekproeven met gepoolde varianties is variantieanalyse. Heeft men te maken met één factor die uit meer dan twee waarden bestaat dan wordt een éénweg variantieanalyse uitgevoerd. In SPSS is dit de procedure One-Way Anova. Als er sprake is van meerdere factoren dan wordt een meerweg variantieanalyse toegepast. In SPSS heet dit de Univariate procedure. De procedure One-Way Anova Bij variantieanalyse met één factor worden op basis van één variabele groepen onderscheiden. SPSS gebruikt hiervoor de procedure One-Way ANOVA, zoals eerder besproken in hoofdstuk I-8. Aan de hand van het onderzoek waarin onderzocht werd in welke mate moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden (bestand MENTAL.SAV, zie hoofdstuk II-12 voor een beschrijving van dit onderzoek) wordt de procedure One-Way ANOVA duidelijk gemaakt. Via de menu-optie Analyze Compare Means One-Way ANOVA kom je in het dialoogvenster van de One-way ANOVA. Geef in het dialoogvenster onder Dependent List op voor welke variabele de gemiddelden getoetst moeten worden, in het voorbeeld is dit de variabele SCORE. De variabele met de groepsindeling wordt in het kader onder Factor geplaatst, in het voorbeeld is dit de variabele METHODE. De procedure One-Way ANOVA kent verder de drukknoppen Contrasts, Post Hoc en Options. De eerste drukknop die gebruikt wordt om specifieke hypotheses omtrent groepsgemiddelden te toetsen wordt niet besproken. Post Hoc Multiple Comparisons Variantieanalyse toetst de nulhypothese dat de gemiddelden van alle te onderscheiden groepen aan elkaar gelijk zijn. De nulhypothese wordt verworpen als er minstens twee gemiddelden van elkaar verschillen. Als uit de variantieanalyse blijkt dat er minstens twee gemiddelden van elkaar verschillen wordt vervolgens onderzocht waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). In de theorie zijn drie van deze toetsen besproken, nl. Bonferroni, Tukey en Scheffé. Deze toetsen zijn terug te vinden in het Post Hoc dialoogvenster. II12-1

2 Options Met de drukknop Options kunnen o.a. kengetallen berekend worden. Gebruik hiervoor Descriptive in het kader onder Statistics van het venster Options. SPSS vermeldt voor het totaal aantal cases en voor elke groep het aantal waarnemingen, gemiddelde, standaarddeviatie, standaardfout, 95% betrouwbaarheidsinterval voor het gemiddelde, minimum en maximum. De overige opties in dit venster worden niet behandeld. Naar aanleiding van een uitvoer van het moeder instructie onderzoek worden de belangrijkste zaken van een eenweg variantieanalye nog eens toegelicht. SPSS uitvoer One-Way ANOVA: ANOVA score Between Groups Within Groups Total Sum of Squares df Mean Square F Sig Post Hoc Tests Multiple Comparisons Dependent Variable: score Tukey HSD Scheffe Bonferroni (I) methode (J) methode *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound * * * * * * II12-2

3 Homogeneous Subsets Tukey HSD a Scheffe a methode.00 Sig..00 Sig. score Subset for alpha =.05 N Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10. In de bovenstaande uitvoer wordt getoetst: H 0 : μ 1 =μ 2 =μ H a : minstens één van de gemiddelden is ongelijk aan de anderen waarbij: μ 1 = populatiegemiddelde van de standaardmethode μ 2 = populatiegemiddelde van experimentele methode 1 μ = populatiegemiddelde van experimentele methode 2 SPSS berekent de ANOVA tabel met de kwadratensommen (SS en MS), de vrijheidsgraden (df), de F-toets (F) en de bijbehorende overschrijdingskans (Sig.). Uit de overschrijdingskans blijkt dat de nulhypothese wordt verworpen (Sig.=.005). Vervolgens wordt geanalyseerd waar de verschillen tussen de groepsgemiddelden zitten (Post Hoc Tests). De hypothesen die getoetst worden met een overall α van 5% zijn : H 01 : μ 1 =μ 2 versus H a1 : μ 1 μ 2 H 02 : μ 1 =μ versus H a2 : μ 1 μ H 0 : μ 2 =μ versus H a : μ 2 μ N.B. Als bij het toetsen van de genoemde hypothesen gebruik gemaakt zou worden van afzonderlijke t-toetsen met een α van 5%, levert het vinden van minstens één significant toetsingsresultaat een overall type I fout op, groter dan 5%. Dit probleem wordt bij variantieanalyse omzeild! Uit de tabel Multiple Comparisons is af te lezen tussen welke groepen een significant verschil gevonden wordt middels de verschillende post hoc test methoden. Tukey (Honestly Significant Difference), Scheffé en Bonferroni vinden alledrie een significant verschil tussen groep 1 en (Sig. <.05). In de tabel staan verder voor elke combinatie van twee groepen het gemiddelde verschil plus de standaard error, en het 95% betrouwbaarheidsinterval van het gemiddelde verschil tussen de betreffende twee groepen vermeld. Tenslotte worden combinaties van groepen (zg. subsets) die op grond van de Tukey en Scheffé methode niet van elkaar verschillen weergegeven onder Homogeneous Subsets in de uitvoer. II12-

4 Met Scheffé wordt het breedste betrouwbaarheidsinterval verkregen, ga dit na! Hierdoor leidt deze methode minder snel tot het verwerpen van de nulhypothese in vergelijking met Bonferroni en Tukey. Omdat het betrouwbaarheidsinterval bij Tukey het smalst is, valt deze methode te verkiezen boven de andere methoden. Voor de verdere inhoudelijke aspecten verwijzen wij naar hoofdstuk II-12. De procedure Univariate ANOVA: meerweg variantieanalyse Het belangrijkste verschil tussen One-Way ANOVA en Univariate ANOVA is dat met de laatsgenoemde ook meerweg variantieanalyse schema's, d.w.z. schema's met meerdere factoren (= onafhankelijke variabelen), geanalyseerd kunnen worden. Het dialoogvenster van deze procedure wordt opgeroepen via Analyze General Linear Model Univariate. Ter instructie maken we wederom gebruik van het voorbeeld van de instructie-methoden (Mental.sav), maar nu wordt naast de variable METHODE tevens rekening gehouden met de variabele Sociaal economische klasse van de moeders (variabele SEK met 1=laag, 2 =midden en =hoog): Evenals in het dialoogvenster van One-Way ANOVA wordt de afhankelijke variabele (hier: SCORE) geplaatst onder Dependent Variable. De groepsindeling wordt nu gevormd op basis van meerdere variabelen (hier: METHODE en SEK) die geplaatst worden onder Fixed of Random Factor(s), afhankelijk van het type (voor uitleg type factoren zie hoofdstuk II-12). In het kader onder Covariates kunnen continue variabelen worden opgegeven. Onder WLS Weight kunnen variabelen geselecteerd worden die aan de observaties een verschillend gewicht toekennen. Het dialoogvenster van de Univariate ANOVA kent 6 drukknoppen: Model, Contrasts, Plots, Post Hoc, Save en Options. De drukknoppen Contrasts (om specifieke hypotheses omtrent groepsgemiddelden te toetsen) en Save (om voorspelde waarden, residuen, Cook s distances en andere gerelateerde maten te verkrijgen) worden hier niet besproken. II12-4

5 Model Met deze drukknop kan men het gewenste model specificeren: full factorial of custom. Het full factorial model bevat álle hoofdeffecten en alle factor-factor interactiemogelijkheden. Wanneer je alleen geïnteresseerd bent in de hoofdeffecten of in de hoofdeffecten plus een bepaalde subset van interactiemogelijkheden kies je voor Custom. Deze optie is dus nodig om de top-down procedure te kunnen voeren. Om een factor als hoofdeffect in het model te selecteren kies je onder Build Term(s) voor Main effects. Klik vervolgens de gewenste factor links onder Factors & Covariates aan en plaats deze via een druk op de pijl onder Build Term(s) naar rechts onder Model. Om een interactie tussen factoren te selecteren kies je eerst onder Build Term(s) voor Interaction. Vervolgens klik je de betreffende factoren links onder Factors & Covariates middels de Ctrl-knop samen aan en plaats je ze tegelijk naar rechts onder Model met een druk op de pijl. Linksonder kan men het type Sum of Squares kiezen welke default op type III staat. Dit is het meest gebruikte type SS bij modellen zonder ontbrekende cellen. Plots Met deze optie kunnen de effecten van een bepaalde factor A op een afhankelijke variabele Y voor verschillende (storende) niveaus van factor B in een (profile-)plot worden weergegeven. Selecteer factor A op de Horizontal Axis en B onder het kopje Separate Lines. Onder Separate Plots kan eventueel een variabele geselecteerd worden waarvoor aparte plots per waarde van die variabele gemaakt moeten worden. Voorbeeld: het onderzoek naar de mate waarin moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden kan mogelijk verstoord worden door de sociaal economische klasse (SEK) van de moeders. Om dit in beeld te brengen middels een profile plot selecteer je METHODE onder Horizontale axis en SEK onder Separate Lines: Vergeet niet op Add te klikken om de selectie actief te maken!! Het resultaat is dat er voor elk niveau van SEK een lijn getrokken wordt die het verband weergeeft tussen METHODE en SCORE (zie grafiek op II12-8). Post Hoc Net als bij de One-Way ANOVA kan ook hier onderzocht worden waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc II12-5

6 kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). De in de theorie besproken toetsen Bonferroni, Tukey en Scheffé zijn terug te vinden in het Post Hoc dialoogvenster.tevens moet nu in het kader onder Post Hoc Tests for: aangeven worden voor welke factoren de multiple comparisons uitgevoerd dienen te worden. Options In het kader Display kan onder Descriptive statistics het gemiddelde, de standaard deviatie en de aantallen van alle cellen worden opgevraagd. De overige mogelijkheden van deze drukknop worden verder niet besproken. SPSS uitvoer Univariate ANOVA met hoofdeffecten en eerste orde interactie (full factorial): Between-Subjects Factors methode sek N Descriptive Statistics Dependent Variable: score methode sek Mean Std. Deviation N Total Total Total Total Total De uitvoer onder Descriptive Statistics (resultaat van Options Display Descriptive statistics) bevat het gemiddelde, de standaard deviatie en het aantal van elke cel. II12-6

7 Dependent Variable: score Source Corrected Model Intercept methode sek methode * sek Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig a a. R Squared =.745 (Adjusted R Squared =.669) Uit deze ANOVA tabel (Test of Between-Subjects Effects) valt het volgende af te lezen: Verklaarde variantie (SS(Corrected Model) = SS(METHODE) + SS(SEK) + SS(METHODE*SEK) = = Onverklaarde variantie (SS(Error)) = Totale variantie (SS(Corrected Total)) = SS(verklaard) + SS(onverklaard) = = Proportie verklaarde variantie ( R Squared) = SS(verklaard)/SS(totaal) = / = Verder staan in de tabel uiteraard het aantal vrijheidsgraden (df), de Mean Squares, de F-waarde (F) en de bijbehorende overschrijdingskans (Sig.) vermeld. De overige gegevens vermeld in de ANOVA tabel worden verder niet behandeld. Opm. F en Sig. kunnen alleen worden weergegeven als er sprake is van meer dan 1 waarneming per cel! Uit de variantieanalyse tabel volgt dat de interactieterm significant is op 5 % niveau (Sig.=.001). II12-7

8 De profile plot ziet er als volgt uit: Estimated Marginal Means of score 80,00 sek.00 70,00 Estimated Marginal Means 60,00 50,00 40,00 0,00 methode.00 Het celgemiddelde voor de lage sociaal economische klasse bij methode 2 is aanzienlijk lager dan de gemiddelden bij methode 1 en methode. Bij de middenklasse is methode duidelijk de beste methode en bij de hoogste klasse geeft methode 2 het beste resultaat. Het effect van de verschillende methoden is dus afhankelijk van de sociaal economische klasse (interactie). Univariate procedure voor variantieanalyse met een continu covariaat: ANCOVA In het statistiekboek is covariantieanalyse (ANCOVA) behandeld in termen van een regressieanalyse (zie hoofdstuk II-11.9, deel 2). We zullen hier zien dat deze analyse ook kan worden uitgevoerd als een variant van variantieanalyse. De uitgangssituatie bij ANCOVA is een vergelijkende studie, waarbij er sprake is van twee of meer groepen die zich van elkaar onderscheiden op basis van een bepaalde discrete (categorische) variabele. Bovendien moet er rekening gehouden worden met een continue storende variabele (de covariaat). Als voorbeeld gaan we uit van een studie over voedingsgewoonten, waarbij o.a. wordt onderzocht of er bij kinderen een verband aanwezig is tussen voedingsgewoonten en lichaamslengte. Als indicatie voor voedingsgewoonten wordt het onderscheid tussen stads- en plattelandskinderen gehanteerd (file: NUTRITIO.SAV, zie ook hoofdstuk II-11.9 voor een beschrijving van dit onderzoek). Daarnaast moet er rekening worden gehouden met de continue variabele LEEFTIJD die de relatie tussen voedingsgewoonten en lengte kan II12-8

9 verstoren (covariaat). Om te kijken of er een significant verschil in lengte is tussen de stads- en plattelandskinderen zonder rekening te houden met andere variabelen, kan er een twee steekproeven t-test worden uitgevoerd. Als er echter sprake zou zijn van meer dan 2 groepen moet er een één-weg variantieanalyse uitgevoerd worden onder de aanname van gelijke varianties in alle groepen. Ook in ons voorbeeld zullen we de lengte van de stads- en plattelandskinderen vergelijken middels één-weg variantieanalyse, wat overeenkomt met de twee steekproeven t-test mits er sprake is van gelijke populatievarianties. Deze één-weg variantieanalyse kan worden uitgevoerd middels de procedure One-Way Anova of Univariate Anova. We kiezen voor de laatste optie omdat deze meer mogelijkheden biedt. Kies Analyze General Linear Model Univariate met LENGTE als afhankelijke variabele en SCHOOL als Fixed Factor. Vraag onder de drukknop Options de paarsgewijze vergelijkingen op via het aanvinken van Compare main effects en vraag om de schattingen van de regressiecoëfficiënten via het aanvinken van Parameter Estimates, zoals is aangegeven in onderstaand scherm: Klik op Continue en vervolgens op OK. Een deel van de uitvoer staat hieronder: II12-9

10 SPSS uitvoer Univariate ANOVA: Descriptive Statistics Dependent Variable: LENGTE SCHOOL.00 platteland stad Total Mean Std. Deviation N De geobserveerde gemiddelde lengte van de plattelandskinderen is cm, met een standaard deviatie van 6.12cm (n=14) en van stadskinderen met een standaard deviatie van 8.59 (n=18). Dependent Variable: LENGTE Source Corrected Model Intercept SCHOOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig a a. R Squared =.06 (Adjusted R Squared =.004) Uit bovenstaande ANOVA tabel (Test of Between-Subjects Effects) blijkt dat er geen significant verschil in lengte bestaat tussen de stads- en plattelandskinderen (SCHOOL, F=1.12, Sig.=.298). Dependent Variable: LENGTE Parameter Intercept [SCHOOL=.00] [SCHOOL=] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound a..... a. This parameter is set to zero because it is redundant. Uit bovenstaande tabel kunnen de gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0) LENGTE = = Voor stadskinderen (SCHOOL = 1) LENGTE = Het geschatte verschil tussen de 2 groepen bedraagt 2.87cm. De gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means: II12-10

11 Estimated Marginal Means SCHOOL Dependent Variable: LENGTE SCHOOL.00 platteland stad Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound In de Pairwise Comparisons tabel in de uitvoer staan alle paarsgewijze vergelijkingen (in dit geval dus alleen de vergelijking stads- en plattelandskinderen). Deze zijn zinvol wanneer de F-toets (zie bovenstaande Test of Between-Subjects Effects tabel) een significant resultaat oplevert en er meer dan 2 groepen zijn. In ons geval is deze test niet significant, dus we zullen verder niet toetsen op paarsgewijze verschillen. Vervolgens gaan we controleren voor de variabele LEEFTIJD. Aangezien dit een continue variabele is, moet deze in de analyse worden meegenomen als covariaat (covariantie-analyse, ANCOVA). Hierbij moet op de eerste plaats worden gecontroleerd of leeftijd lineair gerelateerd is aan lengte zowel bij de stads- als bij de plattelandskinderen. Daarvoor maken we een puntenwolk van LEEFTIJD tegen LENGTE voor beide groepen apart. Daartoe splitst men de datafile eerst in 2 groepen middels Data Split File. Kies voor de optie Organize output by groups; Groups Based on: SCHOOL, zoals hieronder is weergegeven: Vraag nu een puntenwolk op middels: Graphs Legacy Dialogs Scatter/Dot. Kies voor Simple Scatter en klik op Define. Zet LEEFTIJD op de x-as en LENGTE op y-as: II12-11

12 SPSS uitvoer puntenwolk: school: platteland 150,00 145,00 lengte 140,00 15,00 10,00 120,00 125,00 10,00 15,00 140,00 leeftijd school: stad 170,00 160,00 lengte 150,00 140,00 10,00 110,00 120,00 10,00 140,00 leeftijd Alhoewel het lineaire verband bij de plattelandskinderen niet duidelijk in de puntenwolk te zien is (kleine steekproef?) nemen we toch aan dat het verband tussen leeftijd en lengte in beide groepen lineair is. Let op: Als er in het model naast LEEFTIJD nog andere variabelen waren meegenomen dan had men het lineaire verband tussen LEEFTIJD en LENGTE moeten beoordelen in partiële plots, waarin de zuivere relatie wordt weergegeven tussen de afhankelijke variabele (LENGTE) en een onafhankelijke variabele (LEEFTIJD) gecorrigeerd voor alle andere onafhankelijke variabelen die in het model zitten (zie hoofdstuk II11). Deze kunnen in SPSS alleen maar geproduceerd worden via de procedure Linear Regression. Een andere voorwaarde van covariantie-analyse is dat het verband tussen LEEFTIJD en LENGTE voor elke groep hetzelfde is (evenwijdige regressielijnen). Dit wordt onderzocht middels meervoudige variantieanalyse waarin de variabele LEEFTIJD in categorieën wordt opgesplitst. We splitsen de variabele LEEFTIJD middels Analyze Recode (zie het boek SPSS in Praktische Stappen van blok 1.2b) in gelijke groepen (tertielen) en noemen deze gecategoriseerde variabele LFTCAT. Kies Analyze General Linear II12-12

13 Model Univariate, selecteer LENGTE als Dependent Variable en LFTCAT en SCHOOL als Fixed Factors. Klik op Model en kies het Custom model. Selecteer daarin LFTCAT en SCHOOL als hoofdeffecten door Build Terms op Main effects te zetten en de 2 onafhankelijke variabelen met de pijltoets naar de rechterbox over te brengen. Zet Build Terms vervolgens op Interaction, selecteer middels de Ctrl-knop zowel LFTCAT als SCHOOL en breng ze samen met de pijltjestoets over naar de rechterbox: Opm. Omdat er slechts sprake is van 2 onafhankelijke variabelen (LFTCAT en SCHOOL) en we geïnteresseerd zijn in het model met beide hoofdeffecten en hun onderlinge interactie zouden we in dit geval ook gekozen kunnen hebben voor het full factorial model wat automatisch alle hoofdeffecten en alle factorfactor interactiemogelijkheden bevat. Klik op Continue. Vraag onder Plots een plot aan van LENGTE (automatisch op de y-as!) tegen LFTCAT (horizontal axis) met aparte lijnen voor SCHOOL (Separate lines). Klik op Add, Continue, en vervolgens op OK. De volgende uitvoer verschijnt: SPSS uitvoer Univariate ANOVA (controleren voorwaarden ANCOVA): Between-Subjects Factors LFTCAT SCHOOL Value Label N platteland 14 stad 18 II12-1

14 Dependent Variable: LENGTE Source Corrected Model Intercept LFTCAT SCHOOL LFTCAT * SCHOOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig a a. R Squared =.80 (Adjusted R Squared =.261) Er is geen sprake van interactie tussen LFTCAT en SCHOOL (LFTCAT*SCHOOL, F=1.7, Sig.=.202). Het verband tussen LFTCAT en LENGTE is voor beide groepen (stads- en plattelandskinderen) hetzelfde. Estimated Marginal Means of lengte 155,00 school platteland stad Estimated Marginal Means 150,00 145,00 140,00 15,00 lftcat Alhoewel de lijnen in bovenstaande plot niet evenwijdig lopen, is er volgens de variantieanalyse geen interactie tussen SCHOOL en LFTCAT en mogen we dus wel uitgaan van evenwijdige regressielijnen in de populatie. Er is dus aan de voorwaarden van covariantie-analyse voldaan (lineariteit en evenwijdige regressielijnen), en kunnen we deze uitvoeren. Kies Analyze General Linear Model Univariate. Selecteer LENGTE als Dependent Variable, SCHOOL als Fixed Factor en LEEFTIJD als Covariate:.00 II12-14

15 Kies onder Model voor Full factorial en vraag onder Options om Compare main effects van de variabele SCHOOL en Parameter estimates. We krijgen de volgende resultaten: SPSS uitvoer ANCOVA: Between-Subjects Factors SCHOOL.00 Value Label N platteland 14 stad 18 Tests of Between-Subjects Effects Dependent Variable: LENGTE Source Corrected Model Intercept LEEFTIJD SCHOOL Error Total Corrected Total Type III Sum of Squares df Mean Square F Sig a a. R Squared =.259 (Adjusted R Squared =.208) We zien dat er een significant verschil in lengte bestaat tussen de groepen (SCHOOL, F=4.507, Sig.=.042), wanneer er gecorrigeerd wordt voor de leeftijd van de kinderen. Dependent Variable: LENGTE Parameter Intercept LEEFTIJD [SCHOOL=.00] [SCHOOL=] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound a..... a. This parameter is set to zero because it is redundant. II12-15

16 Uit bovenstaande tabel kunnen de voor leeftijd gecorrigeerde gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0) LENGTE = *LEEFTIJD = *LEEFTIJD Voor stadskinderen (SCHOOL = 1) LENGTE = *LEEFTIJD Het gemiddelde aangepaste verschil tussen de 2 groepen bij een constante leeftijd bedraagt 5.466cm, waarbij de plattelandskinderen kleiner zijn dan de stadskinderen. De voor leeftijd gecorrigeerde gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means: Estimated Marginal Means SCHOOL Estimates Dependent Variable: LENGTE 95% Confidence Interval SCHOOL Mean Std. Error Lower Bound Upper Bound.00 platteland a stad a a. Covariates appearing in the model are evaluated at the following values: LEEFTIJD = Dependent Variable: LENGTE (I) SCHOOL.00 platteland stad (J) SCHOOL stad.00 platteland Mean Difference Pairwise Comparisons 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Het aangepaste verschil (5.466cm) tussen de 2 groepen is significant (Sig. =.042). Geconcludeerd kan worden dat dit lengte verschil groter is dan het niet voor leeftijd gecorrigeerde verschil van 2.87cm (zie pagina II12-10). Dus als stadsen plattelandskinderen even oud zouden zijn, bedraagt het verschil in lengte gemiddeld 5.466cm in plaats van het waargenomen verschil van 2.87cm. Merk op dat er nu dus wel sprake is van een significant effect van SCHOOL (Sig. =.042) in tegenstelling tot bij de ANOVA, waarbij niet gecorrigeerd is voor LEEFTIJD (Sig. =.298). II12-16

17 Univariate (mixed model) procedure voor herhaalde metingen: eenweg within-subject design Wanneer tijdens een onderzoek dezelfde proefpersonen meerdere keren worden gemeten hebben we te maken met herhaalde metingen. Deze kunnen geanalyseerd worden via de procedure Univariate, mits de datafile univariaat is opgebouwd (zie hieronder). We gaan uit van de datafile GVO_BRUG_UNIVARIAAT.SAV. Het betreft een onderzoek naar de effectiviteit van verschillende vormen van voorlichting op het gebied van groenteconsumptie, waarbij groepen met elkaar worden vergeleken. Een groep die advies-op-maat heeft gekregen (advies); GROEP=2 Een groep die alleen algemene voorlichting heeft gekregen (brochure); GROEP=1 Een groep die geen voorlichting heeft gekregen (controle); GROEP=0 Deze file is univariaat van opzet, d.w.z., per persoon zijn er records/rijen in het datascherm, waarbij iedere rij overeenkomt met een meettijdstip. Hieronder beschouwen wij voorlopig alleen GROEP= 0 (de controlegroep). Verder is er één voormeting (TIJD=1) en twee nametingen (TIJD=2 resp.) wat betreft de groenteconsumptie: SPSS datavenster bij een univariate opzet van de data: Opmerking: Middels Data -> Select Cases selecteert men de personen van GROEP= 0! In alle de records per persoon is de afhankelijke variabele hetzelfde, nl. GROENTE. De variabele TIJD geeft voor elke persoon het tijdstip van de meting aan, de feitelijke within-subject (WS) factor. We hebben te maken met een eenweg within-subject (WS) design met herhaalde metingen (TIJD=1 t/m II12-17

18 TIJD=). De variabele TIJD kunnen wij zien als een fixed factor, de variabele PERSNO (persoonsnummer) daarentegen is een random factor waarmee we in de analyse rekening moeten houden! Vandaar dat de univariate methode ook wel wordt aangeduid als mixed model methode (ofwel een tweeweg ANOVA met een fixed en een random factor). Ter analyse van deze data kiezen we Analyze General Linear Model Univariate. In het venster dat volgt worden de afhankelijke variabele en zowel de fixed als de random factoren gedefinieerd: Klik vervolgens op de drukknop Model, en kies voor een Custom Model met beide factoren in het model zonder interactieterm. We hebben immers maar 1 observatie per persno*tijd cel, zodat het interactie effect niet berekend kan worden. Tussen de haakjes achter de factor namen zie je een F voor Fixed en een R voor Random: Klik op Continue, en vervolgens op de drukknop Plots. In het Profile Plots scherm vragen we een plot voor de fixed factor TIJD (Horizontal Axis). De Dependent Variable GROENTE komt automatisch op de y-as: II12-18

19 Klik op Add, en Continue. Via de drukknop Options vragen we Descriptive statistics (onder Display) en Estimated Marginal Means voor de WS factor TIJD op. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (hier ) en bijbehorende betrouwbaarheidsintervallen: Klik op OK, en de volgende uitvoer verschijnt: II12-19

20 SPSS uitvoer univariate methode eenweg within-subject design met herhaalde metingen: Between-Subjects Factors TIJD PERSNO Value Label N voormeting 219 eerste 218 nameting tweede 215 nameting 2 Bovenstaande tabel (ingekort!) laat zien dat er sprake is van tijdstippen (TIJD) met het aantal valide waarnemingen per tijdstip en persoon (N) erbij. In totaal zijn er 220 personen in de controlegroep, maar niet elke persoon is keer gemeten (missing values). Tests of Between-Subjects Effects Dependent Variable: GROENTE Type III Sum Source of Squares df Mean Square F Sig. Intercept Hypothesis Error a TIJD Hypothesis Error b PERSNO Hypothesis Error b a..994 MS(PERSNO) MS(Error) b. MS(Error) Uit de bovenstaande Tests of Between-Subjects Effects tabel valt af te lezen dat de WS factor TIJD significant is (F= 8.941, Sig.=.000); De groenteconsumptie verschilt ten minste tussen 2 van de tijdstippen (metingen). Welke metingen precies van elkaar verschillen kan men niet uit II12-20

21 deze tabel afleiden maar wel uit de Pairwise Comparisons tabel hieronder. De factor PERSNO is ook significant (F= 1.797, Sig.=.000). De groenteconsumptie (gemiddeld over de tijdstippen) verschilt significant tussen de verschillende personen. Vervolgens staan in onderstaande tabel de geschatte gemiddelden van de metingen, inclusief de standaard error en hun betrouwbaarheidsinterval: Estimated Marginal Means TIJD Estimates Dependent Variable: GROENTE 95% Confidence Interval TIJD Mean Std. Error Lower Bound Upper Bound voormeting eerste nameting tweede nameting De overall F-toets in de Tests of Between-Subjects Effects tabel laat zien dat de WS factor TIJD significant is. In de Pairwise Comparisons tabel kan men zien welke metingen significant van elkaar verschillen. In dit geval hebben we te maken met metingen en dus paarsgewijze vergelijkingen: Dependent Variable: GROENTE (I) TIJD voormeting eerste nameting tweede nameting (J) TIJD eerste nameting tweede nameting voormeting tweede nameting voormeting eerste nameting Pairwise Comparisons Mean Difference 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.01* E * * E * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Alle de tijdstippen (metingen) verschillen significant van elkaar. De tabel laat ook zien hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). II12-21

22 Onderstaande plot geeft de situatie grafisch weer: Estimated Marginal Means of groente 1,08 Estimated Marginal Means 1,06 1,04 1,02 voormeting eerste nameting tijd tweede nameting Zoals duidelijk te zien is, neemt de groenteconsumptie toe over de tijd. Opmerking: De vermelde standard errors van.016 zijn gelijk vanwege de aannname van sphericity (d.w.z. gelijke variantie van de verschilscores). Multivariate procedure voor herhaalde metingen: eenweg within-subject design In de vorige paragraaf was er sprake van een univariate opzet van de data. Deze data werden geanalyseerd middels de univariate (mixed model) methode, waarbij er sprake was van zowel een fixed als een random factor. Een belangrijke aanname bij deze methode is sphericity (= varianties van de verschilscores die voor ieder 2-tal tijdstippen berekend kunnen worden, zijn gelijk). De univariate procedure is echter wat verouderd, in de regel verdient de multivariate procedure de voorkeur. De aanname van sphericity is dan niet noodzakelijk en bovendien geeft SPSS bij de multivariate procedure dezelfde resultaten als de univariate procedure, met en zonder epsilon-correctie van de vrijheidsgraden. We analyseren dezelfde data als in de vorige paragraaf, met het verschil dat onze file, GVO_BRUG.SAV multivariaat van opzet is, d.w.z., er is één record (regel) per persoon, met aparte kolommen (variabelen) voor de verschillende (herhaalde) metingen. We gaan weer uit van GROEP= 0 (de controlegroep), éen voormeting (GROENV) en twee nametingen wat betreft de groenteconsumptie op 2 verschillende tijdstippen: GROENNA1 en GROENNA2: II12-22

23 SPSS datavenster bij een multivariate opzet van de data: Het verschil tussen de metingen vormt de within-subject (WS) factor. We hebben net zoals in de vorige paragraaf weer te maken met een eenweg withinsubject (WS) design. Nu gaan we echter de multivariate procedure uitvoeren die ook meer complexe WS designs aan kan. Hiervoor kiezen we onder Analyze->General Linear Model ->Repeated Measures. Het eerste scherm dat gepresenteerd wordt vraagt een naam voor de Within-Subject Factor Name en de Number of Levels. We kiezen bijvoorbeeld de naam TIJDSTIP voor de WS Factor Name om aan te geven dat het gaat om het verschil tussen de metingen GROENV, GROENNA1 en GROENNA2, en voor Number of Levels omdat de WS factor niveaus kent. Vervolgens klikken wij op Add: II12-2

24 Als we op Define klikken krijgen we het tweede scherm, Repeated Measures, waarin we de variabelen kunnen aangeven die de WS metingen representeren (GROENV, GROENNA1 en GROENNA2). Between-Subjects (BS) Factor(s) en Covariates zijn hier (nog) niet aan de orde, dus die velden laten we leeg: Onder aan het scherm Repeated Measures staan een zestal knoppen. Via de derde knop, Plots, komt het venster Repeated Measures: Profile Plots te voorschijn. We kiezen voor de WS factor TIJDSTIP op de horizontale as, en klikken op Add om die keuze te actualiseren: Met Continue keren we terug naar het voorgaande scherm. Tenslotte kunnen wij via de drukknop Options diverse aanvullende uitvoer aanvragen, zoals Descriptive statistics (onder Display) en Estimated Marginal Means voor de factor TIJDSTIP. Via Compare main effects krijgen we ook nog paarsgewijze vergelijkingen van ieder 2-tal tijdstippen (hier ), en de bijbehorende betrouwbaarheidsintervallen. II12-24

25 De belangrijkste SPSS uitvoer van de analyse zal hieronder worden besproken. SPSS uitvoer multivariate procedure eenweg within-subject design met herhaalde metingen: Within-Subjects Factors Measure: MEASURE_1 Dependent TIJDSTIP Variable 1 GROENV 2 GROENNA1 GROENNA2 De WS factor TIJDSTIP kent metingen, GROENV, GROENNA1 en GROENNA2 Descriptive Statistics GROENV GROENNA1 GROENNA2 Mean Std. Deviation N Deze tabel geeft het geobserveerde gemiddelde en de standaarddeviatie weer van de metingen. II12-25

26 De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Effect TIJDSTIP Pillai's Trace a. Exact statistic Wilks' Lambda Hotelling's Trace Roy's Largest Root b. Design: Intercept Within Subjects Design: TIJDSTIP Multivariate Tests b Value F Hypothesis df Error df Sig a a a a De H 0 luidt: De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. Het beste kan de toetsingsgrootheid Pillai s Trace worden genomen, welke het meest robuust is tegen modelschendingen. Aangezien de p-waarde<.05 is, wordt de H 0 verworpen (F=6.850, Sig.=.001). Er is minstens 1 paar metingen dat van elkaar verschilt. Vervolgens volgt de uitvoer van de univariate methode. Allereerst wordt er in de tabel Mauchly s Test of Sphericity gekeken of er sprake is van sphericity. Daarbij wordt de H 0 : Er is sphericity (i.e. varianties van de verschilscores zijn gelijk), getest: Measure: MEASURE_1 Mauchly's Test of Sphericity b Epsilon a Approx. Greenhous Within Subjects Effect Mauchly's W Chi-Square df Sig. e-geisser Huynh-Feldt Lower-bound TIJDSTIP Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: TIJDSTIP De p-waarde is kleiner dan.05 (Sig.=.001) dus de H 0 wordt verworpen, er is geen sprake van sphericity. Er zal een epsilon correctie moeten plaatsvinden van het aantal vrijheidsgraden. Wij zullen de Greenhouse-Geisser correctie gebruiken. II12-26

27 Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares df Mean Square F Sig Bovenstaande tabel test wederom de H 0 : De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. We kunnen niet uitgaan van sphericity en passen de Greenhouse-Geisser correctie toe, F=8.478, Sig.=.000, de H 0 wordt verworpen. We komen dus tot dezelfde conclusie als bij de multivariate analyse, dwz dat groente consumptie verschilt op minstens 2 van de tijdstippen. Estimated Marginal Means Estimates Measure: MEASURE_1 95% Confidence Interval TIJDSTIP Mean Std. Error Lower Bound Upper Bound Het gemiddelde van de metingen apart, inclusief standaard error en betrouwbaarheidsinterval. Measure: MEASURE_1 (I) TIJDSTIP 1 2 II12-27 (J) TIJDSTIP Mean Difference Pairwise Comparisons 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound * * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). De Pairwise Comparisons tabel geeft de paarsgewijze vergelijkingen van de metingen. Als de overall F-toets van de WS factor significant is (zie Multivariate Tests tabel en Tests of Within-Subjects Effects tabel) kan men in deze tabel zien welke metingen van elkaar verschillen. In dit geval hebben

28 we te maken met metingen en paarsgewijze vergelijkingen. We kunnen zien dat de groenteconsumptie op tijdstip 1 en, en tijdstip 2 en significant van elkaar verschillen (p-waarde kleiner dan.05). Tussen tijdstip 1 en 2 is er (net) geen significant verschil (Sig.=.059). Merk op dat, in tegenstelling tot bij de univariate methode, elk paar zijn eigen standaard error heeft (geen shericity aanname bij deze multivariate procedure). In deze tabel staat ook hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). Een grafische weergave van de situatie staat in onderstaande plot. Profile Plots Estimated Marginal Means of MEASURE_1 1,150 Estimated Marginal Means 1,125 1,100 1,075 1, tijdstip Opmerking: De univariate (mixed model) procedure zoals beschreven in de vorige paragraaf en de univariate uitvoer zoals hier verkregen middels een multivariate analyse geven niet precies hetzelfde resultaat. Dit is het gevolg van het feit dat SPSS bij de multivariate procedure zg. Listwise Deletion toepast, d.w.z. dat alleen die personen meegenomen worden in de analyse die geen ontbrekende waarden kennen voor de metingen samen. Zoals je in het begin van de uitvoer kunt aflezen zijn dit 212 personen (zie pagina II12-25). In de univariate procedure van de vorige paragraaf worden net zoveel personen geanalyseerd als er beschikbaar zijn voor elke meting apart, in dit geval zijn dat 219 personen voor GROENV, 218 voor GROENNA1 en 215 voor GROENNA2 (zie paginaii12-20). Zou er geen sprake zijn van ontbrekende waarden, dan zouden de resultaten van de univariate (mixed model) procedure van de vorige paragraaf en de univariate uitvoer zonder epsilon correctie binnen de multivariate procedure aan elkaar gelijk zijn. II12-28

29 Multivariate procedure voor herhaalde metingen: Split-plot design met drie groepen en een voormeting In plaats van de voormeting GROENV als een nivo van de WS variabele in de analyse mee te nemen, kunnen we deze ook als covariaat beschouwen. Dan hebben we dus te maken met een model met twee herhaalde nametingen (GROENNA1 en GROENNA2, de WS factor) en een voormeting (GROENV, de Covariaat). Bovendien breiden we ons voorbeeld uit met experimentele groepen (GROEP=0, GROEP= 1 en GROEP= 2, de BS factor). Men noemt dit een zg. Split-plot design met een covariaat. Kies Analyze -> General Linear Model -> Repeated Measures. In het eerste scherm (Define Factor(s)) vul je een WS factor naam in, bijv. TIJDSTIP met Number of Levels = 2. Via Add en Define krijgen we het bekende Repeated Measures venster dat als volgt wordt ingevuld. Let op de BS factor en de covariaat!: Van de knoppen onderaan slaan we Model, Contrasts en Save over. Onder Plots zetten we de WS factor TIJDSTIP op de horizontale as en de BS factor GROEP in het kader Separate Lines. Klik op Add: II12-29

30 Met Continue keren we terug naar het voorgaande scherm. Via Options vragen we Descriptive statistics op en Estimated Marginal Means voor de factoren TIJDSTIP en GROEP. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (WS factor) en groepen (BS factor), en bijbehorende betrouwbaarheidsintervallen, maar deze zijn alleen interpreteerbaar wanneer er geen sprake is van interactie tussen de WS factor en BS factor!! (Opm. De Post-hoc knop (voor post-hoc vergelijkingen tussen groepen) is niet beschikbaar indien er een covariaat in het model zit. Maar via Options -> Compare main effects kan men deze vergelijkingen toch krijgen, eventueel met Bonferroni correctie). Hieronder volgt de belangrijkste uitvoer. SPSS uitvoer Split Plot design met drie groepen en een voormeting: Within-Subjects Factors Measure: MEASURE_1 Dependent TIJDSTIP Variable 1 GROENNA1 2 GROENNA2 De WS factor TIJDSTIP kent 2 metingen, GROENNA1 en GROENNA2. Between-Subjects Factors GROEP.00 N De BS factor GROEP kent groepen, 0, 1 en 2, waarbij de omvang van ieder van de groepen gegeven staat in de kolom N. Descriptive Statistics GROENNA1 GROENNA2 GROEP.00 Total.00 Total Mean Std. Deviation N II12-0

31 Deze tabel geeft verder de geobserveerde gemiddelden en standaard deviaties weer van GROENNA1 en GROENNA2 per GROEP De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Effect TIJDSTIP TIJDSTIP * GROENV TIJDSTIP * GROEP a. Exact statistic Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root b. Design: Intercept+GROENV+GROEP Within Subjects Design: TIJDSTIP Multivariate Tests b Value F Hypothesis df Error df Sig a a a a a a a a a a a a Allereerst kijken we of er sprake is van interactie tussen de WS factor en de BS factor (TIJDSTIP*GROEP). De H 0 luidt: Geen interactie. De p-waarde is >.05 (F=2.186, Sig.=.11). De H 0 kan niet worden verworpen, we gaan uit van geen interactie. Er is wel sprake van interactie tussen de WS factor en de voormeting (TIJDSTIP*GROENV, F=.968, Sig. =.047). Het gevolg hiervan is dat we het effect van de WS factor (TIJDSTIP) niet kunnen interpreteren. In dit voorbeeld is er sprake van slechts 2 herhaalde metingen en dus maar 1 verschilscore. In deze situatie gaat sphericity (=gelijkheid van de varianties van de verschilscores) altijd op. Er is in dat geval geen correctie van de univariate resultaten nodig, zie onderstaande tabel, waarin de resultaten voor sphericity assumed en de Greenhouse-Geisser hetzelfde zijn: II12-1

32 Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP TIJDSTIP * GROENV TIJDSTIP * GROEP Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares df Mean Square F Sig Measure: MEASURE_1 Transformed Variable: Average Source Intercept GROENV GROEP Error Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig Bovenstaande tabel geeft het effect van de BS factor (GROEP) weer, de H 0 luidt: Er is geen verschil tussen de groepen. Deze moet worden verworpen (F=5.947, Sig.=.00). Er is dus wel verschil tussen de groepen wat betreft gemiddelde groenteconsumptie over beide nametingen (GROENNA1 en GROENNA2). Verder staat er ook een toets voor de relatie tussen de voormeting (GROENV) en het gemiddelde van de 2 nametingen wat betreft de groenteconsumptie. Aangezien er sprake is van een significante interactie TIJDSTIP*GROENV mogen we deze echter niet interpreteren. Estimated Marginal Means 1. TIJDSTIP Measure: MEASURE_1 TIJDSTIP 1 2 Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound a a a. Covariates appearing in the model are evaluated at the following values: GROENV = Hier zien wij het geschatte gemiddelde van beide nametingen apart, inclusief standaard error en betrouwbaarheidsinterval. II12-2

33 Pairwise Comparisons Measure: MEASURE_1 (I) TIJDSTIP 1 2 (J) TIJDSTIP 2 1 Mean Difference Based on estimated marginal means *. The mean difference is significant at the.05 level. 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.042* * a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Aangezien er sprake is van interactie tussen TIJDSTIP*GROENV mogen we het effect van TIJDSTIP en dus ook de paarsgewijze vergelijkingen in de tabel Pairwise Comparisons niet interpreteren. 2. conditie: aantal keren advies op maat Measure: MEASURE_1 conditie: aantal keren advies op maat.00 Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound a a a a. Covariates appearing in the model are evaluated at the following values: GROENV = Het gemiddelde van de groenteconsumptie over beide tijdstippen (nametingen) voor de groepen apart, inclusief standaard error en betrouwbaarheidsinterval. Measure: MEASURE_1 (I) conditie: aantal keren advies op maat.00 (J) conditie: aantal keren advies op maat Pairwise Comparisons Mean Difference 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.045* * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Aangezien er geen sprake is van interactie tussen TIJDSTIP*GROEP en de overall F-toets van de BS factor GROEP significant is (zie Multivariate Tests tabel en Tests of Between-Subjects Effects tabel) kan men in de bovenstaande Pairwise Comparisons tabel zien hoe de groepen van elkaar verschillen. GROEP 0 en 1 en GROEP 0 en 2 verschillen significant van elkaar (Sig.<.05), terwijl er geen verschil is tussen GROEP 1 en 2 (Sig.=.19). II12-

34 Het geheel is als volgt grafisch weergegeven: Profile Plots Estimated Marginal Means of MEASURE_1 1,20 1,175 conditie: aantal keren advies op maat.00 Estimated Marginal Means 1,15 1,125 1,10 1,075 1 tijdstip Als er sprake zou zijn van interactie tussen GROEP en TIJDSTIP, moet het groepseffect apart per tijdstip (nameting) worden geanalyseerd met een eenweg ANCOVA. Bijvoorbeeld voor de analyse op tijdstip 1 (GROENNA1): kies Analyze -> General Linear Model-> Univariate. Het scherm dat nu verschijnt, wordt als volgt ingevuld: 2 De variabele GROENNA1 plaatsen we onder Dependent (afhankelijke) Variable, de BS factor GROEP onder Fixed Factor, en de voormeting (GROENV) onder Covariate(s). Via de drukknop Plots wordt een profile plot aangevraagd met GROEP op de horizontale as: II12-4

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8 1. Eén van de nadelige gevolgen van de moderne welvaart is een monstrueus mobiliteitsprobleem. Om één of andere bizarre reden

Nadere informatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke

Nadere informatie

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie? Opdracht 13a ------------ Een-factor ANOVA (ANOVA-tabel, Contrasten, Bonferroni) Bij een onderzoek naar de leesvaardigheid bij kinderen in de V.S. werden drie onderwijsmethoden met elkaar vergeleken. Verschillende

Nadere informatie

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 7 1. Een onderzoeker wil nagaan of de fitheid van jongeren tussen 14 en 18 jaar (laag, matig, hoog) en het geslacht (M, V) een

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf. Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren

Nadere informatie

Antwoordvel Versie A

Antwoordvel Versie A Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3

Nadere informatie

Enkelvoudige lineaire regressie

Enkelvoudige lineaire regressie Enkelvoudige lineaire regressie Inleiding Dit hoofdstuk sluit aan op hoofdstuk I-9 van het statistiekboek. Er wordt hier steeds gesproken over het verband tussen één afhankelijke variabele Y en één onafhankelijke

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) dinsdag 2-08-2003, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA 16. MANOVA MANOVA Multivariate variantieanalyse (MANOVA) kan gebruikt worden in een situatie waarin je meerdere afhankelijke variabelen hebt. Met MANOVA kan er 1 onafhankelijke variabele gebruikt worden

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder

Nadere informatie

Meervoudige lineaire regressie

Meervoudige lineaire regressie Meervoudige lineaire regressie Inleiding In dit hoofdstuk dat aansluit op hoofdstuk II- (deel 2) wordt uitgelegd hoe een meervoudige regressieanalyse uitgevoerd kan worden met behulp van SPSS. Aan de hand

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Verdelingsvrije statistiek

Verdelingsvrije statistiek Verdelingsvrije statistiek Inleiding In hoofdstuk II-5 (deel ) worden een aantal verdelingsvrije toetsen (ook wel niet-parametrische toetsen) besproken, die gebruikt worden als de te onderzoeken variabele

Nadere informatie

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant? Opdracht 14a ------------ Twee-factor ANOVA In een groot research-project bestudeerde men de fysische eigenschappen van multiplex houtmaterialen, vervaardigd door kleine plakjes hout aan elkaar te hechten.

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn. Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op donderdag 0-03-2005, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I Hieronder volgen de SPSS uitvoer en de antwoorden van de opgaven van Stap 7: Oefenen I. Daarnaast wordt bij elke opgave

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

Residual Plot for Strength. predicted Strength

Residual Plot for Strength. predicted Strength Uitwerking tentamen DS mei 4 Opgave Een uitwerking geven is hier niet mogelijk. Het is van belang het iteratieve optimaliseringsproces goed uit te voeren (zie ook de PowerPoint sheets): screening design

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek

MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek Vrijdag 1 april 2005 Opzet: 5 onderdelen, elk 4 punten. Schrijf uw naam en nummer op elke ingeleverde pagina. Vraag 1 In een cohort van 2000

Nadere informatie

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek Opstarten & gegevens inlezen *Inlezen gegevens Via eerste scherm bij opening SPSS of via File; Open; Data. Opletten of namen van variabelen op de eerste rij staan ( Staat ) Opm.: Bij.TXT bestand altijd

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek II voor TeMa (2S195) op maandag 8-5-26, 9.-12. uur Bij het tentamen mag gebruik worden gemaakt van een (grafisch)

Nadere informatie

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes Hieronder wordt uitgelegd hoe alle analyses besproken in paragraaf 7.5 van

Nadere informatie

11. Meerdere gemiddelden vergelijken, ANOVA

11. Meerdere gemiddelden vergelijken, ANOVA 11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

toetskeuze schema verschillen in gemiddelden

toetskeuze schema verschillen in gemiddelden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Betrouwbaarheid, validiteit en overeenstemming

Betrouwbaarheid, validiteit en overeenstemming Betrouwbaarheid, validiteit en overeenstemming Inleiding Dit practicum sluit aan op het theoriegedeelte over betrouwbaarheidsanalyse van hoofdstuk II-16 (deel 2). In dit hoofdstuk wordt besproken hoe een

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie. Toetsen van hypothesen Bijvoorbeeld: nagaan of het gemiddeld IQ bij een bepaalde steekproef groter/kleiner is als in de populatie. µ = 100 Normaalverdeling, waarbij we de score van de steekproef gaan vergelijken

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:

Nadere informatie

20. Multilevel lineaire modellen

20. Multilevel lineaire modellen 20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze

Nadere informatie

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2] Hoofdstuk 8 Toetsende statistiek Meestal zijn we niet alleen geïnteresseerd in beschrijvende statistiek (over de steekproef), maar ook in toetsende statistiek. Het doel hiervan is om hypothesen te toetsen,

Nadere informatie

Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009

Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Opdracht 1 Onderstaande tabel bevat metingen aan de opbrengst van rozen bij verschillende mate van stikstofen fosfortoevoer. rozen/snijvak/dag fosfaatniveau

Nadere informatie

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kruis per vraag slechts één vakje aan op het antwoordformulier. Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor

Nadere informatie

Vergelijken van twee groepen (SPSS)

Vergelijken van twee groepen (SPSS) Vergelijken van twee groepen (SPSS) Vergelijking van gemiddeldes van onafhankelijke steekproeven met gelijke varianties (dataset newspapers) In een onderzoek geven studenten aan hoeveel keer per week ze

Nadere informatie

Beschrijvende statistieken

Beschrijvende statistieken Elske Salemink (Klinische Psychologie) heeft onderzocht of het lezen van verhaaltjes invloed heeft op angst. Studenten werden at random ingedeeld in twee groepen. De ene groep las positieve verhaaltjes

Nadere informatie

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze Regressie-analyse Regressie-analyse is gericht op het voorspellen van één (numerieke) afhankelijke variabele met behulp van een of meerdere onafhankelijke variabelen (numerieke en/of dummy-variabelen).

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek Inhoudsopgave Rooster 2 Studiemateriaal 2 Werkvormen 2 Toetsing 3 Planningsgroep 3 Traject 4 1 Rooster Dag Datum

Nadere informatie

10. Moderatie, mediatie en nog meer regressie

10. Moderatie, mediatie en nog meer regressie 10. Moderatie, mediatie en nog meer regressie Voordat je moderatie en mediatie analyses gaat uitvoeren in, kun je het best een extra dialog box installeren, PROCESS. Volg hiervoor de stappen op pagina

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 3 februari 2012 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 27 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen? Opdracht 15a ------------ Spearman rangcorrelatie coefficient (non-parametrische tegenhanger van de Pearson correlatie coefficient) Wilcoxon symmetrie-toets (non-parametrische tegenhanger van de t-procedure

Nadere informatie

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 6 1. De 15 leden van een kleine mountainbikeclub vragen zich af in welk mate de omgevingstemperatuur een invloed heeft op hun

Nadere informatie

College 7 Tweeweg Variantie-Analyse

College 7 Tweeweg Variantie-Analyse College 7 Tweeweg Variantie-Analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11 Jolien Pas ECO 2012-2013 Het Experiment

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS. Menu aansturing van SPSS voorbeeld in hoofdstuk 8 over schaalconstructie met Cronbach s α en principale componenten analyse van meningen over strafdoelen Hieronder wordt uitgelegd hoe alle analyses besproken

Nadere informatie

Eindtoets Toegepaste Biostatistiek

Eindtoets Toegepaste Biostatistiek Eindtoets Toegepaste Biostatistiek 2013-2014 29 januari 2014 Dit tentamen bestaat uit vier opgaven, onderverdeeld in 24 subvragen. Begin bij het maken van een nieuwe opgave steeds op een nieuw antwoordvel.

Nadere informatie

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Faculteit der Wiskunde en Informatica 2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Opgave 1: (5 x 6 = 30 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk)

Nadere informatie

Basishandleiding SPSS

Basishandleiding SPSS Basishandleiding SPSS Elvira Folmer & Marieke ten Voorde SLO, Juli 2008 Deze handleiding is gebaseerd op SPSS 16.0 for Windows Inhoud 1 Het maken van een gegevensbestand in de Variable View... 4 2 Het

Nadere informatie

De primaire link op gemeentelijke websites, Bijlagen. over efficiëntie, effectiviteit en gebruiksvriendelijkheid

De primaire link op gemeentelijke websites, Bijlagen. over efficiëntie, effectiviteit en gebruiksvriendelijkheid De primaire link op gemeentelijke s, over efficiëntie, effectiviteit en gebruiksvriendelijkheid Bijlagen Henk S. Kok (9827722) scriptiebegeleiders: Frank Jansen en Leo Lentz Faculteit der Letteren Nederlands,

Nadere informatie

DE IMPACT VAN (CONSUMENTEN)RACISME OP DE EFFECTIVITEIT VAN BLANKE EN NIET- BLANKE (CELEBRITY) ENDORSERS IN RECLAME

DE IMPACT VAN (CONSUMENTEN)RACISME OP DE EFFECTIVITEIT VAN BLANKE EN NIET- BLANKE (CELEBRITY) ENDORSERS IN RECLAME UNIVERSITEIT GENT FACULTEIT ECONOMIE EN BEDRIJFSKUNDE ACADEMIEJAAR 2010 2011 DE IMPACT VAN (CONSUMENTEN)RACISME OP DE EFFECTIVITEIT VAN BLANKE EN NIET- BLANKE (CELEBRITY) ENDORSERS IN RECLAME Masterproef

Nadere informatie

12. VARIANTIEANALYSE

12. VARIANTIEANALYSE 12. VARIANTIEANALYSE 12.1 Inleiding Dit hoofdstuk gaat over variantieanalyse (ook wel ANOVA, ANalysis Of VAriance) en is een compacte mix van ideeën en meningen van diverse auteurs, geselecteerd volgens

Nadere informatie

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Opdracht 3a ----------- Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen Voor de meting van de leesvaardigheid van kinderen wordt als

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie. Handleiding SPSS tabellen en kruistabellen In een paar stappen van spss data naar bruikbare informatie. A) Het openen van een databestand File \ open \ data Kies de naam van je databestand, bijvoorbeeld

Nadere informatie

gemiddelde politieke interesse van hoger opgeleide mensen)

gemiddelde politieke interesse van hoger opgeleide mensen) SPSS-oefening 2: Hypothesetoetsen Opgave Oefening 1 a) Het zijn onafhankelijke steekproeven. De scores voor politieke interesse zijn afkomstig van verschillende mensen aangezien elke persoon slechts in

Nadere informatie

Pilot vragenlijst communicatieve redzaamheid

Pilot vragenlijst communicatieve redzaamheid Pilot vragenlijst communicatieve redzaamheid Het instrument Communicatieve redzaamheid kan worden opgevat als een vermogen om wederkerig te communiceren met behulp van woorden, gebaren of symbolen. Communicatief

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 5 februari - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 9 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel. Opdracht 2a ----------- Stamdiagrammen, histogrammen, tijdreeksgrafieken De Old Farmers Almanac vermeldt de groeiseizoenen voor de grote steden in de V.S., zoals gerapporteerd door het National Climatic

Nadere informatie

(slope in het Engels) en het snijpunt met de y-as, b 0

(slope in het Engels) en het snijpunt met de y-as, b 0 8. Regressie Een introductie Al vaak is genoemd dat statistische modellen allemaal neerkomen op uitkomst = model + error. Dit model kun je ook gebruiken om de uitkomst te voorspellen, met een correlatie

Nadere informatie

Introductie SPSS. Hogeschool Gent. Mei 2010. Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test 11. 3 Two-sample T-test 14. 4 Paired T-test 18

Introductie SPSS. Hogeschool Gent. Mei 2010. Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test 11. 3 Two-sample T-test 14. 4 Paired T-test 18 Introductie SPSS Hogeschool Gent Mei 2010 Inhoudsopgave 1 Introductie 2 2 One-sample T-test 11 3 Two-sample T-test 14 4 Paired T-test 18 5 Anova 21 6 Categorische Data-analyse 26 6.1 Binomiaaltoets.................................

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

Beschrijvende statistiek

Beschrijvende statistiek Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op maandag 08-03-2004, 9.00-2.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,

Nadere informatie

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin 11 december

Nadere informatie

Faculteit der Wiskunde en Informatica

Faculteit der Wiskunde en Informatica Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4), op woensdag 7 januari 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters: Hoofdstuk 4 4.1 De ANCOVA is een vorm van statistische controle, en was specifiek ontworpen om on-uitgelegde foutvariatie ( error variation ) te verminderen. Om dit te doen is er een co-variabele ( covariate

Nadere informatie