Meervoudige variantieanalyse

Maat: px
Weergave met pagina beginnen:

Download "Meervoudige variantieanalyse"

Transcriptie

1 Meervoudige variantieanalyse Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken kunnen worden. In eerdere hoofdstukken is de t-toets, waar gemiddelden van twee groepen met elkaar werden vergeleken uitvoerig aan de orde geweest. Een generalisatie van de t-toets voor twee onafhankelijke steekproeven met gepoolde varianties is variantieanalyse. Heeft men te maken met één factor die uit meer dan twee waarden bestaat dan wordt een éénweg variantieanalyse uitgevoerd. In SPSS is dit de procedure One-Way Anova. Als er sprake is van meerdere factoren dan wordt een meerweg variantieanalyse toegepast. In SPSS heet dit de Univariate procedure. De procedure One-Way Anova Bij variantieanalyse met één factor worden op basis van één variabele groepen onderscheiden. SPSS gebruikt hiervoor de procedure One-Way ANOVA, zoals eerder besproken in hoofdstuk I-8. Aan de hand van het onderzoek waarin onderzocht werd in welke mate moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden (bestand MENTAL.SAV, zie hoofdstuk II-12 voor een beschrijving van dit onderzoek) wordt de procedure One-Way ANOVA duidelijk gemaakt. Via de menu-optie Analyze Compare Means One-Way ANOVA kom je in het dialoogvenster van de One-way ANOVA. Geef in het dialoogvenster onder Dependent List op voor welke variabele de gemiddelden getoetst moeten worden, in het voorbeeld is dit de variabele SCORE. De variabele met de groepsindeling wordt in het kader onder Factor geplaatst, in het voorbeeld is dit de variabele METHODE. De procedure One-Way ANOVA kent verder de drukknoppen Contrasts, Post Hoc en Options. De eerste drukknop die gebruikt wordt om specifieke hypotheses omtrent groepsgemiddelden te toetsen wordt niet besproken. Post Hoc Multiple Comparisons Variantieanalyse toetst de nulhypothese dat de gemiddelden van alle te onderscheiden groepen aan elkaar gelijk zijn. De nulhypothese wordt verworpen als er minstens twee gemiddelden van elkaar verschillen. Als uit de variantieanalyse blijkt dat er minstens twee gemiddelden van elkaar verschillen wordt vervolgens onderzocht waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). In de theorie zijn drie van deze toetsen besproken, nl. Bonferroni, Tukey en Scheffé. Deze toetsen zijn terug te vinden in het Post Hoc dialoogvenster. II12-1

2 Options Met de drukknop Options kunnen o.a. kengetallen berekend worden. Gebruik hiervoor Descriptive in het kader onder Statistics van het venster Options. SPSS vermeldt voor het totaal aantal cases en voor elke groep het aantal waarnemingen, gemiddelde, standaarddeviatie, standaardfout, 95% betrouwbaarheidsinterval voor het gemiddelde, minimum en maximum. De overige opties in dit venster worden niet behandeld. Naar aanleiding van een uitvoer van het moeder instructie onderzoek worden de belangrijkste zaken van een eenweg variantieanalye nog eens toegelicht. SPSS uitvoer One-Way ANOVA: ANOVA score Between Groups Within Groups Total Sum of Squares df Mean Square F Sig Post Hoc Tests Multiple Comparisons Dependent Variable: score Tukey HSD Scheffe Bonferroni (I) methode (J) methode *. The mean difference is significant at the.05 level. Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound * * * * * * II12-2

3 Homogeneous Subsets Tukey HSD a Scheffe a methode.00 Sig..00 Sig. score Subset for alpha =.05 N Means for groups in homogeneous subsets are displayed. a. Uses Harmonic Mean Sample Size = 10. In de bovenstaande uitvoer wordt getoetst: H 0 : μ 1 =μ 2 =μ H a : minstens één van de gemiddelden is ongelijk aan de anderen waarbij: μ 1 = populatiegemiddelde van de standaardmethode μ 2 = populatiegemiddelde van experimentele methode 1 μ = populatiegemiddelde van experimentele methode 2 SPSS berekent de ANOVA tabel met de kwadratensommen (SS en MS), de vrijheidsgraden (df), de F-toets (F) en de bijbehorende overschrijdingskans (Sig.). Uit de overschrijdingskans blijkt dat de nulhypothese wordt verworpen (Sig.=.005). Vervolgens wordt geanalyseerd waar de verschillen tussen de groepsgemiddelden zitten (Post Hoc Tests). De hypothesen die getoetst worden met een overall α van 5% zijn : H 01 : μ 1 =μ 2 versus H a1 : μ 1 μ 2 H 02 : μ 1 =μ versus H a2 : μ 1 μ H 0 : μ 2 =μ versus H a : μ 2 μ N.B. Als bij het toetsen van de genoemde hypothesen gebruik gemaakt zou worden van afzonderlijke t-toetsen met een α van 5%, levert het vinden van minstens één significant toetsingsresultaat een overall type I fout op, groter dan 5%. Dit probleem wordt bij variantieanalyse omzeild! Uit de tabel Multiple Comparisons is af te lezen tussen welke groepen een significant verschil gevonden wordt middels de verschillende post hoc test methoden. Tukey (Honestly Significant Difference), Scheffé en Bonferroni vinden alledrie een significant verschil tussen groep 1 en (Sig. <.05). In de tabel staan verder voor elke combinatie van twee groepen het gemiddelde verschil plus de standaard error, en het 95% betrouwbaarheidsinterval van het gemiddelde verschil tussen de betreffende twee groepen vermeld. Tenslotte worden combinaties van groepen (zg. subsets) die op grond van de Tukey en Scheffé methode niet van elkaar verschillen weergegeven onder Homogeneous Subsets in de uitvoer. II12-

4 Met Scheffé wordt het breedste betrouwbaarheidsinterval verkregen, ga dit na! Hierdoor leidt deze methode minder snel tot het verwerpen van de nulhypothese in vergelijking met Bonferroni en Tukey. Omdat het betrouwbaarheidsinterval bij Tukey het smalst is, valt deze methode te verkiezen boven de andere methoden. Voor de verdere inhoudelijke aspecten verwijzen wij naar hoofdstuk II-12. De procedure Univariate ANOVA: meerweg variantieanalyse Het belangrijkste verschil tussen One-Way ANOVA en Univariate ANOVA is dat met de laatsgenoemde ook meerweg variantieanalyse schema's, d.w.z. schema's met meerdere factoren (= onafhankelijke variabelen), geanalyseerd kunnen worden. Het dialoogvenster van deze procedure wordt opgeroepen via Analyze General Linear Model Univariate. Ter instructie maken we wederom gebruik van het voorbeeld van de instructie-methoden (Mental.sav), maar nu wordt naast de variable METHODE tevens rekening gehouden met de variabele Sociaal economische klasse van de moeders (variabele SEK met 1=laag, 2 =midden en =hoog): Evenals in het dialoogvenster van One-Way ANOVA wordt de afhankelijke variabele (hier: SCORE) geplaatst onder Dependent Variable. De groepsindeling wordt nu gevormd op basis van meerdere variabelen (hier: METHODE en SEK) die geplaatst worden onder Fixed of Random Factor(s), afhankelijk van het type (voor uitleg type factoren zie hoofdstuk II-12). In het kader onder Covariates kunnen continue variabelen worden opgegeven. Onder WLS Weight kunnen variabelen geselecteerd worden die aan de observaties een verschillend gewicht toekennen. Het dialoogvenster van de Univariate ANOVA kent 6 drukknoppen: Model, Contrasts, Plots, Post Hoc, Save en Options. De drukknoppen Contrasts (om specifieke hypotheses omtrent groepsgemiddelden te toetsen) en Save (om voorspelde waarden, residuen, Cook s distances en andere gerelateerde maten te verkrijgen) worden hier niet besproken. II12-4

5 Model Met deze drukknop kan men het gewenste model specificeren: full factorial of custom. Het full factorial model bevat álle hoofdeffecten en alle factor-factor interactiemogelijkheden. Wanneer je alleen geïnteresseerd bent in de hoofdeffecten of in de hoofdeffecten plus een bepaalde subset van interactiemogelijkheden kies je voor Custom. Deze optie is dus nodig om de top-down procedure te kunnen voeren. Om een factor als hoofdeffect in het model te selecteren kies je onder Build Term(s) voor Main effects. Klik vervolgens de gewenste factor links onder Factors & Covariates aan en plaats deze via een druk op de pijl onder Build Term(s) naar rechts onder Model. Om een interactie tussen factoren te selecteren kies je eerst onder Build Term(s) voor Interaction. Vervolgens klik je de betreffende factoren links onder Factors & Covariates middels de Ctrl-knop samen aan en plaats je ze tegelijk naar rechts onder Model met een druk op de pijl. Linksonder kan men het type Sum of Squares kiezen welke default op type III staat. Dit is het meest gebruikte type SS bij modellen zonder ontbrekende cellen. Plots Met deze optie kunnen de effecten van een bepaalde factor A op een afhankelijke variabele Y voor verschillende (storende) niveaus van factor B in een (profile-)plot worden weergegeven. Selecteer factor A op de Horizontal Axis en B onder het kopje Separate Lines. Onder Separate Plots kan eventueel een variabele geselecteerd worden waarvoor aparte plots per waarde van die variabele gemaakt moeten worden. Voorbeeld: het onderzoek naar de mate waarin moeders instructies over de opvoeding van kinderen begrijpen volgens drie instructiemethoden kan mogelijk verstoord worden door de sociaal economische klasse (SEK) van de moeders. Om dit in beeld te brengen middels een profile plot selecteer je METHODE onder Horizontale axis en SEK onder Separate Lines: Vergeet niet op Add te klikken om de selectie actief te maken!! Het resultaat is dat er voor elk niveau van SEK een lijn getrokken wordt die het verband weergeeft tussen METHODE en SCORE (zie grafiek op II12-8). Post Hoc Net als bij de One-Way ANOVA kan ook hier onderzocht worden waar de verschillen tussen de groepsgemiddelden zitten. Met de drukknop Post Hoc II12-5

6 kunnen hiervoor een aantal toetsen uitgevoerd worden (multiple comparisons). De in de theorie besproken toetsen Bonferroni, Tukey en Scheffé zijn terug te vinden in het Post Hoc dialoogvenster.tevens moet nu in het kader onder Post Hoc Tests for: aangeven worden voor welke factoren de multiple comparisons uitgevoerd dienen te worden. Options In het kader Display kan onder Descriptive statistics het gemiddelde, de standaard deviatie en de aantallen van alle cellen worden opgevraagd. De overige mogelijkheden van deze drukknop worden verder niet besproken. SPSS uitvoer Univariate ANOVA met hoofdeffecten en eerste orde interactie (full factorial): Between-Subjects Factors methode sek N Descriptive Statistics Dependent Variable: score methode sek Mean Std. Deviation N Total Total Total Total Total De uitvoer onder Descriptive Statistics (resultaat van Options Display Descriptive statistics) bevat het gemiddelde, de standaard deviatie en het aantal van elke cel. II12-6

7 Dependent Variable: score Source Corrected Model Intercept methode sek methode * sek Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig a a. R Squared =.745 (Adjusted R Squared =.669) Uit deze ANOVA tabel (Test of Between-Subjects Effects) valt het volgende af te lezen: Verklaarde variantie (SS(Corrected Model) = SS(METHODE) + SS(SEK) + SS(METHODE*SEK) = = Onverklaarde variantie (SS(Error)) = Totale variantie (SS(Corrected Total)) = SS(verklaard) + SS(onverklaard) = = Proportie verklaarde variantie ( R Squared) = SS(verklaard)/SS(totaal) = / = Verder staan in de tabel uiteraard het aantal vrijheidsgraden (df), de Mean Squares, de F-waarde (F) en de bijbehorende overschrijdingskans (Sig.) vermeld. De overige gegevens vermeld in de ANOVA tabel worden verder niet behandeld. Opm. F en Sig. kunnen alleen worden weergegeven als er sprake is van meer dan 1 waarneming per cel! Uit de variantieanalyse tabel volgt dat de interactieterm significant is op 5 % niveau (Sig.=.001). II12-7

8 De profile plot ziet er als volgt uit: Estimated Marginal Means of score 80,00 sek.00 70,00 Estimated Marginal Means 60,00 50,00 40,00 0,00 methode.00 Het celgemiddelde voor de lage sociaal economische klasse bij methode 2 is aanzienlijk lager dan de gemiddelden bij methode 1 en methode. Bij de middenklasse is methode duidelijk de beste methode en bij de hoogste klasse geeft methode 2 het beste resultaat. Het effect van de verschillende methoden is dus afhankelijk van de sociaal economische klasse (interactie). Univariate procedure voor variantieanalyse met een continu covariaat: ANCOVA In het statistiekboek is covariantieanalyse (ANCOVA) behandeld in termen van een regressieanalyse (zie hoofdstuk II-11.9, deel 2). We zullen hier zien dat deze analyse ook kan worden uitgevoerd als een variant van variantieanalyse. De uitgangssituatie bij ANCOVA is een vergelijkende studie, waarbij er sprake is van twee of meer groepen die zich van elkaar onderscheiden op basis van een bepaalde discrete (categorische) variabele. Bovendien moet er rekening gehouden worden met een continue storende variabele (de covariaat). Als voorbeeld gaan we uit van een studie over voedingsgewoonten, waarbij o.a. wordt onderzocht of er bij kinderen een verband aanwezig is tussen voedingsgewoonten en lichaamslengte. Als indicatie voor voedingsgewoonten wordt het onderscheid tussen stads- en plattelandskinderen gehanteerd (file: NUTRITIO.SAV, zie ook hoofdstuk II-11.9 voor een beschrijving van dit onderzoek). Daarnaast moet er rekening worden gehouden met de continue variabele LEEFTIJD die de relatie tussen voedingsgewoonten en lengte kan II12-8

9 verstoren (covariaat). Om te kijken of er een significant verschil in lengte is tussen de stads- en plattelandskinderen zonder rekening te houden met andere variabelen, kan er een twee steekproeven t-test worden uitgevoerd. Als er echter sprake zou zijn van meer dan 2 groepen moet er een één-weg variantieanalyse uitgevoerd worden onder de aanname van gelijke varianties in alle groepen. Ook in ons voorbeeld zullen we de lengte van de stads- en plattelandskinderen vergelijken middels één-weg variantieanalyse, wat overeenkomt met de twee steekproeven t-test mits er sprake is van gelijke populatievarianties. Deze één-weg variantieanalyse kan worden uitgevoerd middels de procedure One-Way Anova of Univariate Anova. We kiezen voor de laatste optie omdat deze meer mogelijkheden biedt. Kies Analyze General Linear Model Univariate met LENGTE als afhankelijke variabele en SCHOOL als Fixed Factor. Vraag onder de drukknop Options de paarsgewijze vergelijkingen op via het aanvinken van Compare main effects en vraag om de schattingen van de regressiecoëfficiënten via het aanvinken van Parameter Estimates, zoals is aangegeven in onderstaand scherm: Klik op Continue en vervolgens op OK. Een deel van de uitvoer staat hieronder: II12-9

10 SPSS uitvoer Univariate ANOVA: Descriptive Statistics Dependent Variable: LENGTE SCHOOL.00 platteland stad Total Mean Std. Deviation N De geobserveerde gemiddelde lengte van de plattelandskinderen is cm, met een standaard deviatie van 6.12cm (n=14) en van stadskinderen met een standaard deviatie van 8.59 (n=18). Dependent Variable: LENGTE Source Corrected Model Intercept SCHOOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig a a. R Squared =.06 (Adjusted R Squared =.004) Uit bovenstaande ANOVA tabel (Test of Between-Subjects Effects) blijkt dat er geen significant verschil in lengte bestaat tussen de stads- en plattelandskinderen (SCHOOL, F=1.12, Sig.=.298). Dependent Variable: LENGTE Parameter Intercept [SCHOOL=.00] [SCHOOL=] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound a..... a. This parameter is set to zero because it is redundant. Uit bovenstaande tabel kunnen de gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0) LENGTE = = Voor stadskinderen (SCHOOL = 1) LENGTE = Het geschatte verschil tussen de 2 groepen bedraagt 2.87cm. De gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means: II12-10

11 Estimated Marginal Means SCHOOL Dependent Variable: LENGTE SCHOOL.00 platteland stad Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound In de Pairwise Comparisons tabel in de uitvoer staan alle paarsgewijze vergelijkingen (in dit geval dus alleen de vergelijking stads- en plattelandskinderen). Deze zijn zinvol wanneer de F-toets (zie bovenstaande Test of Between-Subjects Effects tabel) een significant resultaat oplevert en er meer dan 2 groepen zijn. In ons geval is deze test niet significant, dus we zullen verder niet toetsen op paarsgewijze verschillen. Vervolgens gaan we controleren voor de variabele LEEFTIJD. Aangezien dit een continue variabele is, moet deze in de analyse worden meegenomen als covariaat (covariantie-analyse, ANCOVA). Hierbij moet op de eerste plaats worden gecontroleerd of leeftijd lineair gerelateerd is aan lengte zowel bij de stads- als bij de plattelandskinderen. Daarvoor maken we een puntenwolk van LEEFTIJD tegen LENGTE voor beide groepen apart. Daartoe splitst men de datafile eerst in 2 groepen middels Data Split File. Kies voor de optie Organize output by groups; Groups Based on: SCHOOL, zoals hieronder is weergegeven: Vraag nu een puntenwolk op middels: Graphs Legacy Dialogs Scatter/Dot. Kies voor Simple Scatter en klik op Define. Zet LEEFTIJD op de x-as en LENGTE op y-as: II12-11

12 SPSS uitvoer puntenwolk: school: platteland 150,00 145,00 lengte 140,00 15,00 10,00 120,00 125,00 10,00 15,00 140,00 leeftijd school: stad 170,00 160,00 lengte 150,00 140,00 10,00 110,00 120,00 10,00 140,00 leeftijd Alhoewel het lineaire verband bij de plattelandskinderen niet duidelijk in de puntenwolk te zien is (kleine steekproef?) nemen we toch aan dat het verband tussen leeftijd en lengte in beide groepen lineair is. Let op: Als er in het model naast LEEFTIJD nog andere variabelen waren meegenomen dan had men het lineaire verband tussen LEEFTIJD en LENGTE moeten beoordelen in partiële plots, waarin de zuivere relatie wordt weergegeven tussen de afhankelijke variabele (LENGTE) en een onafhankelijke variabele (LEEFTIJD) gecorrigeerd voor alle andere onafhankelijke variabelen die in het model zitten (zie hoofdstuk II11). Deze kunnen in SPSS alleen maar geproduceerd worden via de procedure Linear Regression. Een andere voorwaarde van covariantie-analyse is dat het verband tussen LEEFTIJD en LENGTE voor elke groep hetzelfde is (evenwijdige regressielijnen). Dit wordt onderzocht middels meervoudige variantieanalyse waarin de variabele LEEFTIJD in categorieën wordt opgesplitst. We splitsen de variabele LEEFTIJD middels Analyze Recode (zie het boek SPSS in Praktische Stappen van blok 1.2b) in gelijke groepen (tertielen) en noemen deze gecategoriseerde variabele LFTCAT. Kies Analyze General Linear II12-12

13 Model Univariate, selecteer LENGTE als Dependent Variable en LFTCAT en SCHOOL als Fixed Factors. Klik op Model en kies het Custom model. Selecteer daarin LFTCAT en SCHOOL als hoofdeffecten door Build Terms op Main effects te zetten en de 2 onafhankelijke variabelen met de pijltoets naar de rechterbox over te brengen. Zet Build Terms vervolgens op Interaction, selecteer middels de Ctrl-knop zowel LFTCAT als SCHOOL en breng ze samen met de pijltjestoets over naar de rechterbox: Opm. Omdat er slechts sprake is van 2 onafhankelijke variabelen (LFTCAT en SCHOOL) en we geïnteresseerd zijn in het model met beide hoofdeffecten en hun onderlinge interactie zouden we in dit geval ook gekozen kunnen hebben voor het full factorial model wat automatisch alle hoofdeffecten en alle factorfactor interactiemogelijkheden bevat. Klik op Continue. Vraag onder Plots een plot aan van LENGTE (automatisch op de y-as!) tegen LFTCAT (horizontal axis) met aparte lijnen voor SCHOOL (Separate lines). Klik op Add, Continue, en vervolgens op OK. De volgende uitvoer verschijnt: SPSS uitvoer Univariate ANOVA (controleren voorwaarden ANCOVA): Between-Subjects Factors LFTCAT SCHOOL Value Label N platteland 14 stad 18 II12-1

14 Dependent Variable: LENGTE Source Corrected Model Intercept LFTCAT SCHOOL LFTCAT * SCHOOL Error Total Corrected Total Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig a a. R Squared =.80 (Adjusted R Squared =.261) Er is geen sprake van interactie tussen LFTCAT en SCHOOL (LFTCAT*SCHOOL, F=1.7, Sig.=.202). Het verband tussen LFTCAT en LENGTE is voor beide groepen (stads- en plattelandskinderen) hetzelfde. Estimated Marginal Means of lengte 155,00 school platteland stad Estimated Marginal Means 150,00 145,00 140,00 15,00 lftcat Alhoewel de lijnen in bovenstaande plot niet evenwijdig lopen, is er volgens de variantieanalyse geen interactie tussen SCHOOL en LFTCAT en mogen we dus wel uitgaan van evenwijdige regressielijnen in de populatie. Er is dus aan de voorwaarden van covariantie-analyse voldaan (lineariteit en evenwijdige regressielijnen), en kunnen we deze uitvoeren. Kies Analyze General Linear Model Univariate. Selecteer LENGTE als Dependent Variable, SCHOOL als Fixed Factor en LEEFTIJD als Covariate:.00 II12-14

15 Kies onder Model voor Full factorial en vraag onder Options om Compare main effects van de variabele SCHOOL en Parameter estimates. We krijgen de volgende resultaten: SPSS uitvoer ANCOVA: Between-Subjects Factors SCHOOL.00 Value Label N platteland 14 stad 18 Tests of Between-Subjects Effects Dependent Variable: LENGTE Source Corrected Model Intercept LEEFTIJD SCHOOL Error Total Corrected Total Type III Sum of Squares df Mean Square F Sig a a. R Squared =.259 (Adjusted R Squared =.208) We zien dat er een significant verschil in lengte bestaat tussen de groepen (SCHOOL, F=4.507, Sig.=.042), wanneer er gecorrigeerd wordt voor de leeftijd van de kinderen. Dependent Variable: LENGTE Parameter Intercept LEEFTIJD [SCHOOL=.00] [SCHOOL=] Parameter Estimates 95% Confidence Interval B Std. Error t Sig. Lower Bound Upper Bound a..... a. This parameter is set to zero because it is redundant. II12-15

16 Uit bovenstaande tabel kunnen de voor leeftijd gecorrigeerde gemiddelden worden berekend voor beide groepen: Voor plattelandskinderen (SCHOOL = 0) LENGTE = *LEEFTIJD = *LEEFTIJD Voor stadskinderen (SCHOOL = 1) LENGTE = *LEEFTIJD Het gemiddelde aangepaste verschil tussen de 2 groepen bij een constante leeftijd bedraagt 5.466cm, waarbij de plattelandskinderen kleiner zijn dan de stadskinderen. De voor leeftijd gecorrigeerde gemiddelden worden ook weergegeven in de onderstaande tabel van de Estimated Marginal Means: Estimated Marginal Means SCHOOL Estimates Dependent Variable: LENGTE 95% Confidence Interval SCHOOL Mean Std. Error Lower Bound Upper Bound.00 platteland a stad a a. Covariates appearing in the model are evaluated at the following values: LEEFTIJD = Dependent Variable: LENGTE (I) SCHOOL.00 platteland stad (J) SCHOOL stad.00 platteland Mean Difference Pairwise Comparisons 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Het aangepaste verschil (5.466cm) tussen de 2 groepen is significant (Sig. =.042). Geconcludeerd kan worden dat dit lengte verschil groter is dan het niet voor leeftijd gecorrigeerde verschil van 2.87cm (zie pagina II12-10). Dus als stadsen plattelandskinderen even oud zouden zijn, bedraagt het verschil in lengte gemiddeld 5.466cm in plaats van het waargenomen verschil van 2.87cm. Merk op dat er nu dus wel sprake is van een significant effect van SCHOOL (Sig. =.042) in tegenstelling tot bij de ANOVA, waarbij niet gecorrigeerd is voor LEEFTIJD (Sig. =.298). II12-16

17 Univariate (mixed model) procedure voor herhaalde metingen: eenweg within-subject design Wanneer tijdens een onderzoek dezelfde proefpersonen meerdere keren worden gemeten hebben we te maken met herhaalde metingen. Deze kunnen geanalyseerd worden via de procedure Univariate, mits de datafile univariaat is opgebouwd (zie hieronder). We gaan uit van de datafile GVO_BRUG_UNIVARIAAT.SAV. Het betreft een onderzoek naar de effectiviteit van verschillende vormen van voorlichting op het gebied van groenteconsumptie, waarbij groepen met elkaar worden vergeleken. Een groep die advies-op-maat heeft gekregen (advies); GROEP=2 Een groep die alleen algemene voorlichting heeft gekregen (brochure); GROEP=1 Een groep die geen voorlichting heeft gekregen (controle); GROEP=0 Deze file is univariaat van opzet, d.w.z., per persoon zijn er records/rijen in het datascherm, waarbij iedere rij overeenkomt met een meettijdstip. Hieronder beschouwen wij voorlopig alleen GROEP= 0 (de controlegroep). Verder is er één voormeting (TIJD=1) en twee nametingen (TIJD=2 resp.) wat betreft de groenteconsumptie: SPSS datavenster bij een univariate opzet van de data: Opmerking: Middels Data -> Select Cases selecteert men de personen van GROEP= 0! In alle de records per persoon is de afhankelijke variabele hetzelfde, nl. GROENTE. De variabele TIJD geeft voor elke persoon het tijdstip van de meting aan, de feitelijke within-subject (WS) factor. We hebben te maken met een eenweg within-subject (WS) design met herhaalde metingen (TIJD=1 t/m II12-17

18 TIJD=). De variabele TIJD kunnen wij zien als een fixed factor, de variabele PERSNO (persoonsnummer) daarentegen is een random factor waarmee we in de analyse rekening moeten houden! Vandaar dat de univariate methode ook wel wordt aangeduid als mixed model methode (ofwel een tweeweg ANOVA met een fixed en een random factor). Ter analyse van deze data kiezen we Analyze General Linear Model Univariate. In het venster dat volgt worden de afhankelijke variabele en zowel de fixed als de random factoren gedefinieerd: Klik vervolgens op de drukknop Model, en kies voor een Custom Model met beide factoren in het model zonder interactieterm. We hebben immers maar 1 observatie per persno*tijd cel, zodat het interactie effect niet berekend kan worden. Tussen de haakjes achter de factor namen zie je een F voor Fixed en een R voor Random: Klik op Continue, en vervolgens op de drukknop Plots. In het Profile Plots scherm vragen we een plot voor de fixed factor TIJD (Horizontal Axis). De Dependent Variable GROENTE komt automatisch op de y-as: II12-18

19 Klik op Add, en Continue. Via de drukknop Options vragen we Descriptive statistics (onder Display) en Estimated Marginal Means voor de WS factor TIJD op. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (hier ) en bijbehorende betrouwbaarheidsintervallen: Klik op OK, en de volgende uitvoer verschijnt: II12-19

20 SPSS uitvoer univariate methode eenweg within-subject design met herhaalde metingen: Between-Subjects Factors TIJD PERSNO Value Label N voormeting 219 eerste 218 nameting tweede 215 nameting 2 Bovenstaande tabel (ingekort!) laat zien dat er sprake is van tijdstippen (TIJD) met het aantal valide waarnemingen per tijdstip en persoon (N) erbij. In totaal zijn er 220 personen in de controlegroep, maar niet elke persoon is keer gemeten (missing values). Tests of Between-Subjects Effects Dependent Variable: GROENTE Type III Sum Source of Squares df Mean Square F Sig. Intercept Hypothesis Error a TIJD Hypothesis Error b PERSNO Hypothesis Error b a..994 MS(PERSNO) MS(Error) b. MS(Error) Uit de bovenstaande Tests of Between-Subjects Effects tabel valt af te lezen dat de WS factor TIJD significant is (F= 8.941, Sig.=.000); De groenteconsumptie verschilt ten minste tussen 2 van de tijdstippen (metingen). Welke metingen precies van elkaar verschillen kan men niet uit II12-20

21 deze tabel afleiden maar wel uit de Pairwise Comparisons tabel hieronder. De factor PERSNO is ook significant (F= 1.797, Sig.=.000). De groenteconsumptie (gemiddeld over de tijdstippen) verschilt significant tussen de verschillende personen. Vervolgens staan in onderstaande tabel de geschatte gemiddelden van de metingen, inclusief de standaard error en hun betrouwbaarheidsinterval: Estimated Marginal Means TIJD Estimates Dependent Variable: GROENTE 95% Confidence Interval TIJD Mean Std. Error Lower Bound Upper Bound voormeting eerste nameting tweede nameting De overall F-toets in de Tests of Between-Subjects Effects tabel laat zien dat de WS factor TIJD significant is. In de Pairwise Comparisons tabel kan men zien welke metingen significant van elkaar verschillen. In dit geval hebben we te maken met metingen en dus paarsgewijze vergelijkingen: Dependent Variable: GROENTE (I) TIJD voormeting eerste nameting tweede nameting (J) TIJD eerste nameting tweede nameting voormeting tweede nameting voormeting eerste nameting Pairwise Comparisons Mean Difference 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.01* E * * E * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Alle de tijdstippen (metingen) verschillen significant van elkaar. De tabel laat ook zien hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). II12-21

22 Onderstaande plot geeft de situatie grafisch weer: Estimated Marginal Means of groente 1,08 Estimated Marginal Means 1,06 1,04 1,02 voormeting eerste nameting tijd tweede nameting Zoals duidelijk te zien is, neemt de groenteconsumptie toe over de tijd. Opmerking: De vermelde standard errors van.016 zijn gelijk vanwege de aannname van sphericity (d.w.z. gelijke variantie van de verschilscores). Multivariate procedure voor herhaalde metingen: eenweg within-subject design In de vorige paragraaf was er sprake van een univariate opzet van de data. Deze data werden geanalyseerd middels de univariate (mixed model) methode, waarbij er sprake was van zowel een fixed als een random factor. Een belangrijke aanname bij deze methode is sphericity (= varianties van de verschilscores die voor ieder 2-tal tijdstippen berekend kunnen worden, zijn gelijk). De univariate procedure is echter wat verouderd, in de regel verdient de multivariate procedure de voorkeur. De aanname van sphericity is dan niet noodzakelijk en bovendien geeft SPSS bij de multivariate procedure dezelfde resultaten als de univariate procedure, met en zonder epsilon-correctie van de vrijheidsgraden. We analyseren dezelfde data als in de vorige paragraaf, met het verschil dat onze file, GVO_BRUG.SAV multivariaat van opzet is, d.w.z., er is één record (regel) per persoon, met aparte kolommen (variabelen) voor de verschillende (herhaalde) metingen. We gaan weer uit van GROEP= 0 (de controlegroep), éen voormeting (GROENV) en twee nametingen wat betreft de groenteconsumptie op 2 verschillende tijdstippen: GROENNA1 en GROENNA2: II12-22

23 SPSS datavenster bij een multivariate opzet van de data: Het verschil tussen de metingen vormt de within-subject (WS) factor. We hebben net zoals in de vorige paragraaf weer te maken met een eenweg withinsubject (WS) design. Nu gaan we echter de multivariate procedure uitvoeren die ook meer complexe WS designs aan kan. Hiervoor kiezen we onder Analyze->General Linear Model ->Repeated Measures. Het eerste scherm dat gepresenteerd wordt vraagt een naam voor de Within-Subject Factor Name en de Number of Levels. We kiezen bijvoorbeeld de naam TIJDSTIP voor de WS Factor Name om aan te geven dat het gaat om het verschil tussen de metingen GROENV, GROENNA1 en GROENNA2, en voor Number of Levels omdat de WS factor niveaus kent. Vervolgens klikken wij op Add: II12-2

24 Als we op Define klikken krijgen we het tweede scherm, Repeated Measures, waarin we de variabelen kunnen aangeven die de WS metingen representeren (GROENV, GROENNA1 en GROENNA2). Between-Subjects (BS) Factor(s) en Covariates zijn hier (nog) niet aan de orde, dus die velden laten we leeg: Onder aan het scherm Repeated Measures staan een zestal knoppen. Via de derde knop, Plots, komt het venster Repeated Measures: Profile Plots te voorschijn. We kiezen voor de WS factor TIJDSTIP op de horizontale as, en klikken op Add om die keuze te actualiseren: Met Continue keren we terug naar het voorgaande scherm. Tenslotte kunnen wij via de drukknop Options diverse aanvullende uitvoer aanvragen, zoals Descriptive statistics (onder Display) en Estimated Marginal Means voor de factor TIJDSTIP. Via Compare main effects krijgen we ook nog paarsgewijze vergelijkingen van ieder 2-tal tijdstippen (hier ), en de bijbehorende betrouwbaarheidsintervallen. II12-24

25 De belangrijkste SPSS uitvoer van de analyse zal hieronder worden besproken. SPSS uitvoer multivariate procedure eenweg within-subject design met herhaalde metingen: Within-Subjects Factors Measure: MEASURE_1 Dependent TIJDSTIP Variable 1 GROENV 2 GROENNA1 GROENNA2 De WS factor TIJDSTIP kent metingen, GROENV, GROENNA1 en GROENNA2 Descriptive Statistics GROENV GROENNA1 GROENNA2 Mean Std. Deviation N Deze tabel geeft het geobserveerde gemiddelde en de standaarddeviatie weer van de metingen. II12-25

26 De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Effect TIJDSTIP Pillai's Trace a. Exact statistic Wilks' Lambda Hotelling's Trace Roy's Largest Root b. Design: Intercept Within Subjects Design: TIJDSTIP Multivariate Tests b Value F Hypothesis df Error df Sig a a a a De H 0 luidt: De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. Het beste kan de toetsingsgrootheid Pillai s Trace worden genomen, welke het meest robuust is tegen modelschendingen. Aangezien de p-waarde<.05 is, wordt de H 0 verworpen (F=6.850, Sig.=.001). Er is minstens 1 paar metingen dat van elkaar verschilt. Vervolgens volgt de uitvoer van de univariate methode. Allereerst wordt er in de tabel Mauchly s Test of Sphericity gekeken of er sprake is van sphericity. Daarbij wordt de H 0 : Er is sphericity (i.e. varianties van de verschilscores zijn gelijk), getest: Measure: MEASURE_1 Mauchly's Test of Sphericity b Epsilon a Approx. Greenhous Within Subjects Effect Mauchly's W Chi-Square df Sig. e-geisser Huynh-Feldt Lower-bound TIJDSTIP Tests the null hypothesis that the error covariance matrix of the orthonormalized transformed dependent variables is proportional to an identity matrix. a. May be used to adjust the degrees of freedom for the averaged tests of significance. Corrected tests are displayed in the Tests of Within-Subjects Effects table. b. Design: Intercept Within Subjects Design: TIJDSTIP De p-waarde is kleiner dan.05 (Sig.=.001) dus de H 0 wordt verworpen, er is geen sprake van sphericity. Er zal een epsilon correctie moeten plaatsvinden van het aantal vrijheidsgraden. Wij zullen de Greenhouse-Geisser correctie gebruiken. II12-26

27 Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares df Mean Square F Sig Bovenstaande tabel test wederom de H 0 : De metingen (GROENV, GROENNA1 en GROENNA2, samen de WS factor TIJDSTIP) verschillen niet van elkaar. We kunnen niet uitgaan van sphericity en passen de Greenhouse-Geisser correctie toe, F=8.478, Sig.=.000, de H 0 wordt verworpen. We komen dus tot dezelfde conclusie als bij de multivariate analyse, dwz dat groente consumptie verschilt op minstens 2 van de tijdstippen. Estimated Marginal Means Estimates Measure: MEASURE_1 95% Confidence Interval TIJDSTIP Mean Std. Error Lower Bound Upper Bound Het gemiddelde van de metingen apart, inclusief standaard error en betrouwbaarheidsinterval. Measure: MEASURE_1 (I) TIJDSTIP 1 2 II12-27 (J) TIJDSTIP Mean Difference Pairwise Comparisons 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound * * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). De Pairwise Comparisons tabel geeft de paarsgewijze vergelijkingen van de metingen. Als de overall F-toets van de WS factor significant is (zie Multivariate Tests tabel en Tests of Within-Subjects Effects tabel) kan men in deze tabel zien welke metingen van elkaar verschillen. In dit geval hebben

28 we te maken met metingen en paarsgewijze vergelijkingen. We kunnen zien dat de groenteconsumptie op tijdstip 1 en, en tijdstip 2 en significant van elkaar verschillen (p-waarde kleiner dan.05). Tussen tijdstip 1 en 2 is er (net) geen significant verschil (Sig.=.059). Merk op dat, in tegenstelling tot bij de univariate methode, elk paar zijn eigen standaard error heeft (geen shericity aanname bij deze multivariate procedure). In deze tabel staat ook hoe groot het verschil is tussen de betreffende metingen (Mean Difference) met het bijbehorende 95% betrouwbaarheidsinterval van het verschil (95% Confidence Interval for Difference). Een grafische weergave van de situatie staat in onderstaande plot. Profile Plots Estimated Marginal Means of MEASURE_1 1,150 Estimated Marginal Means 1,125 1,100 1,075 1, tijdstip Opmerking: De univariate (mixed model) procedure zoals beschreven in de vorige paragraaf en de univariate uitvoer zoals hier verkregen middels een multivariate analyse geven niet precies hetzelfde resultaat. Dit is het gevolg van het feit dat SPSS bij de multivariate procedure zg. Listwise Deletion toepast, d.w.z. dat alleen die personen meegenomen worden in de analyse die geen ontbrekende waarden kennen voor de metingen samen. Zoals je in het begin van de uitvoer kunt aflezen zijn dit 212 personen (zie pagina II12-25). In de univariate procedure van de vorige paragraaf worden net zoveel personen geanalyseerd als er beschikbaar zijn voor elke meting apart, in dit geval zijn dat 219 personen voor GROENV, 218 voor GROENNA1 en 215 voor GROENNA2 (zie paginaii12-20). Zou er geen sprake zijn van ontbrekende waarden, dan zouden de resultaten van de univariate (mixed model) procedure van de vorige paragraaf en de univariate uitvoer zonder epsilon correctie binnen de multivariate procedure aan elkaar gelijk zijn. II12-28

29 Multivariate procedure voor herhaalde metingen: Split-plot design met drie groepen en een voormeting In plaats van de voormeting GROENV als een nivo van de WS variabele in de analyse mee te nemen, kunnen we deze ook als covariaat beschouwen. Dan hebben we dus te maken met een model met twee herhaalde nametingen (GROENNA1 en GROENNA2, de WS factor) en een voormeting (GROENV, de Covariaat). Bovendien breiden we ons voorbeeld uit met experimentele groepen (GROEP=0, GROEP= 1 en GROEP= 2, de BS factor). Men noemt dit een zg. Split-plot design met een covariaat. Kies Analyze -> General Linear Model -> Repeated Measures. In het eerste scherm (Define Factor(s)) vul je een WS factor naam in, bijv. TIJDSTIP met Number of Levels = 2. Via Add en Define krijgen we het bekende Repeated Measures venster dat als volgt wordt ingevuld. Let op de BS factor en de covariaat!: Van de knoppen onderaan slaan we Model, Contrasts en Save over. Onder Plots zetten we de WS factor TIJDSTIP op de horizontale as en de BS factor GROEP in het kader Separate Lines. Klik op Add: II12-29

30 Met Continue keren we terug naar het voorgaande scherm. Via Options vragen we Descriptive statistics op en Estimated Marginal Means voor de factoren TIJDSTIP en GROEP. Via Compare main effects krijgen we paarsgewijze vergelijkingen van elk 2-tal tijdstippen (WS factor) en groepen (BS factor), en bijbehorende betrouwbaarheidsintervallen, maar deze zijn alleen interpreteerbaar wanneer er geen sprake is van interactie tussen de WS factor en BS factor!! (Opm. De Post-hoc knop (voor post-hoc vergelijkingen tussen groepen) is niet beschikbaar indien er een covariaat in het model zit. Maar via Options -> Compare main effects kan men deze vergelijkingen toch krijgen, eventueel met Bonferroni correctie). Hieronder volgt de belangrijkste uitvoer. SPSS uitvoer Split Plot design met drie groepen en een voormeting: Within-Subjects Factors Measure: MEASURE_1 Dependent TIJDSTIP Variable 1 GROENNA1 2 GROENNA2 De WS factor TIJDSTIP kent 2 metingen, GROENNA1 en GROENNA2. Between-Subjects Factors GROEP.00 N De BS factor GROEP kent groepen, 0, 1 en 2, waarbij de omvang van ieder van de groepen gegeven staat in de kolom N. Descriptive Statistics GROENNA1 GROENNA2 GROEP.00 Total.00 Total Mean Std. Deviation N II12-0

31 Deze tabel geeft verder de geobserveerde gemiddelden en standaard deviaties weer van GROENNA1 en GROENNA2 per GROEP De Multivariate Tests tabel bevat het resultaat van de multivariate analyse van de data: Effect TIJDSTIP TIJDSTIP * GROENV TIJDSTIP * GROEP a. Exact statistic Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root Pillai's Trace Wilks' Lambda Hotelling's Trace Roy's Largest Root b. Design: Intercept+GROENV+GROEP Within Subjects Design: TIJDSTIP Multivariate Tests b Value F Hypothesis df Error df Sig a a a a a a a a a a a a Allereerst kijken we of er sprake is van interactie tussen de WS factor en de BS factor (TIJDSTIP*GROEP). De H 0 luidt: Geen interactie. De p-waarde is >.05 (F=2.186, Sig.=.11). De H 0 kan niet worden verworpen, we gaan uit van geen interactie. Er is wel sprake van interactie tussen de WS factor en de voormeting (TIJDSTIP*GROENV, F=.968, Sig. =.047). Het gevolg hiervan is dat we het effect van de WS factor (TIJDSTIP) niet kunnen interpreteren. In dit voorbeeld is er sprake van slechts 2 herhaalde metingen en dus maar 1 verschilscore. In deze situatie gaat sphericity (=gelijkheid van de varianties van de verschilscores) altijd op. Er is in dat geval geen correctie van de univariate resultaten nodig, zie onderstaande tabel, waarin de resultaten voor sphericity assumed en de Greenhouse-Geisser hetzelfde zijn: II12-1

32 Tests of Within-Subjects Effects Measure: MEASURE_1 Source TIJDSTIP TIJDSTIP * GROENV TIJDSTIP * GROEP Error(TIJDSTIP) Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Type III Sum of Squares df Mean Square F Sig Measure: MEASURE_1 Transformed Variable: Average Source Intercept GROENV GROEP Error Tests of Between-Subjects Effects Type III Sum of Squares df Mean Square F Sig Bovenstaande tabel geeft het effect van de BS factor (GROEP) weer, de H 0 luidt: Er is geen verschil tussen de groepen. Deze moet worden verworpen (F=5.947, Sig.=.00). Er is dus wel verschil tussen de groepen wat betreft gemiddelde groenteconsumptie over beide nametingen (GROENNA1 en GROENNA2). Verder staat er ook een toets voor de relatie tussen de voormeting (GROENV) en het gemiddelde van de 2 nametingen wat betreft de groenteconsumptie. Aangezien er sprake is van een significante interactie TIJDSTIP*GROENV mogen we deze echter niet interpreteren. Estimated Marginal Means 1. TIJDSTIP Measure: MEASURE_1 TIJDSTIP 1 2 Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound a a a. Covariates appearing in the model are evaluated at the following values: GROENV = Hier zien wij het geschatte gemiddelde van beide nametingen apart, inclusief standaard error en betrouwbaarheidsinterval. II12-2

33 Pairwise Comparisons Measure: MEASURE_1 (I) TIJDSTIP 1 2 (J) TIJDSTIP 2 1 Mean Difference Based on estimated marginal means *. The mean difference is significant at the.05 level. 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.042* * a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Aangezien er sprake is van interactie tussen TIJDSTIP*GROENV mogen we het effect van TIJDSTIP en dus ook de paarsgewijze vergelijkingen in de tabel Pairwise Comparisons niet interpreteren. 2. conditie: aantal keren advies op maat Measure: MEASURE_1 conditie: aantal keren advies op maat.00 Estimates 95% Confidence Interval Mean Std. Error Lower Bound Upper Bound a a a a. Covariates appearing in the model are evaluated at the following values: GROENV = Het gemiddelde van de groenteconsumptie over beide tijdstippen (nametingen) voor de groepen apart, inclusief standaard error en betrouwbaarheidsinterval. Measure: MEASURE_1 (I) conditie: aantal keren advies op maat.00 (J) conditie: aantal keren advies op maat Pairwise Comparisons Mean Difference 95% Confidence Interval for Difference a (I-J) Std. Error Sig. a Lower Bound Upper Bound -.045* * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). Aangezien er geen sprake is van interactie tussen TIJDSTIP*GROEP en de overall F-toets van de BS factor GROEP significant is (zie Multivariate Tests tabel en Tests of Between-Subjects Effects tabel) kan men in de bovenstaande Pairwise Comparisons tabel zien hoe de groepen van elkaar verschillen. GROEP 0 en 1 en GROEP 0 en 2 verschillen significant van elkaar (Sig.<.05), terwijl er geen verschil is tussen GROEP 1 en 2 (Sig.=.19). II12-

34 Het geheel is als volgt grafisch weergegeven: Profile Plots Estimated Marginal Means of MEASURE_1 1,20 1,175 conditie: aantal keren advies op maat.00 Estimated Marginal Means 1,15 1,125 1,10 1,075 1 tijdstip Als er sprake zou zijn van interactie tussen GROEP en TIJDSTIP, moet het groepseffect apart per tijdstip (nameting) worden geanalyseerd met een eenweg ANCOVA. Bijvoorbeeld voor de analyse op tijdstip 1 (GROENNA1): kies Analyze -> General Linear Model-> Univariate. Het scherm dat nu verschijnt, wordt als volgt ingevuld: 2 De variabele GROENNA1 plaatsen we onder Dependent (afhankelijke) Variable, de BS factor GROEP onder Fixed Factor, en de voormeting (GROENV) onder Covariate(s). Via de drukknop Plots wordt een profile plot aangevraagd met GROEP op de horizontale as: II12-4

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 7 1. Een onderzoeker wil nagaan of de fitheid van jongeren tussen 14 en 18 jaar (laag, matig, hoog) en het geslacht (M, V) een

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen

Nadere informatie

Enkelvoudige lineaire regressie

Enkelvoudige lineaire regressie Enkelvoudige lineaire regressie Inleiding Dit hoofdstuk sluit aan op hoofdstuk I-9 van het statistiekboek. Er wordt hier steeds gesproken over het verband tussen één afhankelijke variabele Y en één onafhankelijke

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Meervoudige lineaire regressie

Meervoudige lineaire regressie Meervoudige lineaire regressie Inleiding In dit hoofdstuk dat aansluit op hoofdstuk II- (deel 2) wordt uitgelegd hoe een meervoudige regressieanalyse uitgevoerd kan worden met behulp van SPSS. Aan de hand

Nadere informatie

Verdelingsvrije statistiek

Verdelingsvrije statistiek Verdelingsvrije statistiek Inleiding In hoofdstuk II-5 (deel ) worden een aantal verdelingsvrije toetsen (ook wel niet-parametrische toetsen) besproken, die gebruikt worden als de te onderzoeken variabele

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant? Opdracht 14a ------------ Twee-factor ANOVA In een groot research-project bestudeerde men de fysische eigenschappen van multiplex houtmaterialen, vervaardigd door kleine plakjes hout aan elkaar te hechten.

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek

MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek MLW -- Toets stroomblok 2.2: Epidemiologie en Biostatistiek Vrijdag 1 april 2005 Opzet: 5 onderdelen, elk 4 punten. Schrijf uw naam en nummer op elke ingeleverde pagina. Vraag 1 In een cohort van 2000

Nadere informatie

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I Hieronder volgen de SPSS uitvoer en de antwoorden van de opgaven van Stap 7: Oefenen I. Daarnaast wordt bij elke opgave

Nadere informatie

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek Opstarten & gegevens inlezen *Inlezen gegevens Via eerste scherm bij opening SPSS of via File; Open; Data. Opletten of namen van variabelen op de eerste rij staan ( Staat ) Opm.: Bij.TXT bestand altijd

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

Residual Plot for Strength. predicted Strength

Residual Plot for Strength. predicted Strength Uitwerking tentamen DS mei 4 Opgave Een uitwerking geven is hier niet mogelijk. Het is van belang het iteratieve optimaliseringsproces goed uit te voeren (zie ook de PowerPoint sheets): screening design

Nadere informatie

Betrouwbaarheid, validiteit en overeenstemming

Betrouwbaarheid, validiteit en overeenstemming Betrouwbaarheid, validiteit en overeenstemming Inleiding Dit practicum sluit aan op het theoriegedeelte over betrouwbaarheidsanalyse van hoofdstuk II-16 (deel 2). In dit hoofdstuk wordt besproken hoe een

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek Inhoudsopgave Rooster 2 Studiemateriaal 2 Werkvormen 2 Toetsing 3 Planningsgroep 3 Traject 4 1 Rooster Dag Datum

Nadere informatie

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze Regressie-analyse Regressie-analyse is gericht op het voorspellen van één (numerieke) afhankelijke variabele met behulp van een of meerdere onafhankelijke variabelen (numerieke en/of dummy-variabelen).

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009

Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Opdracht 1 Onderstaande tabel bevat metingen aan de opbrengst van rozen bij verschillende mate van stikstofen fosfortoevoer. rozen/snijvak/dag fosfaatniveau

Nadere informatie

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2] Hoofdstuk 8 Toetsende statistiek Meestal zijn we niet alleen geïnteresseerd in beschrijvende statistiek (over de steekproef), maar ook in toetsende statistiek. Het doel hiervan is om hypothesen te toetsen,

Nadere informatie

Beschrijvende statistieken

Beschrijvende statistieken Elske Salemink (Klinische Psychologie) heeft onderzocht of het lezen van verhaaltjes invloed heeft op angst. Studenten werden at random ingedeeld in twee groepen. De ene groep las positieve verhaaltjes

Nadere informatie

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kruis per vraag slechts één vakje aan op het antwoordformulier. Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor

Nadere informatie

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 6 1. De 15 leden van een kleine mountainbikeclub vragen zich af in welk mate de omgevingstemperatuur een invloed heeft op hun

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch

Nadere informatie

12. VARIANTIEANALYSE

12. VARIANTIEANALYSE 12. VARIANTIEANALYSE 12.1 Inleiding Dit hoofdstuk gaat over variantieanalyse (ook wel ANOVA, ANalysis Of VAriance) en is een compacte mix van ideeën en meningen van diverse auteurs, geselecteerd volgens

Nadere informatie

College 7 Tweeweg Variantie-Analyse

College 7 Tweeweg Variantie-Analyse College 7 Tweeweg Variantie-Analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11 Jolien Pas ECO 2012-2013 Het Experiment

Nadere informatie

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS. Menu aansturing van SPSS voorbeeld in hoofdstuk 8 over schaalconstructie met Cronbach s α en principale componenten analyse van meningen over strafdoelen Hieronder wordt uitgelegd hoe alle analyses besproken

Nadere informatie

Basishandleiding SPSS

Basishandleiding SPSS Basishandleiding SPSS Elvira Folmer & Marieke ten Voorde SLO, Juli 2008 Deze handleiding is gebaseerd op SPSS 16.0 for Windows Inhoud 1 Het maken van een gegevensbestand in de Variable View... 4 2 Het

Nadere informatie

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Faculteit der Wiskunde en Informatica 2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015, 13.30-16.30 Opgave 1: (5 x 6 = 30 punten) (Bij deze opgave is gebruik van resultaten uit bijlage 1 noodzakelijk)

Nadere informatie

Introductie SPSS. Hogeschool Gent. Mei 2010. Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test 11. 3 Two-sample T-test 14. 4 Paired T-test 18

Introductie SPSS. Hogeschool Gent. Mei 2010. Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test 11. 3 Two-sample T-test 14. 4 Paired T-test 18 Introductie SPSS Hogeschool Gent Mei 2010 Inhoudsopgave 1 Introductie 2 2 One-sample T-test 11 3 Two-sample T-test 14 4 Paired T-test 18 5 Anova 21 6 Categorische Data-analyse 26 6.1 Binomiaaltoets.................................

Nadere informatie

Bijlage 3: Multiple regressie analyse

Bijlage 3: Multiple regressie analyse Bijlage 3: Multiple regressie analyse REGRESSION /DESCRIPTIVES MEAN STDDEV CORR SIG N /MISSING PAIRWISE /STATISTICS COEFF OUTS CI(95) R ANOVA COLLIN TOL ZPP /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig. Variable Coefficient Std. Error t-statistic Prob.

Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig. Variable Coefficient Std. Error t-statistic Prob. Technische appendix bij DNBulletin Voor lagere werkloosheid is meer economische groei nodig Schatting Okun s law; Nederland, periode 1979-2017 Variabelen Afhankelijke variabele UD= jaar op jaarmutatie

Nadere informatie

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie. Handleiding SPSS tabellen en kruistabellen In een paar stappen van spss data naar bruikbare informatie. A) Het openen van een databestand File \ open \ data Kies de naam van je databestand, bijvoorbeeld

Nadere informatie

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)? Vraag 1. Welk design bevat geen random assignment: a) Een design gebaseerd op matching b) Een design gebaseerd op blocking c) Een factorial design d) Elk van de hierboven genoemde designs Vraag 2. In een

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014 Huidig kennis- en ervaringsniveau?????? Beginners Gevorderden 2 Inhoud 1. Wat doe

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens Hieronder wordt uitgelegd hoe alle analyses besproken in paragraaf 6.5 van

Nadere informatie

Beknopte handleiding SPSS versie 18.0 1 van 28

Beknopte handleiding SPSS versie 18.0 1 van 28 Beknopte handleiding SPSS versie 18.0 1 van 28 Beknopte handleiding SPSS versie 18.0 2 van 28 Inhoudsopgave Inleiding...3 SPSS- tips...4 Kopiëren van datakenmerken...6 Van SPSS naar Excel...7 Opsturen

Nadere informatie

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 9 1. Een klinisch psycholoog vraagt zich af of er een verband bestaat tussen depressie en sociale vermijding in de populatie

Nadere informatie

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen:

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 10 1. Volgende regressievergelijking werd opgesteld na onderzoek: YY ii = 6 + 2.5 XX ii1 + 3 XX ii2 + εε ii Bereken de voorspelde

Nadere informatie

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. SPSS is een alom gebruikt, gebruiksvriendelijk statistisch programma dat vele analysemogelijkheden kent. Voor HBO en universitaire

Nadere informatie

Grafieken Cirkeldiagram

Grafieken Cirkeldiagram Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Opdracht 5a ----------- Kruistabellen

Opdracht 5a ----------- Kruistabellen Opdracht 5a ----------- Kruistabellen Aan elk van 36 studenten werd gevraagd of zij alcohol drinken, en zo ja, welke soort alcoholische drank de voorkeur heeft. Tevens werd voor elke student de leeftijd

Nadere informatie

Moleculaire LevensWetenschappen stroom 1.2

Moleculaire LevensWetenschappen stroom 1.2 MLW Moleculaire LevensWetenschappen stroom 1.2 Methoden en Statistiek werkboek 2005-2006 Inhoudsopgave Blz. Rooster 1 Studiemateriaal 2 Werkvormen 2 Toetsing 2 Planningsgroep 2 Hoorcolleges 3 Werkcolleges

Nadere informatie

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van

Extra Opgaven. 3. Van 10 personen meten we 100 keer de hartslag na het sporten. De gemiddelde hartslag van Extra Opgaven 1. Een persoon doet een HIV-test. Helaas is de uitslag positief. De test is echter niet perfect. De persoon vraagt zich af wat de kans is dat hij nu ook echt HIV heeft. Gegeven is: de kans

Nadere informatie

DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR 2000 2001. Feedback Praktische Proef

DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR 2000 2001. Feedback Praktische Proef DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR 2000 2001 Feedback Praktische Proef 1 Vooraf Het is onbegonnen werk om voor elke versie van de praktische proef een volledig uitgeschreven rapport te presenteren.

Nadere informatie

feb 2013 Instituut CMI SPSS les 2

feb 2013 Instituut CMI SPSS les 2 feb 2013 Instituut CMI SPSS les 2 Onderzoek toont aan.. Mobiele nieuwssites populairst onder 18-34 jarigen 18 tot 34 jarigen maken over de gehele dag het meest gebruik van mobiel internet. Dit blijkt uit

Nadere informatie

Nominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht

Nominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht Ordinaal - Kwalitatief - Middelste niveau - Categorieën wel ordenen - Opleidingsniveau Interval / ratio - Kwantitatief - Hoogste

Nadere informatie

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS. Menu aansturing van SPSS voorbeeld in hoofdstuk 9 over multipele correspondentie (HOMALS) en niet-linaire principale componenten analyse (PRINCALS) van kenmerken van moorden Hieronder wordt uitgelegd hoe

Nadere informatie

De bijbel der SPSS procedures

De bijbel der SPSS procedures De bijbel der SPSS procedures Onze SPSS die op de computer zijt Geheiligd zijn uw functies Uw regressies kome, Uw output geschiede op papier als op scherm. Geef ons heden onze dagelijkse anova en vergeef

Nadere informatie

Technische uitwerkingen voor het SPSS practicum Inleiding M&T.

Technische uitwerkingen voor het SPSS practicum Inleiding M&T. Technische uitwerkingen voor het SPSS practicum Inleiding M&T. NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin October 19, 2012

Nadere informatie

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop

Nadere informatie

Twee en een half jaar Kwaliteitsmeting in de Fysiotherapie

Twee en een half jaar Kwaliteitsmeting in de Fysiotherapie Twee en een half jaar Kwaliteitsmeting in de Fysiotherapie Feiten en cijfers tot nu toe Managementsamenvatting Na twee en een half jaar kwaliteitsmetingen in de fysiotherapie is het een geschikt moment

Nadere informatie

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

TYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK

TYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK TYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK Prof. Dr. M. Vandebroek 1. Een aantal proefpersonen werd gevraagd een frisdrank te beoordelen door aan te geven in hoeverre ze het eens zijn met de volgende

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger De groothandel Onderwerp: regressieanalyse met SPSS Bij: hoofdstuk 10 Een groothandel heeft onderzoek gedaan onder de klanten en daarbij geprobeerd met regressieanalyse vast te stellen wat de bepalende

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 17-11-2003 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een zakrekenmachine.

Nadere informatie

Wat zijn de verschillen tussen SPSS 9 en SPSS 10?

Wat zijn de verschillen tussen SPSS 9 en SPSS 10? Wat zijn de verschillen tussen SPSS 9 en SPSS 10? 1.1 De data-editor / het definiëren van variabelen 1.2 Het openen van bestanden 1.3 Output lezen 1.4 Mogelijke problemen 1.1.1 De data-editor Het grootste

Nadere informatie

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Bij Excel denken de meesten niet direct aan een statistisch programma. Toch biedt Excel veel mogelijkheden tot statistische

Nadere informatie

S0A17D: Examen Sociale Statistiek (deel 2)

S0A17D: Examen Sociale Statistiek (deel 2) S0A17D: Examen Sociale Statistiek (deel 2) 21 juni 2011 Naam : Jaar en studierichting : Lees volgende aanwijzingen eerst voor het examen te beginnen : Wie de vragen aanneemt en bekijkt, moet minstens 1

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november 2008 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november 2008 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op woensdag 2 november 28 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

1 Inleiding spss; Aanwijzingen.

1 Inleiding spss; Aanwijzingen. 1 INLEIDING SPSS; AANWIJZINGEN. 24 april 2007: A.K. en M.d.L. 1 Inleiding spss; Aanwijzingen. = Start Windows Internet Explorer op. Ga naar www.stat.unimaas.nl. Klik op education. Klik op Statistics for

Nadere informatie

Vertaling van enkele termen uit de kansrekening en statistiek alternative hypothesis alternatieve hypothese approximate methods benaderende methoden asymptotic variance asymptotische variantie asymptotically

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets

Nadere informatie

Toegepaste data-analyse: sessie 3

Toegepaste data-analyse: sessie 3 Toegepaste data-analyse: sessie 3 Mixed Models II: Actor-partner model Corr (Yij, Yik) = σσ 2 kkkkkkkkkkkk σσ 2 kkkkkkkkkkkk+ σσ 2 rrrrrr Je kan deze data niet modelleren a.d.h.v. lineaire regressie. Er

Nadere informatie

STATISTIEK 2 VERSIE A MAT15403 1308-1. Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, 11.00-13.00 uur

STATISTIEK 2 VERSIE A MAT15403 1308-1. Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, 11.00-13.00 uur STTISTIEK 2 VERSIE MT15403 1308-1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 2 (MT-15403) Maandag 5 augustus 2013, 11.00-13.00 uur EZE PGIN NIET vóór 11.00 uur OMSLN! STRT MET INVULLEN

Nadere informatie

INDUCTIEVE STATISTIEK

INDUCTIEVE STATISTIEK INDUCTIEVE STATISTIEK Toegepaste hypothesetoetsing met SPSS Tim Vanhoomissen 1 Workshop Inductieve Statistiek INHOUD Hypothesetoetsing Principe van hypothesetoetsing Steekproevenverdeling Centrale limiet

Nadere informatie

statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie

statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie Statistiek voor de psychologie Deel 2: Toetsen voor twee gemiddelden en toetsingstheorie Jules L. Ellis Derde druk

Nadere informatie

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren SPSS: Wist je dat (1) je bij het invoeren van de variabelen in het menu door de CTRL-knop ingedrukt te houden, meerdere variabelen kunt selecteren die niet precies onder elkaar staan? Met de SHIFT-knop

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum]

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum] 6 Multiple response [aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum] 6.1 Inleiding Het komt regelmatig voor dat respondenten

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen gewest, tetra en freq.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen gewest, tetra en freq. Opdracht 11a ------------ chi-kwadraattoets In Januari 1975 sprak de geneesmiddelencommissie van de Amerikaanse Academie voor Kindergeneeskunde de aanbeveling uit, geneesmiddelen met tetracycline niet

Nadere informatie

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer Endinet Regressie-analyse Energiekamer Laboratory for Industrial Mathematics Eindhoven Postbus 513 5600 MB Eindhoven tel.: 040 247 4875 fax: 040 244 2489 e-mail: lime@tue.nl WWW: http://www.lime.tue.nl

Nadere informatie

3. Het gebruik van een grafische rekenmachine van een goedgekeurd type is toegestaan.

3. Het gebruik van een grafische rekenmachine van een goedgekeurd type is toegestaan. vrije Universiteit Amsterdam Faculteit der Economische Wetenschappen en Bedrijfskunde Afdeling Econometrie Toets: Kwantitatieve methoden- Statistics II Opleiding: premasterprogramma voor Business Administration

Nadere informatie

Initiële Data Analyse. (Truuks en Flessenhalzen)

Initiële Data Analyse. (Truuks en Flessenhalzen) Slide 1 Initiële data analyse (Truuks en Flessenhalzen) Herman Adèr 13 Mei, 2003 Overzicht Slide 2 Fasen in de data analyse Data kwaliteit Initiële Data Analyse Behoud van informatie Ontbrekende waarnemingen

Nadere informatie

Variantie-analyse. 3.1 Het twee-steekproevenprobleem III.1

Variantie-analyse. 3.1 Het twee-steekproevenprobleem III.1 III.1 Variantie-analyse 3.1 Het twee-steekproevenprobleem In Statistiek & kansrekening zijn vragen aan de orde geweest zoals heeft invoering van nieuwe veiligheidsmaatregelen geleid tot een vermindering

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april 2013 14.00-17.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het

Nadere informatie

4 Meervoudige lineaire regressie

4 Meervoudige lineaire regressie 4 Meervoudige lineaire regressie In het vorige hoofdstuk is enkelvoudige lineaire regressie besproken. Hierbij was er slechts één onafhankelijke variabele. In de praktijk zijn er echter gevallen waarin

Nadere informatie

2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72

2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72 Inhoud Hoofdstuk 1 Design en analyse 11 1.1 Specificatie van designs 13 1.2 Definities 14 1.3 Het verschil tussen een afhankelijke variabele en een niveau van een within-subjectfactor 19 1.4 Kiezen van

Nadere informatie

Voorblad bij tentamen

Voorblad bij tentamen Studentnaam: Studentnummer: Voorblad bij tentamen (in te vullen door de examinator) Vaknaam:Biostatistiek en Lineaire Algebra Vakcode: 2DM81 Datum: Begintijd:13.30 Eindtijd: 16.30 Aantal pagina s:2 voor

Nadere informatie

Uitwerkingen tentamen Statistiek 2 voor TeMa Maandag 08-03-2004.

Uitwerkingen tentamen Statistiek 2 voor TeMa Maandag 08-03-2004. Utwerkngen tentamen Statstek voor TeMa Maandag 8-3-4. Opgave a. Model: Y = β + β* x+ ε met ε ~ Nd(, σ ) Y s het energeverbruk, x s de omgevngstemperatuur.. Volgens het scatterplot n de bjlage ljkt er sprake

Nadere informatie