INDUCTIEVE STATISTIEK
|
|
- Jurgen Karel Koning
- 8 jaren geleden
- Aantal bezoeken:
Transcriptie
1 INDUCTIEVE STATISTIEK Toegepaste hypothesetoetsing met SPSS Tim Vanhoomissen 1 Workshop Inductieve Statistiek
2 INHOUD Hypothesetoetsing Principe van hypothesetoetsing Steekproevenverdeling Centrale limiet theorema Mogelijke fouten Effectgrootte SPSS: data invoeren en bewerken Toetsen T-toetsen Variantieanalyse, repeated measures Regressieanalyse 2 Workshop Inductieve Statistiek
3 HYPOTHESETOETSING Empirische cyclus Theorie Statistiek Hypothese Dataverzameling 3 Workshop Inductieve Statistiek
4 HYPOTHESETOETSING Theorie Drummers zijn dommer dan gemiddelde personen Toetsing Hypothese verwerpen Hypothese niet verwerpen Hypothese H1 Drummers scoren lager op IQ test dan gemiddelde personen Dataverzameling IQ test Gemiddelden Nulhypothese H0 Drummers scoren even hoog op IQ-test als anderen 4 Workshop Inductieve Statistiek
5 HYPOTHESETOETSING Dus: nulhypothese (onschuld) wordt verworpen als de kans klein is dat het bewijsmateriaal aanwezig is terwijl de nulhypothese klopt. In statistiek: Nulhypothese wordt verworpen als de kans klein is om een bepaald steekproefgemiddelde te observeren terwijl de nulhypothese klopt. Nulhypothese wordt behouden als de kans groot is om een bepaald steekproefgemiddelde te observeren terwijl de nulhypothese klopt. 5 Workshop Inductieve Statistiek
6 kans HYPOTHESETOETSING Toetsing Theorie Hypothes e Kansen zijn dus noodzakelijk om inductieve beslissingen te kunnen nemen => kansverdeling van steekproefgemiddelden => om te beslissen of onze steekproef uitzonderlijk is of niet Dataverza meling Nulhypot hese We trokken een steekproef van drummers en vonden een gemiddeld IQ van 96. We weten dat het gemiddelde IQ 100 is. Hoe groot is nu de kans om een gemiddelde van 96 te vinden terwijl de,25 populatie drummers toch niet afwijkt van,20 de algemene populatie?,15 Kunnen we afleiden uit de verdeling van de steekproefgemiddelden:,10,05, punten statistiek 6 Workshop Inductieve Statistiek
7 populatie steekproef steekproeven- verdeling 7 Workshop Inductieve Statistiek
8 DE STEEKPROEVENVERDELING Hoe groter de steekproef, hoe meer de normale verdeling benaderd wordt: (vb: gooien van 1 dobbelsteen) Abraham De Moivre, 17E 8 Workshop Inductieve Statistiek
9 DE STEEKPROEVENVERDELING Vorm van de steekproevenverdeling? populatie normaal verdeeld? ja nee nee steekproefgrootte? / > 30 < 30 steekproevenverdeling normaal verdeeld met verw. waarde μ en / N onzeker 9 Hoofdstuk 2: Kansverdelingen en kansberekening
10 DE STEEKPROEVENVERDELING Wat is er nu zo cool aan de steekproevenverdeling van het gemiddelde? Aangezien we kennen: µ en N of s N we weten dat ze normaal verdeeld is (als populatie normaal verdeeld is of als N > 30) kunnen we z-scores berekenen en kansen uit de standaardnormaalverdeling halen! z x X X 10 Hoofdstuk 2: Kansverdelingen en kansberekening
11 HYPOTHESETOETSING Toetsing Theorie Hypothes e Terug naar de drummers: steekproef: N = 36 ; X = 96 ; SX = 13 populatie: µ = 100 en = 15 Dataverza meling Nulhypot hese >> kans berekenen op een gemiddelde van 96 of hoger bij een µ = 100 en = 15 Stap1: z( 96) Stap 2: P(z < -1.6) = ? 11 Workshop Inductieve Statistiek
12 kans HYPOTHESETOETSING Kleine kans / grote kans? 5% = α,03,03,02,02 Sir Ronald Fisher, ernstig nadenkend over hoe groot een kleine kans is.,01,01, IQ 12 Workshop Inductieve Statistiek
13 HYPOTHESETOETSING Betekenis 5% 13
14 EÉN- OF TWEEZIJDIG? 14
15 EÉN- OF TWEEZIJDIG? De keuze kan bepalend zijn voor significantie! Populariteit van docenten statistiek is in populatie normaal verdeeld met µ = 100 en σ = 15. Onderzoekshypothese: 1. door doorgedreven training en complete restyling kan de populariteitsscore stijgen (= eenzijdig). of: 2. door doorgedreven training en complete restyling kan de populariteitsscore veranderen (= tweezijdig). 25 docenten worden getraind. Populariteitsscore na training in deze steekproef =
16 EÉN- OF TWEEZIJDIG? 1. Rechtseenzijdig toetsen: H0: µ 100 H1: µ > 100 z x Pr (1.67) = = Is ? -> ja, dus verwerp H0 µ
17 EÉN- OF TWEEZIJDIG? 2. Tweezijdig toetsen: H0: µ = 100 H1: µ 100 z x Pd (1.67)= 2 * Pr (1.67) = 2 * = Is ? -> neen, dus verwerp H0 µ = 100 niet 17
18 EÉN- OF TWEEZIJDIG? In SPSS meestal tweezijdige overschrijdingskans! Independent Samples Test inf o Equal v ariances ass umed Equal v ariances not assumed Lev ene's Test for Equality of Varianc es F Sig. t df Sig. (2-tailed) t-test f or Equality of Means Mean Dif f erence 95% Conf idence Interv al of the Std. Error Dif f erence Dif f erence Lower Upper,109,741-2, ,019 -, 0929, , , , ,853,019 -, 0929, , , éénzijdige overschrijdingskans nodig? => sig (2-tailed) / 2 en vgl met α tweezijdige overschrijdingskans nodig? => sig (2-tailed) direct vgl met α 18
19 ONZEKERHEDEN Zijn we daar nu helemaal zeker van? Beslissing H 0 verwerpen H 0 niet verwerpen Realiteit H 0 is waar H 0 is niet waar Type I-fout = α Correcte verwerping = 1 - β Correct aanvaarden = 1 - α Type II-fout = β = sensitivity / power 19
20 ONZEKERHEDEN = H0 waar verwerp H0 aanvaard H0 verwerp H0 H0 niet waar 20
21 ONZEKERHEDEN = H0 waar verwerp H0 aanvaard H0 verwerp H0 H0 niet waar 21
22 EFFECTGROOTTE Effectgrootte = indicatie van de mate waarin de onafhankelijke variabele de variatie in de afhankelijke variabele kan verklaren. Kan uitgedrukt worden in uiteenlopende grootheden (r, d, ) maar vaak wordt r gebruikt. Interpretatie: Dus:.10 < r <.30 : klein effect.30 < r <.50 : matig effect r >.50 : sterk effect Significantie: Is er een effect van seksuele deprivatie op alcoholgebruik? Effectgrootte: Hoe sterk bepaalt seksuele deprivatie het alcoholgebruik? 22
23 DATA ORGANISEREN De meest gebruikte commando s om data te ordenen in SPSS. 23 Workshop Inductieve Statistiek
24 SPSS Interface Importeren (*.xls, *.csv, ) Recode Compute 24 Workshop Inductieve Statistiek
25 TOETSEN De meest gebruikte parametrische en nonparametrische toetsen 25 Workshop Inductieve Statistiek
26 PARAMETRISCH VS. NON- PARAMETRISCH Parametrische toetsen Non-parametrische toetsen variabelen normaal verdeeld in populatie (afhankelijke) variabelen gemeten op intervalniveau steekproeven hebben gelijke varianties * *als er meerdere steekproeven zijn geen normale verdeling vereist voordeel: breder inzetbaar wegens minder voorwaarden, ook bij nominale- en ordinale variabelen nadeel: minder snel significante resultaten 26
27 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal onafh. Pearson correlation n-way ANOVA Spearman correlation nominaal afh. repeated measures ANOVA gemengd mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square 2 gemengd logistic regression
28 STRAMIEN TOETSEN 1. Toetsingssituatie Bij welk soort onderzoeksvragen gebruik je deze toets? 2. Voorwaarden Wanneer mag je deze toets wel/niet gebruiken? 3. Hypothesen Hoe zien H0 en H1 eruit wanneer je deze toets gebruikt? 4. Toetsingsgrootheid Welke grootheid bereken je en wat is de kansverdeling van die grootheid? 5. Beslissingsregels Wanneer verwerp je H0: via overschrijdingskansen of kritieke waarden? 6. Effectgrootte Hoe belangrijk is het gevonden effect? 7. Rapporteren Hoe vermeld je op een juiste manier de resultaten? 28 Workshop Inductieve Statistiek
29 T-TOETS VOOR HET GEMIDDELDE 1. Toetsingssituatie Heeft het gemiddelde van de populatie waaruit de steekproef afkomstig is een bepaalde waarde of niet? 2. Voorwaarden σ is niet bekend en populatie is normaal verdeeld en N < 100 N > 30 en populatie is niet normaal verdeeld σ bekend? J a J a J a N e e N e e J a N e e N e e p o p u l a t i e N v e r d e e l d? J a J a N e e j a N e e N e e J a N e e n < < < < Z ( σ ) Z ( σ ) Z ( σ ) Z ( s ) Z ( s ) - G e e n Z - G e e n Z - G e e n Z - W e l t a l s - W e l t - W e l t a l s 3 0 < n < < n < G e e n t - G e e n t a l s a l s n < 3 0 n < Hoofdstuk 4: Toetsen voor één populatie
30 T-TOETS VOOR HET GEMIDDELDE Opmerking: SPSS gaat ervan uit dat σ niet gekend is en voert steeds een t-toets uit (dus ook in situaties waar een Z-toets toegelaten is) Maar: de overschrijdingskansen bij een t-toets zijn groter dan bij een z-toets (zie ook dikkere staarten in t-verdeling in vergelijking met z-verdeling) Gevolg: H0 zal minder snel verworpen worden bij een t-toets in vergelijking met een z-toets: 1-β (P om H0 terecht te verwerpen - onderscheidingsvermogen) neemt af We krijgen dus minder snel een significant resultaat bij een t- toets in vergelijking met een z-toets. Daarom eventueel manuele Z-toets gebruiken als aan de voorwaarden is voldaan. 30 Hoofdstuk 4: Toetsen voor één populatie
31 T-TOETS VOOR HET GEMIDDELDE 3. Hypothesen Linkseenzijdig H0: µ µ0 H1: µ < µ0 Rechtseenzijdig H0: µ µ0 H1: µ > µ0 Tweezijdig H0: µ = µ0 H1: µ µ0 µ0 = veronderstelde waarde voor populatiegemiddelde µ 31 Hoofdstuk 4: Toetsen voor één populatie
32 T-TOETS VOOR HET GEMIDDELDE 4. Toetsingsgrootheid X 0 X s s N 0 t x N cfr. Z-toets maar s ipv σ Kansverdeling: Student t-verdeling Vrijheidsgraden: df = N-1 32 Hoofdstuk 4: Toetsen voor één populatie
33 T-TOETS VOOR HET GEMIDDELDE Student t-verdeling Lijkt sterk op de normale verdeling - Symmetrisch - Gemiddelde = 0 - Bij oneindig grote steekproef identiek William Gosset, zichtbaar tevreden met het ontdekken van de t-verdeling Verschillen: - Iets platter, dikkere staarten - Bepaald door grootte steekproef -> Meerdere t-verdelingen: parameter df 33 Hoofdstuk 4: Toetsen voor één populatie
34 T-TOETS VOOR HET GEMIDDELDE 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pl (t x) α? Pr (t x) α? Pd (t x) = 2*Pl (t x) α? (als X < μ) 2*Pr (t x) α? (als X > μ) >> linkseenzijdig >> rechtseenzijdig >> tweezijdig 34 Hoofdstuk 4: Toetsen voor één populatie
35 T-TOETS VOOR HET GEMIDDELDE Demo SPSS: metalfans en haarlengte Hebben metalfans langere haren dan de gemiddelde volwassene? (boek p76) Tests voor normaliteit: boek p Hoofdstuk 4: Toetsen voor één populatie
36 T-TOETS VOOR HET GEMIDDELDE 6. Effectgrootte 7. Rapporteren Om na te gaan of metalfans langere haren hebben dan de algemene bevolking werd een one sample t-test uitgevoerd. Gemiddeld hadden de metalfans uit de steekproef langere haren (M = 9.83, SD = 2.62) dan de referentiewaarde 8.9 uit de populatie, t(59) = 2.739, p =.008, r = Hoofdstuk 4: Toetsen voor één populatie
37 Χ²-TOETS VOOR FREQUENTIES Wat als niet voldaan is aan voorwaarden voor parametrisch toetsen bij bestuderen van 1 populatie? variabele niet normaal verdeeld in populatie? steekproef < 30? geen intervalvariabele? χ²-toets voor frequenties 37 Hoofdstuk 4: Toetsen voor één populatie
38 Χ²-TOETS VOOR FREQUENTIES 1. Toetsingssituatie Stemmen de geobserveerde frequenties in de steekproef overeen met de verwachte frequenties op basis van normen of eerder onderzoek? Vb. Stemmen de frequenties leerlingen die lezen op niveau AVI-2, AVI-3, AVI-4 en AVI-5 in het tweede leerjaar van een bepaalde school overeen met de frequenties van deze leesniveaus in de algemene bevolking? 2. Voorwaarden de categorieën waarvan de frequenties bestudeerd worden moeten elkaar uitsluiten. 20% of minder van de categorieën heeft een verwachte frequentie kleiner dan 5; geen enkele categorie heeft een verwachte frequentie van minder dan 1; ordinale variabelen worden beschouwd als nominale variabelen. 38 Hoofdstuk 4: Toetsen voor één populatie
39 Χ²-TOETS VOOR FREQUENTIES 3. Hypothesen Enkel tweezijdig! H 0 : π 1 = π 2 = = π k H 1 : niet H 0 Of H 0 : π 1 = π A ; π 2 = π B ; ; π k = π K H 1 : niet H 0 39 Hoofdstuk 4: Toetsen voor één populatie
40 Χ²-TOETS VOOR FREQUENTIES 4. Toetsingsgrootheid met df = k 1 f o = geobserveerde frequenties f e = verwachte frequenties k = aantal categorieën 40 Hoofdstuk 4: Toetsen voor één populatie
41 Χ²-TOETS VOOR FREQUENTIES 5. Beslissingsregels a. overschrijdingskansen maar χ²-verdeling afhankelijk van df, dus teveel mogelijkheden om te tabelleren, daarom: b. kritieke waarden 41 Hoofdstuk 4: Toetsen voor één populatie
42 Χ²-TOETS VOOR FREQUENTIES 6. Effectgrootte (phi) (interpreteerbaar zoals r) 7. Rapporteren Verwachte en geobserveerde proportie, X², df, p-waarde. 42 Hoofdstuk 4: Toetsen voor één populatie
43 Χ²-TOETS VOOR FREQUENTIES Demo SPSS: voorkeur vrijetijdsactiviteit bij senioren. Een gemoedelijke Duitse gemeente wil in het kader van de budgettering voor recreatie weten of de senioren in de gemeente een uitgesproken voorkeur hebben voor een bepaalde vrijetijdsactiviteit. Een steekproef van senioren wordt gevraagd een keuze te maken tussen wandelen, fietsen of rotsklimmen. 43 Hoofdstuk 4: Toetsen voor één populatie
44 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square Workshop Inductieve Statistiek 44
45 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Vb. Besteden jongens evenveel tijd aan hun huiswerk dan meisjes in de lagere school? Belangrijk: onafhankelijke steekproeven 2. Voorwaarden σ1 en σ2 zijn niet bekend en populaties zijn normaal verdeeld en n1 < 100 en n2 < 100 populaties zijn niet normaal verdeeld, 30 < n1 < 100 en 30 < n2 < Hoofdstuk 5: Twee gemiddelden
46 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN σ1 e n σ 2 b e k e n d? J a J a J a N e e N e e J a N e e N e e p o p u l a t i e s N v e r d e e l d? J a J a N e e J a N e e N e e J a N e e n 1 e n n < < < < Z ( σ ) Z ( σ ) Z ( σ ) Z ( s ) Z ( s ) - G e e n Z - G e e n Z - G e e n Z - W e l t a l s - W e l t - W e l t a l s 3 0 < n 1 < e n 3 0 < n 1 < e n 3 0 < n 2 < < n 2 < G e e n t a l s n 1 - G e e n t a l s n 1 o f n 2 < 3 0 o f n 2 < Hypothesen Linkseenzijdig H0: µ1 µ2 of H0: µ1 - µ2 0 H1: µ1 < µ2 H1: µ1 - µ2 < 0 Rechtseenzijdig H0: µ1 µ2 H0: µ1 - µ2 0 H1: µ1 > µ2 H1: µ1 - µ2 > 0 Tweezijdig H0: µ1 = µ2 H0: µ1 - µ2 = 0 H1: µ1 µ2 H0: µ1 - µ Hoofdstuk 5: Twee gemiddelden
47 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 2 varianten om de toetsingsgrootheid te berekenen: Variant 1: varianties in twee populaties zijn gelijk Variant 2: varianties in twee populaties zijn niet gelijk >> F-toets voor gelijke varianties wordt in SPSS vaak mee gerapporteerd bij andere toetsen (Levene s test bij t- test, ANOVA) 47 Hoofdstuk 5: Twee gemiddelden
48 F-TOETS VOOR 2 VARIANTIES 1. Toetsingssituatie Verschillen twee populatievarianties of niet? (als hulptoets bij t-toets, of op zichzelf) 2. Voorwaarden Populaties waaruit steekproeven komen zijn normaal verdeeld Indien n > 100 is het minder erg als populaties niet normaal verdeeld zijn In SPSS: Levene s test for equality of variances (ook F-toets) 3. Hypothesen Linkseenzijdig H0: σ²1 σ²2 of H0: σ²1 - σ²2 0 H1: σ²1 < σ²2 H1: σ²1 - σ²2 < 0 Rechtseenzijdig H0: σ²1 σ²2 H0: σ²1 σ²2 0 H1: σ²1 > σ²2 H1: σ²1 - σ²2 > 0 Tweezijdig H0: σ²1 = σ²2 H0: σ²1 σ²2 = 0 H1: σ²1 σ²2 H0: σ²1 σ² Hoofdstuk 5: Twee gemiddelden
49 F-TOETS VOOR 2 VARIANTIES 4. Toetsingsgrootheid F s² s² 1 2 met df1 = n1-1 en df2 = n2-1 opgelet: in teller altijd de grootste s² en in noemer altijd de kleinste s² F-toets: hoeveel maal is de grootste variantie groter dan de kleinste variantie? Indien H0 waar is zal F in de buurt van 1 liggen. Hoe groter F wordt, hoe aannemelijker dat de populatievarianties van elkaar verschillen. Kansverdeling: F-verdeling die bepaald wordt door df1 en df2 49 Hoofdstuk 5: Twee gemiddelden
50 F-TOETS VOOR 2 VARIANTIES F-verdeling die bepaald wordt door df1 en df2 vb: F = 10/9 = 1.11 met df1 = 6 en df2 = 12 P r (F = 1.11) = 0.41 F=1.11 Opgelet: niet symmetrisch! -> daarom altijd grootste S² in teller! 50 Hoofdstuk 5: Twee gemiddelden
51 F-TOETS VOOR 2 VARIANTIES 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pr (F) α? Pd (F) = 2*Pr (F) α? >> rechts/links eenzijdig >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α =.05 en df1 = 6 en df2 = 12. (Andere α of df -> andere kritieke waarden!!) F 3 F 3.7 >> rechts/links eenzijdig >> tweezijdig 51 Hoofdstuk 5: Twee gemiddelden
52 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN Variant 1: varianties in twee populaties zijn gelijk σ²1 = σ²2 Populatievarianties zijn onbekend en worden geschat op basis van de twee steekproefvarianties s²1 en s²2; namelijk een schatting op basis van een gewogen gemiddelde van s²1 en s²2 -> gepoolde variantie s²p s² p ( n 1 1) s² ( n 1 1 1) ( n 2 ( n 2 1) s² 1) 2 52 Hoofdstuk 5: Twee gemiddelden
53 De standaardafwijking van de steekproevenverdeling van het verschil tussen twee gemiddelden is gebaseerd op de gepoolde variantie s²p -> t-score voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties -> Kansverdeling: Student t-verdeling met df = n1+n2-2 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN ² ² n s n s s p p X X ² ² ) ( ) ( ) ( ) ( n s n s µ X X s X X t p p x x x x meestal 0 53 Hoofdstuk 5: Twee gemiddelden
54 Variant 2: varianties in twee populaties zijn niet gelijk We gebruiken geen gepoolde variantie (sp) maar de standaardafwijkingen in elke steekproef (s1 en s2) Kansverdeling: Student t-verdeling met vrijheidsgraden (schatting): T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN ² ² ) ( ) ( ) ( ) ( n s n s µ X X s X X t x x x x 1 ² 1 ² ² ² n n s n n s n s n s df 54 Hoofdstuk 5: Twee gemiddelden
55 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 5. Beslissingsregels a. overschrijdingskansen - H0 verwerpen indien: Pl (t x1-x2 ) α? Pr (t x1-x2 ) α? Pd (t x1-x2 ) α? >> linkseenzijdig >> rechtseenzijdig >> tweezijdig b. kritieke waarden : H0 verwerpen indien: vb. voor α =.05 en df = 17. (Andere α of df -> andere kritieke waarden!!) t x1-x >> linkseenzijdig t x1-x >> rechtseenzijdig t x1-x of 2.11 >> tweezijdig 55 Hoofdstuk 5: Twee gemiddelden
56 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 4. Significantie? kritieke t-waarde opzoeken in tabel -> df = = 21 en alpha = 0.05 en 2-zijdig -> t-score vergelijken met kritieke t-score > dus H0 niet verwerpen Besluit? 56 Hoofdstuk 5: Twee gemiddelden
57 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN IN SPSS Demo SPSS independent samples t-test Muziekvoorkeuren Waarom luisteren we liever naar onze favoriete muziek dan naar andere muziek? Dopamineproductie vergelijken bij luisteren naar favoriete vs niet-favoriete muziek. 57 Hoofdstuk 5: Twee gemiddelden
58 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN 6. Effectgrootte 7. Rapporteren Om na te gaan of er bij het luisteren naar favoriete muziek meer dopamine aanwezig is in de hersenen dan bij het luisteren naar nietfavoriete muziek, werd een independent samples t-test uitgevoerd. Gemiddeld werd er meer dopamine gemeten in de conditie met favoriete muziek (M = 16.03, SD = 2.66) dan in de conditie met nietfavoriete muziek (M = 13.96, SD = 2.94). Dit effect was significant op niveau α =.05, t(58) = 2.86, p =.006, r = Hoofdstuk 5: Twee gemiddelden
59 WILCOXON RANK-SUM / MANN- WHITNEY TOETS Verschil tussen 2 medianen ipv tussen 2 gemiddelden omdat variabele ook op ordinaal niveau kan gemeten worden 1. Toetsingssituatie Verschillen de scores in populatie 1 over het algemeen van de scores in populatie 2 waaruit de steekproeven afkomstig zijn? Vb. Verschillen mannen en vrouwen in opleidingsniveau ( = ordinale variabele)? = nonparametrische variant van onafhankelijke t-toets 2. Voorwaarden onafhankelijke steekproeven minstens ordinaal meetniveau scores hoeven niet normaal verdeeld te zijn 59 Hoofdstuk 5: Twee gemiddelden
60 WILCOXON RANK-SUM / MANN- WHITNEY TOETS 3. Hypotheses tweezijdig H 0 : θ 1 = θ 2 H1: θ 1 θ 2 rechtseenzijdig H 0 : θ 1 θ 2 H1: θ 1 > θ 2 linkseenzijdig H 0 : θ 1 θ 2 H1: θ 1 < θ 2 60 Hoofdstuk 5: Twee gemiddelden
61 WILCOXON RANK-SUM / MANN- WHITNEY TOETS 4. Toetsingsgrootheid U bij Mann-Whitney W bij Wilcoxon SPSS: Analyze > nonparametric > 2 independent samples 5. Beslissingsregel Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α? ja: verwerp H 0 nee: verwerp H 0 niet Ter herinnering: SPSS geeft 2-zijdige overschrijdingskans -> als je éénzijdige overschrijdingskans nodig hebt (omdat je links- of rechtszijdig wil toetsen): overschrijdingskans uit SPSS delen door 2 en kijken of dat getal α (bv. 0.05) 61 Hoofdstuk 5: Twee gemiddelden
62 WILCOXON RANK-SUM / MANN- WHITNEY TOETS 2 groepen vergelijken op basis van ordinale schaal Berekening van W: a. Scores ordenen en rangen toekennen: b. Rangensom per groep berekenen: groep 1: = 41.5 groep 2: = 36.5 c. Toetsingsgrootheid = kleinste rangensom: W s = 36.5 Score Groep Initiële rang Defintieve rang Hoofdstuk 5: Twee gemiddelden
63 WILCOXON RANK-SUM / MANN- WHITNEY TOETS d. W s omzetten naar z-score: wiskundige verwachting: standaarddeviatie: z-formule: overschrijdingskans: 63 Hoofdstuk 5: Twee gemiddelden
64 WILCOXON RANK-SUM / MANN- WHITNEY TOETS Demo SPSS Mann-Whitney / Wilcoxon Rank-Sum Voorkeur voor muziek meten aan de hand van ordinale schaal: Ik studeer nog liever drie dagen onophoudelijk inductieve statistiek dan hieraan deel te nemen Een documentaire over het paargedrag van de bidsprinkhaan lijkt me opwindender dan dit experiment Deelname aan dit experiment maakt me eigenlijk warm noch koud Het evenaart geen verjaardagsfeest, maar komt toch al in de buurt Ik heb me sinds mijn kindertijd niet meer zo gelukkig gevoeld 64 Hoofdstuk 5: Twee gemiddelden
65 WILCOXON RANK-SUM / MANN- WHITNEY TOETS 6. Effectgrootte 7. Rapportering Om na te gaan of het subjectief welbevinden van mensen groter is bij het luisteren naar favoriete muziek in tegenstelling tot niet-favoriete muziek werd een Mann-Whitney toets uitgevoerd. De score voor subjectief welbevinden was hoger in de conditie met favoriete muziek (Mdn = 4) dan in de conditie met niet-favoriete muziek (Mdn = 3). Dit verschil was significant op α =.05-niveau, W s = 167.5, z = , p =.006, r = Hoofdstuk 5: Twee gemiddelden
66 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square Workshop Inductieve Statistiek 66
67 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Belangrijk: afhankelijke steekproeven zoals bij herhaalde metingen, gematchte steekproeven 2. Voorwaarden steekproeven zijn afhankelijk populaties zijn normaal verdeeld Indien populaties niet normaal zijn verdeeld moet n1 > 30 en n2 > 30 (dus het aantal paren moet > 30) 67 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
68 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN σ e n σ 2 b e k e n d? J a J a J a N e e N e e J a N e e N e e p o p u l a t i e s N v e r d e e l d? J a J a N e e J a N e e N e e J a N e e n 1 e n n < < < < t t t t t - w e l t a l s n 1 t - w e l t a l s n 1 e n n 2 > 3 0 e n n 2 > g e e n t a l s - g e e n t a l s n 1 e n n 2 < n 1 e n n 2 < Hypothesen V = verschil per paar (steekproef1 steekproef2) Linkseenzijdig H0: µv 0 H1: µv < 0 Rechtseenzijdig H0: µv 0 H1: µv > 0 Tweezijdig H0: µv = 0 H1: µv 0 68 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
69 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 4. Toetsingsgrootheid t-score van het gemiddelde verschil v t v V s v v n aantal paren standaarddeviatie van de verschilscores gemiddelde verschil veronderstelde gemiddelde verschil tussen 2 steekproeven populaties Kansverdeling? Student t-verdeling met df = n-1 69 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
70 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 4. t score berekenen Score op test P voor na Verschil(voor-na) V =.5569 sv =.6023 t Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
71 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN Voorbeeld: ratten en tinnitus in SPSS Onderzoeksvraag: kunnen ratten door herprogrammeren van neuronen in de auditieve cortex van hun tinnitus verlost worden? 17 ratten worden voor en na het toepassen van de techniek getest. De afhankelijke variabele wordt bepaald door het aantal fouten dat de ratten maken in het onderscheiden van tonen, en wordt gemeten op intervalniveau. Navzer D. Engineer, Jonathan R. Riley, Jonathan D. Seale, Will A. Vrana, Jai A. Shetake, Sindhu P. Sudanagunta, Michael S. Borland, Michael P. Kilgard. Reversing pathological neural activity using targeted plasticity.nature, 2011; DOI: /nature Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
72 T-TOETS VOOR VERSCHIL TUSSEN 2 GEMIDDELDEN, AFH. STEEKPROEVEN 6. Effectgrootte 7. Rapporteren Om na te gaan of de ratten beter presteerden op de frequentie-test na de behandeling werd een t-test voor afhankelijke steekproeven uitgevoerd. De ratten maakten significant minder fouten na (M = 3.41, SD =.69) dan voor de behandeling (M = 3.97, SD =.43), t(16) = 3.814, p =.002, r = Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
73 WILCOXON RANGTEKENTOETS 1. Toetsingssituatie Verschilt het gemiddelde in populatie 1 van het gemiddelde in populatie 2 waaruit de steekproeven afkomstig zijn? Belangrijk: afhankelijke steekproeven (zie les over steekproeven) zoals bij herhaalde metingen, gematchte steekproeven = nonparametrische variant van afhankelijke t-toets 2. Voorwaarden afhankelijke steekproeven minstens ordinaal meetniveau (achterliggende variabele is continu) scores hoeven niet normaal verdeeld te zijn 73 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
74 WILCOXON RANGTEKENTOETS 3. Hypotheses V = verschil binnen elk paar scores Linkseenzijdig H0: θv 0 H1: θv < 0 Rechtseenzijdig H0: θv 0 H1: θv > 0 Tweezijdig H0: θv = 0 H1: θv 0 concentratiescores hoger op woensdag dan op vrijdag? H1: woensdag - vrijdag > 0 of θv > 0 H0: woensdag vrijdag 0 of θv 0 74 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
75 WILCOXON RANGTEKENTOETS 4. Toetsingsgrootheid vrijdag woensdag verschil verschil rang Rang + Rang tie tie Toetsingsgrootheid = kleinste rangensom, hier: T - = 1 75 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
76 WILCOXON RANGTEKENTOETS 5. Beslissingsregel overschrijdingskansen met z-toets z T = T T = T n(n+1) 4 SE n n+1 (2n+1) 24 = 1 8(8+1) (16+1) 24 = =-2.38 met: T = kleinste van rangensommen n = aantal paren aantal ties 76 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
77 WILCOXON RANGTEKENTOETS Demo SPSS: concentratiescores woensdag versus vrijdag Berekenen van de medianen via Analyze > Descriptive statistics > Frequencies > Statistics 77 Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
78 WILCOXON RANGTEKENTOETS 6. Effectgrootte Opgelet: N = totaal aantal observaties, niet aantal paren! 7. Rapporteren Om na te gaan of de concentratiescores variëren in functie van het moment in de week werd een Wilcoxon signed rank toets uitgevoerd. De scores waren significant hoger op vrijdag (Mdn = 33.5) dan op woensdag (Mdn = 18), z = -2.39, p =.017, r = Hoofdstuk 6: Twee gemiddelden uit afhankelijke steekproeven
79 OEFENINGEN Handboek H4: 3 & 4 H5: 2 & 3 H6: 3
80 Variantieanalyse: one- en two-way ANOVA & Kruskal-Wallis
81 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square Hoofdstuk 7: Variantieanalyse 81
82 VARIANTIEANALYSE Toetsen voor verschillen tussen meer dan 2 gemiddelden - is er een verschil in het welbevinden van kinderen met ouders die autoritair, autoritatief of permissief opvoeden? -> telkens 1 OV (vb. opvoedingsstijl) met telkens meer dan 2 waarden (vb. 3) -> telkens 1 AV (vb. welbevinden) eenwegs ( one way ) variantie-analyse ( ANOVA ) Bij twee OV: tweewegs ( two way ) variantie analyse (zie volgende les) Bij meer dan één AV: MANOVA (niet in Statistiek II) 82 Hoofdstuk 7: Variantieanalyse
83 VARIANTIEANALYSE 1. Toetsingssituatie Is er een verschil in gemiddelde tussen groep a, b, c, op variabele Y? of Is er een effect van variabele X (met niveau s a, b, c,..) op variabele Y? en: Indien er een effect is, tussen welke groepen is er een verschil? (= post hoc toetsing) 83 Hoofdstuk 7: Variantieanalyse
84 VARIANTIEANALYSE 2. Voorwaarden AV is gemeten op intervalniveau OV wordt als nominaal beschouwd (ook al is OV soms ordinaal) scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke populatie groter dan 30 varianties in populaties zijn gelijk (homogeniteit) onafhankelijke steekproeven Assumptie van normaliteit en homogeniteit minder strikt bij gelijke steekproeven 84 Hoofdstuk 7: Variantieanalyse
85 VARIANTIEANALYSE 3. Hypothesen H0: alle populatiegemiddelden zijn aan elkaar gelijk: µa = µb = µc = = µj als er J populaties zijn H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µj µj voor minstens één paar van j en j Dus H1 is NIET µa µb µc µj H0 wordt getoetst door gebruik te maken van varianties: De tussen-groeps-variantie of between-groups variance mean square between (MSb) De binnen-groeps-variantie of within-groups variance mean square within (MSw) 85 Hoofdstuk 7: Variantieanalyse
86 VARIANTIEANALYSE Within groups 86 Hoofdstuk 7: Variantieanalyse
87 VARIANTIEANALYSE Between groups Within groups 87 Hoofdstuk 7: Variantieanalyse
88 VARIANTIEANALYSE Between groups Within groups Wanneer de verschillen tussen groepsgemiddelden groter worden en de verschillen binnen elke groep ongeveer hetzelfde blijven wordt de betweengroups variantie groter ten opzichte van de within-groups varianties. Dus: de verhouding between-groups variantie/within-groups variantie zegt iets over het verschil tussen groepsgemiddelden. 88 Hoofdstuk 7: Variantieanalyse
89 VARIANTIEANALYSE Between groups Within groups 89 Hoofdstuk 7: Variantieanalyse
90 VARIANTIEANALYSE MS w = verschillen te wijten aan verschillen tussen personen binnen dezelfde groep = inter-individuele verschillen die niet te wijten zijn aan het effect van de OV = foutenvariantie (var fout ) MS b = variantie van groepsgemiddelden + variantie van scores rondom groepsgemiddelden = variantie van de effecten van OV (var effect ) + foutenvariantie (var fout ) MS w = var fout MS b = var effect + var fout 90 Hoofdstuk 7: Variantieanalyse
91 VARIANTIEANALYSE MS b = var effect + var fout MS w = var fout -> ALS H0 waar is, dwz. var effect zeer klein is of gelijk is aan 0 DAN: MSb = MSw of MSb / MSw = 1 -> ALS H0 niet waar is, dwz. var effect verschilt van 0 DAN: MSb > MSw of MSb / MSw > 1 91 Hoofdstuk 7: Variantieanalyse
92 VARIANTIEANALYSE 4. Toetsingsgrootheid F MS MS b w SS SS b w / / df df b w Df b = J 1 (J =aantal groepen) Df w = N J (N = totaal aantal waarnemingen; J = aantal groepen) Kansverdeling: F-verdeling (zie bijlage) Vb / 2 F / Met df b = 3 1 = 2 en df w = 27 3 = Hoofdstuk 7: Variantieanalyse
93 VARIANTIEANALYSE 5. Beslissingsregels a. Overschrijdingskansen (niet in tabel) Is P r (F) α? ja, verwerp H0 neen, verwerp H0 niet Vb. P r (F = 7.13) = voor df b = 2, df w= 24 P r (= ) < 0.05 dus H0 verwerpen 93 Hoofdstuk 7: Variantieanalyse
94 VARIANTIEANALYSE b. kritieke waarden Is F kritieke F waarde bij df teller = df b = J 1 df noemer = df w = N - J ja, verwerp H0 neen, verwerp H0 niet kritieke F waarde df b = 2, df w= 24 bij alpha = 0.05 = 3.4 (zie tabel) F (7.13) > Fkritiek (3.4) dus H0 verwerpen 94 Hoofdstuk 7: Variantieanalyse
95 VARIANTIEANALYSE ANOVA TOETSGEG Between Groups Within Groups Total Sum of Squares df Mean Square F Sig. 39, , 677 7, 126,004 66, , , Hoofdstuk 7: Variantieanalyse
96 VARIANTIEANALYSE Wanneer H0 verworpen is weten we dat minstens 2 groepen verschillen mbt. hun gemiddelde -> welke groepen? = post-hoc toetsing We zouden via t-toetsen elk paar van groepen met elkaar kunnen vergelijken (vb. groep 1-2, 2-3, 1-3). Bij elke t-toets gebruiken we een α = Probleem: door herhaaldelijk t-toetsen uit te voeren neemt de fout van de 1e soort toe. Oplossing: bij posthoc toetsing corrigeren voor deze hogere kans op fouten van de 1e soort. >> Bonferroni correctie: wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P 0.05/3 (ipv. 0.05) (andere mogelijke correcties: Tukey, Scheffé,...) 96 Hoofdstuk 7: Variantieanalyse
97 VARIANTIEANALYSE Post-hoc toetsing in SPSS: Dependent Variable: TOETSGEG Bonferroni Multiple Comparisons (I) GROEP 1,00 2,00 3,00 (J) GROEP 2,00 3,00 1,00 3,00 1,00 2,00 Mean Difference 95% Confidence Interval (I-J) Std. Error Sig. Lower Bound Upper Bound -1,2667,76353,330-3,2317,6984 *. The mean difference is significant at the.05 level. -3,0417*,80747,003-5,1198 -,9635 1,2667,76353,330 -,6984 3,2317-1,7750,78824,101-3,8037,2537 3,0417*,80747,003,9635 5,1198 1,7750,78824,101 -,2537 3,8037 SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd. Als P 0.05 dan is er een significant verschil tussen beide groepen vb. enkel significant verschil ts. Groep Hoofdstuk 7: Variantieanalyse
98 VARIANTIEANALYSE Voorbeeld ANOVA in SPSS: stressreductie door chocolade bij dansers 98 Hoofdstuk 7: Variantieanalyse
99 VARIANTIEANALYSE 6. Effectgrootte stress ANOVA Sum of df Mean Square F Sig. r = SS between SS total Squares Between Groups 714, ,245 3,136,048 Within Groups 11277, ,914 Total 11991, r = ,961 = = Rapportering Er was een significant effect van chocolade op het stressniveau van de dansers, F(2, 99) = 3.14, p =.048, r =.24. De dansers die geen chocolade aten rapporteerden een hoger stressniveau (M = 65.5, SD = 10.54) dan dansers die twee repen chocolade aten (M = 59.12, SD = 12.27). Het stressniveau van de dansers die één reep chocolade aten (M = 61.32, SD = 8.95) verschilde niet significant van de andere condities. 99 Hoofdstuk 7: Variantieanalyse
100 Variantieanalyse: two way ANOVA
101 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square
102 TWEEWEGS-VARIANTIEANALYSE Twee vragen: 1. vraag over hoofdeffect van elke OV op AV 2. vraag over interactie-effect tussen OV1 en OV2 op AV hoe hebben de twee OV s samen in combinatie een effect op AV? is het effect van de ene OV op AV anders naargelang het niveau van de andere OV? - is het effect van ses op toekomstbeeld anders voor jongens dan voor meisjes? - is het effect van chocolade op stressreductie anders voor beginners dan voor gevorderden? 102 Hoofdstuk 7: Variantieanalyse
103 TWEEWEGS-VARIANTIEANALYSE 1. Toetsingssituatie a. Is er een effect van variabele A (met niveaus a1, a2, ) op variabele Y? b. Is er een effect van variabele B (met niveaus b1, b2, ) op variabele Y? = 2 hoofdeffecten c. Is het effect van variabele A anders naargelang het niveau van variabele B (of omgekeerd)? Wat is het effect van de combinatie van A en B op Y? = interactie-effect tussen A en B d. Indien er een hoofdeffect is van A, tussen welke groepen van A is er een verschil? e. Indien er een hoofdeffect is van B, tussen welke groepen van B is er een verschil? = post hoc toetsing 103 Hoofdstuk 7: Variantieanalyse
104 TWEEWEGS-VARIANTIEANALYSE 2. Voorwaarden AV is gemeten op intervalniveau OV s worden als nominaal beschouwd (ook al is OV soms ordinaal) scores van AV zijn in alle populaties normaal verdeeld varianties in populaties zijn gelijk (F-toets of Levene s toets) onafhankelijke steekproeven 104 Hoofdstuk 7: Variantieanalyse
105 Toekomstbeeld TWEEWEGS-VARIANTIEANALYSE 3. Hypothesen Wat is het effect van ses en geslacht op de toekomstverwachting van jongeren? OV1 (A) = ses (laag, midden, hoog) OV2 (B) = geslacht (jongens, meisje) AV = toekomstbeeld score ts. -10 en +10 -> 3 x 2 design (dus 6 populaties - zie les 2: waarden van OV bepalen aantal populaties) a. Is er een hoofdeffect van variabele A (met i niveaus)? H0: alle populatiegemiddelden van A zijn aan elkaar gelijk µ1 = µ2 = µ3 = = µi als er I groepen zijn van A H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µi µi voor minstens één paar van i en i Of in termen van varianties H0: σ²a = σ²w of σ²a / σ²w = 1 H1: σ²a > σ²w of σ²a / σ²w > laag midden hoog SES 105 Hoofdstuk 7: Variantieanalyse
106 Toekomstbeeld TWEEWEGS-VARIANTIEANALYSE b. Is er een hoofdeffect van variabele B (met j niveaus)? H0: alle populatiegemiddelden van B zijn aan elkaar gelijk µ1 = µ2 = µ3 = = µj als er J groepen zijn van B H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µj µj voor minstens één paar van j en j Of in termen van varianties H0: σ²b = σ²w of σ²b / σ²w = 1 H1: σ²b > σ²w of σ²b / σ²w > jongens geslacht meisjes 106 Hoofdstuk 7: Variantieanalyse
107 Toekomstbeeld TWEEWEGS-VARIANTIEANALYSE c. Is er een interactie-effect van variabele AxB? H0: alle populatiegemiddelden van combinatie AxB zijn aan elkaar gelijk: µ11 = µ12 = = µij als er I x J groepen zijn H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar µij µi j voor minstens één paar van ij en i j Of in termen van varianties H0: σ²axb = σ²w of σ²axb / σ²w = 1 H1: σ²axb > σ²w of σ²axb / σ²w > laag midden hoog SES jongens meisjes 107 Hoofdstuk 7: Variantieanalyse
108 TWEEWEGS-VARIANTIEANALYSE 4. Toetsingsgrootheid 4.1 F toets voor hoofdeffect van A F A MS MS A W SS SS A W / df / df A W met dfa = I 1 (I = aantal niveaus van A) met dfw = N (I x J) (N = totaal aantal ) vb. FA = 10/2.02 = 4.95 met dfa = 2 dfw = F toets voor hoofdeffect van B F B MS MS B W SS SS B W / df / df B W met dfb = J 1 (J = aantal niveaus van B) met dfw = N (I x J) (N = totaal aantal ) vb. FB = 0.53/2.02 = 0.26 met dfb = 1 dfw = F toets voor interactie-effect van AxB F AxB MS MS AxB W SS SS AxB W / df / df AxB W met dfaxb = (I - 1). (J 1) met dfw = N (I x J) (N = totaal aantal) vb. FAxB = 30.54/2.02 = met dfaxb = 2 dfw = Hoofdstuk 7: Variantieanalyse
109 TWEEWEGS-VARIANTIEANALYSE 5. Beslissingsregels a. Overschrijdingskansen Is P r (F) α? ja, verwerp H0 neen, verwerp H0 niet >> overschrijdingskans per mogelijk effect (hoofd / interactie) in ANOVA-tabel SPSS b. Kritieke waarden Ook mogelijk via tabel met F-waarden. 109 Hoofdstuk 7: Variantieanalyse
110 TWEEWEGS-VARIANTIEANALYSE significant hoofdeffect ses: jongens en meisjes samengenomen is er een effect van ses geen significant hoofdeffect geslacht: 3 ses niveaus samengenomen is er geen significant verschil tussen j en m een interactie-effect: het verschil ts. j en m is niet hetzelfde voor alle niveaus van ses >> post-hoc toetsing nodig om te weten tussen welke groepen er een verschil is. (SPSS) 110 Hoofdstuk 7: Variantieanalyse
111 Toekomstbeeld Toekomstbeeld Toekomstbeeld TWEEWEGS-VARIANTIEANALYSE hoofdeffect SES interactie effect laag midden hoog SES ses laag midden hoog jongens 5,6 5,6 4,2 5,13 meisjes 2,4 4,4 7,8 4, laag midden hoog jongens meisjes SES geen hoofdeffect geslacht interactie-effect: het verschil ts. jongens en meisjes is niet hetzelfde voor alle niveaus van ses (lijnen lopen niet parallel) 0 jongens meisjes geslacht 111 Hoofdstuk 7: Variantieanalyse
112 TWEEWEGS-VARIANTIEANALYSE Post hoc analyse bij two-way ANOVA: Zie post-hoc bij one-way ANOVA: niveaus binnen 1 OV vergelijken. ses laag midden hoog jongens 5,6 5,6 4,2 5,13 meisjes 2,4 4,4 7,8 4, (overbodig als er maar 2 niveaus zijn bv. geslacht. Kijk dan naar gemiddeldentabel) Om alle cellen paarsgewijs te vergelijken: simple effects enkel met SPSS syntax (zie boek p. 163) ses laag midden hoog jongens 5,6 5,6 4,2 5,13 meisjes 2,4 4,4 7,8 4, Hoofdstuk 7: Variantieanalyse
113 TWEEWEGS-VARIANTIEANALYSE 6. Effectgrootte Partial Eta squared: interpreteerbaar zoals r te berekenen met SPSS Via ANOVA-dialoogbox > options > estimates of effect size aanvinken 113 Hoofdstuk 7: Variantieanalyse
114 TWEEWEGS-VARIANTIEANALYSE Demo two-way ANOVA: effect van chocolade én dansniveau op stress? 114 Hoofdstuk 7: Variantieanalyse
115 TWEEWEGS-VARIANTIEANALYSE 7. Rapportering Eerst de potentiële hoofdeffecten bespreken (zie one-way ANOVA, inclusief eventuele post-hoc) gegevens: gemiddelden, SD, F-waarde, p-waarde, r Daarna potentieel interactie-effect, zelfde gegevens. Hoofdeffecten zijn niet meer relevant als er een interactie-effect is, maar moeten wel gerapporteerd worden. Interpretatie van de resultaten gaat enkel over interactie-effect. 115 Hoofdstuk 7: Variantieanalyse
116 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square Hoofdstuk 7: Variantieanalyse 116
117 KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES 1. Toetsingssituatie Is er een verschil in gemiddelde tussen groep a, b, c, op variabele Y? >> zelfde situatie als eenwegs-variantieanalyse. 2. Voorwaarden AV is niet normaal verdeeld en/of AV is van ordinaal meetniveau Chocolade als afrodisiacum? Gemeten met: Seks is absoluut het allerlaatste waar ik nu aan kan denken. Ik ervaar niet meer of minder zin in seks dan op een doordeweekse dag. Ik voel een onwaarschijnlijke lust tot paren annuleer de voorstelling! 117 Hoofdstuk 7: Variantieanalyse
118 KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES 3. Hypothesen H0: θ1 = θ2 = = θk H1= niet H0 bij k niveaus van de OV 4. Toetsingsgrootheid Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H >> analyze > non-parametric > legacy dialogs > k independent samples (zie boek 7.3.4) 118 Hoofdstuk 7: Variantieanalyse
119 KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES 5. Beslissingsregel Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α? ja > verwerp H0 nee > verwerp H0 niet Is er een effect? post-hoc toetsen met meerdere Mann-Whitney/Wilcoxon Rank-Sum. Gebruik zo weinig mogelijk tests en hanteer Bonferroni-correctie: α / aantal tests. 119 Hoofdstuk 7: Variantieanalyse
120 KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES Demo Kruskal-Wallis: chocolade als afrodisiacum? OV : 3 niveaus chocolade geen, één reep, twee repen AV: ordinale schaal met 3 niveaus 120 Hoofdstuk 7: Variantieanalyse
121 KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES 6. Effectgrootte Geen effectgrootte voor K-W test algemeen Wel effectgrootte van bijhorende Mann-Whitney tests zie H5 Test Statistics a lust Mann-Whitney U 359,500 Wilcoxon W 954,500 Z -2,976 Asymp. Sig. (2-tailed),003 a. Grouping Variable: chocolade 121 Hoofdstuk 7: Variantieanalyse
122 KRUSKAL-WALLIS TOETS VOOR VERSCHIL TUSSEN K POPULATIES 7. Rapportering Een Kruskal-Wallis toets werd uitgevoerd om het effect van het eten van chocolade op de lustgevoelens van dansers na te gaan. Dit effect bleek inderdaad significant, H = 8.71, p =.013. Bijkomend werden de condities zonder chocolade (mean rank = 41), met één reep chocolade (mean rank = 59.91) en twee repen chocolade (mean rank = 53.59) onderling vergeleken door middel van een Wilcoxon rank-sum toets, waarbij een gecorrigeerd significantieniveau van α =.017 werd gehanteerd. Hieruit bleek dat er enkel een significant verschil was tussen de conditie zonder chocolade en de conditie met één reep chocolade (W s = 954.5, z = , p =.003, r = -.36). Het verschil tussen de conditie zonder chocolade en de conditie met twee repen chocolade (W s = , z = , p =.06, r = -.23) noch het verschil tussen de conditie met één reep chocolade en de conditie met twee repen chocolade (W s = , z = -.917, p =.36, r = -.11) waren significant. 122 Hoofdstuk 7: Variantieanalyse
123 Variantieanalyse bij herhaalde metingen
124 HERHAALDE METINGEN ANOVA De motivatie van 17 voetbalspeelsters wordt gemeten op drie momenten in het voetbalseizoen. We willen nagaan of de motivatie eerder stijgt dan wel daalt door de strenge behandeling door de coach. Jarmila Kratochvilova, in haar eigen glorietijd bij de Tsjechische nationale atletiekploeg. 124 Hoofdstuk 8: Variantieanalyse herhaalde metingen
125 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square Hoofdstuk 8: Variantieanalyse herhaalde metingen
126 HERHAALDE METINGEN ANOVA 1. Toetsingssituatie Is er een verschil in gemiddelde tussen metingen 1, 2, 3, van variabele Y? of Is er een effect van variabele X (metingen 1, 2, 3,..) op variabele Y? en: Indien er een effect is, tussen welke metingen is er een verschil? (= post hoc toetsing) 126 Hoofdstuk 8: Variantieanalyse herhaalde metingen
127 HERHAALDE METINGEN ANOVA 2. Voorwaarden AV is gemeten op intervalniveau scores van AV zijn in elke populatie normaal verdeeld of aantal deelnemers is in elke steekproef groter dan 30 OV wordt als nominaal beschouwd (ook al is OV soms ordinaal) afhankelijke steekproeven voldaan aan sfericiteits-eis 127 Hoofdstuk 8: Variantieanalyse herhaalde metingen
128 HERHAALDE METINGEN ANOVA Sfericiteit? Varianties van verschilscores moeten ongeveer gelijk zijn aan elkaar: Meting 1 Meting 2 Meting 3 Verschil 1-2 Verschil 1-3 Verschil Variantie Mauchly s test + eventuele correctie 128 Hoofdstuk 8: Variantieanalyse herhaalde metingen
129 HERHAALDE METINGEN ANOVA 3. Hypothesen H0: alle populatiegemiddelden zijn aan elkaar gelijk: H1: minstens twee populatiegemiddelden zijn niet gelijk aan elkaar tweezijdig H 0 : μ 1 = μ 2 = = μ j H 1 : μ i μ j voor minstens 1 paar van i en j Dus H1 is NIET µa µb µc µj 129 Hoofdstuk 8: Variantieanalyse herhaalde metingen
130 HERHAALDE METINGEN ANOVA 4. Prinicipe Opnieuw vergelijken van effectvariantie met foutenvariantie, maar nu zit de effectvariantie in de within groups variantie! 130 Hoofdstuk 8: Variantieanalyse herhaalde metingen
131 HERHAALDE METINGEN ANOVA 131 Hoofdstuk 8: Variantieanalyse herhaalde metingen
132 HERHAALDE METINGEN ANOVA 132 Hoofdstuk 8: Variantieanalyse herhaalde metingen
133 HERHAALDE METINGEN ANOVA 5. Beslissingsregels a. Overschrijdingskansen (niet in tabel) Is P (F) α? ja, verwerp H0 neen, verwerp H0 niet Vb. P (F = 7.13) = voor df m = 2, df error = 24 P (= ) < 0.05 dus H0 verwerpen 133 Hoofdstuk 8: Variantieanalyse herhaalde metingen
134 HERHAALDE METINGEN ANOVA 5. Beslissingsregels b. kritieke waarden Is F kritieke F waarde bij df teller = df m = k 1 df noemer = df error = df w - df m ja, verwerp H0 neen, verwerp H0 niet kritieke F waarde df b = 2, df w= 24 bij alpha = 0.05 = 3.4 (zie tabel) F (7.13) > F kritiek (3.4) dus H0 verwerpen 134 Hoofdstuk 8: Variantieanalyse herhaalde metingen
135 HERHAALDE METINGEN ANOVA Tests of Within-Subjects Effects Measure: motivatie Source Type III Sum of Squares df Mean Square F Sig. Partial Eta Squared moment Sphericity Assumed 426, ,152 5,271,009,201 Greenhouse-Geisser 426,303 1, ,939 5,271,013,201 Huynh-Feldt 426,303 1, ,663 5,271,011,201 Lower-bound 426,303 1, ,303 5,271,032,201 Error(moment) Sphericity Assumed 1698, ,437 Greenhouse-Geisser 1698,364 35,534 47,796 Huynh-Feldt 1698,364 38,313 44,329 Lower-bound 1698,364 21,000 80, Hoofdstuk 8: Variantieanalyse herhaalde metingen
136 HERHAALDE METINGEN ANOVA Wanneer H0 verworpen is weten we dat minstens 2 metingen verschillen mbt. hun gemiddelde -> welke metingen? = post-hoc toetsing Zelfde probleem als bij one-way ANOVA voor herhaalde toetsen, dus opnieuw corrigeren voor verhoogde kans op Type 1-fout. >> Bonferroni correctie (wanneer we drie groepen vergelijken, alleen besluiten dat er een significant verschil is als P 0.05/3) 136 Hoofdstuk 8: Variantieanalyse herhaalde metingen
137 HERHAALDE METINGEN ANOVA Measure: motivatie Pairwise Comparisons (I) moment (J) moment Mean Difference (I-J) Std. Error Sig. b 95% Confidence Interval for Difference b Lower Bound Upper Bound 1 2 2,455 2,175,815-3,203 8, ,182 * 2,038,019,880 11, ,455 2,175,815-8,112 3, ,727 1,464,056 -,081 7, ,182 * 2,038,019-11,484 -, ,727 1,464,056-7,536,081 Based on estimated marginal means *. The mean difference is significant at the,05 level. b. Adjustment for multiple comparisons: Bonferroni. SPSS output houdt al rekening met deze correctie; dus de P waarden zijn al gecorrigeerd. Als P 0.05 dan is er een significant verschil tussen beide groepen vb. enkel significant verschil ts. Groep Hoofdstuk 8: Variantieanalyse herhaalde metingen
138 HERHAALDE METINGEN ANOVA Voorbeeld ANOVA in SPSS: motivatie van voetbalspeelsters op drie meetmomenten Aandacht voor correcte invoer van data! 138 Hoofdstuk 8: Variantieanalyse herhaalde metingen
139 HERHAALDE METINGEN ANOVA 6. Effectgrootte Partial Eta squared: η² interpreteerbaar zoals r te berekenen met SPSS Via ANOVA-dialoogbox > options > estimates of effect size aanvinken 139 Hoofdstuk 8: Variantieanalyse herhaalde metingen
140 HERHAALDE METINGEN ANOVA 7. Rapportering Om na te gaan of de coachingmethode een effect heeft op de motivatie van de speelsters werd een repeated measures ANOVA uitgevoerd. Hieruit bleek dat er een significant effect van meetmoment op de motivatie was, F(2, 42) = 5.27, p =.009, η² =.201. In het begin van het voetbalseizoen was de motivatie van de speelsters hoger (M = 47.64, SD = 6.81) dan op het einde van het seizoen (M = 41.45, SD = 5.40, p =.019). Ook vlak na de winterstop was de motivatie van de speelsters hoger (M = 45.18, SD = 5.15) dan op het einde van het seizoen, maar dit verschil benaderde slechts significantie, p = Hoofdstuk 8: Variantieanalyse herhaalde metingen
141 FRIEDMAN S ANOVA 1. Toetsingssituatie Is er een verschil in gemiddelde tussen metingen 1, 2, 3, van variabele Y? >> zelfde situatie als herhaalde metingen-variantieanalyse. 2. Voorwaarden AV is niet normaal verdeeld en/of AV is van ordinaal meetniveau Evaluatie van de coach in onderzoek van Evelien: Op een schaal van 1 tot 10, hoe sterk wens je de coach op dit moment enkele bijzonder pijnlijke eksterogen toe? 141 Hoofdstuk 8: Variantieanalyse herhaalde metingen
142 type AV? aantal OV? type OV? hoeveel populaties? categorieën afhankelijk? parametrisch non-parametrisch niet in dit boek 1 one sample t-test / z-test chi-square goodness of fit nominaal 2 onafh. afh. independent t-test / z-test dependent t-test Rank-sum Signed-ranks 1 > 2 onafh. afh. one way ANOVA repeated measures ANOVA Kruskal-Wallis Friedman s ANOVA interval/ ordinaal interval/ ordinaal Pearson correlation Spearman correlation nominaal onafh. afh. gemengd n-way ANOVA repeated measures ANOVA mixed design ANOVA > 1 interval multiple regression gemengd multiple regression nominaal 1 nominaal/ ordinaal 1 2 onafh. onafh. chi-square goodness of fit Pearson chi-square Hoofdstuk 8: Variantieanalyse herhaalde metingen
143 FRIEDMAN S ANOVA 3. Hypothesen H0: θ1 = θ2 = = θk H1: θ i θ j voor minstens 1 paar van i en j bij k niveaus van de OV 4. Toetsingsgrootheid Gebaseerd op rangordening zoals bij Mann-Whitney, grootheid = H >> analyze > non-parametric > legacy dialogs > k independent samples (zie boek 7.3.4) 143 Hoofdstuk 8: Variantieanalyse herhaalde metingen
144 FRIEDMAN S ANOVA 4. Toetsingsgrootheid Rangordening zoals bij Kruskal-Wallis, maar ordenen per deelnemer ipv groep speelster moment 1 moment 2 moment 3 moment 1 moment 2 moment R i R = de rangensom voor moment/conditie i N = totale steekproefgrootte k = aantal meetmomenten/condities 144 Hoofdstuk 8: Variantieanalyse herhaalde metingen
145 FRIEDMAN S ANOVA 5. Beslissingsregel a. Is de gerapporteerde overschrijdingskans in SPSS kleiner dan α? ja > verwerp H0 nee > verwerp H0 niet b. Is F r groter dan de kritieke X²-waarde? (df = k 1) ja > verwerp H0 nee > verwerp H0 niet Is er een effect? post-hoc toetsen met meerdere Wilcoxon Signed-Rank toetsen. Gebruik zo weinig mogelijk toetsen en hanteer Bonferronicorrectie: α / aantal tests. 145 Hoofdstuk 8: Variantieanalyse herhaalde metingen
146 FRIEDMAN S ANOVA Demo Friedman s ANOVA: evaluatie van de coach OV : meetmoment in het seizoen AV: haatgevoelens t.o.v. de coach 146 Hoofdstuk 8: Variantieanalyse herhaalde metingen
147 FRIEDMAN S ANOVA 6. Effectgrootte Geen effectgrootte voor Friedman s toets Wel effectgrootte voor eventuele Wilcoxon Signed-rank toetsen (zie H6) 147 Hoofdstuk 8: Variantieanalyse herhaalde metingen
148 FRIEDMAN S ANOVA 7. Rapportering Friedman s ANOVA werd uitgevoerd om het effect van de coachingmethode op de haatgevoelens tegenover de coach na te gaan. Dit effect bleek inderdaad significant, F = 18.87, p <.001. Bijkomend werden paarsgewijze Wilcoxon signed-rank toetsen uitgevoerd om de metingen bij de start van het seizoen (mean rank = 1.34), vlak na de winterstop (mean rank = 2.23) en op het einde van het seizoen (mean rank = 2.43) onderling te vergelijken. Hierbij werd een gecorrigeerd significantieniveau van α =.017 gehanteerd. Uit deze post hoc toetsen bleken significante verschillen tussen de haatgevoelens bij de start van het seizoen en vlak na de winterstop (z = , p <.001, r = -.52) alsook tussen de haatgevoelens bij de start van het seizoen en op het einde van het seizoen (z = -3.42, p <.001, r = -.51). Er was geen significant verschil tussen de haatgevoelens vlak na de winterstop en op het einde van het seizoen (z = 1.58, p =.11, r = -.24). 148 Hoofdstuk 8: Variantieanalyse herhaalde metingen
149 STATISTIEK II toetsen voor het verband tussen variabelen met gelijk meetniveau hoofdstuk 9
150 Y Y Y PEARSON CORRELATIE Wat is een correlatie? (zie Statistiek I) De samenhang tussen twee variabelen (sterkte + richting van het verband) -1 als minimumwaarde en +1 als maximumwaarde 120,00 140,00 80,00 100,00 120,00 r = r = r = ,00 100,00 80,00 70,00 50,00 80,00 60,00 40,00 40,00 60,00 30,00 20,00 20,00 30,00 40,00 50,00 60,00 70,00 X 40,00 20,00 30,00 40,00 50,00 60,00 70,00 X 20,00 20,00 30,00 40,00 50,00 60,00 70,00 X 150 Hoofdstuk 9: Variabelen met gelijk meetniveau
151 PEARSON CORRELATIE Formule r = n i=1(x i x )(y i y) (N 1)s x s y met N = aantal paren 151 Hoofdstuk 9: Variabelen met gelijk meetniveau
152 PEARSON CORRELATIE 1. Toetsingssituatie Is er een lineair (rechtlijnig) verband tussen twee variabelen? Vb. is er een positief verband tussen intelligentie en schoolresultaten? 2. Voorwaarden X en Y zijn gemeten op intervalniveau X en Y zijn normaal verdeeld in de populatie of N 30 X en Y zijn bivariaat normaal verdeeld (voor elke X waarde zijn de Y waarden normaal verdeeld) Homoscedasticiteit (populatievarianties van Y voor elke waarde van X zijn aan elkaar gelijk) 152 Hoofdstuk 9: Variabelen met gelijk meetniveau
153 PEARSON CORRELATIE 3. Hypothesen Linkseenzijdig H0: ρ 0 H1: ρ < 0 Rechtseenzijdig H0: ρ 0 H1: ρ > 0 Tweezijdig H0: ρ = 0 H1: ρ 0 4. Toetsingsgrootheid t r r. N 2 1 r² met df = N 2 (N = aantal paren) Kansverdeling: Student t-verdeling 153 Hoofdstuk 9: Variabelen met gelijk meetniveau
154 PEARSON CORRELATIE 5. Beslissingsregels Studenten die meer vooraan in de aula zitten halen ook hogere cijfers op het examen. Tweezijdig H0: ρ = 0 H1: ρ 0 Steekproef: 32 studenten, r(rij, examen) = -.38 t r r. N 2 1 r² ( 0.39²) Voor df = 30 en alpha = 0.05 is kritieke waarde (tweezijdig) gelijk aan (tabel p. 323 ev.) Is t l (-2.32) < t kritiek (-2.042)? Ja, dus H0 verwerpen >> studenten die meer vooraan zitten halen inderdaad hogere cijfers! 154 Hoofdstuk 9: Variabelen met gelijk meetniveau
155 PEARSON CORRELATIE Determinatiecoëficiënt R² R² = r² wat is het aandeel van variabele X in de variantie van variabele Y? Wat is hun gedeelde variantie? in welke mate is variabele X oorzaak van variabele Y? causaliteit kan in twee richtingen lopen derde variabele kan verband verklaren partiële correlatie 155 Hoofdstuk 9: Variabelen met gelijk meetniveau
156 PEARSON CORRELATIE Partiële correlatie Wat is de gedeeltelijke gezamenlijke variantie tussen twee variabelen als je controleert voor de invloed van een derde variabele? rij punten motivatie? 156 Hoofdstuk 9: Variabelen met gelijk meetniveau
157 PEARSON CORRELATIE Demo SPSS: Studenten die meer vooraan in de aula zitten halen ook hogere cijfers op het examen. 157 Hoofdstuk 9: Variabelen met gelijk meetniveau
158 PEARSON CORRELATIE 6. Effectgrootte Effectgrootte = r 7. Rapportering Om na te gaan of er een verband is tussen de plaats in de aula waar studenten zitten en hun cijfers op het examen, werd een correlatie berekend. Dit verband bleek significant, r = -.39, p =.027, N = 32. Hoe verder de studenten van de docent zaten, hoe lager de punten op het examen. Nadat gecorrigeerd werd voor de motivatie van de studenten daalde deze correlatie tot r =.005, p =.98, N = Hoofdstuk 9: Variabelen met gelijk meetniveau
159 RANGCORRELATIE VAN SPEARMAN 1. Toetsingssituatie Berekenen van een correlatie tussen twee ordinale variabelen. (Pearson correlatie = correlatie tussen twee intervalvariabelen) 2. Voorwaarden Twee variabelen gemeten op ordinaal niveau of Twee variabelen duidelijk niet normaal verdeeld 3. Hypothesen Linkseenzijdig H0: ρ s 0 H1: ρ s < 0 Rechtseenzijdig H0: ρ s 0 H1: ρ s > 0 Tweezijdig H0: ρ s = 0 H1: ρ s Hoofdstuk 9: Variabelen met gelijk meetniveau
160 RANGCORRELATIE VAN SPEARMAN 4. Toetsingsgrootheid De waarden van X en Y afzonderlijk ordenen en correlatie berekenen tussen beide rangordeningen r s 1 6 N³ D² N N = aantal paren D = verschil in rangordenr per paar -1 als minimumwaarde en +1 als maximumwaarde 160 Hoofdstuk 9: Variabelen met gelijk meetniveau
161 RANGCORRELATIE VAN SPEARMAN Toetsingsgrootheid zoals bij Pearson s correlatie m.b.v. t-verdeling: 5. Beslissingsregels Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α? ja: verwerp H 0 nee: verwerp H 0 niet 161 Hoofdstuk 9: Variabelen met gelijk meetniveau
162 RANGCORRELATIE VAN SPEARMAN 6. Effectgrootte Effectgrootte = r s = ρ s 7. Rapportering (zie Pearson correlatie, maar dan met r s ) 162 Hoofdstuk 9: Variabelen met gelijk meetniveau
163 Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN 1. Toetsingssituatie Zijn twee nominale variabelen afhankelijk van elkaar? >> Kruistabel met frequenties Is er een verband tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête? Schriftelijk Telefonisch Mondeling Niet meedoen Wel meedoen Hoofdstuk 9: Variabelen met gelijk meetniveau
164 Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN 2. Voorwaarden Categorieën van elke variabele sluiten elkaar uit Alle waarden die in het onderzoek bestudeerd worden kunnen in de categorieën ondergebracht worden X² toets mag je gebruiken wanneer minder dan 20% van de cellen een f e < 5 en geen van de cellen een f e < Hoofdstuk 9: Variabelen met gelijk meetniveau
165 Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN 3. Hypothesen H0: de variabelen zijn onafhankelijk; er is geen verband H1: de variabelen zijn afhankelijk; er is wel een verband Opm. altijd 2-zijdige toetsing 4. Toetsingsgrootheid Pearson Chi Square: 165 Hoofdstuk 9: Variabelen met gelijk meetniveau
166 Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN 5. Beslissingsregels Overschrijdingskansen Is de gevonden P (Asymp. Sig. 2-tailed) kleiner dan α? ja: verwerp H 0 nee: verwerp H 0 niet 166 Hoofdstuk 9: Variabelen met gelijk meetniveau
167 Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN f o Pearson Chi-Square Likelihood Ratio N of Valid Cases Chi-Square Tests Asy mp. Sig. Value df (2-sided) 12,012 a 2,002 12, 254 2, a. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is 37,00. aan de voorwaarden is voldaan want 0% van de cellen heeft fe < 5 en minimum fe > 1 f e 167 Hoofdstuk 9: Variabelen met gelijk meetniveau
168 Χ²-TOETS VOOR VERBAND TUSSEN 2 NOMINALE VARIABELEN 6. Effectgrootte Verschillende mogelijkheden, Cramer s V meest universeel geschikt: 7. Rapportering Om na te gaan of er een verband bestaat tussen de wijze waarop vragenlijsten worden afgenomen en het al of niet willen meedoen met de enquête werd een X²-toets uitgevoerd, die uitwees dat er inderdaad een eerder zwak verband is tussen beide variabelen, X² = 12.01, p =.002, V =.16) 168 Hoofdstuk 9: Variabelen met gelijk meetniveau
169 OEFENINGEN Handboek H7: 1 & 3 H8: 1 & 3 H9: 1 & 2
170 STATISTIEK II Regressieanalyse hoofdstuk 10
171 REGRESSIEANALYSE Voorspelling maken op basis van correlatie Invloed van verschillende OV vergelijken 171 Workshop Inductieve Statistiek
172 REGRESSIEANALYSE Voorwaarden De criteriumvariabele (= afhankelijke variabele) is gemeten op intervalniveau. De observaties van de criteriumvariabele zijn onafhankelijk van elkaar. De predictor (= onafhankelijke variabele) is gemeten op intervalniveau of het is een dichotome variabele. De fouten (of residuen) van de voorspelling die we maken zijn normaal verdeeld met een gemiddelde van 0. De fouten (of residuen) van de voorspelling die we maken zijn ongecorreleerd met elkaar. 172 Workshop Inductieve Statistiek
173 ENKELVOUDIGE REGRESSIE y = 2 + 3x 173 Workshop Inductieve Statistiek
174 fuifsatisfactie ENKELVOUDIGE REGRESSIE { alcohol d = 1.8 d = 2.1 d = 1.2 Y i = b 0 + b 1 X i + ε i 174 Workshop Inductieve Statistiek
175 fuifsatisfactie fuifsatisfactie ENKELVOUDIGE REGRESSIE alcohol alcohol 175 Workshop Inductieve Statistiek
176 ENKELVOUDIGE REGRESSIE Wanneer is het model nuttig? R² = SS M SS T SS M Verschil regressiepredictie vs gemiddelde van Y SS T Verschil geobserveerde scores vs gemiddelde van Y F = MS M MS R Variantie model Variantie fouten (residuen) 176 Workshop Inductieve Statistiek
177 ENKELVOUDIGE REGRESSIE Wanneer is de predictor nuttig? Y i = b 0 + b 1 X i + ε i als b 1 > 0 t = b obs b exp SE b 177 Workshop Inductieve Statistiek
178 ENKELVOUDIGE REGRESSIE Normaliteit van residuen? 178 Workshop Inductieve Statistiek
179 ENKELVOUDIGE REGRESSIE Autocorrelatie van residuen? Durbin-Watson toets: Workshop Inductieve Statistiek
180 ENKELVOUDIGE REGRESSIE Outliers? 180 Workshop Inductieve Statistiek
181 ENKELVOUDIGE REGRESSIE Outliers? 2 technieken: 1. Cook s Distance: case > 1 outlier 2. Gestandaardiseerde residuen: z > 3 outlier 181 Workshop Inductieve Statistiek
182 MEERVOUDIGE REGRESSIE Voorwaarden De criteriumvariabele (= afhankelijke variabele) is gemeten op intervalniveau. De observaties van de criteriumvariabele zijn onafhankelijk van elkaar. De predictor (= onafhankelijke variabele) is gemeten op intervalniveau of het is een dichotome variabele. De fouten (of residuen) van de voorspelling die we maken zijn normaal verdeeld met een gemiddelde van 0. De fouten (of residuen) van de voorspelling die we maken zijn ongecorreleerd met elkaar. De predictoren zijn lineair onafhankelijk van elkaar: er is geen multicollineariteit. 182 Workshop Inductieve Statistiek
183 MEERVOUDIGE REGRESSIE Uitbreiding van enkelvoudige regressie: Y i = b 0 + b 1 X i1 + b 2 X i2 + + b n X n + ε i Of fuifsatisfactie i = b 0 + b 1i alc consumpties i +b 2i aantal aanwezigen i + ε i 183 Workshop Inductieve Statistiek
184 MEERVOUDIGE REGRESSIE 184 Workshop Inductieve Statistiek
Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse
Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,
Nadere informatieInhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28
Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische
Nadere informatieHoofdstuk 6 Twee populaties: parametrische toetsen
Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.
Nadere informatieM M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 7 1. Een onderzoeker wil nagaan of de fitheid van jongeren tussen 14 en 18 jaar (laag, matig, hoog) en het geslacht (M, V) een
Nadere informatieWe berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies
Nadere informatieINDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatieHoofdstuk 8 Het toetsen van nonparametrische variabelen
Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn
Nadere informatieAanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling
Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl
Nadere informatieHoofdstuk 3 Statistiek: het toetsen
Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.
Nadere informatieMeervoudige ANOVA Onderzoeksvraag Voorwaarden
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatieEnkelvoudige ANOVA Onderzoeksvraag Voorwaarden
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatieAntwoordvel Versie A
Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3
Nadere informatietoetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.
Nadere informatietoetskeuze schema verschillen in gemiddelden
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van
Nadere informatieCollege 6 Eenweg Variantie-Analyse
College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld
Nadere informatieInterim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN
Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen
Nadere informatieintroductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets
toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:
Nadere informatieCursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015
Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%
Nadere informatieDe data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 6 1. De 15 leden van een kleine mountainbikeclub vragen zich af in welk mate de omgevingstemperatuur een invloed heeft op hun
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatieBij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R
14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten
Nadere informatieINDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8 1. Eén van de nadelige gevolgen van de moderne welvaart is een monstrueus mobiliteitsprobleem. Om één of andere bizarre reden
Nadere informatieVerdelingsvrije statistiek
Verdelingsvrije statistiek Inleiding In hoofdstuk II-5 (deel ) worden een aantal verdelingsvrije toetsen (ook wel niet-parametrische toetsen) besproken, die gebruikt worden als de te onderzoeken variabele
Nadere informatieBerekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt
A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:
Nadere informatieNominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht
Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht Ordinaal - Kwalitatief - Middelste niveau - Categorieën wel ordenen - Opleidingsniveau Interval / ratio - Kwantitatief - Hoogste
Nadere informatieANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003
ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatiegemiddelde politieke interesse van hoger opgeleide mensen)
SPSS-oefening 2: Hypothesetoetsen Opgave Oefening 1 a) Het zijn onafhankelijke steekproeven. De scores voor politieke interesse zijn afkomstig van verschillende mensen aangezien elke persoon slechts in
Nadere informatieKruis per vraag slechts één vakje aan op het antwoordformulier.
Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor
Nadere informatiec Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6
c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere
Nadere informatieStatistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018
Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht
Nadere informatieBij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:
13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke
Nadere informatieFasen in het onderzoeksproces
Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:
Nadere informatieToetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen
M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &
Nadere informatieCollege 7 Tweeweg Variantie-Analyse
College 7 Tweeweg Variantie-Analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11 Jolien Pas ECO 2012-2013 Het Experiment
Nadere informatieCursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen
Cursus Statistiek 2 Fellowonderwijs Opleiding Intensive Care UMC St Radboud, Nijmegen Cursus Statistiek 2 Steekproefgrootte en power berekening Vergelijken van gemiddelden (T-testen) Niet-parametrische
Nadere informatieBeschrijvende statistiek
Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd
Nadere informatieHoofdstuk 7: Statistische gevolgtrekkingen voor distributies
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieCursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud
Cursus Statistiek Parametrische en non-parametrische testen Fellowonderwijs Intensive Care UMC St Radboud Vergelijken gemiddelde met hypothetische waarde 13 24 19 18 11 22 10 17 14 31 21 18 22 12 18 11
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets
Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en
Nadere informatieHOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN
HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n
Nadere informatieStatistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009
Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Opdracht 1 Onderstaande tabel bevat metingen aan de opbrengst van rozen bij verschillende mate van stikstofen fosfortoevoer. rozen/snijvak/dag fosfaatniveau
Nadere informatiea. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?
Opdracht 15a ------------ Spearman rangcorrelatie coefficient (non-parametrische tegenhanger van de Pearson correlatie coefficient) Wilcoxon symmetrie-toets (non-parametrische tegenhanger van de t-procedure
Nadere informatieStatistiek 2 deel A 30 minuten over statistisch toetsen
Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +
Nadere informatieMeervoudige variantieanalyse
Meervoudige variantieanalyse Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets
Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets
Nadere informatieToetsende Statistiek Week 7. Verdelingsvrije toetsen
Toetsende Statistiek eek 7. Verdelingsvrije toetsen MM&C, 15 Nonparametric Tests 15.1 2 Independent Samples Chemicus Ontwikkelde de Rank-Sum test en Signed-Rank test (1945) 15.2 2 Dependent Samples NB
Nadere informatieToegepaste Statistiek, Week 6 1
Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën
Nadere informatiewerkcollege 6 - D&P10: Hypothesis testing using a single sample
cursus huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 werkcollege 6 - D&P10: Hypothesis testing using a single sample Activities 9.3 en 9.4 van schatting naar toetsing vorige bijeenkomst: populatie-kenmerk
Nadere informatieInhoudsopgave. Deel I Schatters en toetsen 1
Inhoudsopgave Deel I Schatters en toetsen 1 1 Hetschattenvanpopulatieparameters.................. 3 1.1 Inleiding:schatterversusschatting................. 3 1.2 Hetschattenvaneengemiddelde..................
Nadere informatie1. Reductie van error variantie en dus verhogen van power op F-test
Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De
Nadere informatieSheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6
MATERIALEN BIJ STATISTIEK (1991) JANUARI 010 Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 1 Antwoorden uitgewerkte opgaven week 1 11 15 Power-point sheets hoorcollege (over paragraaf
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieMethoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2
Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte
Nadere informatiewerkcollege 7 - D&P10: Hypothesis testing using a single sample
cursus 11 mei 2012 werkcollege 7 - D&P10: Hypothesis testing using a single sample huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 Activities 9.3 en 9.4 experimenten zelf deelnemen als proefpersoon
Nadere informatie11. Meerdere gemiddelden vergelijken, ANOVA
11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke
Nadere informatieVoer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.
Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren
Nadere informatiemlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2
mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart
Nadere informatieInductieve statistiek voor informatiewetenschappers
INDUCTIEVE STATISTIEK VOOR INFORMATIEWETENSCHAPPERS I 570 1 Inductieve statistiek voor informatiewetenschappers HENK VOORBIJ 1. Inleiding Er zijn twee soorten statistiek: beschrijvende en inductieve (ook
Nadere informatieStatistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef
Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,
Nadere informatieEIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009
EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieVerklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?
Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet? Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieVergelijken van twee groepen (SPSS)
Vergelijken van twee groepen (SPSS) Vergelijking van gemiddeldes van onafhankelijke steekproeven met gelijke varianties (dataset newspapers) In een onderzoek geven studenten aan hoeveel keer per week ze
Nadere informatieAnalyse van kruistabellen
Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieINDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 11
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 11 1. Een onderzoeker vraagt zich af of werknemers zich na de Kerstvakantie meer depressief voelen dan na de zomervakantie.
Nadere informatieStatistiek II. Sessie 5. Feedback Deel 5
Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :
Nadere informatieToetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing
Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing M, M & C, Chapter 6, Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Use and Abuse
Nadere informatieOnderzoek. B-cluster BBB-OND2B.2
Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou
Nadere informatieVoorbeeld regressie-analyse
Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke
Nadere informatieZowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y
1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieSchriftelijk tentamen - UITWERKINGEN
Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB0019t Soort tentamen : gesloten
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieintroductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter
Nadere informatieS0A17D: Examen Sociale Statistiek (deel 2)
S0A17D: Examen Sociale Statistiek (deel 2) 21 juni 2011 Naam : Jaar en studierichting : Lees volgende aanwijzingen eerst voor het examen te beginnen : Wie de vragen aanneemt en bekijkt, moet minstens 1
Nadere informatieOplossingen hoofdstuk XI
Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij
Nadere informatiec. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?
Opdracht 13a ------------ Een-factor ANOVA (ANOVA-tabel, Contrasten, Bonferroni) Bij een onderzoek naar de leesvaardigheid bij kinderen in de V.S. werden drie onderwijsmethoden met elkaar vergeleken. Verschillende
Nadere informatieIntroductie tot de statistiek
Introductie tot de statistiek Hogeschool Gent 04/05/2010 Inhoudsopgave 1 Basisbegrippen en beschrijvende statistiek 8 1.1 Onderzoek............................ 8 1.1.1 Data........................... 8
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieHierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking
Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder
Nadere informatieEIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010
EIND TOETS TOEGEPASTE BIOSTATISTIEK I 5 februari - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 9 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.
Nadere informatieHOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)
HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:
Nadere informatieFeedback examen Statistiek II Juni 2011
Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven
Nadere informatieEne variabele. Nonparametrische toetsen. Kolmogorov-Smirnov. Kolmogorov-Smirnov. Andere variabele. Onderzoekspracticum.
Nonparametrische Data Analyse (NPDA) Nonparametrische toetsen Andere variabele Onderzoekspracticum Sessie Gjalt-Jorn Peters gjp@ou.nl Ene variabele Dichotoom: afhankelijke Dichotoom: Meer dan twee Nominaal
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal
Nadere informatieHoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]
Hoofdstuk 8 Toetsende statistiek Meestal zijn we niet alleen geïnteresseerd in beschrijvende statistiek (over de steekproef), maar ook in toetsende statistiek. Het doel hiervan is om hypothesen te toetsen,
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatieOpen het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 9 1. Een klinisch psycholoog vraagt zich af of er een verband bestaat tussen depressie en sociale vermijding in de populatie
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) dinsdag 2-08-2003, 4.00-7.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine,
Nadere informatieToegepaste Statistiek, Week 3 1
Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is
Nadere informatie