Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Vergelijkbare documenten
Hoofdstuk 12: Eenweg ANOVA

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

College 2 Enkelvoudige Lineaire Regressie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 10: Regressie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen

College 6 Eenweg Variantie-Analyse

11. Multipele Regressie en Correlatie

Les 5: Analysis of variance

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

1. Reductie van error variantie en dus verhogen van power op F-test

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

9. Lineaire Regressie en Correlatie

Voorbeeldtentamen Statistiek voor Psychologie

11. Meerdere gemiddelden vergelijken, ANOVA

College 2 Enkelvoudige Lineaire Regressie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

College 7 Tweeweg Variantie-Analyse

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Antwoordvel Versie A

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Oefenvragen bij Statistics for Business and Economics van Newbold

Les 5: ANOVA. Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 19 november 2018

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Data analyse Inleiding statistiek

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Statistiek ( ) eindtentamen

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Kansrekening en Statistiek

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Kansrekening en Statistiek

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Hoofdstuk 5: Steekproevendistributies

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

werkcollege 6 - D&P10: Hypothesis testing using a single sample

gemiddelde politieke interesse van hoger opgeleide mensen)

Eindtoets Toegepaste Biostatistiek

H7: Analysis of variance

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Data analyse Inleiding statistiek

werkcollege 7 - D&P10: Hypothesis testing using a single sample

toetskeuze schema verschillen in gemiddelden

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Beschrijvende statistiek

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Toetsen van hypothesen

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

Kansrekening en Statistiek

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Feedback examen Statistiek II Juni 2011

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Statistiek II. Sessie 5. Feedback Deel 5

Kansrekening en Statistiek

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Toetsen van Hypothesen. Het vaststellen van de hypothese

8. Analyseren van samenhang tussen categorische variabelen

variantie: achtergronden en berekening

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Les 2: Toetsen van één gemiddelde

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

E Y = ln(β 1 x) ln β 1 + β 2

SOCIALE STATISTIEK (deel 2)

Voorbeeld regressie-analyse

Kansrekening en Statistiek

Variantie-analyse. 3.1 Het twee-steekproevenprobleem III.1

15.1 Beslissen op grond van een steekproef [1]

Statistiek II. Sessie 4. Feedback Deel 4

Kansrekening en Statistiek

College 1 Grondprincipes van de Wetenschap

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Wiskunde B - Tentamen 1

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

Transcriptie:

A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten: Gebaseerd op de proportie verklaarde variantie: de proportie verklaarde variantie wordt vaak aangegeven met één van de volgende termen: R² of eta squared, partial eta squared of omega squared. Deze vormen worden verderop in de samenvatting verder toegelicht bij de uitleg over ANOVA en regressie. Gebaseerd op het verschil in gemiddelden. Dit wordt vaak aangeduid met behulp van Cohen s d. Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt berekend met behulp van één van de volgende formules: d = y µ y 1 y 2 of d = σ σ Dit is afhankelijk van of je een steekproefgemiddelde met het populatiegemiddelde wilt vergelijken of twee gemiddelden van twee verschillende steekproeven met elkaar wilt vergelijken. Wanneer we voor de eerste methode zouden kiezen en dus het gevonden steekproefgemiddelde willen vergelijken met het populatiegemiddelde, dan geeft de waarde van Cohen s d het aantal standaarddeviatie weer waarmee het steekproefgemiddelde van het populatiegemiddelde afligt. Wanneer je dus een waarde van d van d = 0,5 zou hebben, dan zou het steekproefgemiddelde 0,5 standaarddeviaties van het populatiegemiddelde afliggen. Er zijn een aantal vuistregels die meestal worden aangehouden om te kunnen spreken van een klein, een middelmatig of een groot effect. Wanneer de effectgrootte rond de d = 0,80 ligt, dan spreken we van een groot effect. Is de waarde van de effectgrootte ongeveer d = 0,50, dan is het bevonden effect middelmatig. Bevinden we een effectgrootte van rondom d = 0,20, dan wordt het effect klein genoemd. Denk er wel aan dat deze regels niet meer zijn dan vuistregels. Het zijn geen vaste regels en iemand anders zou ook gemakkelijk kunnen kiezen voor andere vuistregels. Berekenen van het onderscheidingsvermogen Wanneer we een significantietoets uitvoeren, dan zijn er vier mogelijke conclusies die we kunnen trekken: Je verwerpt H0 wel Je verwerpt H0 niet H0 klopt fout type één α 1 fout type één H0 klopt niet 1 fout type twee fout type twee β Tabel 1: Fout type één en twee. Fout type één is wanneer H0 klopt is, maar je verwerpt deze: het onterecht verwerpen van de nulhypothese. Deze fout wordt aangeduid met het sigmateken α. Fout type twee ontstaat wanneer H0 niet klopt, maar je deze niet verwerpt: je neemt dan onterecht de nulhypothese aan. Deze fout wordt aangeduid met het bètateken β. Je zit dus goed als H0 klopt is en je H0 niet verwerpt. De kans hierop kun je ook berekenen door middel van de formule 1 α. Je zit ook goed wanneer H0 niet waar is en je deze wel verwerpt.. 1

Deze kans is te berekenen door middel van de formule 1 - β. Dit laatste, 1 - β, is het onderscheidingsvermogen van je toets. Het onderscheidingsvermogen wordt ook wel de power genoemd en is het terecht verwerpen van de nulhypothese. De waarde van het onderscheidingsvermogen wil je zo groot mogelijk hebben, bijvoorbeeld wanneer je een significante uitkomst ontdekt met je onderzoek en je de nulhypothese gaat verwerpen, je ook wilt dat je deze handelingen terecht doet. Om de power te berekenen, bereken je eerst de waarde die x aanneemt onder de verkeerde nulhypothese. Dit doe je met behulp van de z-score. Je kijkt dus naar wanneer je onder de verkeerde nulhypothese deze nulhypothese zou verwerpen. Wanneer je de waarde van deze x weet, bereken je de juiste kans om H0 te verwerpen met behulp van de z-score door hierin de juiste waarde van het gemiddelde in te voeren. Het berekenen van het onderscheidingsvermogen kan lastig te begrijpen zijn. Daarom kan dit het beste uitgelegd worden met behulp van een voorbeeld. Stel, je hebt een populatie die verdeeld is met X ~ N(µ,1). Hierin voer je een significantietoets uit met een alfa van 0,05, waarbij je het volgende toetst: H0: µ = 4,0 Ha: µ > 4,0 Hier is bekend dat het aantal proefpersonen 49 is. Vervolgens komen we er achter dat µ verkeerd is: deze is niet 4,0 maar 4,6. Om de power te berekenen moeten we eerst de waarde van x achterhalen onder de verkeerde nulhypothese, om zo te achterhalen wanneer H0 wordt verworpen onder de verkeerde H0. We weten dat bij een éénzijdige toetsing met α=0,05 de z-score z = 1,645 is. Vervolgens: z = x µ α/ n = x 4,0 1/7 = 1,645. x 4,0 = 0,235. x = 4,235. Vervolgens bereken je de correcte kans om H0 te verwerpen (onder Ha = 4,6): P Ha ( x > 4,235) = P Ha = ( x 4,6 ) 1/7 > (4,235 4,6 1/7 P Ha (Z > -2,555) = 1-0,0054 = 0,9946. De conclusie die we hier uit kunnen trekken is dat er een kans is van 99,46% dat we H0 terecht afwijzen als Ha: µ = 4,6 waar is. Het onderscheidingsvermogen van een significantietoets is afhankelijk van: De steekproefgrootte n: wanneer n groter wordt, dan wordt het onderscheidingsvermogen groter. Het significantieniveau α: wanneer α groter wordt, dan wordt het onderscheidingsvermogen groter. De effectgrootte (effect size, ES, wordt hier onder uitgelegd): wanneer de ES groter wordt, dan wordt het onderscheidingsvermogen groter. ) 2

Als de bovenstaande 3 punten bekend zijn, dan kan de power worden berekend met behulp van het software programma G*Power. Een andere manier om je power te vergroten, is door de errorvariantie te verkleinen. Dit kan door groepen in je onderzoek homogener te maken of door een extra variabele aan je onderzoek toe te voegen. Er zijn 2 manieren waarop analyse naar onderscheidingsvermogen kan worden uitgevoerd: A priori analyse naar onderscheidingsvermogen: deze manier heeft de voorkeur. De power van het onderzoek wordt berekend vóórdat het onderzoek wordt uitgevoerd door de effectgrootte, het significantieniveau en het gewenste onderscheidingsvermogen in te voeren in het programma G*Power. Vervolgens wordt de benodigde steekproefgrootte voor het onderzoek uitgerekend. Deze steekproefgrootte is dus aangepast op het gewenste onderscheidingsvermogen. Dus als je in je onderzoek een goed onderscheidingsvermogen van ongeveer 0,80 wilt nastreven, dan kun je door de overige gegevens in te vullen berekenen hoeveel proefpersonen je bij je onderzoek moet betrekken. Post hoc analyse naar onderscheidingsvermogen: deze manier wordt uitgevoerd nadat het onderzoek is uitgevoerd. Door de ES, het significantieniveau en de steekproefgrootte in te voeren, bereken je de power die het onderzoek (dat al is uitgevoerd) had. Deze manier is geschikt als a priori onderzoek voor een volgend onderzoek. 3

B. Eénweg ANOVA en de toepassingen daarvan. De t-toets met twee steekproeven Je maakt gebruik van de t-toets wanneer je twee steekproefgroepen met elkaar wilt vergelijken. Hierbij toets je de volgende hypotheses: H0: µ1=µ2 Ha:µ1 µ2 (deze kan ook éénzijdig zijn in plaats van tweezijdig). Hierbij zijn de populatiegemiddelde µ en standaarddeviatie σ onbekend: ze worden benaderd met y en s. Herinner je dat dat het grote verschil was tussen een t-toets en een z-toets: bij een t-toets is de populatiestandaarddeviatie onbekend. In dit vak gaan we over het algemeen uit van gelijke standaarddeviaties. Op deze manier kunnen we gebruik maken van Spooled: de gepoolde standaarddeviatie. De test statistic voor de t test luidt als volgt: t= y 1 y 2 sp 1 n1 + 1 n2. Deze test statistic is verdeeld met n1 + n2-2 vrijheidsgraden. Éénweg ANOVA Helaas blijft het gebruik van de t-toets beperkt tot het vergelijken van slechts twee groepen. In sommige gevallen willen we meer dan twee groepen met elkaar vergelijken. In zo n geval maken we gebruik van ANOVA: ANalysis Of VAriance. Bij het uitvoeren van een ANOVA wordt gekeken naar de verschillen tussen gemiddelden van I onafhankelijke groepen die je in je onderzoek opneemt. De H0 en Ha hierbij luiden als volgt: H0: µ1=µ2=µ3=µ4 Ha: Ten minste één µ wijkt af of niet alle µs zijn gelijk. Omdat het idee achter ANOVA vrijwel gelijk is aan het uitvoeren van een t-toets vergelijk je bij een ANOVA net zoals bij het uitvoeren van een t-toets de between group variatie met de within group variatie. De between group variatie is de variatie tussen de groepen die je vergelijkt. Dit is dus het deel dat kan worden verklaard door de verschillen tussen groepen. In bovenstaande formule van de t-toets is dat wat boven de streep in de breuk gebeurt. Hier vergelijk je immers de verschillen tussen de twee groepen door het ene gemiddelde van het andere gemiddelde af te trekken. De within group variatie is de variatie binnen de groepen die je vergelijkt. Dit is het deel van de variantie die onverklaard blijft binnen de groepen, ofwel de error. In de bovenstaande formule is dat wat onder de streep in de breuk staat. Er is namelijk altijd sprake van variatie in scores, de scores van de betrokken proefpersonen zijn immers nooit allemaal hetzelfde. Dat zien we terug in de standaarddeviatie. Een ANOVA tabel gemaakt met behulp van SPSS ziet er als volgt uit: Tabel 2: Fictief Voorbeeld van ANOVA Tabel SPSS: Descriptive Statistics. 4

Tabel 3: Fictief Voorbeeld van ANOVA Tabel SPSS: ANOVA De onderdelen van deze ANOVA-tabel uit SPSS zullen hieronder worden toegelicht. De sum of squares De variantie wordt bij ANOVA weergegeven in sum of squares. De sum of squares kunnen als volgt worden opgedeeld: SStotaal= SSgroep + SSerror Hierbij is SST (SStotaal) de totale spreiding die je observeert. De formule hiervoor is: SST= ij(yij-y )². Dit kan handmatig worden berekend door de totale variantie van y x (n- 1) te doen. Kan ook als volgt worden berekend: SStotaal = SSgroep + SSerror SStotaal = MStotaal x DFtotaal SSG (SSgroep) is de spreiding tussen groepen. Dit wordt in andere situaties ook wel SSmodel of SSbetween genoemd. De formule hiervoor is: SSG= ij(y i y )². Dit kan handmatig worden berekend door van alle gemiddelden van de groepen het totale gemiddelde af te trekken, te kwadrateren en x de n van die groep te doen. Deze uitkomsten tel je vervolgens bij elkaar op. Kan ook als volgt worden berekend: SSgroep = SStotaal - SSerror SSgroep = MSgroep x DFgroep (ofwel MSmodel x DFmodel) SSE (SSerror) is de spreiding binnen groepen die niet verklaard kan worden. Dit wordt ook wel SSwithin genoemd. De formule hiervoor is: SSE= ij(yij y i). Dit kan handmatig worden berekend door de variantie van elke groep x (n - 1) van die groep te doen. Als je dit gedaan hebt tel je dit vervolgens bij elkaar op. De sum of squares error kan ook als volgt worden berekend: SSerror = SStotaal - SSgroep (ofwel SStotaal - SSmodel) SSerror = MSerror x DFerror 5

Als je over de sum of squares beschikt, kun je deze gebruiken om samen met de vrijheidsgraden (DF) de mean square te berekenen. De vrijheidsgraden De vrijheidsgraden kunnen als volgt worden berekend: DFtotaal (DFT) = n - 1. DFtotaal kan ook op één van de volgende manieren worden berekend: DFtotaal = DFgroep + DFerror. DFtotaal = SST MST. DFgroep (DFG) = I - 1, waarbij I het aantal groepen van X is. DFgroep kan ook op één van de volgende manieren worden berekend: DFgroep = DFtotaal - DFerror. DFgroep = SSG MSG. DFerror (DFE) = n - I. DFerror kan ook op de één van de volgende manieren worden berekend: DFerror = DFtotaal - DFgroep. DFerror = SSE MSE. 6