Hoofdstuk 6 Twee populaties: parametrische toetsen

Vergelijkbare documenten
Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Kansrekening en Statistiek

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Kansrekening en Statistiek

Hoofdstuk 12: Eenweg ANOVA

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Toetsen van hypothesen

Toetsen van Hypothesen. Het vaststellen van de hypothese

Voorbeeldtentamen Statistiek voor Psychologie

Statistiek voor A.I.

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Inhoudsopgave. Deel I Schatters en toetsen 1

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Sheets K&S voor INF HC 10: Hoofdstuk 12

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Kansrekening en Statistiek

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Antwoordvel Versie A

15.1 Beslissen op grond van een steekproef [1]

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Data analyse Inleiding statistiek

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Hoofdstuk 10: Regressie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Kansrekening en Statistiek

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

11. Multipele Regressie en Correlatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Kansrekening en Statistiek

Kansrekening en Statistiek

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Kansrekening en Statistiek

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Hoofdstuk 4 Hypothese toetsen

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

College 2 Enkelvoudige Lineaire Regressie

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Oefenvragen bij Statistics for Business and Economics van Newbold

Wiskunde B - Tentamen 1

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Toegepaste Statistiek, Week 3 1

Rechter overschrijdingskansen (in procenten) van z van de standaardnormale verdeling

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Toegepaste Statistiek, Week 6 1

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Statistiek voor A.I. College 10. Donderdag 18 Oktober

HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN

Les 2: Toetsen van één gemiddelde

INDUCTIEVE STATISTIEK

Beschrijvende statistiek

8. Analyseren van samenhang tussen categorische variabelen

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Examen Statistiek I Januari 2010 Feedback

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Les 7-8: Parameter- en Vergelijkingstoetsen

werkcollege 7 - D&P10: Hypothesis testing using a single sample

. Dan geldt P(B) = a d. 3 8

Statistische toetsen

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

9. Lineaire Regressie en Correlatie

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

toetskeuze schema verschillen in gemiddelden

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Wiskunde B - Tentamen 2

Feedback examen Statistiek II Juni 2011

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Beslissen op grond van een steekproef Hoofdstuk 15

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Statistiek 1 Blok 6, Werkgroepopdrachten

Transcriptie:

Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd. De t-toets tussen twee gemiddelden gaat ervan uit dat we twee normaal verdeelde populaties hebben waarvan we de gemiddelden en de standaarddeviaties niet kennen. We trekken uit elke populatie aselect een steekproef, zodat we over twee onafhankelijke steekproeven beschikken. Je krijgt de volgende situatie: 1. Populatie 1: µ1 & σ1 (onbekend); steekproef I: ₁, S1, en n1. 2. Populatie 2: µ2 & σ2 (onbekend); steekproef 2: 2, S1, en n2. Voorwaarden T-toets voor het verschil tussen twee gemiddelden: - de twee populaties zijn normaal verdeeld met een onbekende σ1 en σ2; - de populaties zijn niet normaal verdeeld, maar beide steekproeven bevatten meer dan dertig onderzoekseenheden. Hypothesen: Linkseenzijdig toetsen: H0: µ1 µ2 en : µ1 < µ2 Rechtseenzijdig toetsen: H0: µ1 µ2 en : µ1 > µ2 Tweezijdig toetsen: H0: µ2 = µ2 en : µ1 = µ2 Er zijn twee varianten van de t-toets voor het verschil tussen twee gemiddelden die samenhangen met de vraag of de varianties in de populaties wel of niet verschillend zijn. Daarom moet eerst getoetst worden of de varianties gelijk zijn. Variant 1: toetsingsgrootheid als varianties ongelijk zijn We mogen hierbij de standaardfout schatten door de populatie varianties te vervangen door steekproefvarianties. Als we het verschil tussen de steekproefgemiddelden en standaardfout hebben berekend, kunnen we het verschil omzetten in een t-score. Dit is de toetsingsgrootheid waarmee hypothesen over verschillen in gemiddelden tussen twee normaal verdeelde populaties kunnen worden getoetst. M1 en M2: gemiddelden van steekproef 1 en 2 s1 en s2: varianties van steekproeven 1 en 2 n1 en n2: grootte van steekproeven 1 en 2

De vrijheidsgraden worden nu bijna geschat. Variant 2: toetsingsgrootheid als varianties gelijk zijn Omdat onder de aanname van gelijk varianties alle σ s gelijk zijn, is het niet meer nodig onderscheid te maken. Je krijgt dan σ² ₁= σ² ₂ = σ². De standaardfout wordt dan Als de populatievarianties inderdaad gelijk zijn, kunnen we de populatievariantie (σ²) schatten als een gewogen gemiddelde van twee steekproefvarianties. Dit is ook wel het poolen van varianties, het gewogen gemiddelde van 2 steekproeven waarvan de varianties aan elkaar gelijk zijn. Of ze aan elkaar gelijk zijn heb je met de F- toets bepaald (volgt later). µ1 en µ2 = Gemiddelden van populatie 1 & 2. df = Aantal vrijheidsgraden Dan heb je vervolgens ook nog de t-score formule voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties: Waarbij: df= n1 + n2-2

Als df nou groter of gelijk is aan 100, dan zijn de afwijkingen ten opzichte van een standaard normale verdeling te verwaarlozen. Dit houdt in dat je er dan vanuit kunt gaan dat je met een standaard normale verdeling te maken hebt. Bij een df van onder de 100 kan je de overschrijdingskans die SPSS bij sig rapporteert niet opzoeken dus. Beslissingsregels Je kan H0 verwerpen door middel van overschrijdingskansen en kritieke waarden. Overschrijdingskansen Linkseenzijdige toetsing: Pl (t ₁- ₂) α Rechtseenzijdige toetsing: Pr (t ₁- ₂) α Tweezijdige toetsing: Pd (t ₁- ₂) α Kritieke waarden Je kijkt voor de kritieke waarden achter in je boek. Het getal dat je gevonden hebt in de kolom bij het df en significantie getal staat gelijk aan je significantieniveau α. Dus H0 moet verworpen worden bij linkszijdige toetsing als het kleiner of gelijk is aan dat getal, en bij rechtszijdige toetsing moet H0 verworpen worden als het groter is dan het getal. Je kijkt naar de vrijheidsgraden, een- of tweezijdige toetsing en het significantieniveau α. Stel je vindt 2,110, dan zijn de kritieke waarden +2,110 en -2,110. H0 wordt verworpen als 1-2 -2,110 of als 1-2 +2,110. Effectgrootte: als de toets significant resultaat geeft, bepalen we bij de t-toets voor twee gemiddelden ook de effectgrootte Cohen s d. Je moet bij het verschil tussen twee gemiddelden de standaardafwijking in de noemer schatten, door middel van de gepoolde variantie. De standaardrichtlijnen worden hierbij gebruikt. Rapporteren: bij het rapporteren van de resultaten van een t-toets voor twee gemiddelden vermelden we eerst de steekproefresultaten per groep (M en s). Dan geef je aan of het resultaat significant was, de waarde van toetsingsgrootheid t, inclusief de vrijheidsgraden en de p-waarde. Als er sprake is van significantie, wordt ook de effectgrootte vermeld. Betrouwbaarheidsinterval Wanneer de varianties ongelijk zijn: Bij ongelijke populatievarianties gebruiken we in het betrouwbaarheidsinterval de algemene vorm van de standaardfout. µ1 en µ2 = Gemiddelden van populatie 1 en 2.

t = Positieve t-waarde waarvoor geldt dat Pd(t) = α bij df= n₁ en n₂- 2. Wanneer de varianties gelijk zijn: Bij gelijke populatievarianties wordt de formule van het betrouwbaarheidsinterval aangepast met de gepoolde versie van de standaardfout. µ1 en µ2 = Gemiddelden van populatie 1 en 2. df = Aantal vrijheidsgraden t = Positieve t-waarde waarvoor geldt dat Pd(t) = α bij df= n1 en n2-2. De formules voor betrouwbaarheidsintervallen lijken heel veel op elkaar. Wanneer de populatievarianties gelijk zijn, komt in de formules voor de toetsingsgrootheid en het betrouwbaarheidsinterval de gepoolde variantie te staan. Zijn de populatievarianties ongelijk dan komen in de formules voor de toetsingsgrootheid en het betrouwbaarheidsinterval de afzonderlijke steekproefvarianties te staan. 6.3 F-toets: Bij de F-toets gaat het erom of twee populatievarianties van elkaar verschillen (dit moet je weten voor de t-toets). Het komt er op neer dat je kijkt naar S12 en S12, hoeveel keer de kleinste van de twee in de grootste past. Hier komt een quotiënt uit, welke F genoemd wordt. Je bent vaak geïnteresseerd in de F-waarden met rechter overschrijdingskansen die gelijk zijn aan vaak voorkomende waarden van α (0.05, 0.025, 0.01, 0,10) Voorwaarden F-toets: De populaties waaruit de steekproeven getrokken zijn moeten normaal verdeeld zijn. Deze eis is zeer belangrijk, omdat bij kleine afwijkingen de F zeer veel kan afwijken van wat zij in werkelijkheid zou moeten zijn. Slechts bij grote steekproeven (N > 100) worden de afwijkingen acceptabel. Hypothesen F-toets: Eenzijdig toetsen: H0: = en H1 > Tweezijdig toetsen: H0: = en H1 =

Toetsingsgrootheid F-toets: 1. Om H0 te kunnen verwerpen ja of nee, moet je het quotiënt van de varianties van beiden steekproeven nemen. De formule luidt als volgt: S12 en S22 = variantie van de steekproef 1 en 2 N1 en n2 = grootte van de steekproef 1 en 2 Df1 = aantal vrijheidsgraden van de teller (van de grootste variantie) Df2 = aantal vrijheidsgraden van de noemer (van de kleinste variantie) Als de nulhypothese waar is, bestaat er geen verschil tussen de populatievarianties en zal F in de buurt liggen van 1. Naarmate F groter is, is het aannemelijker dat de populatievarianties werkelijk van elkaar verschillen. Als H0 juist is, volgt de toetsingsgrootheid een kansverdeling die de F-verdeling wordt genoemd. Beslissingsregel: Dit kan ook weer door middel van overschrijdingskansen en kritieke waarden. Overschrijdingskansen H0 wordt verworpen bij rechtszijdig of tweezijdig toetsen. Linkszijdig toetsen kan bij de F- toets niet omdat de grootste variantie altijd in de teller staat, en de kleinste variantie altijd in de noemer. De uitkomst zal daarom altijd positief zijn. Hierdoor moet je de linkseenzijdige hypothese andersom formuleren als een alternatieve hypothese voor rechtseenzijdig toetsen. Rechtszijdig toetsen: Pr (F) α Tweezijdig toetsen: Pd (F) = 2 * Pr (F) α Kritieke waarden voor de kritieke waarden van de F-toets zoek je in de bijlagen achter in je boek bij de F-tabel. Voor elke α is er een andere tabel. Kijk goed wat je df₁ (teller, grootste variantie) en je df₂ (noemer, kleinste variantie) is. Wanneer je dan bijvoorbeeld de waarde 4,0 vindt bij rechtszijdig toetsen, dan weet je dat H ₒ wordt verworpen als F (toetsingsgrootheid) groter is dan 4. F 4,0. Bij tweezijdig toetsen bepaal je alleen de rechter kritieke waarde. Toets van Levene: wanneer niet aan de eis van een normale verdeling wordt gedaan, vormt de toets van Levene een goed alternatief. Hierbij wordt van iedere score het groepsgemiddelde afgetrokken en hier wordt de absolute waarde van genomen. Daarna wordt met een toets voor twee gemiddelden (vaak een nonparametrische toets) berekend of de gemiddelden van deze absolute scores in beide groepen gelijk zijn. Deze vergelijking wordt omgezet in een F-waarde, die door SPSS wordt vermeld met de bijbehorende overschrijdingskans.