Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd. De t-toets tussen twee gemiddelden gaat ervan uit dat we twee normaal verdeelde populaties hebben waarvan we de gemiddelden en de standaarddeviaties niet kennen. We trekken uit elke populatie aselect een steekproef, zodat we over twee onafhankelijke steekproeven beschikken. Je krijgt de volgende situatie: 1. Populatie 1: µ1 & σ1 (onbekend); steekproef I: ₁, S1, en n1. 2. Populatie 2: µ2 & σ2 (onbekend); steekproef 2: 2, S1, en n2. Voorwaarden T-toets voor het verschil tussen twee gemiddelden: - de twee populaties zijn normaal verdeeld met een onbekende σ1 en σ2; - de populaties zijn niet normaal verdeeld, maar beide steekproeven bevatten meer dan dertig onderzoekseenheden. Hypothesen: Linkseenzijdig toetsen: H0: µ1 µ2 en : µ1 < µ2 Rechtseenzijdig toetsen: H0: µ1 µ2 en : µ1 > µ2 Tweezijdig toetsen: H0: µ2 = µ2 en : µ1 = µ2 Er zijn twee varianten van de t-toets voor het verschil tussen twee gemiddelden die samenhangen met de vraag of de varianties in de populaties wel of niet verschillend zijn. Daarom moet eerst getoetst worden of de varianties gelijk zijn. Variant 1: toetsingsgrootheid als varianties ongelijk zijn We mogen hierbij de standaardfout schatten door de populatie varianties te vervangen door steekproefvarianties. Als we het verschil tussen de steekproefgemiddelden en standaardfout hebben berekend, kunnen we het verschil omzetten in een t-score. Dit is de toetsingsgrootheid waarmee hypothesen over verschillen in gemiddelden tussen twee normaal verdeelde populaties kunnen worden getoetst. M1 en M2: gemiddelden van steekproef 1 en 2 s1 en s2: varianties van steekproeven 1 en 2 n1 en n2: grootte van steekproeven 1 en 2
De vrijheidsgraden worden nu bijna geschat. Variant 2: toetsingsgrootheid als varianties gelijk zijn Omdat onder de aanname van gelijk varianties alle σ s gelijk zijn, is het niet meer nodig onderscheid te maken. Je krijgt dan σ² ₁= σ² ₂ = σ². De standaardfout wordt dan Als de populatievarianties inderdaad gelijk zijn, kunnen we de populatievariantie (σ²) schatten als een gewogen gemiddelde van twee steekproefvarianties. Dit is ook wel het poolen van varianties, het gewogen gemiddelde van 2 steekproeven waarvan de varianties aan elkaar gelijk zijn. Of ze aan elkaar gelijk zijn heb je met de F- toets bepaald (volgt later). µ1 en µ2 = Gemiddelden van populatie 1 & 2. df = Aantal vrijheidsgraden Dan heb je vervolgens ook nog de t-score formule voor het verschil in gemiddelden van twee steekproeven uit populaties met gelijke varianties: Waarbij: df= n1 + n2-2
Als df nou groter of gelijk is aan 100, dan zijn de afwijkingen ten opzichte van een standaard normale verdeling te verwaarlozen. Dit houdt in dat je er dan vanuit kunt gaan dat je met een standaard normale verdeling te maken hebt. Bij een df van onder de 100 kan je de overschrijdingskans die SPSS bij sig rapporteert niet opzoeken dus. Beslissingsregels Je kan H0 verwerpen door middel van overschrijdingskansen en kritieke waarden. Overschrijdingskansen Linkseenzijdige toetsing: Pl (t ₁- ₂) α Rechtseenzijdige toetsing: Pr (t ₁- ₂) α Tweezijdige toetsing: Pd (t ₁- ₂) α Kritieke waarden Je kijkt voor de kritieke waarden achter in je boek. Het getal dat je gevonden hebt in de kolom bij het df en significantie getal staat gelijk aan je significantieniveau α. Dus H0 moet verworpen worden bij linkszijdige toetsing als het kleiner of gelijk is aan dat getal, en bij rechtszijdige toetsing moet H0 verworpen worden als het groter is dan het getal. Je kijkt naar de vrijheidsgraden, een- of tweezijdige toetsing en het significantieniveau α. Stel je vindt 2,110, dan zijn de kritieke waarden +2,110 en -2,110. H0 wordt verworpen als 1-2 -2,110 of als 1-2 +2,110. Effectgrootte: als de toets significant resultaat geeft, bepalen we bij de t-toets voor twee gemiddelden ook de effectgrootte Cohen s d. Je moet bij het verschil tussen twee gemiddelden de standaardafwijking in de noemer schatten, door middel van de gepoolde variantie. De standaardrichtlijnen worden hierbij gebruikt. Rapporteren: bij het rapporteren van de resultaten van een t-toets voor twee gemiddelden vermelden we eerst de steekproefresultaten per groep (M en s). Dan geef je aan of het resultaat significant was, de waarde van toetsingsgrootheid t, inclusief de vrijheidsgraden en de p-waarde. Als er sprake is van significantie, wordt ook de effectgrootte vermeld. Betrouwbaarheidsinterval Wanneer de varianties ongelijk zijn: Bij ongelijke populatievarianties gebruiken we in het betrouwbaarheidsinterval de algemene vorm van de standaardfout. µ1 en µ2 = Gemiddelden van populatie 1 en 2.
t = Positieve t-waarde waarvoor geldt dat Pd(t) = α bij df= n₁ en n₂- 2. Wanneer de varianties gelijk zijn: Bij gelijke populatievarianties wordt de formule van het betrouwbaarheidsinterval aangepast met de gepoolde versie van de standaardfout. µ1 en µ2 = Gemiddelden van populatie 1 en 2. df = Aantal vrijheidsgraden t = Positieve t-waarde waarvoor geldt dat Pd(t) = α bij df= n1 en n2-2. De formules voor betrouwbaarheidsintervallen lijken heel veel op elkaar. Wanneer de populatievarianties gelijk zijn, komt in de formules voor de toetsingsgrootheid en het betrouwbaarheidsinterval de gepoolde variantie te staan. Zijn de populatievarianties ongelijk dan komen in de formules voor de toetsingsgrootheid en het betrouwbaarheidsinterval de afzonderlijke steekproefvarianties te staan. 6.3 F-toets: Bij de F-toets gaat het erom of twee populatievarianties van elkaar verschillen (dit moet je weten voor de t-toets). Het komt er op neer dat je kijkt naar S12 en S12, hoeveel keer de kleinste van de twee in de grootste past. Hier komt een quotiënt uit, welke F genoemd wordt. Je bent vaak geïnteresseerd in de F-waarden met rechter overschrijdingskansen die gelijk zijn aan vaak voorkomende waarden van α (0.05, 0.025, 0.01, 0,10) Voorwaarden F-toets: De populaties waaruit de steekproeven getrokken zijn moeten normaal verdeeld zijn. Deze eis is zeer belangrijk, omdat bij kleine afwijkingen de F zeer veel kan afwijken van wat zij in werkelijkheid zou moeten zijn. Slechts bij grote steekproeven (N > 100) worden de afwijkingen acceptabel. Hypothesen F-toets: Eenzijdig toetsen: H0: = en H1 > Tweezijdig toetsen: H0: = en H1 =
Toetsingsgrootheid F-toets: 1. Om H0 te kunnen verwerpen ja of nee, moet je het quotiënt van de varianties van beiden steekproeven nemen. De formule luidt als volgt: S12 en S22 = variantie van de steekproef 1 en 2 N1 en n2 = grootte van de steekproef 1 en 2 Df1 = aantal vrijheidsgraden van de teller (van de grootste variantie) Df2 = aantal vrijheidsgraden van de noemer (van de kleinste variantie) Als de nulhypothese waar is, bestaat er geen verschil tussen de populatievarianties en zal F in de buurt liggen van 1. Naarmate F groter is, is het aannemelijker dat de populatievarianties werkelijk van elkaar verschillen. Als H0 juist is, volgt de toetsingsgrootheid een kansverdeling die de F-verdeling wordt genoemd. Beslissingsregel: Dit kan ook weer door middel van overschrijdingskansen en kritieke waarden. Overschrijdingskansen H0 wordt verworpen bij rechtszijdig of tweezijdig toetsen. Linkszijdig toetsen kan bij de F- toets niet omdat de grootste variantie altijd in de teller staat, en de kleinste variantie altijd in de noemer. De uitkomst zal daarom altijd positief zijn. Hierdoor moet je de linkseenzijdige hypothese andersom formuleren als een alternatieve hypothese voor rechtseenzijdig toetsen. Rechtszijdig toetsen: Pr (F) α Tweezijdig toetsen: Pd (F) = 2 * Pr (F) α Kritieke waarden voor de kritieke waarden van de F-toets zoek je in de bijlagen achter in je boek bij de F-tabel. Voor elke α is er een andere tabel. Kijk goed wat je df₁ (teller, grootste variantie) en je df₂ (noemer, kleinste variantie) is. Wanneer je dan bijvoorbeeld de waarde 4,0 vindt bij rechtszijdig toetsen, dan weet je dat H ₒ wordt verworpen als F (toetsingsgrootheid) groter is dan 4. F 4,0. Bij tweezijdig toetsen bepaal je alleen de rechter kritieke waarde. Toets van Levene: wanneer niet aan de eis van een normale verdeling wordt gedaan, vormt de toets van Levene een goed alternatief. Hierbij wordt van iedere score het groepsgemiddelde afgetrokken en hier wordt de absolute waarde van genomen. Daarna wordt met een toets voor twee gemiddelden (vaak een nonparametrische toets) berekend of de gemiddelden van deze absolute scores in beide groepen gelijk zijn. Deze vergelijking wordt omgezet in een F-waarde, die door SPSS wordt vermeld met de bijbehorende overschrijdingskans.