HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Vergelijkbare documenten
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 10: Regressie

Hoofdstuk 3 Statistiek: het toetsen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Kansrekening en Statistiek

Data analyse Inleiding statistiek

Voorbeeldtentamen Statistiek voor Psychologie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Hoofdstuk 4 Kansen. 4.1 Randomheid

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Les 2: Toetsen van één gemiddelde

werkcollege 6 - D&P9: Estimation Using a Single Sample

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

College 2 Enkelvoudige Lineaire Regressie

Statistiek voor A.I.

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

8. Analyseren van samenhang tussen categorische variabelen

Examen Statistiek I Feedback

11. Multipele Regressie en Correlatie

9. Lineaire Regressie en Correlatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Examen Statistiek I Januari 2010 Feedback

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Kansrekening en Statistiek

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Toetsen van hypothesen

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Sheets K&S voor INF HC 10: Hoofdstuk 12

Kansrekening en Statistiek

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Inhoudsopgave. Deel I Schatters en toetsen 1

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Eerst wordt ingegaan op de verschillende soorten data die we kunnen verzamelen en hoe datasets georganiseerd zijn.

toetskeuze schema verschillen in gemiddelden

15.1 Beslissen op grond van een steekproef [1]

Beschrijvende statistiek

Kansrekening en Statistiek

Cursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Kansrekening en Statistiek

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Kruis per vraag slechts één vakje aan op het antwoordformulier.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Oefenvragen bij Statistics for Business and Economics van Newbold

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

SOCIALE STATISTIEK (deel 2)

Statistiek II. Sessie 5. Feedback Deel 5

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

Kansverdelingen Inductieve statistiek met Geogebra 4.2

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Feedback proefexamen Statistiek I

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Antwoordvel Versie A

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

VOOR HET SECUNDAIR ONDERWIJS

Paragraaf 10.1 : Populatie en Steekproef

Gegevensverwerving en verwerking

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

. Dan geldt P(B) = a d. 3 8

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Kansrekening en Statistiek

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

1 Basisbegrippen, W / O voor waar/onwaar

Kansrekenen en statistiek. Daniël Slenders Faculteit Ingenieurswetenschappen Katholieke Universiteit Leuven

Kansrekening en Statistiek

Transcriptie:

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan van een bekende σ. In de praktijk kennen we de standaarddeviatie van de populatie vaak niet. De standaarddeviatie van de steekproef (s) wordt dan gebruikt om σ te schatten. De t-distributie We gebruiken de t-distributie (in plaats van de z-distributie) wanneer we de standaarddeviatie van de populatie niet kennen. Wanneer de standaarddeviatie van een statistiek uit de data wordt geschat, dan wordt het resultaat de (geschatte) standaardfout van de statistiek genoemd. De standaardfout van het steekproefgemiddelde is: SE M = s/ n. Het gestandaardiseerde steekproefgemiddelde wordt ook wel weergegeven met de éénsteekproef-z-toets: z=( -μ)/ (σ/ n ). Deze toets is de normaalverdeeld: N(0,1). Wanneer we (σ/ n ) vervangen door (s/ is nu een t-distributie ontstaan. n ), dan is er echter geen sprake meer van een normaalverdeling. Er Als er een SRS van grootte n uit een normaalverdeelde populatie N(μ,σ) wordt getrokken, dan is de één-steekproef-t-toets: t=( -μ)/ (s/ n ). Dit is een t-distributie met n-1 vrijheidsgraden (k). Bij elke vrijheidsgraad hoort een andere t-distributie. De dichtheidscurves van de t-distributies lijken qua vorm op die van de bekende normaal verdeelde curve. De piek is echter lager en de staarten staan wat hoger. Er is dus meer spreiding aanwezig. Dit komt omdat de standaarddeviatie van de populatie niet gebruikt wordt in de formule. De standaarddeviatie van de steekproef zorgt voor meer spreiding. Tabel D geeft kritische t*-waarden voor de t- distributies. Bij het gebruiken van de tabel moet gekeken worden naar de bijbehorende vrijheidsgraden. Betrouwbaarheidsintervallen voor t-distributies Als je een SRS van grootte n uit een populatie met een onbekend gemiddelde (μ) trekt, dan is het betrouwbaarheidsinterval (C) voor μ: ±t*(s/ n ). In dit verband is t* de waarde voor de t(n-1) dichtheidscurve met gebied C tussen t* en t*. In deze formule staat t*(s/ n ) voor de foutenmarge. 1

De t-toets Het toetsen van significantie met een t-toets lijkt erg op het toetsen van significantie met de z-toets. De t- waarde wordt verkregen door: t= ( - μ 0 )/ (s/ n ). De bijbehorende p-waarde kan opgezocht worden in tabel D achterin het boek. We kunnen er, net zoals bij de z-toets, voor kiezen om eenzijdig of tweezijdig te toetsen. Als er geen vermoeden over de richting van het effect bestaat, dan is het altijd beter om een tweezijdige toets uit te voeren. Gematchte paren en de t-distributie Bij een gematchte paren-onderzoek vormen deelnemers paren. Vervolgens wordt er naar de onderzoekresultaten binnen elk paar gekeken. De onderzoeker kan bijvoorbeeld twee vormen van therapie uitproberen op de verschillende leden van een paar, om te kijken of er verschillen in uitkomsten optreden. We willen elk lid van een paar dus met het andere lid vergelijken. Er wordt voor elk paar (of elk individu) een verschilscore berekend. Deze scores worden gebruikt als data. Tot slot kunnen met deze informatie t- betrouwbaarheidsintervallen en t-significantietoetsen uitgevoerd worden. Een dergelijk onderzoek wordt vaak ook gedaan als randomisatie niet mogelijk is. Equivalentietest Als er uit een onderzoek geen statistische significantie naar voren komt, betekent dit niet per se dat de nulhypothese waar is. In dat geval kun je gebruik maken van een equivalentietest. Een equivalentietest gebruikt een betrouwbaarheidsinterval (van bijvoorbeeld 90%) om te bewijzen dat het gemiddelde verschil rond 0 is en dat de resultaten acceptabel zijn. Ga ervan uit dat n de populatie is en μ het gemiddelde. Als het significatieniveau α is en μ binnen een marge van μ 0 equivalent moet zijn, en het interval μ 0 ± δ is, dan gaat een equivalentietestals volgt: Bereken het betrouwbaarheidsinterval waarbij C = 1 2 α. Vergelijk dit interval met de marge van equivalentie. Alleen als het betrouwbaarheidsinterval geheel binnen het vooraf bepaalde interval ligt, dan is de conclusie dat μ equivalent is aan μ 0. Ook met behulp van statistische software kun je equivalentietests uitvoeren. Robuustheid De uitkomsten van de één-steekproef-t-toets zijn helemaal juist wanneer de populatie normaal verdeeld is. In werkelijkheid is geen enkele populatie precies normaal verdeeld. De bruikbaarheid van de t-distributie hangt in de praktijk daarom vooral af van hoe niet-normaal verdeeld een populatie is. Een distributie die niet erg door een niet-normaal verdeelde populatie wordt beïnvloed, wordt robuust genoemd. Een statistische procedure is robuust wanneer de benodigde kansberekeningen niet worden beïnvloed als niet aan de voorwaarden voor die kansberekeningen wordt voldaan. De voorwaarde voor de t-distributie is dus dat de populatie normaal verdeeld is, wat vaak niet het geval blijkt te zijn. Toch is de t-distributie robuust. 2

Robuustheid van de t-distributie De t-distributie is behoorlijk robuust tegen niet-normaliteit van de populatie, behalve als er uitbijters zijn of als er een sterke afwijking naar links of rechts aanwezig is. Grote steekproeven verbeteren de accuraatheid van de p-waarden wanneer de populatie niet normaal verdeeld is. Dit is waar om de volgende twee redenen: Allereerst is de steekproevendistributie van een steekproefgemiddelde van een grote steekproef bijna normaal verdeeld. Normaliteit van individuele observaties is niet erg belangrijk wanneer de steekproef groot genoeg is. Als de steekproefgrootte n groter wordt, dan zal de steekproefstandaarddeviatie s een betere schatter zijn van σ, of de populatie nou wel of niet normaal verdeeld is. Het is slim om de t- distributie pas te gebruiken als de steekproef 15 of meer deelnemers heeft. Als er sprake is van een hele kleine steekproef, dan is de aanname dat de data van een SRS afkomstig belangrijker dan de aanname dat de populatiedistributie normaalverdeeld is. Steekproefgrootte en de t-distributie Als de steekproef minder dan 15 deelnemers bevat, dan kan de t-distributie alleen gebruikt worden wanneer de data bijna normaal verdeeld is. Als de data niet normaal verdeeld is en er uitbijters aanwezig zijn, dan dient de t-distributie niet gebruikt te worden. Als de steekproef minstens 15 deelnemers heeft, kan dan de t-distributie gebruikt worden, behalve als er sprake is van uitbijters of een sterke afwijking naar links of rechts. De t-distributie kan zelfs gebruikt worden voor distributies met een sterke afwijking naar links of rechts als de steekproef 40 of meer deelnemers bevat. Introductie resampling en bootstrapping Wat kun je doen als de populatie niet normaal verdeeld is en er enkel een kleine steekproef genomen kan worden? Om toch de steekproefdistributie van te benaderen, kan gebruik worden gemaakt van een bootstrap. Hierbij doe je alsof de beschikbare populatie de gehele populatie is, en worden er veel kleine steekproeven uit genomen. Elke steekproef heet hierbij een resample. Vervolgens bereken je voor elke steekproef de gemiddelde. De hieruit resulterende distributie behandel je alsof het de steekproefdistributie is, door statistische gevolgtrekking erop toe te passen, kun je ondanks het gebrek aan beschikbare gegevens toch een idee krijgen van hoe een steekproefdistributie eruit zou komen zien. 7.2 Twee gemiddelden vergelijken Twee groepen Het doel van statistische gevolgtrekkingen is vaak het vergelijken van responsen in twee groepen. Elke groep wordt als een aparte steekproef uit een populatie gezien. De responsen van de groepen zijn onafhankelijk van elkaar. Bij twee aparte steekproeven is er geen sprake van gematchte paren en statistische procedures om twee steekproeven te vergelijken verschillen dan ook van statistische procedures om gematchte paren te vergelijken. We bestuderen twee onafhankelijke steekproeven en dus ook twee afzonderlijke populaties. Dezelfde (afhankelijke) variabele wordt gemeten voor beide steekproeven. 3

We kunnen de variabele x 1 noemen voor de eerste populatie en x 2 voor de tweede populatie. Dit omdat de variabele verschillende distributies in de twee populaties kan hebben. Het gemiddelde van de eerste populatie noemen we µ 1 en het gemiddelde van de tweede populatie noemen we µ 2. De standaarddeviatie van de eerste populatie is σ 1 en voor de tweede populatie is dat σ 2. De z-toets voor twee steekproeven De nulhypothese die we willen onderzoeken is of het gemiddelde van beide populaties hetzelfde is, dus: H 0: µ 1 = µ 2. Dit kunnen we uitzoeken door middel van twee steekproeven met gemiddelden 1 en 2. Deze steekproeven zijn van grootte n 1 en n 2. De bijbehorende steekproefstandaarddeviaties zijn s 1 en s 2. We schatten het verschil tussen de populatiegemiddelden dus door middel van het verschil tussen de steekproefgemiddelden. Grote steekproeven zijn nodig om kleine verschillen vast te stellen. De z-toets voor twee steekproeven wordt als volgt gevonden: Vind eerst: ( 1 en 2)- (µ 1 - µ 2 ). Trek daarna de wortel uit (σ² 1 / n 1 +σ² 2 / n 2 ). Deel de eerste uitkomst door de tweede uitkomst. De z-toets voor twee steekproeven heeft de N(0,1)-steekproevendistributie. De z-toets voor twee steekproeven wordt echter zelden gebruikt, aangezien de standaarddeviaties van de populaties zelden geweten worden. In de praktijk wordt daarom veel vaker de t-toets voor twee steekproeven gebruikt. De t-toets voor twee steekproeven De t- toets voor twee steekproeven wordt als volgt gevonden: Bereken eerst ( 1 en 2) Trek daarna de wortel uit (s² 1 / n 1 +s² 2 / n 2 ). Deel de eerste uitkomst door de tweede uitkomst. Deze toets heeft echter geen t-distributie. Een t-distributie vervangt de N(0,1)-distributie alleen wanneer een enkele standaarddeviatie (σ) in een z-toets wordt vervangen door een steekproefstandaarddeviatie (s). Bij de t-toets worden echter beide standaarddeviaties (σ 1 en σ 2 ) vervangen door s 1 en s 2. Toch kunnen we de t-distributie voor twee steekproeven benaderen door een benadering met de vrijheidsgraden (k) te maken. We gebruiken deze benadering om waarden voor t* te vinden voor betrouwbaarheidsintervallen en om p-waarden te vinden voor significantietoetsen. Hoe maken we deze benadering? Dit kan op twee manieren. Hieronder zullen die manieren beschreven worden. Gebruik een waarde van k die met de data berekend is. Vaak is dit geen heel getal. Vaak maken computerprogramma s gebruik van deze manier. De berekende vrijheidsgraden zijn in dit geval minstens even groot als de kleinste van n 1-1 en n 2-1. Het is echter ook zo dat de berekende vrijheidsgraden nooit groter zijn dan n 1 +n 2-2. Bereken n 1-1 en n 2-1 en kies de kleinste uitkomst. Deze manier is het gemakkelijkst wanneer handmatig te werk wordt gegaan. 4

Eerst moet de t- toets voor twee steekproeven dus berekend worden. Vervolgens moeten de vrijheidsgraden per steekproef gevonden worden. De kleinste moet gekozen worden om gebruik te maken van tabel D achterin het boek. Het t-betrouwbaarheidsinterval voor twee steekproeven Stel: we trekken een SRS van grootte n 1 uit een normaalverdeelde populatie met een onbekende µ 1 en we trekken ook een onafhankelijke SRS van grootte n 2 uit een andere normaalverdeelde populatie met een onbekende µ 2. In dat geval wordt het betrouwbaarheidsinterval als volgt berekend: Eerst moet 1-2 berekend worden. Daarna moet t* de wortel uit (s² 1 / n 1 +s² 2 / n 2 ) berekend worden. De gehele formule is: 1-2 ± t* de wortel uit (s² 1 / n 1 +s² 2 / n 2 ). Wat de standaarddeviaties van de populaties zijn is dus niet van belang voor deze formule. Robuustheid van berekeningen op basis van twee steekproeven De t-toets op basis van twee steekproeven is robuuster dan de t-toets die op een enkele steekproef is gebaseerd. Wanneer beide steekproeven van dezelfde grootte zijn en de bijbehorende populaties dezelfde vorm hebben, dan zijn de waarden uit de t-tabel behoorlijk accuraat, als de steekproeven maar minimaal uit 5 deelnemers bestaan. Het is daarom aan te raden om steekproeven van gelijke grootte te kiezen als dat mogelijk is. De t-toets voor twee steekproeven zijn het meest robuust tegen niet-normaliteit in dit geval. Wanneer de twee populatiedistributies verschillende vormen hebben, zijn er grotere steekproeven nodig. Kleine steekproeven De power van significantietoetsen is vaak klein wanneer gebruik gemaakt wordt van kleine steekproeven. De foutenmarge dat bij de betrouwbaarheidsintervallen hoort is juist erg groot. Ondanks deze moeilijkheden kunnen we toch belangrijke conclusies trekken op basis van kleine steekproeven. De steekproefgrootte heeft invloed op de p-waarde van een toets. Een effect dat niet significant is op een specifiek significantieniveau, kan dat wel worden als een grotere steekproef uit de populatie getrokken wordt. Software en de vrijheidsgraad berekenen De vrijheidsgraad (degrees of freedom) geeft informatie over hoeveel verschil achter de komma toelaatbaar is. Er bestaan formules om de vrijheidsgraad (df) zelf te berekenen, maar dit kan makkelijker (en betrouwbaarder) worden gedaan met behulp van statistische software. De meeste software heeft een functie of knop waarmee je de degrees of freedom kunt laten berekenen. De gepoolde t-toets voor twee steekproeven Er is één situatie waarin een t-toets om twee gemiddelden te vergelijken precies een t-distributie heeft. Bij deze situatie wordt meer gewicht gegeven aan de grotere steekproef, want deze bevat meer informatie. We zeggen dan dat we de t-toets poolen. Het resultaat is: s² p = (n 1-1)s² 1 +(n 2-1)s² 2 / n 1 +n 2-2. De uitkomst wordt ook wel de gepoolde schatter van σ² genoemd. Als we hier de wortel uittrekken, dan hebben we de gepoolde standaarddeviatie gevonden. Deze kunnen we weer gebruiken om een betrouwbaarheidsinterval te berekenen: 5

1-2 ± t*s p (s² 1 / n 1 +s² 2 / n 2 ). Om de nulhypothese te toetsen (die beweert dat de gemiddelden van beide populaties hetzelfde is), kan de gepoolde standaarddeviatie ook gebruikt worden: 1-2/ s p 1/n 1 +1/n 2. Het nadeel van t-toetsen die op twee steekproeven gebaseerd zijn, is dat ze uitgaan van de aanname dat de twee onbekende populatiestandaarddeviaties gelijk aan elkaar zijn. Deze aanname is moeilijk te verifiëren. Het poolen van t-toetsen is daarom risicovol. 7.3 Extra onderwerpen over gevolgtrekkingen De steekproefgrootte kiezen Bij het ontwerpen van een onderzoek kun je gebruik maken van software bij ondersteuning in het kiezen van de steekproefgrootte. Het kiezen van een geschikte steekproefgrootte voor betrouwbaarheidsintervallen vergroot de betrouwbaarheid en minimaliseert de kans op fouten. Om de steekproefgrootte te bepalen, is het volgende noodzakelijk: Het betrouwbaarheidsniveau C De maximale marge voor toelaatbare fouten m De kritieke waarde t*waarbij C slechts n 1 vrijheidsgraden heeft De geschatte waarde van de standaarddeviatie van de populatie s* De formule wordt dan: m t* s* / n Soortgelijke onderzoeken of pilot studies kunnen dienen om de standaarddeviatie te schatten (s*). Om de foutenmarge zo klein mogelijk te maken, is het beter om een standaarddeviatie een klein beetje groter in te schatten dan wat je verwacht. De hoeveelheid data die beschikbaar komt, wordt vaak met het voortschreiden van het onderzoek minder dan vooraf ingepland, bijvoorbeeld omdat participanten afhaken. Bij het bepalen van de steekproefgrootte is het handig om hier alvast rekening mee te houden. Power van de t-toets De power van een toets meet het vermogen van de toets om afwijkingen van de nulhypothese vast te stellen. De precieze berekening van de power van de t-toets is wat complexer, omdat er rekening gehouden moet worden met het feit dat de standaarddeviatie van de steekproef gebruikt moet worden om de standaarddeviatie van de populatie te schatten. Vaak wordt de precieze power niet berekend, maar wordt er genoegen genomen met een benadering van de power. Deze berekening lijkt erg op die van de z- toets: 6

Bepaal een standaarddeviatie, significantieniveau, de een- of tweezijdigheid van de toets en een alternatieve hypothese. Het is altijd beter om een waarde van de standaarddeviatie te gebruiken die iets groter is dan wat we zouden verwachten. Noteer bij welke gebeurtenis de nulhypothese afgewezen zal worden (in termen van ). Vind de kans op deze gebeurtenis als de alternatieve hypothese waar zou zijn. De power van de t-toets berekenen voor twee steekproeven volgt dezelfde principes als bij een enkele steekproef. De niet-centrale t distributie (noncentral t distribution) sluit hierbij aan. Hiervoor is het nodig om de niet-centrale parameter (noncentrality parameter) te bepalen. Software berekent de exacte power van de t-toets, in plaats van een benadering. Statistiek voor populaties die niet normaal verdeeld zijn Wat te doen als een populatie niet normaal verdeeld is en als de steekproef klein is? Er zijn in dat geval drie alternatieven: Soms geeft een niet-normaal verdeelde distributie een goede beschrijving van de data. Er zijn veel niet-normaal verdeelde modellen voor data en er zijn ook statistische procedures beschikbaar voor deze modellen. Het is ook mogelijk om te proberen de afwijkende data te transformeren in normaal verdeelde data. Er zal dan geen sprake zijn van een perfect normaal verdeelde distributie, maar de distributie zal wel zo normaal verdeeld mogelijk zijn. Deze transformatie kan gemaakt worden met het logaritme. Daarmee wordt de rechterstaart van een distributie aangepakt. Tot slot kan een distributievrije methode gebruikt worden. Zo een methode heeft niet als aanname dat de populatie normaal verdeeld moet zijn. Distributievrije procedures worden ook wel nonparametrische procedures genoemd. De tekentest (The sign test) Een voorbeeld van de makkelijkste en meest gebruikte nonparametrische procedure is de tekentest. Negeer bij een tekentest de paren met een verschil van nul: het aantal gebeurtenissen n is de telling van de overige paren. De teststatistiek is de telling X van paren met een positief verschil. P-waarden voor X zijn gebaseerd op de binomiale B(n,1/2) distributie. De tekentest toetst in feite de hypothese dat de mediaan van de verschillen nul is. Als p de kans is dat een verschil positief is, dan is p 0.5 als de mediaan 0 is. De nulhypothese is dat de populatiemediaan 0 is en de alternatieve hypothese is dat de populatiemediaan groter dan 0 is. De tekentest maakt geen gebruik van echte verschillen, er wordt alleen gekeken of scores gestegen zijn. Omdat er niet naar inhoudelijke verschillen wordt gekeken, is de tekentest veel minder sterk dan de t-toets. 7