Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet?
Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid en significantieniveau Eenzijdig of tweezijdig toetsen Procedure - Beslisregel Overschrijdingskans
Nulhypothese- Alternatieve Hypothese Nulhypothese : De hypothese die we met een toets, uitgevoerd op een steekproef, proberen te verwerpen. : Er zijn evenveel mannelijke als vrouwelijke biologie studenten Als dat lukt gaan we over op de Alternatieve hypothese : Er zijn NIET evenveel mannelijke als vrouwelijke biologie studenten
Het kiezen van een nulhypothese De nul- en alternatieve hypothesen, en, zeggen iets over een parameter van de kansverdeling van de variabele die we meten. : De kans dat een willekeurig gekozen biologiestudent een man is, is 0.5 De formulering is belangrijk en moet precies zijn. en zijn disjunct : De kans dat een willekeurig gekozen biologiestudent een man is, is NIET 0.5 We plannen een steekproef...
Betrouwbaarheid en significantienivo... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens. We kunnen dan de kansverdeling van die toetsingsgrootheid bepalen, onder de aanname dat H 0 waar is: α heet significantienivo (1 α ) heet betrouwbaarheid We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α. 0.1 0.08 0.06 0.04 0.02 acceptatiegebied 35 40 45 50 55 60 65 70 kritische gebied
Betrouwbaarheid en significantienivo... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens. We kunnen dan de kansverdeling van die toetsingsgrootheid bepalen, onder de aanname dat H 0 waar is: α heet significantienivo (1 α ) heet betrouwbaarheid We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α. 0.1 0.08 0.06 0.04 0.02 (1 α )-voorspellingsinterval acceptatiegebied 35 40 45 50 55 60 65 70 kritische gebied
Betrouwbaarheid en significantienivo... en we bedenken een toetsingsgrootheid: dwz. een, informatief gekozen, kansvariabele te berekenen uit de steekproefgegevens. We kunnen dan de kansverdeling van die toetsingsgrootheid bepalen, onder de aanname dat H 0 waar is: α heet significantienivo (1 α ) heet betrouwbaarheid 0.1 0.08 0.06 0.04 0.02 (1 α )-voorspellingsinterval acceptatiegebied 35 40 45 50 55 60 65 70 kritische gebied We verwerpen de hulhypothese wel als de kans op de gevonden toetsingsgrootheid, of een waarde die nog verder in de staart(en) van de kansverdeling ligt, kleiner is dan α. We verwerpen de nulhypothese niet als de gevonden toetsingsgrootheid in het (1 α)-voorspellingsinterval ligt.
Eenzijdig of tweezijdig toetsen Tweezijdig toetsen: De waarden die voldoen aan de alternatieve hypothese kunnen zowel groter als kleiner zijn dan die van de nulhypothese Eenzijdig toetsen: De waarden die voldoen aan de alternatieve hypothese zijn altijd groter (of altijd kleiner) dan die van de nulhypothese Tweezijdig: : θ = θ o : θ θ o Eenzijdig: enkelvoudig: : θ = θ o : θ > θ o samengesteld: : θ θ o : θ > θ o
Tweezijdig: : De kans dat een willekeurig gekozen biologiestudent een man is, is 0.5 : De kans dat een willekeurig gekozen biologiestudent een man is, is N IET 0.5 : p = 0.5 : p 0.5 Eenzijdig: : De kans dat een willekeurig gekozen biologiestudent een man is, is kleiner dan 0.5 : De kans dat een willekeurig gekozen biologiestudent een man is, is groter dan 0.5 : p 0.5 : p > 0.5
Tweezijdige toets: : De kans dat een willekeurig gekozen student een man is, is 0.5. : De kans dat een willekeurige student een man is, is NIET 0.5. We toetsen aan het aantal mannen in een steekproef: k. betrouwbaarheid 1- α is 0.95, significantieniveau α is 0.05. We kiezen willekeurig 100 studenten: 66 vrouwen en 34 mannen. De toetsingsgrootheid heeft dus de waarde 34. Als juist is geldt k ~ B (100, 0.5), E (k) = 50, Var(k) = 25. We gebruiken een benadering van k met x ~ N (50, 5).
P (toetsingsgrootheid in het kritisch gebied ) α Als waar is, valt de toetsingsgrootheid met kans 1-α = 0.95 in het voorspellingsinterval. f (x) 0.1 0.08 0.06 0.04 0.02 E (x) = 50 Var(x) = 25 35 40 45 50 55 60 65 70 x P ( 50-1.96 5 < x < 50 + 1.96 5 ) = 0.95 P ( 40.2 < x < 59.8 ) = 0.95 De waarden van x buiten het voorspellingsinterval [40.2, 59.8] vormen het kritisch gebied.
f (x) 0.1 0.08 0.06 0.04 0.02 Tweezijdige toets : p = 0.5 35 40 45 50 55 60 65 70 x Verwerp P (x < 40.2 = 0.025) Aanvaard Verwerp P (x > 59.8) = 0.025 voordeel van de twijfel: bereken met p = 0.5 f (x) Rechts-Eenzijdige toets : p 0.5 0.1 0.08 0.06 0.04 0.02 35 40 45 50 55 60 65 70 x 0 0.5 1 Aanvaard Verwerp P (x > 58.2) = 0.05
0.1 0.08 0.06 0.04 0.02 35 40 45 50 55 60 65 70 40.2 P (40.2 < x < 59.8 ) = 0.95 terug naar de discrete verdeling van k (met conservatieve continuiteitscorrectie): P (39 < k < 61 ) 0.95 59.8 37 38 39 40 41 42 43 58 59 60 61 62 63 64 Kritisch gebied: k 39 en k 61. De toetsingsgrootheid k = 34 ligt in dit gebied. wordt verworpen: p is NIET 0.5. Er zijn niet evenveel mannelijke als vrouwelijke biologiestudenten.
Procedure - Beslisregel 1a) Stel nul - en alternatieve hypothese op (kies 1- of 2-zijdige test). 1b) kies de toetsingsgrootheid en significantieniveau α ( in de meeste gevallen wordt α = 0.05 gekozen). 2) Neem een steekproef. 3a) Bereken de toetsingsgrootheid. 3b) Bereken een voorspellingsinterval en een kritisch gebied voor de toetsingsgrootheid op basis van α en. P (toetsingsgrootheid in het kritisch gebied ) α. 4) Kijk of de toetsingsgrootheid in het kritisch gebied dan wel het voorspellingsinterval ligt. Kritisch gebied zit vast aan de staarten van de kansverdeling voor θ=θ o. Als we α kleiner kiezen krimpt het kritische gebied.
Overschrijdingskans 3b) Als waar is, valt de toetsingsgrootheid minstens met kans 1-α = 0.95 in het voorspellingsinterval. Andere aanpak: Bereken de kans, onder, dat de toetsingsgrootheid x de gevonden waarde x, dan wel een extremere waarde aanneemt: de overschrijdingskans of p-waarde rechtseenzijdige toets: p = P (x x ) linkseenzijdige toets: p = P (x x ) tweezijdige toets: p = 2 Min[ P (x x ), P (x x ) ] Als de overschrijdingskans kleiner is dan het significantieniveau, verwerp je