Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt nog niets berekend. 1.1 Voorbeeld Tweezijdige formulering Van een muntstuk wil je controleren of het zuier is, door voor een serie worpen bij te houden hoe vaak 'kop' en 'munt' gegooid worden. We spreken van 'zuiver' als P(kop) = π = ½. Het alternatief is dat de munt niet zuiver is. : π s 1 2 1.2 Voorbeeld (Rechts)Eenzijdige formulering Een fabrikant stelt dat een productieproces hoogstens 20% exemplaren van mindere kwaliteit oplevert. Om deze stelling te controleren, wordt een aantal producten gecontroleerd: : π & 0.20 : π O 0.20 1.3 Voorbeeld (Links)Eenzijdige formulering Een fabrikant garandeert dat het afgeleverde gewicht van een product gemiddeld minstens 1000 gram per verpakking bedraagt. Als we deze uitspraak willen toetsen, formuleren we een linkseenzijdige alternatieve hypothese: : μ S 1000 : μ! 1000
2. Vaststellen van de toetsingsgrootheid en doen van onderzoek met steekproef Nadat de hypothesen zijn vastgesteld, formuleren we het onderzoek. Er moet een steekproef genomen worden en er moet bepaald worden wat de toetsingsgrootheid is. Ga daarbij uit van het grensgeval dat aangegeven wordt door de nulhypothese en verdere informatie over de verdeling. Soms is van een verdeling de standaarddeviatie bekend. 2.1 Voorbeeld Tweezijdig toetsen, binomiaal, normaal benaderd Van een muntstuk wil je controleren of het zuier is, door voor een serie worpen bij te houden hoe vaak 'kop' en 'munt' gegooid worden. We spreken van 'zuiver' als P(kop) = π = ½. Stel dat het muntstuk zuiver is dus π = 1 2. : π s 1 2 We doen nu een onderzoek en nemen een steekproef van n =100 worpen. Als toetsingsgrootheid nemen we k het aantal malen 'kop'. Deze kansvariabele k volgt een binomiale verdeling met n = 100 en π = 1 2. Neem hiervan de normale benadering (n > 20) met verwachtingswaarde 50 en variantie 25 (= n π (1-π) ) en dus σ = 5. 2.2 Voorbeeld Eenzijdig, binomiaal, normaal benaderd Een fabrikant stelt dat een productieproces hoogstens 20% exemplaren van mindere kwaliteit oplevert. Om deze stelling te controleren, wordt een aantal producten gecontroleerd: : π & 0.20 : π O 0.20 Stel dat er gemiddeld 20% van de producten mindere kwaliteit heeft. We doen nu een onderzoek en nemen een steekproef van n =100 producten Als toetsingsgrootheid nemen we k het aantal producten van mindere kwaliteit. Deze kansvariabele k volgt een binomiale verdeling met n = 100 en π =0.2. Neem hiervan de normale benadering (n > 20) met verwachtingswaarde 20 en variantie 16 (= n π (1-π) ) en dus σ = 4. 2.3 Voorbeeld
Eenzijdig, normale verdeling Een fabrikant garandeert dat het afgeleverde gewicht van een product gemiddeld minstens 1000 gram per verpakking bedraagt. Als we deze uitspraak willen toetsen, formuleren we een linkseenzijdige alternatieve hypothese: : μ S 1000 : μ! 1000 Stel dat het gemiddelde gewicht van de producten gelijk is aan μ = 1000 g met een standaarddeviatie van 25 g. We doen nu een onderzoek en nemen een steekproef van n =100 producten Als toetsingsgrootheid nemen we nu het steekproefgemiddelde x. Voor deze x geldt dat deze normaal verdeeld is met μ = 1000 en σ = 2.5 g (wortel-nwet). 3. Kritieke gebied, voorspellingsinterval en significantieniveau α Als de hypothesen en zijn vastgesteld en de onderzoeksgrootheden zijn afgesproken, is het tijd om bij de opdrachtgever te achterhalen hoe groot de betrouwbaarheid moet zijn. De keuze van het significantieniveau α, wordt bepaald door het risico dat de onderzoeker wil lopen om de nulhypothese ten onrechte te verwerpen. Dit risico wordt het type I risico genoemd (fout van de eerste soort). Het significantieniveau α behoort voorafgaande aan de uitvoering van het onderzoek te worden vastgesteld en niet pas als de resultaten van het steekproefonderzoek bekend zijn. Er worden dan een kritiek gebied gedefinieerd en een acceptatiegebied gedefinieerd uitgaande van de hypothese en NIET uitgaande van de metingen! Vervolgens vindt pas het onderzoek plaats en als de uitkomst van het onderzoek in het kritieke gebied valt, wordt de nulhypothese verworpen en dan wordt de alternatieve hypothese voor waar aangenomen. 3.1 Enkele handige waarden Als het een 90%-betrouwbaarheidsinterval is, dan hoort daarbij z =1.645. (Rechter overschrijdingskans van 0.05) Als het een 95%-betrouwbaarheidsinterval is, dan hoort daarbij z =1.96. (Rechter overschrijdingskans van 0.025) Als het een 98%-betrouwbaarheidsinterval is, dan hoort daarbij z =2.33. (Rechter overschrijdingskans van 0.01) Als het een 99%-betrouwbaarheidsinterval is, dan hoort daarbij z =2.58. (Rechter overschrijdingskans van 0.005) Eenzijdige overschrijdingskans van 0.1 hoort bij z =1.28 Eenzijdige overschrijdingskans van 0.05 hoort bij z = 1.645 Eenzijdige overschrijdingskans van 0.02 hoort bij z =2.05
Eenzijdige overschrijdingskans van 0.01 hoort bij z =2.33 Eenzijdige overschrijdingskans van 0.005 hoort bij z =2.58 3.2 Voorbeeld Eenzijdig toetsen, binomiaalverdeling, normaal benaderd Een fabrikant stelt dat een productieproces hoogstens 20% exemplaren van mindere kwaliteit oplevert. Om deze stelling te controleren, wordt een aantal producten gecontroleerd: : π & 0.20 : π O 0.20 Stel dat er gemiddeld 20% van de producten mindere kwaliteit heeft. We doen nu een onderzoek en nemen een steekproef van n =100 producten Als toetsingsgrootheid nemen we k het aantal producten van mindere kwaliteit. Deze kansvariabele k volgt een binomiale verdeling met n = 100 en π =0.2. Neem hiervan de normale benadering (n>20) met verwachtingswaarde μ 0 = 20 en variantie 16 (= n π (1-π) ) en dus σ = 4. Kies nu het kritieke gebied met significantieniveau α met α = 0.05. De grens t α van het (eenzijdige) kritieke gebied wordt gevonden met: t α =20C1.645 $ 4 = 26.580 Het kritieke gebied (roze gearceerd) is dus Z = x x O 26.58 Om dit gebied terug te vertalen naar de discrete binomiale verdeling, moeten we rekening houden met de continuïteitscorrectie. Het kritieke gebied wordt dus: Z = k k S 27 Hou bij de continuïteitscorrectie altijd in de gaten dat als er sprake is van α = 0.05, dat deze kans altijd kleiner of gelijk aan 0.05 moet zijn. Als het onderzoek d.m.v. de steekproef is gedaan en de uitslag (aantal producten van mindere kwaliteit) ligt in het acceptatiegebied, dan wordt de Nulhypothese aangenomen.
Ligt het gemeten aantal van de steekproef inhet kritieke gebied, dan wordt de Nulhypothese verworpen en wordt de Alternatieve hypothese aangenomen. 3.3 Voorbeeld Eenzijdig, binomiale verdeling Asthma-patiënten worden behandeld met een nieuwe vorm van fysiotherapie. De uitkomsten kunnen zijn 'verbeterd' of 'verslechterd'. De onderzoeksvraag is of de therapie de toestand van de patiënten verbetert. De nulhypothese is dat het middel niet helpt. De alternatieve hypothese is dat de meerderheid van de patiënten verbetert. Stel de kans verbeterd π = ½. : π O 1 2 Er wordt een steekproef gedaan van 8 mensen. Onder de nulhypothese heeft het aantal verbeterde patiënten k de binomiale verdeling met π = 0.5 en n = 8. Spreek het significantieniveau af met α = 0.05. Het onderzoek wordt nu gedaan en het blijkt dat 7 van de 8 patiënten verbeterd zijn. De overschrijdingskans P k S 7 van deze uitkomst is gelijk aan (uit de tabel): P k S 7 =1KP k& 6 = 0.0352 De overschrijdingskans P k S 6 = 1KP k& 5 = 0.1445 De grens van het acceptatiegebied ( α = 0.05 ) ligt dus tussen k =6 en k =7. De uitkomst k =7 ligt dus in het kritieke gebied wat tot gevolg heeft dat de Nulhypothese verworpen moet worden. Het wil dus zeggen dat er wel al te veel mensen beter worden dan dat dit aan het toeval te wijten is. 3.4 Voorbeeld Tweezijdig, binomiaal, normale benadering
Een munt is eerlijk of niet eerlijk bij het opgooien met resultaat kop of munt. Stel de nulhypothese een eerlijke munt H : π s 1 1 2 Er wordt een steekproef gedaan met n =100. Als toetsingsgrootheid kiezen we k = aantal keren kop. Het is dus een binomiale verdeling B(n = 100,π = 0.5) Overgaan op een normale benadering (n > 20) met gemiddelde μ = 50 en σ = 5. (Immers de Variantie is Var = n π (1-π) = 25.) Bij teveel keren kop óf te weinig keren kop beslissen we dat de munt niet eerlijk is. We stellen het kritieke gebied Z vast met α = 0.05. Aan weerszijden ligt het kritieke gebied met kans α/2 = 0.025. De grenswaarden van het Acceptatiegebied (het Kritieke gebied is roze gearceerd) zijn: 50 K1.96$5! x! 50 C1.96$5 40.2! x! 59.8 41 # k # 59 Let op de continuïteitscorrectie! Als de uitkomst van de meting in dit gebied ligt, wordt de nulhypothese aangenomen. Dus als er 100 keer gegooid wordt met de munt en daarvan is 64 keer kop, dan veronderstellen we dat we te maken hebben met een oneerlijke munt.