Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen 8.1. Stel dat medisch onderzoek heeft uitgewezen dat als het gemiddelde nicotinegehalte van een sigaret 25 mg of meer bedraagt, de kans op longkanker groot is, en dat als het gemiddelde kleiner is dan 25 mg de roker relatief veilig is. Stel dat je roker bent, het wil blijven, maar een merk wilt selecteren dat relatief veilig is, hoe zou je dan de hypothesen formuleren? Wat kun je zeggen over de fout α van type I en de fout β van type II? Oplossing: We kiezen als nulhypothese H 0 : µ 25 en als alternatieve hypothese H 1 : µ < 25. (a) De fout α van het type I is de kans dat we een onveilig merk als veilig bestempelen. Bijgevolg willen we α zo klein mogelijk kiezen (α 0.01). (b) De fout β van het type II is de kans dat we een veilig merk als onveilig bestempelen. Bijgevolg is de waarde van β irrelevant. 8.2. Voor het testen van de nulhypothese dat de parameter λ van de Poisson distributie (van een toevalsveranderlijke X) gelijk is aan 1, m.a.w. H 0 : λ 1, tegenover de alternatieve hypothese dat λ gelijk is aan 3, m.a.w. H 1 : λ 3, doet men één waarneming van X en gebruikt men de testfunctie: φ(x) { 1, als x > 2, 0, als 0 x 2. (a) Wat is de kans α op een fout van het type I? (antw. α 0.080) (b) Bereken de macht van deze test. (antw. 1 β 0.577) Oplossing: We beschouwen een steekproef van omvang 1 uit een P (λ)-verdeeld universum. (a) α is de kans dat we H 0 verkeerdelijk verwerpen, i.e. α P H0 (X > 2) 1 P H0 (X 2) 1 e 1 (1 + 1 + 1 2 ) 0.080. 1
(b) β is de kans dat we H 1 verkeerdelijk aanvaarden, i.e. β P H1 (X 2) e 3 (1 + 3 + 4.5) 0.423. De macht van de test is bijgevolg 1 β 0.577 8.3. Persoon A zendt meerdere keren per dag een signaal uit naar persoon B met waarde µ en B ontvangt een veranderlijke waarde met distributie N(µ, 4). (a) Persoon B vermoedt dat µ 8 en registreert daarom het signaal 5 keer, wat x 9.5 oplevert. Is deze uitslag consistent met het vermoeden bij een betrouwbaarheidsdrempel α 0.05? (antw. ja) (b) Welk risico β loopt persoon B het vermoeden te aanvaarden als in werkelijkheid µ 10? (antw. β 0.6064) Oplossing: (a) We kiezen als nulhypothese en als alternatieve hypothese H 0 : µ µ 0 8 H 1 : µ 8. Bij een betrouwbaarheidsdrempel van α 0.05 berekenen we bijgevolg Z : X 5 µ 0 σ/ n 9.5 8 2/ 5 1.677 en verwerpen de nulhypothese als ( Z 1.677 > Φ 1 1 0.05 ) 1.96. 2 Dit bevestigt het vermoeden van persoon B. (b) Het risico β is de kans dat H 0 aanvaard wordt als µ 10: β P µ10 ( X 5 8 2/ 5 ) 1.96 P µ10 ( 1.96 2/ 5 + 8 10 2/ 5 Φ( 5 + 1.96) Φ( 5 1.96) Φ(0.27607) Φ( 3.6439) 0.6064. < X 5 8 2/ 5 De macht van de test bij µ 10 is bijgevolg 1 β 0.3936. ) 1.96 2/ 5 + 8 10 < 2/ 5 2
8.4. In een fabriek wordt een product gemaakt door een groot aantal dezelfde machines. Elk heeft een verwachtingswaarde van 100 eenheden per uur en standaardafwijking σ 8. Een nieuw type machine komt op de markt. Alles veranderen is een dure aangelegenheid, maar de fabrikant oordeelt dat een overschakeling winstgevend is als de gemiddelde output van het nieuwe type meer dan 150 eenheden per uur bedraagt (onderstel dezelfde σ). De fabrikant mag proefdraaien op 35 machines en vindt x 160 eenheden per uur. Formuleer de hypothesen, bepaal de drempelwaarde, voer de geschikte test uit en besluit. (antw. nieuwe machines aankopen) Oplossing: De nulhypothese H 0 wordt zo gekozen dat we iets zinvol over de fout α van het type I kunnen zeggen. Aangezien alles veranderen een dure aangelegenheid is, kiezen we als nulhypothese H 0 : µ µ 0 150 (eigenlijk µ 150) en als alternatieve hypothese H 1 : µ > 150 met een kleine betrouwbaarheidsdrempel α, b.v. α 0.01. We voeren vervolgens een rechtseenzijdige test uit (we veronderstellen σ 8) en berekenen We verwerpen H 0 wanneer Z : X n µ 0 σ/ n 160 150 8/ 35 Z > Φ 1 (0.99) 2.33. 7.395. Aangezien dit inderdaad het geval is, zullen we de aankoop van nieuwe machines adviseren. 8.5. Een farmaceutisch bedrijf heeft een nieuw soort vermageringspillen ontwikkeld en beweert dat iemand die gedurende 2 maanden die pillen neemt gemiddeld 5 kg in gewicht afvalt. Een onafhankelijke consumentenorganisatie wil die bewering controleren. Daarvoor volgt ze een groep van 200 mensen die gedurende 2 maanden de vermageringspillen nemen. Na verloop van de twee maanden meet men het gewichtsverlies van deze maanden. Men vindt een gemiddeld verlies van 4.9 kg en een steekproefvariantie van 1 kg 2. Ga na of de bewering van het bedrijf aanvaard kan worden als men aanneemt dat het gewichtsverlies normaal verdeeld is en als men slechts 5% kans wil hebben dat de bewering van het bedrijf ten onrechte verworpen wordt. (antw. bewering van het bedrijf aanvaarden). Oplossing: We stellen de volgende hypothesen voorop: H 0 : µ µ 0 5 H 1 : µ 5 Een steekproef van 200 mensen levert x 4.9 en s 2 1. Bij een betrouwbaarheidsdrempel van α 0.05 berekenen we bijgevolg en verwerpen de nulhypothese als T : X 200 µ 0 s 2 n /n 4.9 5 1/200 2 1.4142 T 1.4142 > t 1 199 (0.975) Φ 1 (0.975) 1.96. Bijgevolg wordt de nulhypothese niet verworpen en wordt de bewering van het bedrijf aanvaard. 3
8.6. Een bepaald type voertuig heeft bij 60km/u gemiddeld een afstand van 20m nodig om tot stilstand te komen. Een beter remsysteem wordt ontworpen en geïnstalleerd in 61 voertuigen. Bij 60km/u levert de test een gemiddelde remafstand van 19m en steekproefvariantie (1.2m) 2. Toont het verschil van 1m met α 0.05 inderdaad dat het nieuwe remsysteem efficiënter is? (antw. ja) Oplossing: We formuleren de hypothesen H 0 : µ µ 0 20 H 1 : µ < 20 en voeren met α 0.05 een linkseenzijdige t-test uit. Daartoe berekenen we en vergelijken we T : X n µ 0 S 2 n /n T < t 1 60 19 20 1.2/ 61 6.509 (0.05) t 1(0.95) 1.671. De nulhypothese wordt dus duidelijk verworpen en het nieuwe remsysteem wordt efficiënter bevonden. 8.7. De ware diameter van een partij golfballen mag gemiddeld niet kleiner zijn dan 1,68inch. De statisticus van het bedrijf wil een test opzetten om de productie te controleren door het nemen van N ballen uit de productie van 2 uur. Hij wil met de test de productie van ballen met gemiddelde diameter kleiner dan 1.675 verwijderen en neemt α 0.05 en β 0.01. (a) Formuleer de hypothesen. (b) Wat is de betekenis van α en β? (c) Bereken de grootte van de steekproef als σ 0.01. (antw. 64) Oplossing: (a) Als hypothesen stellen we voorop 60 H 0 : µ µ 0 1.68 (eigenlijk µ 1.68) H 1 : µ < 1.68 met α 0.05 en waarbij voor µ 1 1.675 een macht 0.99 vereist wordt. (b) De fout α van het type I is de kans dat we goede golfballen afkeuren, terwijl de kans β van het type II de kans is dat we slechte golfballen goedkeuren. Wanneer µ 1.675 willen we die lans tot 0.01 reduceren. (c) Enerzijds moet gelden α P µ0 (X n < µ 0 a) ( Xn µ 0 P µ0 σ/ n < a ) σ/ n ( Φ a ) σ/ n 4
of met α 0.05: a σ/ n Φ 1 (0.05) Φ 1 (0.95). Anderzijds moet gelden, met µ 1 1.675 dat of met β 0.01: 1 β P µ1 (X n < µ 0 a) ( Xn µ 1 P µ1 σ/ n < µ ) 0 µ 1 a σ/ n µ 0 µ 1 a σ/ n We bekomen dan de volgende vergelijkingen Φ 1 (0.99). a n σ Φ 1 (0.95) (0.005 a) n σ Φ 1 (0.99) waaruit met σ 0.01 volgt n 2(Φ 1 (0.95) + Φ 1 (0.99)), wat leidt tot n 4 (1.645 + 2.33) 2 63.2025. Bijgevolg nemen we de steekproefgrootte n 64. 8.8. Twee automerken, Mercedes en Volvo, worden getest om te zien welke van beide de beste resultaten haalt op een bepaald soort crash. De grootte van de schade wordt bepaald volgens een schaal van 0 tot 100 (100 is de grootste schade). Zulke testen zijn uiteraard vrij duur en daarom wordt het aantal testen beperkt (5 Mercedes en 4 Volvo). X en Y meten resp. de schade aand de Mercedes en aan de Volvo (X en Y mogen normaal verdeeld verondersteld worden met dezelfde variantie). Veronderstel de volgende resultaten: x 43.3 en s 2 x 4.5 voor Mercedes en y 45.2 en s 2 y 3.80 voor Volvo. Mercedes beweert dan dat zijn wagens gemiddeld beter presteren (d.i. minder schade oplopen) op de test dan Volvo. Toets deze bewering op het 5%-significantieniveau. (Oplossing: H 0 niet verwerpen) Oplossing: We beschouwen de hypothesen H 0 : µ 1 µ 2 H 1 : µ 1 < µ 2. We voeren daartoe een t-test uit en berekenen Sp 2 4 4.5 + 3 3.8 4.2 7 T 43.3 45.2 ( ) 1.382. 4.2 1 4 + 1 5 Vermits t 1 7 (0.05) t 1 7 (0.95) 1.895 geldt t 1 7 (0.05) < T. Bijgevolg kan met een betrouwbaarheidsdrempel 5% niet aangetoond worden dat Mercedes gemiddeld beter presteert. 5
8.9. Men wil nagaan of het ijzergehalte in het bloed van kinderen met mucoviscoïdose gemiddeld verschillend is van het ijzergehalte in het bloed van gezonde kinderen. Voor een steekproef van grootte 9 uit de gezonde kinderen vindt men een gemiddeld ijzergehalte van 18.9 en een standaardafwijking van 5.9. Voor een steekproef van grootte 13 uit de kinderen met mucoviscoïdose vindt men een gemiddeld ijzergehalte van 11.9 en een standaardafwijking 6.3. Toets met betrouwbaarheidsdrempel α 0.05. Neem aan dat het ijzergehalte in beide groepen normaal verdeeld is. Oplossing: Het ijzergehalte in beide groepen is normaal verdeeld. Maar σx 2 en σ2 Y zijn ongekend. Indien de ongekende varianties zijn, zouden we kunnen gebruik maken van een t-test voor normale gemiddelden voor 2 populaties. Dit weten we echter niet. Maar dit kunnen we wel nagaan door een F -test uit te voeren voor normale varianties voor 2 populaties. We beschouwen de hypothesen H 0 : σx 2 σy 2 H 1 : σx 2 σy 2 We voeren daartoe een F-test uit en berekenen (α 0.05): F SX/S 2 Y 2 5.9 2 /6.3 2 (0.9365) 2 0.87705 Vermits F8,12 1 1 (0.975) 3.51 en F8,12 (0.025) 1 1 F 1 12,8 (0.975 4.3 0.23256 geldt F8,12 1 1 (0.025) < F < F8,12 (0.975) Bijgevolg kunnen we de nulhypothese van gelijke varianties aanvaarden. Het eigenlijke Toesingsprobleem: Gegeven: Steekproef : X : n X 9 X 18.9 s X 5.9 Y : n Y 13 Y 11.9 s Y 6.3 We beschouwen de hypothesen: H 0 : µ Y µ X 0 met µ X het gemiddeld ijzergehalte bij gezonde kinderen en µ Y het gemiddeld ijzergehalte bij kinderen met mucoviscoïdose H 1 : µ Y µ X 0 want men wil nagaan of het gemiddeld ijzergehalte bij gezonde kinderen verschillend is van het gemiddeld ijzergehalte bij kinderen met mucoviscoïdose We voeren daartoe een t-test uit en berekenen T Y X (µ Y µ X ) H0 ( ) Sp 2 1 n Y + 1 n X 6
met waarbij Vervolgens is S 2 p 1 20 [8s2 X + 12s 2 Y ] 37.738 Y X 0 ( ) Sp 2 1 9 + 1 13 S 2 X 34.81 S 2 Y 39.69 11.9 18.9 7.096 2.63 Uit de tabel van de t-verdeling met 20 vrijheidsgraden vinden we: Er geldt dus t 1 20 (0.975) 2.086 T 2.63 > t 1 20 (0.975) 2.086 Bijgevolg kan met een betrouwbaarheidsdrempel van 5% aangetoond worden dat het gemiddelde ijzergehalte bij gezonde kinderen en kinderen met mucoviscoïdose verschillend is. 8.10. Men beweert dat, wanneer een roker stopt met roken, hij gemiddeld 10 kg zwaarder wordt. Uit een groot aantal rokers die ermee gestopt zijn trekt men lukraak 6 personen en men vindt volgende resultaten (de gewichten voor en na het stoppen met roken zijn aangegeven in kg): roker gewicht voor gewicht na A 62 63 B 84 86 C 59 63 D 78 83 E 70 81 F 66 79 Neem aan dat het gewicht normaal verdeeld is en toets de bewering met betrouwbaarheidsdrempel 0.05. Oplossing: Het is duidelijk dat de observaties gepaarde metingen zijn, bijgevolg berekenen we de verschillen (na-voor): roker verschil(na-voor) A 1 B 2 C 4 D 5 E 11 F 13 7
We kiezen als nulhypothese en als alternatieve hypothese H 0 : µ µ 0 10 H 1 : µ 10 Bij een betrouwbaarheidsdrempel van α 0.05 berekenen we bijgevolg met X 6 6 en S 2 6 24. We verwerpen de nulhypothese als T : X 6 µ 0 6 10 2 S6 2/6 24/6 T 2 > t 1 5 (0.975) 2.571 Bijgevolg wordt de nulhypothese niet verworpen en wordt de bewering aanvaard. 8.11. Een urne bevat een mengeling van rode en blauwe knikkers. Het is geweten dat de fractie rode knikkers ofwel 3/4 ofwel 2/3 van alle knikkers bedraagt. Zij p de kans om een rode knikker te trekken in één random trekking. De nulhypothese H 0 : p 3/4 wordt getest door twee keer at random een knikker te trekken (met teruglegging van de eerste knikker) en H 0 te verwerpen tenzij beide knikkers rood zijn. Bepaal de betrouwbaarheidsdrempel α en macht 1 β van deze test. (antw. α 7/16 en 1 β 4/9). Oplossing: De betrouwbaarheidsdrempel α is de fout van het type I: α P H0 (geen 2 rode knikkers) 1 3 3 4 4 7 16. De macht van deze test wordt gegeven door 1 β P H1 (geen 2 rode knikkers) 1 2 2 3 3 4 9. 8.12. Men heeft 120 keer na elkaar twee muntstukken opgegooid en daarbij 40 keer dubbel kop, 35 keer dubbel munt en 45 keer kop en munt bekomen. Test met betrouwbaarheidsdrempel α 0.05 de hypothese dat de muntstukken onvervalst zijn. (antw. H 0 verwerpen) Oplossing: De absolute frequenties N i en verwachtingswaarden nπ i worden gegeven in de volgende tabel Bijgevolg is KK MM KM nπ i 30 30 60 N i 40 35 45 χ 2 100 30 + 25 30 + 125 30 25 3. Met k 3 het aantal klassen en geen te schatten parameters vergelijken we χ 2 met (χ 2 2 ) 1 (0.95) 5.9913. Aangezien 8.33 > 5.99 verwerpen we de hypothese dat de muntstukken onvervalst zijn. 8
8.13. Een onderzoek van 320 families met 5 kinderen leverde de volgende verdeling van aantallen zonen en dochters op. 5J / 0M 4J / 1M 3J / 2M 2J / 3M 1J / 4M 0M / 5J totaal # families 18 56 110 88 40 8 320 Zijn deze resultaten met 5% betrouwbaarheidsdrempel consistent met de (nul)hypothese dat de geboorte van een zoon of dochter even waarschijnlijk is? (antw. H 0 verwerpen) Oplossing: De absolute frequenties N i en verwachtingswaarden nπ i worden gegeven in de volgende tabel 5J / 0M 4J / 1M 3J / 2M 2J / 3M 1J / 4M 0M / 5J nπ i 10 50 100 100 50 10 N i 18 56 110 88 40 8 Als de nulhypothese waar is, dan is het aantal jongens X binomiaal verdeeld: X d B(320, 1 2 ). Bijgevolg is Er geldt dan ( ) 1 5 π 1 1 5 32 ( ) (1 5 5 π 2 1 5) 5 32 ( ) (1 ) 5 5 π 3 10 2 5 32 ( ) (1 ) 5 5 π 4 10 3 5 32 ( ) (1 5 5 π 5 4 5) 5 32 ( ) (1 5 5 π 6 5 5) 1 32 χ 2 64 10 + 36 50 + 100 100 + 144 100 + 100 50 + 4 10 11.96. Met k 6 het aantal klassen en geen te schatten parameters vergelijken we χ 2 met (χ 2 5 ) 1 (0.95) 11.705. Aangezien 11.96 > 11.705, verwerpen we de hypothese dat de geboorte van een zoon of dochter even waarschijnlijk is. 8.14. Een muntstuk wordt opgegooid tot wanneer kruis wordt bekomen en het aantal nodige worpen X wordt genoteerd. Dit experiment wordt 256 keer herhaald en men vindt Xaantal worpen 1 2 3 4 5 6 7 8 frequentie 136 60 34 12 9 1 3 1 Test met betrouwbaarheidsdrempel 0.05 de hypothese dat X geometrisch verdeeld is met parameter p 0.5. (antw. H 0 aanvaarden) 9
Oplossing: De absolute frequenties N i en de verwachtingswaarden nπ i worden gegeven in de volgende tabel X 1 2 3 4 5 nπ i 128 64 32 16 16 N i 136 60 34 12 14 Als de nulhypothese waar is, dan is X geometrisch verdeeld met p X (i) (1 p) i 1 p p i zodat en π 1 1 2, π 2 1 4, π 3 1 8, π 4 1 16 π 5 1 (π 1 + π 2 + π 3 + π 4 ) 1 16. Bijgevolg is χ 2 64 128 + 16 64 + 4 32 + 16 16 + 4 16 2.125. Met k 5 het aantal klassen en geen te schatten parameters vergelijken we χ 2 met (χ 2 4 ) 1 (0.95) 9.4877. Bijgevolg aanvaarden we de nulhypothese. 8.15. Een machine wordt verondersteld pindanoten, hazelnoten, cashewnoten en walnoten te mengen in de verhouding 5:2:2:1. In een blik met 500 noten van het mengsel treft men 269 pindanoten, 112 hazelnoten, 74 cashewnoten en 45 walnoten aan. Test met betrouwbaarheidsdrempel 0.05 de hypothese dat de machine de noten in de verhouding 5:2:2:1 mengt. (antw. H 0 verwerpen). Oplossing: De absolute frequenties N i en verwachtingswaarden nπ i worden gegeven in de volgende tabel Bijgevolg is pinda hazel cashew wal nπ i 250 100 100 50 N i 269 112 74 45 χ 2 192 250 + 122 100 + 262 100 + 52 50 10.14. Met k 4 het aantal klassen en geen te schatten parameters vergelijken we χ 2 met (χ 2 3 ) 1 (0.95) 7.81. Aangezien 7.81 < 10.14 verwerpen we de hypothese dat de machine de noten in de gegeven verhouding mengt. 10