Hypothese toetsen. Moderne Wiskunde MW B1 deel 5, hoofdstuk S3



Vergelijkbare documenten
11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

15.1 Beslissen op grond van een steekproef [1]

Lesbrief hypothesetoetsen

Toetsen van Hypothesen. Het vaststellen van de hypothese

Hoofdstuk 4 Hypothese toetsen

Hoofdstuk 6 Hypothesen toetsen

Samenvatting Wiskunde A

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 3 Statistiek: het toetsen

15.1 Beslissen op grond van een steekproef

Hoofdstuk 3 Toetsen uitwerkingen

Uitleg significantieniveau en toetsen van hypothesen

De normale verdeling. Les 3 De Z-waarde (Deze les sluit aan bij de paragraaf 10 van Binomiale en normale verdelingen van de Wageningse Methode)

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Kansrekening en Statistiek

De normale verdeling

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

15.1 Beslissen op grond van een steekproef theorie C Eenzijdig en tweezijdig toetsen Binomiale toetsen theorie A, B, C

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

c P( X 1249 of X 1751 µ = 1500 en σ = 100) = 1 P(1249 X 1751)

Statistiek voor A.I. College 10. Donderdag 18 Oktober

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Voorbeeldtentamen Wiskunde A

11.1 Kansberekeningen [1]

wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

7.1 Toets voor het gemiddelde van een normale verdeling

13.1 Kansberekeningen [1]

Notatieafspraken Grafische Rekenmachine, wiskunde A

4.1 Eigenschappen van de normale verdeling [1]

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

14.1 Kansberekeningen [1]

Beslissen op grond van een steekproef Hoofdstuk 15

Lesbrief de normale verdeling

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Zin en onzin van normale benaderingen van binomiale verdelingen

Antwoorden door K woorden 14 augustus keer beoordeeld. Wiskunde A. Supersize me. Opgave 1: leerstof: Formules met meer variabelen.

EXAMENTOETS TWEEDE PERIODE 5HAVO MLN/SNO

Werken met de grafische rekenmachine

wordt niet verworpen, dus het gemiddelde wijkt niet significant af van 400 wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

13,5% 13,5% De normaalkromme heeft dezelfde vorm als A (even breed en even hoog), maar ligt meer naar links.

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Examen Statistiek I Januari 2010 Feedback

. Dan geldt P(B) = a d. 3 8

Kansrekening en Statistiek

Hoe verwerk je gegevens met de Grafische Rekenmachine?

Hoofdstuk 5 - Hypothese toetsen

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

Grootste examentrainer en huiswerkbegeleider van Nederland. Wiskunde A. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

Het werken met TI-83-programma s in de klas

Voorbeeldtentamen Wiskunde A

Correctievoorschrift VWO-Compex. Wiskunde A1,2 (nieuwe stijl)

Kansrekening en Statistiek

In de handel is het gebruikelijk om korting te geven als een klant veel exemplaren van een bepaald product bestelt.

Correctievoorschrift VWO

f. Wat is de halveringstijd van deze uitstervende diersoort uitgaande van de formule: N ,88 t, t in jaren t=0 betekent ?

Paragraaf 9.1 : De Verwachtingswaarde

Uitwerkingen Mei Eindexamen VWO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Hoofdstuk 1 : De Tabel

Kansrekening en Statistiek

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Kansrekening en Statistiek

Wiskunde B - Tentamen 1

3.1 Het herhalen van kansexperimenten [1]

Uitwerkingen Mei Eindexamen VWO Wiskunde C. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Uitwerkingen voortoets/oefentoets E3 maart/april 2009 MLN

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Wiskunde B - Tentamen 2

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Voorbeeldtentamen Statistiek voor Psychologie

Rekenen met de normale verdeling (met behulp van grafisch rekentoestel)

Boek 2 hoofdstuk 8 De normale verdeling.

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Stoomcursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven VWO ( ) = = ( ) ( ) ( ) = ( ) ( ) = ( ) = = ( )

wiskunde A vwo 2017-II

Toetsen van hypothesen

de Wageningse Methode Beknopte gebruiksaanwijzing TI84 1

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Examen HAVO. Wiskunde B1

Eindexamen wiskunde B1 vwo 2004-II

Uitwerkingen Mei Eindexamen HAVO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

H10: Allerlei functies H11: Kansverdelingen..6-7

Examen VWO. wiskunde A1,2 Compex. Vragen 1 tot en met 12. In dit deel van het examen staan de vragen waarbij de computer niet wordt gebruikt.

Examencursus. wiskunde A. Rekenregels voor vereenvoudigen. Voorbereidende opgaven VWO kan niet korter

Statistiek = leuk + zinvol

TECHNISCHE UNIVERSITEIT EINDHOVEN

Transcriptie:

Hypothese toetsen Moderne Wiskunde MW B deel 5, hoofdstuk S3 Het is vaak onmogelijk om een volledige populatie te onderzoeken. Dan moet je je behelpen met een steekproef uit de populatie. Op grond van de resultaten van de steekproef moet een uitspraak gedaan of een beslissing genomen worden over de volledige populatie. Dat houdt een risico op verkeerde uitspraken of beslissingen in. Dat risico moet acceptabel blijven. Voorbeeld. (Binomiale verdeling) Een fabrikant wenst een nieuw product uitsluitend op de markt te brengen als het marktaandeel groter zal zijn dan 60%. Als dat niet het geval is, vindt hij de noodzakelijke investeringen te groot. Om te kunnen beslissen wordt een onderzoeksbureau ingeschakeld. Men gaat een aselecte steekproef van 00 potentiële gebruikers ondervragen. Hoeveel toekomstige kopers zullen er in de steekproef van 00 minimaal moeten zijn, wil de fabrikant het nieuwe product op de markt brengen? De fabrikant wil dat de kans dat hij een verkeerde beslissing neemt, niet groter is dan 5%. Uit de steekproef zal blijken hoeveel van de 00 ondervraagden toekomstige gebruikers zullen zijn. Als het er 60 of minder zijn, dan wordt het nieuwe product zeker niet op de markt gebracht. Zijn het er meer dan 60 dan zou het product wél op de markt gebracht kunnen worden. Alhoewel: als er 6 toekomstige gebruikers (van de 00 ondervraagden) zijn, dan is de kans groot dat de fabrikant een verkeerde beslissing neemt, als hij het product op de markt brengt. Op grond van steekproefresultaten wordt er een beslissing genomen. Bij een zg. toetsingsprobleem gaat het er om welke beslissing genomen wordt. We noemen een veronderstelling of een bewering een hypothese. Stel, we gaan uit van de veronderstelling dat het marktaandeel kleiner of gelijk aan 60% is, m.a.w. de fabrikant brengt dan geen nieuw middel op de markt. In dit geval noemen we deze veronderstelling de nulhypothese H 0. Voor H 0 geldt dan: p 0,60. Wordt de nulhypothese verworpen, dan betekent dat dat je de tegenovergestelde veronderstelling, de alternatieve hypothese H accepteert. Voor H geldt: p > 0,60. Laten we nu eens kijken hoe groot de kans is dat in de steekproef meer dan 60 toekomstige gebruikers zullen zijn. De stochast X is het aantal toekomstige gebruikers in de steekproef. We hebben te maken met een binomiale verdeling. X 6) = X 60) = 0,5379 = 0,46 ( binomcdf (00, 0.60, 60) = 0,5379) Als de fabrikant bij 60 of meer toekomstige gebruikers in de steekproef besluit tot het op de markt brengen van het nieuwe middel, dan gaat hij ervan uit dat er in de populatie ook minstens 60% van de mensen het nieuwe middel zullen gaan kopen. Maar de steekproef zou best wel eens een verkeerd beeld van de werkelijkheid kunnen geven (60 toekomstige gebruikers in de steekproef hoeft nog niet te beteken dat er ook werkelijk 60% van de mensen het nieuwe middel gaan gebruiken). De kans op een verkeerde beslissing (nl. dat de fabrikant op grond van de steekproef toch besluit tot het nieuwe middel, maar dat er in werkelijkheid geen 60% van de potentiële gebruikers te vinden is) is 0,46 (46,%). Deze kans is zelfs vrij groot. We zeggen: de kans dat H 0 ten onrechte wordt verworpen is 0,46. De kans zelf heet de overschrijdingskans. Hypothese toetsen G.D. Bouwman /0

De fabrikant wil meer zekerheid en zegt dat er meer dan 60% potentiële gebruikers zullen zijn, als er in de steekproef 64 toekomstige gebruikers voorkomen. X 64) = X 63) = 0,764 = 0,386. ( binomcdf (00, 0.60, 63) = 0,764) De fabrikant vindt waarschijnlijk deze overschrijdingskans ook nog te groot. (3,86%!). Je zult wel begrijpen dat de fabrikant nooit volledige zekerheid over de gehele populatie kan krijgen op grond van de steekproefresultaten. Toch kan het risico op een verkeerde beslissing (H 0 wordt dus ten onrechte verworpen) op een aanvaardbaar niveau gebracht worden. De fabrikant zou een overschrijdingskans van 5% kunnen accepteren. We zeggen: het significantieniveau α = 0,05. (Het gedeelte dat bij het significantieniveau hoort wordt ook wel kritieke gebied genoemd.) We moeten nu proberen uit te vinden, bij welk aantal in de steekproef de overschrijdingskans lager wordt dan het significantieniveau, dus voor welke k geldt: P ( X k) 0, 05. We kunnen dit uitproberen met de GR, of m.b.v. het programma VU-Stat: X 68) = X 67) = 0,9385 = 0,065. ( binomcdf (00, 0.60, 67) = 0,9385) X 69) = X 68) = 0,960 = 0,0398. ( binomcdf (00, 0.60, 68) = 0,960) Pas wanneer er minimaal 69 toekomstige gebruikers in de steekproef zijn, is de fabrikant zeker van een voldoend aantal potentiële gebruikers van de volledige populatie en zal hij dus het nieuwe middel op de markt brengen. Als de fabrikant staat te springen om het nieuwe middel op de markt te kunnen brengen, zal hij het significantieniveau eerder bij 0% leggen. De keuze van het significantieniveau is dus arbitrair. Omdat voor de alternatieve hypothese geldt: p > 0,60, noemen we bovenstaande toets een rechtszijdige toets. Een andere manier om het getal 69 te vinden gaat als volgt: P ( X k) 0.05 X k ) 0,05. Toets op je GR in: Y = binomcdf (00, 0.6, x ). Neem TblStart = 60 en ΔTbl =. Als je nu bij TABLE (nd GRAPH) kijkt, zie je dat voor k = 69 bovenstaande bewering klopt. Hypothese toetsen G.D. Bouwman /0

Voorbeeld (Binomiale verdeling) Als een productieproces niet minstens 90% eerste kwaliteits artikelen aflevert, moet het worden bijgesteld. Dit bijstellen is een tijdrovende en kostbare zaak. Daarom neemt men een steekproef van 50 artikelen, waarbij gekeken wordt naar het aantal goede artikelen. Is de uitkomst 4 bij een significantieniveau van 5% reden om het proces bij te stellen? De stochast X is het aantal goede artikelen in een steekproef van lengte 50. X is binomiaal verdeeld. We hebben hier te maken met een linkszijdige toets. H 0 : p 0,90 (bijstellen hoeft niet) De hoogste staaf zal dan bij 45 liggen. Immers 90% van 50 is 45. H : p < 0,90 (wel bijstellen) X 4) = 0,0579 ( binomcdf (50, 0.9, 4) = 0,0579) Deze kans is groter dan 0,05. Conclusie: de nulhypothese H 0 wordt niet verworpen; de uitkomst 4 is geen reden om het proces bij te stellen. Voorbeeld 3 (Binomiale verdeling, tweezijdige toets) Bij een onderzoek naar de invloed van alcohol op het rijgedrag, dronken 00 proefpersonen in vijf minuten tijd twee glazen bier. Na een kwartier kregen ze de opdracht een bepaald traject te rijden en zich steeds aan de maximumsnelheid te houden. Van 'alcoholvrije' proefautomobilisten is uit een groot aantal proefritten bekend dat zij dit traject afleggen met een gemiddelde snelheid van 8,3 km/u. Van de proefpersonen bleken er 59 het traject af te leggen met een gemiddelde snelheid van meer dan 8,3 km/u, de overige reden gemiddeld langzamer dan 8,3 km/u. Verschilt de 59 op 0%-niveau significant van de helft? M.a.w. heeft alcohol invloed op het rijgedrag, uitgaande van 0%-significantieniveau? De stochast X is het aantal proefpersonen uit een steekproef van 00 die sneller of langzamer dan de gemiddelde snelheid van 8,3 km/u rijden. X is binomiaal verdeeld. H 0 : p = 0,50 (alcohol heeft geen invloed op het rijgedrag) Dat de kans p = 0,50 is, komt omdat wanneer alcohol geen invloed heeft op het rijgedrag, we er van uit kunnen gaan dat er evenveel proefpersonen sneller als langzamer dan de gemiddelde snelheid van 8,3 km/u zullen rijden. Immers dan verwachten we dat 50% van de proefpersonen sneller en 50% van de proefpersonen langzamer dan 8,3 km/u rijden. H : p 0,50 (alcohol heeft wel invloed op het rijgedrag) We hebben hier te maken met een tweezijdige toets. In dit geval spreken we af dat we H 0 verwerpen als P ( X k) α en ook als P ( X k) α. We nemen dus zowel aan de linkerkant als aan de rechterkant de helft van het significantieniveau. X 59) = X 58) = 0,9557 = 0,0443 ( binomcdf (00,0.50,58) = 0,9557) ( < 0,05!!). Conclusie: H 0 wordt verworpen; alcohol heeft wel invloed op het rijgedrag. Het rekenwerk bij kansen met 'trekken zonder terugleggen' is vaak vervelend. Als de populatie echter groot genoeg is (meer dan 60 elementen) en de steekproef relatief klein (minder dan 0% van de populatie) dan speelt het niet-terugleggen geen belangrijke rol en mag de binomiale formule gebruikt worden. Een binomiale verdeling is meestal goed te benaderen door een normale verdeling. Het gaat goed als n p > 5 èn n ( p) > 5. Bovendien moet er dan een continuïteitscorrectie plaatsvinden. Hypothese toetsen G.D. Bouwman 3/0

Bij een binomiaal verdeelde stochast gelden de volgende formules: μ = n p en σ = n p ( p). Voorbeeld 4 (Benaderen van een binomiale verdeling met een normale verdeling) In een zeker land zullen over een jaar verkiezingen worden gehouden. De oppositie beweert dat als er nu zou worden gekozen, 40% van de kiezers op hen zou stemmen. Het onderzoeksbureau van een van de regeringspartijen denkt dat dit percentage lager ligt. Zij willen controle met behulp van een aselecte steekproef van 000 kiesgerechtigden. a) Ga na dat het onderzoeksbureau niet gelijk heeft als er van de steekproef 370 mensen op de oppositie zouden stemmen. Het significantieniveau is %. b) Bereken bij welk aantal in de steekproef van 000 kiesgerechtigden het onderzoeksbureau niet gelijk heeft bij een significantieniveau van %. De stochast X is het aantal oppositiestemmers in de steekproef van 000. (oppositie heeft gelijk) H 0 : p = 0,40 en dus ook p 0,40 (oppositie heeft gelijk) H : p < 0,40 (onderzoeksbureau regeringspartij heeft gelijk) Hier dus een linkszijdige toets. a) Met de nieuwste grafische rekenmachines kan deze opgave opgelost worden m.b.v. de binomiale verdeling. Sommige oudere rekenmachines accepteren niet dat je bij binomcdf een getal > 999 invult. Intoetsen in de GR geeft dan de foutmelding: ERROR: DOMAIN. (De steekproef van 000 is te groot.) Hieronder staat een voorbeeld hoe we dan te werk gaan: We stappen over naar de normale verdeling. Aan de voorwaarden (zie eerder) is wel voldaan. μ = 000 0,4 = 400 σ = Nu geldt dus: H 0 : μ 400 H : μ < 400. Denk aan de continuïteitscorrectie!! Conclusie: de nulhypothese wordt niet verworpen. Vooralsnog heeft de oppositie gelijk. b) Met de nieuwste rekenmachines kun je deze opgave gewoon oplossen met de binomiale verdeling. Hier geven we een voorbeeld hoe je moet handelen als je een benadering met de normale verdeling wilt. X k) = X k + Op GR toets je het volgende in : Y = normalcdf ( E99, X + 0.5, 400,5.49) X min 000 0,4 0,6 5,49 X 370) = X 370,5) = 0,084 ( normalcdf ( E99,370.5, 400,5.49) = 0,084) = 300, X max = 400, ) 0,0 Y min = 0, = 0.0. Via GRAPH CALC INTERSECT krijg je voor k 363,46. Y > 0,0 max en Y = 0.0 Conclusie: bij 363 of minder kiesgerechtigden in de steekproef heeft het onderzoeksbureau gelijk met haar bewering, de nulhypothese wordt dus verworpen. Hypothese toetsen G.D. Bouwman 4/0

De z-toets Bij een toetsprobleem kan de toetsingsgrootheid normaal verdeeld zijn met een bekende standaardafwijking. Een vermoeden omtrent het gemiddelde van de verdeling kun je toetsen d.m.v. een steekproef. De vraag is dan of er teveel of te weinig afgeweken wordt van het gemiddelde μ. Zo ja, dan wordt de nulhypothese verworpen. Voorbeeld 5 In een bedrijf is de totale tijd X in uren die per dag wordt overgewerkt normaal verdeeld met μ x = 9,3 en σ x =,. Sinds kort is een systeem van flexibele werktijden ingevoerd. In een periode van 5 werkdagen bleek de gemiddelde totale overwerktijd 8,3 uur per dag te zijn. Onderzoek of bij een significantieniveau van % geconcludeerd kan worden dat het nieuwe systeem invloed op de overwerktijd heeft. De stochast X is de overwerktijd per dag in uren. We hebben hier te maken met een tweezijdige toets, want er kan minder of juist meer overgewerkt worden. In beide gevallen heeft het nieuwe systeem invloed op de overwerktijd. Merk op dat er niet gevraagd wordt of het nieuwe systeem beter is dan het oude systeem! H 0 : μ = 9,3 H : μ 9,3 De stochast X is het gemiddelde aantal uren overwerktijd per dag in de steekproef. De stochast X is normaal verdeeld met, μ = 9,3 en σ = = 0, 4. x x 5 We berekenen de overschrijdingskans: X 8,3) = 0.0086 ( > α!!) ( normalcdf ( E99,8.3, 9.3, 0.4) = 0,0086) Conclusie: H 0 wordt niet verworpen: het nieuwe systeem heeft geen invloed op de overwerktijd. De GR bezit een optie om hypothesen te toetsen. Om dit uit te leggen, gebruiken we het bovenstaande voorbeeld. STAT TESTS :Z-Test Zorg dat achter Inpt (=Input) niet Data, maar Stats knippert. Vul in: μ 0 : 9.3 σ :. (je vult dus de standaarddeviatie van de populatie in!) x : 8.3 n : 5 Bij de regel [μ: μ 0 <μ 0 > μ 0 ] laat je ' <μ 0 ' knipperen. De conclusie m.b.t. het significantieniveau van de tweezijdige toets laat de GR aan jezelf over. Als je nu Calculate activeert, rekent de GR de kans voor je uit. Wil je bovendien ook nog een schets, dan activeer je Draw. De GR voert de toets voor het gemiddelde niet uit door middel van overschrijdingskansen, maar gebruikt een z-waarde op grond waarvan je dus een conclusie moet trekken. De z-waarde is het getal dat je krijgt als je overgaat van de normale verdeling naar de standaardnormale verdeling. Het gemiddelde is dan 0 en de standaarddeviatie. g μ De formule voor z is: z =, waarbij g de grens is, μ het gemiddelde en σ de standaarddeviatie. σ Hypothese toetsen G.D. Bouwman 5/0

Bij het toetsen van hypothesen doe je op grond van een steekproefgemiddelde een uitspraak over het al dan niet verwerpen van de nulhypothese. Je hebt bij de berekening, zoals je zag, te maken met een linkszijdige, rechtszijdige of tweezijdige toets. In het laatste geval neem je voor elke zijde van de grafiek de helft van het significantieniveau. Om duidelijk te maken welke soort toets we moeten gebruiken, nog enkele voorbeelden: Voorbeeld 6 In een koffiebranderij worden pakken gevuld met koffiebonen. Het gewicht X in gram van de pakken is normaal verdeeld met σ x = 4 gram. De fabrikant beweert dat de vulmachine zo is ingesteld dat een pak gemiddeld 505 gram weegt. Toets onderstaande beweringen als gekozen is voor α = 0,05 en voor de steekproeflengte n = 5. a) Een consumenten organisatie zegt dat de pakken gemiddeld minder dan 505 gram wegen. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 504 gram is. b) De afdeling controle beweert dat t.g.v. een defect van de vulmachine het gemiddelde gewicht niet 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,5 gram is. c) Het hoofd van de calculatie-afdeling beweert dat het gemiddelde gewicht meer dan 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,4 gram is. 4 De stochast X is normaal verdeeld met μ = 505 en σ 0, 8 x x = =. 5 a) H 0 : μ 505 H : μ < 505 X < 504) = 0.056 ( > α) ( normalcdf ( E99,504,505,0.8) = 0,056) Conclusie: H 0 wordt niet verworpen: de consumentenorganisatie heeft geen gelijk. b) H 0 : μ = 505 H : μ 505 X 506,5) = 0.0304 ( > α!!) ( normalcdf (506,5,E99,505,0.8) = 0,0304) Conclusie: H 0 wordt niet verworpen: de afdeling controle heeft geen gelijk. c) H 0 : μ 505 H : μ > 505 X 506,4) = 0.040 ( normalcdf ( < α) (506,4,E99,505, 0.8) = 0,040) Conclusie: H 0 wordt verworpen: het hoofd van de calculatieafdeling heeft wel gelijk. Hypothese toetsen G.D. Bouwman 6/0

================================== Nu eerst even een stukje geschiedenis: Carl Friedrich Gauss (777-855) heeft de theorie van de normale verdeling ontwikkeld. Hij kwam de theorie op het spoor toen hij zich ging bezighouden met de astronomie. Gauss slaagde erin, uitgaande van een gering aantal gegevens, de baan van de eerste ontdekte planetoïde, Ceres, te berekenen. De formule voor de grafiek van de normale verdeling is: Hierbij is μ het gemiddelde en σ de standaarddeviatie. De normaalkromme die bij deze functie hoort wordt ook wel Gauss-kromme genoemd. De Belg Adolphe Quetelet (796-874) ontdekte echter dat de normaalkrommen goed gebruikt konden worden om allerlei menselijke kenmerken, zoals lichaamslengte, te besschrijven. x μ σ f ( x) = e. σ π Niet alle verdelingen waren normale verdelingen. De Franse wiskundige Pierre-Simon Laplace (749-87) herontdekte de zg. centrale limietstelling. (Deze stelling was al eerder ontdekt door de Engelse wiskundige Abraham de Moivre (667-754) en luidt: de som van een groot aantal onafhankelijke stochasten, die zelf niet normaal verdeeld hoeven te zijn, is nagenoeg normaal verdeeld.) Hij publiceerde hierover in zijn werk dat in 8 verscheen. Laplace benaderde hierin binomiale kansverdelingen door normale verdelingen. Pas in 90 werd een exact bewijs gegeven door Aleksandr Lyapunov uit Rusland. De stelling die hij bewees luidt: Voor een binomiale toevalsvariabele X met parameters n en p, verwachtingswaarde μ en standaarddeviatie σ geldt: X x) = x e σ π t μ σ dt. ================================== Hypothese toetsen G.D. Bouwman 7/0

Opgave I (MWB dl 5, blz 3, opg 5) In een bepaald land heeft 4,4% van de inwoners bloedgroep A. Een onderzoeker vermoedt dat onder de lijders aan een bepaalde maagziekte dit percentage hoger ligt en laat een aselecte steekproef uitvoeren. In de steekproef van 967 lijders aan de maagziekte blijken 45 personen bloedgroep A te hebben. a) Formuleer het toetsingsprobleem. b) Wat is de conclusie met significantieniveau %? Opgave II (MWB dl 5, blz 6, opg T-) In hotel De Witte Brug wordt bij het ontbijt altijd wit en bruin brood geserveerd in de verhouding 4 :. Men gaat er vanuit dat er meer wit dan bruin brood wordt gegeten. Omdat er de laatste tijd nogal wat klachten over een tekort aan bruin brood komen, besluit men een onderzoekje te doen. Aan 0 aselect getrokken gasten wordt gevraagd waaraan zij de voorkeur geven: wit of bruin brood. a) Hoe luiden de hypotheses in termen van de kansverdeling van X? b) Hoe groot is de overschrijdingskans bij x = 0? c) Is de uitkomst x = 8 op 0%-niveau significant? Opgave III (MWB dl 5, blz 9, opg E-6) Golfballen van een bepaalde kwaliteit worden getest met een slagmachine. De ballen moeten met een marge van meter een bepaalde afstand afleggen. Als er geen storingen in het productieproces zijn opgetreden, is 90% van de geproduceerde ballen goed. Wekelijks wordt er een steekproef van 50 ballen getest. Als er teveel ballen moeten worden afgekeurd, wordt de hele weekproductie gecontroleerd. In zeker week bleken er in de steekproef 3 ballen niet ver genoeg en 0 ballen te ver geslagen te zijn. a) Is het resultaat van de steekproef reden genoeg om actie te ondernemen? Neem α = 0,05. b) Wat verandert er als alleen ballen die die niet ver genoeg komen worden afgekeurd? Opgave IV (MWB dl 5, blz 7, opg T-5) Een fabrikant garandeert dat minstens 95% van de door hem geleverde producten voldoet. Om dit te controleren telt een consument in een aselecte steekproef van 00 hoeveel exemplaren niet deugen. Dat blijken er 8 te zijn. a) Formuleer het toetsingsprobleem. b) Is het gevonden resultaat op 5%-niveau significant? c) Geef het kritieke gebied. (Het gebied dat bij het significantieniveau hoort.) Opgave V (MWB dl 5, blz, opg 8) Voor een beschermd broedgebied van wadvogels geldt dat het aantal nesten per 00 m bij benadering normaal verdeeld is met een gemiddelde 5,3 en standaardafwijking 3,9. Bij wijze van proef wordt het gebied opengesteld voor wandelaars. In het broedseizoen worden op een stuk terrein van 00 m negen nesten geteld. Is dit aantal op significantieniveau 0% aanleiding om te veronderstellen dat de openstelling invloed heeft op de broedintensiteit? Opgave VI (MWB dl 5, blz 303, opg 5) Bij veel computerkaartspelletjes wordt een simulatieprogramma gebruikt om te schudden en te delen. Marjanne heeft een simulator geprogrammeerd en test dit programma uit. Marjanne heeft de indruk dat hartenboer te vaak wordt getrokken. Zij laat nu 0000 trekkingen uitvoeren en telt 9 keer hartenboer. a) Toets met significantieniveau % of dit teveel is. b) Het lijkt erop dat het programma in het algemeen een hartenvoorkeur heeft. Stel dat bij 00 trekkingen X harten worden getrokken. Welke waarden van X zijn dan op 5%-niveau significant groot? Hypothese toetsen G.D. Bouwman 8/0

Opgave VII (MWB dl 5, blz 0, opg 6) De lengte van 8-jarige jongens was in 990 Norm(83,)-verdeeld. In 000 werd een aselecte steekproef van honderd 8-jarige jongens gehouden om te onderzoeken of de gemiddelde lengte toegenomen was. De gemiddelde lengte bleek 85 cm te zijn. Neem aan dat de standaardafwijking gelijk bleef. a) Ga na dat de gemiddelde lengte L van de steekproef Norm(μ;,)-verdeeld is. b) Formuleer het bovenstaande als een z-toets. Schrijf daarbij zorgvuldig de onderdelen op. c) Bereken de overschrijdingskans. d) Wat is op 5%-niveau nu de conclusie? e) Ga na of je deze toets kunt uitvoeren op je rekenmachine. Opgave VIII (MWB dl 5, blz 8, opg ) Het gewicht van pakken koffie is normaal verdeeld. Bij een vulmachine is de standaardafwijking van de gewichten 6 gram. De machine moet ingesteld staan op 55 gram. De fabrikant neemt dagelijks aselect 00 pakken uit de productie en weegt ze. Op een dag wordt bij een steekproef een gemiddeld gewicht gemeten van 5 gram. De vraag is of dit gemiddelde aanleiding geeft om de machine opnieuw in te stellen. De stochast G is het gemiddeld gewicht van de pakken van de steekproef. Is de uitkomst g = 5 bij een significantieniveau van 5% reden om de machine opnieuw in te stellen? Opgave IX (MWB dl 5, blz 9, opg 5) Vijftien jaar geleden hebben metingen in een deel van de oceaan een gemiddelde diepte van 56,4 vadem* met een standaardafwijking van 4,9 opgeleverd. Een oceanograaf wilde nu testen of de gemiddelde diepte is afgenomen. Hij nam een aselecte steekproef van 8 metingen. De gemiddelde diepte in de steekproef is 5, vadem. Welke conclusie kan de oceanograaf trekken omtrent de diepte van dit deel van de oceaan? Neem α = 0,5. * vadem = 6 voet; Amsterdamse vadem =,698 meter; Engelse vadem =, 89 meter. Opgave X (MWB dl 5, blz 0, opg 7) Op een landelijk examen Engels kan een deelnemer een aantal punten scoren van 0 tot en met 00. Uit ervaring weet men dat het examenresultaat van alle deelnemers bij benadering normaal verdeeld is met een standaardafwijking σ =. Omdat het niet goed mogelijk is om elk jaar dezelfde moeilijkheidsgraad aan te houden, verschilt de gemiddelde score van de deelnemers van jaar tot jaar. Daarom wordt het cijfer naar boven gecorrigeerd als de gemiddelde score van alle deelnemers lager is dan 65. Anders is het cijfer de score gedeeld door 0. In een zeker jaar blijkt in een aselecte steekproef van 5 examenkandidaten de gemiddelde score 60, punten te zijn. De vraag is nu of dit significant te weinig is en er dus moet worden gecorrigeerd. Bereken de overschrijdingskans bij g = 60,. Wat is de conclusie op significantieniveau 5%? Opgave XI (MWB dl 5, blz opg 9) In een ziekenhuis wordt verondersteld dat de wachttijd in een polikliniek Norm(5, 6)-verdeeld is, met de tijd in minuten. Een patiënt twijfelt aan de verwachtingswaarde van deze verdeling en voert een aselecte steekproef uit. Het resultaat staat in de tabel hieronder. wachttijden polikliniek: 4, 3,7 7,0 9,6,0 9,7 0,6 9,4 8,7 4, 8,0 De patiënt denkt dat de gemiddelde wachttijd groter is dan men in de polikliniek zegt. Ga na of deze resultaten significant afwijken van de verwachtingswaarde. Neem α = 0,05. Opgave XII (Internet) Zoek op internet naar examens VWO-wb die vragen naar het toetsen van hypothesen. Hypothese toetsen G.D. Bouwman 9/0

Verkort traject "Toetsen van hypothesen". Voorbeeld Een fabrikant wenst een nieuw product uitsluitend op de markt te brengen als het marktaandeel groter zal zijn dan 60%. Als dat niet het geval is, vindt hij de noodzakelijke investeringen te groot. Om te kunnen beslissen wordt een onderzoeksbureau ingeschakeld. Men gaat een aselecte steekproef van 00 potentiële gebruikers ondervragen. Voorbeeld. Als een productieproces niet minstens 90% eerste kwaliteits artikelen aflevert, moet het worden bijgesteld. Dit bijstellen is een tijdrovende en kostbare zaak. Daarom neemt men een steekproef van 50 artikelen genomen, waarbij gekeken wordt naar het aantal goede artikelen. Is de uitkomst 4 bij een significantieniveau van 5% reden om het proces bij te stellen? Voorbeeld 3 Bij een onderzoek naar de invloed van alcohol op het rijgedrag, dronken 00 proefpersonen in vijf minuten tijd twee glazen bier. Na een kwartier kregen ze de opdracht een bepaald traject te rijden en zich steeds aan de maximumsnelheid te houden. Van 'alcoholvrije' proefautomobilisten is uit een groot aantal proefritten bekend dat zij dit traject afleggen met een gemiddelde snelheid van 8,3 km/u. Van de proefpersonen bleken er 59 het traject af te leggen met een gemiddelde snelheid van meer dan 8,3 km/u, de overige reden gemiddeld langzamer dan 8,3 km/u. Verschilt de 59 op 0%-niveau significant van de helft? M.a.w. heeft alcohol invloed op het rijgedrag, uitgaande van 0%-significantieniveau? Voorbeeld 4 In een zeker land zullen over een jaar verkiezingen worden gehouden. De oppositie beweert dat als er nu zou worden gekozen, 40% van de kiezers op hen zou stemmen. Het onderzoeksbureau van een van de regeringspartijen denkt dat dit percentage lager ligt. Zij willen controle met behulp van een aselecte steekproef van 000 kiesgerechtigden. a) Ga na dat het onderzoeksbureau niet gelijk heeft als er van de steekproef 370 mensen op de oppositie zouden stemmen. Het significantieniveau is %. b) Bereken bij welk aantal in de steekproef van 000 kiesgerechtigden het onderzoeksbureau niet gelijk heeft bij een significantieniveau van %. Voorbeeld 5 In een bedrijf is de totale tijd X in uren die per dag wordt overgewerkt normaal verdeeld met μ x = 9,3 en σ x =,. Sinds kort is een systeem van flexibele werktijden ingevoerd. In een periode van 5 werkdagen bleek de gemiddelde overwerktijd 8,3 uur per dag te zijn. Onderzoek of bij een significantieniveau van % geconcludeerd kan worden dat het nieuwe systeem invloed op de overwerktijd heeft. Voorbeeld 6 In een koffiebranderij worden pakken gevuld met koffiebonen. Het gewicht X in gram van de pakken is normaal verdeeld met σ x = 4 gram. De fabrikant beweert dat de vulmachine zo is ingesteld dat een pak gemiddeld 505 gram weegt. Toets onderstaande beweringen als gekozen is voor α = 0,05 en voor de steekproeflengte n = 5. a) Een consumenten organisatie zegt dat de pakken gemiddeld minder dan 505 gram wegen. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 504 gram is. b) De afdeling controle beweert dat t.g.v. een defect van de vulmachine het gemiddelde gewicht niet 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,5 gram is. c) Het hoofd van de calculatie-afdeling beweert dat het gemiddelde gewicht meer dan 505 gram is. Neem aan dat het gemiddeld gewicht in een hierbij horende steekproef 506,4 gram is. Hypothese toetsen G.D. Bouwman 0/0