15.1 Beslissen op grond van een steekproef theorie C. 15.2 Eenzijdig en tweezijdig toetsen. 15.3 Binomiale toetsen theorie A, B, C



Vergelijkbare documenten
15.1 Beslissen op grond van een steekproef

Beslissen op grond van een steekproef Hoofdstuk 15

wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

wordt niet verworpen, dus het gemiddelde wijkt niet significant af van 400 wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

15.1 Beslissen op grond van een steekproef [1]

Samenvatting Wiskunde A

Lesbrief hypothesetoetsen

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

4.1 Eigenschappen van de normale verdeling [1]

Toetsen van Hypothesen. Het vaststellen van de hypothese

13.1 Kansberekeningen [1]

Uitleg significantieniveau en toetsen van hypothesen

Hoofdstuk 3 Statistiek: het toetsen

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

14.1 Kansberekeningen [1]

Hoofdstuk 6 Hypothesen toetsen

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

Hoofdstuk 3 Toetsen uitwerkingen

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 4 Hypothese toetsen

11.1 Kansberekeningen [1]

Lesbrief de normale verdeling

P ( X 26) 0,5 α H 0 wordt verworpen. Conclusie: er is aanleiding om µ = 25 in twijfel te trekken.

De normale verdeling. Les 3 De Z-waarde (Deze les sluit aan bij de paragraaf 10 van Binomiale en normale verdelingen van de Wageningse Methode)

Hypothese toetsen. Moderne Wiskunde MW B1 deel 5, hoofdstuk S3

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

c P( X 1249 of X 1751 µ = 1500 en σ = 100) = 1 P(1249 X 1751)

Hoofdstuk 5 Een populatie: parametrische toetsen

Kansrekening en Statistiek

Grootste examentrainer en huiswerkbegeleider van Nederland. Wiskunde A. Trainingsmateriaal. De slimste bijbaan van Nederland! lyceo.

In de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht.

Kansrekening en Statistiek

o Geef bij de beantwoording van de vragen ALTIJD JE BEREKENINGEN. Als je alleen een antwoord geeft worden er GEEN PUNTEN toegekend!

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Uitwerkingen voortoets/oefentoets E3 maart/april 2009 MLN

Examen VWO. Wiskunde A1,2 (nieuwe stijl)

7.1 Toets voor het gemiddelde van een normale verdeling

Les 1: Waarschijnlijkheidrekening

Examen VWO. wiskunde A1,2 Compex. Vragen 1 tot en met 12. In dit deel van het examen staan de vragen waarbij de computer niet wordt gebruikt.

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Hoofdstuk 5 - Hypothese toetsen

Kansrekening en Statistiek

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Examen Statistiek I Januari 2010 Feedback

Examen HAVO. Wiskunde B1

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Examen VWO. wiskunde A1

Inleiding Hypothese toetsen

3.1 Het herhalen van kansexperimenten [1]

Voorbeeldtentamen Wiskunde A

Eindexamen wiskunde A 12 VWO I

TOETSEN VAN HYPOTHESEN

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt.

Uitwerkingen Mei Eindexamen VWO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Examen HAVO. Wiskunde A1,2 (nieuwe stijl)

Eindexamen wiskunde A1-2 vwo 2007-II

EXAMENTOETS TWEEDE PERIODE 5HAVO MLN/SNO

Toetsen van hypothesen

Examen VWO. Wiskunde A1,2 (nieuwe stijl)

De 'echte' toets lijkt hierop, alleen is de vormgeving anders. De uitwerkingen vind je voor de toetsweek terug op

Boek 2 hoofdstuk 8 De normale verdeling.

Hoofdstuk 2 De normale verdeling. Kern 1 Normale verdelingen. 1 a

Antwoorden door K woorden 14 augustus keer beoordeeld. Wiskunde A. Supersize me. Opgave 1: leerstof: Formules met meer variabelen.

13,5% 13,5% De normaalkromme heeft dezelfde vorm als A (even breed en even hoog), maar ligt meer naar links.

Examen VWO. Wiskunde B1 (nieuwe stijl)

Toetsen van hypothesen

Examen VWO. wiskunde A1,2. tijdvak 2 woensdag 20 juni uur. Bij dit examen hoort een uitwerkbijlage.

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

2. In de klassen 2A en 2B is een proefwerk gemaakt. Je ziet de resultaten in de frequentietabel. 2A 2B

UITWERKINGEN VOOR HET VWO NETWERK B13

Uitwerkingen Mei Eindexamen HAVO Wiskunde A. Nederlands Mathematisch Instituut Voor Onderwijs en Onderzoek

Paragraaf 9.1 : De Verwachtingswaarde

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

In de handel is het gebruikelijk om korting te geven als een klant veel exemplaren van een bepaald product bestelt.

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

wiskunde A vwo 2017-II

Eindexamen wiskunde B 1 havo I

Eindexamen wiskunde A1-2 compex vwo 2007-II

Examen HAVO. wiskunde B1. tijdvak 1 dinsdag 20 mei uur

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

Examen HAVO. wiskunde A. tijdvak 2 woensdag 23 juni uur

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Toegepaste Statistiek, Week 6 1

Voorbeeldtentamen Statistiek voor Psychologie

Eindexamen wiskunde B1 havo 2000-II

Examen HAVO. wiskunde A. tijdvak 1 vrijdag 17 mei uur. Bij dit examen hoort een uitwerkbijlage.

Examen VWO. Wiskunde A1 (nieuwe stijl)

Eindexamen wiskunde A1-2 vwo 2007-I

Hoofdstuk 11: Kansverdelingen 11.1 Kansberekeningen Opgave 1: Opgave 2: Opgave 3: Opgave 4: Opgave 5:

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

H9: Rijen & Reeksen H10: Kansverdelingen H11: Allerlei functies.5-6

Transcriptie:

Wat leer je? Zorgt verbeterde hygiëne voor een toename van allergische aandoeningen? In de statistiek is een methode ontwikkeld om op zo n vraag een onderbouwd antwoord te geven aan de hand van een steekproefresultaat. Deze methode heet het toetsen van hypothesen. Je maakt hiermee kennis met een belangrijk onderdeel van de statistiek, namelijk de toetsingstheorie. 15.1 Beslissen op grond van een steekproef theorie C 15. Eenzijdig en tweezijdig toetsen 15.3 Binomiale toetsen theorie A, B, C 15.4 De tekentoets theorie B 15.5 Diagnostische toets 15

Het toetsen van hypothesen Volgens de laatste gegevens lijdt meer dan 30% van de kinderen in Nederland aan een vorm van allergie. Dat percentage is de laatste decennia sterk toegenomen. Een verklaring wordt gevonden in de door de Britse epidemioloog Strachan geformuleerde hygiënehypothese: door een schonere leefwijze worden kinderen minder blootgesteld aan ziektekiemen, waardoor het natuurlijke afweersysteem ontregeld wordt. Hoewel deze hypothese onderwerp is van felle discussies, wijst onderzoek uit dat bijvoorbeeld kinderen op het platteland minder vatbaar zijn voor allergieën.

15.1 Beslissen op grond van een steekproef O 1 Fabrikant Helder brengt een vloeibaar schuurmiddel op de markt in flacons van 400 ml. De vulmachine is ingesteld op een gemiddelde 400 ml. De praktijk wijst uit dat na verloop van tijd het gemiddelde niet meer precies 400 ml is. a Het zou kunnen zijn dat het gemiddelde is toegenomen. Noem hiervan een nadeel voor de fabrikant. b Noem een nadeel van een te laag gemiddelde. In alle opgaven en theorie over Helder geldt: Inhoud X is normaal verdeeld σ met x = 4ml Vulmachine is ingesteld op μ x = 400ml Beslissingsvoorschrift De vulmachine van fabrikant Helder zorgt per flacon schuurmiddel voor een inhoud van X ml, waarbij X normaal verdeeld is met X 4 ml. De vulmachine is ingesteld op een gemiddelde van X 400 ml, maar na verloop van tijd is het gemiddelde niet meer precies 400 ml. Vandaar dat Helder op gezette tijden een aselecte steekproef neemt en op grond van het steekproefgemiddelde besluit de vulmachine al dan niet bij te stellen. Theorie A Helder besluit tot het nemen van een steekproef van 5 flacons. Hij berekent de gemiddelde inhoud X per flacon. Zoals je weet, volgt uit de n-wet dat X normaal verdeeld is met μ X X 400 en X X 5 4 5 0,8. Bij een meetresultaat van X 399 of X 400,5 zal Helder op grond van X 0,8 geen aanleiding zien tot bijstelling over te gaan. Bij het meetresultaat X 404 is er alle aanleiding om te twijfelen aan de juiste werking van de vulmachine. Maar wat zal Helder beslissen als X 398 of X 401,8? Het is bij dit soort problemen gebruikelijk een beslissingsvoorschrift af te spreken dat aangeeft bij welke meetresultaten tot bijstelling wordt overgegaan. Helder zou bijvoorbeeld kunnen afspreken Vulmachine bijstellen als X 398 of X 40. Helder loopt met zo n afspraak een zeker risico. Het is immers mogelijk dat X 397,8, terwijl de machine goed werkt. Hij vraagt zich daarom af hoe groot het risico is dat hij de machine bijstelt, terwijl deze goed werkt. Dit risico is P X 398 of X 40 bij μ X 400 en X 0,8. n-wet Voor het streekproefgemiddelde X geldt μ x = μ x en σ σ x =. x n X = 400,5 is nog geen σ van het gemiddelde af. Dat zou dus kunnen. X = 404 is maar liefst 5σ van het gemiddelde af. Dat is vrijwel onmogelijk. figuur 15.1 398 400 40 μ σ X = 400 = 0,8 X 84 Hoofdstuk 15

P X 398 of X 40 P X 398 normalcdf 10 99, 398, 400, 0.8 0,01 Helder loopt een risico van 1,% dat de productie wordt stilgelegd om de vulmachine bij te stellen, terwijl dat eigenlijk niet nodig is. We zeggen dat de vulmachine in dat geval ten onrechte wordt bijgesteld. Het risico voor Helder wordt kleiner als gekozen wordt voor het beslissingsvoorschrift Vulmachine bijstellen als X 397 of X 403. Toch is het niet verstandig het beslissingsvoorschrift zo te kiezen dat dit risico heel erg klein is. Helder heeft immers nog met een ander soort risico te maken, namelijk het risico dat het productieproces voortgaat, terwijl het gemiddelde niet 400 ml is. En dat kan vervelende consequenties hebben. voorbeeld Fabrikant Helder neemt een steekproef van 40 flacons. Hij kiest het beslissingsvoorschrift Vulmachine bijstellen als X 398,5 of X 401,5. a Bereken de kans dat ten onrechte tot bijstelling wordt overgegaan. b Neem eens aan dat de machine werkt met een gemiddelde van 398 ml. Bereken de kans dat op grond van het steekproefresultaat de vulmachine niet wordt bijgesteld. Aanpak a Ten onrechte bijstellen impliceert er wordt bijgesteld, dus het steekproefresultaat voldoet aan X 398,5 of X 401,5 het bijstellen geschiedt ten onrechte, dus in werkelijkheid is het gemiddelde 400. b Op grond van het steekproefresultaat X wordt niet tot bijstelling overgegaan, dus X voldoet aan 398,5 X 401,5. Bereken P 398,5 X 401,5 met μ X 398 en X 4 40. Uitwerking a P ten onrechte bijstellen P X 398,5 of X 401,5 P X 398,5 4 normalcdf 1099, 398.5, 400, 40 0,018 b P niet bijstellen P 398,5 X 401,5 bij μ X 398 normalcdf 398.5, 401.5, 398, 4 40 0,15 398,5 400 401,5 μ X = 400 σ X = 40 4 μ X = 398 σ X = 40 4 398,5 401,5 Het toetsen van hypothesen 85

Neem aan dat fabrikant Helder een steekproef van 50 flacons neemt. Hij kiest als beslissingsvoorschrift Vulmachine bijstellen als X 399 of X 401. a Bereken de kans dat hij ten onrechte de machine gaat bijstellen. b Waarom is het niet mogelijk de kans te berekenen dat Helder terecht tot bijstelling overgaat? c Neem aan dat de machine werkt met het gemiddelde van 401 ml. Bereken de kans dat Helder op grond van het steekproefresultaat niet tot bijstelling overgaat. 3 Neem aan dat Helder een steekproef van 10 flacons neemt. Als beslissingsvoorschrift kiest hij De vulmachine wordt ten onrechte bijgesteld. 1 Er vindt bijstelling plaats, dus uit de steekproef volgt X 399 of X 401. Het bijstellen is ten onrechte, dus in werkelijkheid werkt de machine goed, d.w.z. is nog gewoon 400. μ Rond kansen af op drie decimalen! Vulmachine bijstellen als X 399 of X 401. a Bereken de kans dat Helder ten onrechte tot bijstelling overgaat. b Neem aan dat de machine werkt met een gemiddelde van 399, ml. Bereken de kans dat de vulmachine op grond van het steekproefresultaat niet wordt bijgesteld. Significantieniveau Fabrikant Helder wil op grond van een steekproef van 5 flacons een beslissing nemen over het al dan niet bijstellen van de vulmachine. Hij heeft te maken met twee veronderstellingen. 1 De inhoud van een flacon is normaal verdeeld met 400. De inhoud van een flacon is normaal verdeeld met 400. Theorie B De eerste veronderstelling heet de nulhypothese, aangegeven met H 0. We schrijven H 0 400. Tegenover de nulhypothese staat de alternatieve hypothese H 1 die zegt dat het gemiddelde geen 400 is. Notatie H 1 400. Op grond van het steekproefresultaat X zal Helder besluiten de nulhypothese al dan niet te verwerpen. Kiest Helder het beslissingsvoorschrift H 0 : μ = μ 0 nulhypothese H 1 : μ μ 0 alternatieve hypothese Verwerp H 0 als X 399 of X 401 dan is de kans dat hij H 0 ten onrechte verwerpt gelijk aan P X 399 of X 401 P X 399 4 normalcdf 1099, 399, 400, 5 0,11. 86 Hoofdstuk 15

Kiest Helder het beslissingsvoorschrift Verwerp H 0 als X 397,5 of X 40,5 dan is de kans dat hij H 0 ten onrechte verwerpt gelijk aan P X 397,5 of X 40,5 P X 397,5 4 normalcdf 1099, 397.5, 400, 5 0,00. H 0 ten onrechte verwerpen houdt in H 0 is waar op grond van het beslissingsvoorschrift en het steekproefgemiddelde wordt H 0 verworpen. Door een geschikt beslissingsvoorschrift te kiezen, kun je P H 0 ten onrechte verwerpen zo klein maken als je wilt. Je loopt dan het gevaar dat het productieproces doorgaat, terwijl het gemiddelde niet meer 400 ml is. Je hebt dus met tegenstrijdige belangen te maken. Om aan beide belangen tegemoet te komen, spreekt men van te voren af wat de maximale kans mag zijn dat H 0 ten onrechte wordt verworpen. Deze maximale waarde heet het significantieniveau en wordt aangegeven met. De kans dat je H 0 ten onrechte verwerpt is hoogstens het significantieniveau. De keuze van is een zaak die van externe factoren afhangt, zoals hoe schadelijk het is de nulhypothese te verwerpen. In de praktijk kiest men meestal 0,10, 0,05 of 0,01. Informatief: het significantieniveau De keuze van het significantieniveau heeft te maken met twee tegenstrijdige belangen van de fabrikant. Enerzijds wil hij dat de inhoud van een flacon niet te veel van 400 ml afwijkt, want te weinig in een flacon kost hem klanten te veel in een flacon kost hem geld. Anderzijds wil de fabrikant het productieproces niet te vaak stilleggen om de machine bij te stellen. Een grote waarde van betekent dat hij vaak moet bijstellen, terwijl hij bij een kleine waarde van het risico loopt flacons te produceren met een afwijkende inhoud. De praktijk heeft bewezen dat 0,10 of 0,05 een evenwichtige keuze is. Vóór het uitvoeren van de steekproef moet er overeenstemming zijn over de keuze van.inde opgaven is steeds een waarde voor gegeven. Het toetsen van hypothesen 87

Laten we eens aannemen dat Helder besluit 0,10 te kiezen. De steekproefomvang is 5. Het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X g l of X g r μ X = 400 4 σ X = = 0,8 5 opp = 0,10 Bij 0,10 moet je g l en g r zo berekenen, dat P X g l of X g r 0,10. Omdat de normaalkromme symmetrisch is, geldt opp links opp rechts 1 0,10 0,05. Dus P X g l 0,05, dus g l invnorm 0.05, 400, 0.8 398,68. P X g r 1 0,05 0,95 dus g r invnorm 0.95, 400, 0.8 401,3. Na het vaststellen van het beslissingsvoorschrift laat Helder de steekproef uitvoeren. Op grond van het gevonden steekproefgemiddelde X zal hij H 0 al dan niet verwerpen. Vindt hij bijvoorbeeld X 398,83 dan is er geen aanleiding H 0 te verwerpen, maar bij X 398,63 zal H 0 verworpen worden. We zeggen dat het steekproefgemiddelde X 398,63 significant afwijkt van 400 ml. g l figuur 15. 400 Uit de symmetrie volgt g r = 400 + (400 398,68). g r 398,68 400 g l μ g r 1,3 1,3 4 Fabrikant Helder wil op grond van een steekproef met lengte 100 een beslissing nemen over het al dan niet verwerpen van H 0 400. Hij kiest als significantieniveau 0,01. Het beslissingsvoorschrift is: Verwerp H 0 als X g l of X g r. a Bereken g l en g r in twee decimalen nauwkeurig. b Het steekproefgemiddelde blijkt 400,8 ml te zijn. Welke conclusie trekt Helder? 5 Een fabrikant maakt gloeilampen van het type GL04, waarvan de levensduur X in uren normaal verdeeld is met 1500 en 60. De afdeling research heeft voor de fabricage van de lampen een goedkoper procédé ontwikkeld waarvan men beweert dat het de levensduur van de lampen niet beïnvloedt. De fabrikant twijfelt hieraan en onderzoekt dit door middel van een steekproef van 100 lampen. Als significantieniveau wordt 0,05 gekozen. a Geef H 0 en H 1. b Het beslissingsvoorschrift is: Verwerp H 0 als X g l of X g r. Bereken g l en g r in één decimaal nauwkeurig. c Het steekproefgemiddelde blijkt 149,7 te zijn. Welke conclusie trekt de fabrikant? Afspraak Neem aan dat bij het nieuwe productieprocédé de standaardafwijking niet verandert. Ook in de rest van dit hoofdstuk gaan we van deze aanname uit. 88 Hoofdstuk 15

A 6 Een autofabrikant beweert dat bij normaal rijgedrag het aantal kilometers X dat zijn banden meegaan normaal verdeeld is met X 35000 en X 4000. Een autotijdschrift houdt een bandentest. In een steekproef van 64 van deze banden komt als steekproefgemiddelde 33844 km tevoorschijn. We vragen ons af of je op grond van dit steekproefresultaat mag concluderen dat X significant afwijkt van 35000. Neem 0,05. a Geef H 0 en H 1. b Het beslissingsvoorschrift is: Verwerp H 0 als X g l of X g r. Bereken g l en g r in gehelen nauwkeurig. c Wat is de conclusie van het autotijdschrift? De theorie kun je doornemen met de applet Overschrijdingskans. Normale toetsen Bij de bandentest in opgave 6 is H 0 35000, H 1 35000 en 0,05. In deze opgave is het steekproefresultaat 33844 bekend. In zo n geval is het niet nodig eerst het beslissingsvoorschrift op te stellen. Door P X 33844 te berekenen, kun je direct zien of je H 0 al dan niet moet verwerpen. Je krijgt P X 33844 normalcdf 10 99, 33844, 35000, 500 0,010. Omdat P X 33844 0,05, is 33844 g l. Het steekproefresultaat 33844 wijkt dus significant af van 35000. Theorie C μ X = 35000 4000 σ X = = 500 64 opp = 0,05 opp = 0,05 g l 35000 g r 33844 figuur 15.3 P X 33844 heet de overschrijdingskans van het steekproefresultaat X 33844. Omdat deze overschrijdingskans kleiner is dan 0,5 verwerp je H 0. De overschrijdingskans van X 34831 is P X 34831. Omdat P X 34831 normalcdf 10 99, 34831, 35000, 500 0,368 en 0,368 0,5 geeft het steekproefresultaat X 34831 geen aanleiding H 0 te verwerpen. Bij de steekproefuitslag X 3568 is de overschrijdingskans P X 3568, want 3568 35000. Omdat P X 3568 normalcdf 3568, 10 99, 35000, 500 0,086 en 0,086 0,5 is er bij het steekproefresultaat X 3568 geen aanleiding H 0 te verwerpen. g l 35000 g r 33844 34831 3568 figuur 15.4 μ σ X = 35000 = 500 X Bij H 0 0 en H 1 0 is de overschrijdingskans van k gelijk aan P X k als k 0 gelijk aan P X k als k 0. Is de overschrijdingskans van k kleiner dan of gelijk aan 0,5, dan wordt H 0 verworpen. Het toetsen van hypothesen 89

Afspraak Is het steekproefresultaat bekend, gebruik dan de overschrijdingskans om te bepalen of H 0 al dan niet verworpen wordt. Dit gaat sneller dan het berekenen van g l en g r. Is de overschrijdingskans kleiner dan of gelijk aan 0,5, dan verwerp je H 0 0 ten gunste van H 1 0. voorbeeld In een bedrijf is de totale tijd X in uren die per dag wordt overgewerkt normaal verdeeld met X 9,3 en X,1. Sinds kort is een systeem van flexibele werktijden ingevoerd. In een periode van 40 werkdagen bleek de gemiddelde overwerktijd 8,6 uur per dag te zijn. Onderzoek of bij een significantieniveau van 1% geconcludeerd kan worden dat het nieuwe systeem invloed heeft op de overwerktijd. Uitwerking X is de overwerktijd per dag in uren. H 0 9,3, H 1 9,3 en 0,01. De overschrijdingskans van 8,6 is P X 8,6.1 normalcdf 1099, 8.6, 9.3, 40 0,018. P X 8,6 0,5, dus H 0 wordt niet verworpen. Conclusie: er is geen aanleiding te veronderstellen dat het nieuwe systeem invloed heeft op de overwerktijd. Je hebt in deze paragraaf bij een gegeven significantieniveau op grond van een steekproefresultaat de hypothese H 0 al dan niet verworpen. Men zegt dat de hypothese H 0 getoetst is tegen H 1. Bij het toetsen van hypothesen wordt op grond van een steekproefresultaat de nulhypothese H 0 al dan niet verworpen. Omdat het hier gaat om het steekproefgemiddelde bij een normale verdeling, spreken we van een normale toets. Informatief: data-snooping In het voorbeeld op de vorige bladzijde is het misschien verleidelijk om 0,05 te kiezen. Dan is namelijk P(X 8,6) 0,5 en zou geconcludeerd mogen worden dat het nieuwe systeem inderdaad invloed heeft op de overwerktijd bij het bedrijf. Zo n verandering van het toetsmodel is echter niet toegestaan. Deze manier van werken wordt in de statistiek data-snooping genoemd. Bij een juiste toetsprocedure moet je vooraf afspraken maken over de hypothesen en over het significantieniveau. Je mag die afspraken niet achteraf, na het uitvoeren van de steekproef, bijstellen. 90 Hoofdstuk 15

7 Gegeven is een normaal verdeelde toevalsvariabele X met X 5 en X 3. Telkens is het steekproefgemiddelde gegeven. Onderzoek of bij het gegeven significantieniveau er aanleiding is het gemiddelde X 5 in twijfel te trekken. a 5%, steekproefgemiddelde 4 en steekproefomvang 50 b 1%, steekproefgemiddelde 6 en steekproefomvang 100 8 De levensduur X in uren van een bepaald soort batterij is normaal verdeeld met X 000 en X 5,5. Een steekproef van 00 batterijen levert een gemiddelde levensduur op van 1995 uur. Onderzoek of bij een significantieniveau van 5% geconcludeerd mag worden dat het steekproefgemiddelde significant afwijkt van 000. 9 Een machine vult pakken suiker. Het gewicht X in kg van een pak suiker is normaal verdeeld met X 1,0 en X 0,04. De fabrikant vermoedt dat na verloop van tijd de vulmachine de neiging vertoont om pakken met een afwijkend gemiddelde te leveren. Een steekproef van 50 pakken levert een steekproefgemiddelde van 1,04 kg op. a Onderzoek of de fabrikant bij een significantieniveau van 5% zal besluiten de vulmachine opnieuw in te stellen. b Welke conclusie zal de fabrikant trekken als het steekproefgemiddelde 1,03 kg is bij een significantieniveau van 5%? A 10 Bij de productie van tennisballen is de diameter X in cm normaal verdeeld met 6,8 cm en 0, cm. Een afnemer twijfelt of de gemiddelde diameter klopt. a Bij een steekproef van lengte 40 is het steekproefgemiddelde 6,75 cm. Bereken de overschrijdingskans van X 6,75 en geef aan welke conclusie de afnemer trekt bij een significantieniveau 0,10. En wat is zijn conclusie bij 0,05? b De tennisbond wil op grond van een steekproef van lengte 100 een beslissing nemen over het al dan niet verwerpen van H 0 6,8. Stel het beslissingsvoorschrift op. Neem 0,10. Het toetsen van hypothesen 91

Hypothesen toetsen Een fabrikant van tennisballen maakt ballen waarvan het gewicht X in gram normaal verdeeld is met 58 en. Er is een nieuwe productiemethode ontwikkeld die goedkoper is en die volgens de afdeling research geen invloed heeft op het gewicht van de tennisballen. Een afnemer van de tennisballen twijfelt aan deze bewering. Je hebt hier te maken met twee hypothesen: H 0 58 de nieuwe productiemethode heeft geen invloed op het gewicht en H 1 58 de nieuwe methode beïnvloedt het gewicht. Bij het toetsen van hypothesen doe je op grond van een steekproefresultaat een uitspraak over het al dan niet verwerpen van H 0. Belangrijke begrippen nulhypothese H 0 58 alternatieve hypothese H 1 58 toetsingsgrootheid X het steekproefgemiddelde beslissingsvoorschrift Verwerp H 0 als X g l of X g r. significantieniveau De kans dat H 0 ten onrechte verworpen wordt is hoogstens, ofwel P X g l of X g r bij X 58. Overschijdingskans Op grond van een steekproefresultaat besluit je H 0 al dan niet te verwerpen. Er zijn twee situaties te onderscheiden. terugblik 1 Het steekproefresultaat is bekend. Bereken de overschrijdingskans van het steekproefgemiddelde. Is deze kans kleiner dan 0,5, dan verwerp je H 0. Is gegeven dat X 56,6, dan is de overschrijdingskans P X 56,6, want 56,6. Is gegeven dat X 58,7, dan is de overschrijdingskans P X 58,7, want 58,7. Verwerp H 0 als de overschrijdingskans van het steekproefresultaat kleiner is dan 1 α. Het steekproefresultaat is niet bekend. Stel het beslissingsvoorschrift op en bereken g l en g r. opp = 1 α μ X = 58 σ X = n n = steekproefomvang opp = 1 α figuur 15.5 g l 58 g r 9 Hoofdstuk 15

15. Eenzijdig en tweezijdig toetsen O 11 Bij de fabricage van gloeilampen van het merk Flash is de levensduur X van de lampen normaal verdeeld met X 1150 uur en X 5 uur. Een medewerker beweert een nieuwe productiemethode ontwikkeld te hebben, waarmee de levensduur van de gloeilampen verlengd wordt. Door middel van een steekproef van 100 lampen, geproduceerd met de nieuwe methode, zal beslist worden of het nieuwe procédé inderdaad een gunstig effect heeft. a Waarom is het niet juist bij H 0 1150 als alternatieve hypothese H 1 1150 te nemen? b Stel dat het steekproefgemiddelde X 1135 is. Is er aanleiding te veronderstellen dat de nieuwe productiemethode een gunstig effect heeft? Linkszijdige en rechtszijdige toetsen Tot nu toe was bij het toetsen van hypothesen de alternatieve hypothese steeds van de vorm H 1 0. Je verwerpt dan H 0 als X g l of X g r. Zo n toets heet een tweezijdige toets. Maar de alternatieve hypothese kan ook van de vorm H 1 0 of van de vorm H 1 0 zijn. We spreken dan van een eenzijdige toets. Theorie A Als voorbeeld bekijken we het productieproces van een bepaald type beeldscherm. De levensduur X in uren van de beeldschermen is normaal verdeeld met X 18000 en X 3000. De afdeling productie beweert een nieuw procédé ontwikkeld te hebben dat de levensduur van de beeldschermen verlengt, terwijl de kosten en de productietijd gelijk blijven. Op grond van een steekproef van 100 beeldschermen beslist de directie of het nieuwe procédé zal worden ingevoerd. Omdat de productieafdeling beweert dat de levensduur verlengd is, is de alternatieve hypothese H 1 18000. Het beslissingsvoorschrift heeft daarom de vorm: Verwerp H 0 als X g. Bij significantieniveau 0,05 bereken je g zo, dat P X g 0,05. Opp links 1 0,05 0,95, 3000 dus g invnorm 0.95, 18000, 100 18493,46. Je verwerpt H 0 als X 18494. Het toetsen van H 0 18000 tegen H 1 18000 is een voorbeeld van een rechtszijdige toets. Het toetsen van H 0 0 tegen H 1 0 is een voorbeeld van een linkszijdige toets. 18 493 18 494 Let op met afronden! Kies je X 18493, dan is P(X g) iets groter dan α en dat mag niet. g opp = 0,05 Het toetsen van hypothesen 93

EENZIJDIGE TOETSEN Bij de linkszijdige toets H 0 0 tegen H 1 0 hoort het beslissingsvoorschrift Verwerp H 0 als X g. Bij de rechtszijdige toets H 0 0 tegen H 1 0 hoort het beslissingsvoorschrift Verwerp H 0 als X g. NORMALE TOETSEN Tweezijdige toets H 0 0 H 1 0 Linkszijdige toets H 0 0 H 1 0 Rechtszijdige toets H 0 0 H 1 0 opp = 1 α 1 opp = opp = α opp = α g l μ 0 g r g μ 0 μ 0 g Beslissingsvoorschrift Verwerp H 0 als X g l of X g r. Beslissingsvoorschrift Verwerp H 0 als X g. Beslissingsvoorschrift Verwerp H 0 als X g. 1 Gegeven is de normaal verdeelde toevalsvariabele X met X 85 en X 15. Stel het beslissingsvoorschrift op bij de volgende toetsen. Hierbij is n de steekproefomvang. a H 0 85, H 1 85, 0,10 en n 30 b H 0 85, H 1 85, 0,05 en n 50 c H 0 85, H 1 85, 0,01 en n 00 13 De afhandelingstijd in minuten van de bestellingen op de verpakkingsafdeling van een groothandel is normaal verdeeld met 1 en 3. De groothandel beweert dat door een interne reorganisatie de gemiddelde afhandelingstijd is teruggedrongen. a Deze bewering wordt getoetst door van 5 bestellingen de afhandelingstijd te meten. Bij welke steekproefgemiddelden is er bij een significantieniveau van 5% aanleiding te veronderstellen dat de afhandelingstijd inderdaad verminderd is? b Een steekproef van 80 bestellingen heeft een steekproefgemiddelde van 11,3 minuten. Is er bij een significantieniveau van 1% aanleiding om te concluderen dat de afhandelingstijd is afgenomen? 94 Hoofdstuk 15

Overschrijdingskans Weet je het steekproefresultaat, dan is het ook bij eenzijdig toetsen aan te bevelen met overschrijdingskansen te werken. rechtszijdige toets opp = α Theorie B Bij H 0 5 tegen H 1 5 met significantieniveau is de overschrijdingskans van het steekproefgemiddelde 6,3 gelijk aan P X 6,3. Je verwerpt H 0 als P X 6,3. 5 6,3 Als P(X 6,3) α, verwerp je H 0. g Bij H 0 5 tegen H 1 5 met significantieniveau is de overschrijdingskans van het steekproefgemiddelde 4, gelijk aan P X 4,. Je verwerpt H 0 als P X 4,. opp = α linkszijdige toets g 5 4, Als P(X 4,) α, verwerp je H 0. OVERSCHRIJDINGSKANSEN BIJ STEEKPROEFRESULTAAT k EN SIGNIFICANTIENIVEAU nulhypothese alternatieve hypothese overschrijdingskans van k Je verwerpt H 0 als de overschrijdingskans kleiner dan of gelijk is aan LINKSZIJDIG TWEEZIJDIG RECHTSZIJDIG H 0 0 H 0 0 H 0 0 H 1 0 H 1 0 H 1 0 P X k P X k als k 0 P X k als k 0 opp α? 0,5 opp 0,5 α? opp 0,5 α? P X k opp α? k μ 0 k μ 0 k μ 0 k voorbeeld Een fabrikant beweert dat de levensduur X in uren van een nieuw soort batterij normaal verdeeld is met X 800 en X 40. Een consumentenorganisatie beweert dat de gemiddelde levensduur minder is dan 800 uur. Een aselecte steekproef van 100 batterijen geeft een gemiddelde levensduur van 793,8 uur. Is er op grond van dit steekproefresultaat bij een significantieniveau van 0,05 aanleiding om te twijfelen aan de bewering van de fabrikant? Uitwerking H 0 800, H 1 800 en 0,05. 40 P X 793,8 normalcdf 1099, 793.8, 800, 100 0,061 Dus verwerp H 0 niet. Er is geen aanleiding de bewering van de fabrikant in twijfel te trekken. Het toetsen van hypothesen 95

Werkschema: het toetsen van hypothesen 1 Formuleer H 0 en H 1 en vermeld het significantieniveau. Is het steekproefresultaat bekend? JA NEE Bereken de overschrijdingskans en beantwoord de gestelde vraag. Stel het beslissingsvoorschrift op en beantwoord de gestelde vraag. 14 Een zuivelfabrikant levert margarine in pakjes van 500 gram. Bij de productieafdeling bestaat het vermoeden dat de pakjes te veel margarine bevatten. Een steekproef van 100 pakjes levert een gemiddeld gewicht van 500,4 gram per pakje op. Is er op grond van het steekproefresultaat bij een significantieniveau van 5% reden om de productieafdeling gelijk te geven? Ga er vanuit dat het gewicht van een pakje normaal verdeeld is met een standaardafwijking van 1,5 gram. 15 Van een middeleeuwse schrijver is bekend dat hij zinnen schreef met een gemiddelde zinslengte van 8,6 woorden en een standaardafwijking van 5,9 woorden. De zinslengte is normaal verdeeld. Onlangs zijn resten van een manuscript gevonden waarvan vermoed wordt dat het door deze auteur geschreven is. Onderzoek wees uit dat bij 75 zinnen de gemiddelde zinslengte 30, woorden is. Kun je bij een significantieniveau van 1% stellen dat het pas ontdekte manuscript van deze auteur afkomstig kan zijn? 16 Lees het volgende krantenartikel. Het IQ Volgens de Duitse filosoof William Stern (1871-1938) is intelligentie de begaafdheid tot aanpassing door denkmiddelen van de reacties der persoonlijkheid op nieuwe en onverwachte situaties in de buitenwereld. Door middel van intelligentietests wordt de intelligentie gemeten en uitgedrukt in het intelligentiequotiënt IQ. De tests worden zo ontworpen, dat een normale verdeling ontstaat met = 100 en = 15. Het IQ van de Nederlander is normaal verdeeld met μ 100 en 15. Tijdens een interview met het plaatselijke dagblad vertelt de voorzitter van schaakvereniging ASC dat het gemiddelde IQ van de 5 competitiespelende leden maar liefst 108 is. Volgens hem toont dit gemiddelde aan dat schakers intelligenter zijn dan gemiddeld. Kun je met een significantieniveau van,5% zeggen dat de voorzitter gelijk heeft? 96 Hoofdstuk 15

A 17 Een medicijn is verkrijgbaar in tabletvorm. Het werkzame aandeel X in een tablet is normaal verdeeld met een gemiddelde van 4 mg en een standaardafwijking van 0,1 mg. Het medicijn helpt als het werkzame aandeel per tablet tussen 3,8 mg en 4, mg ligt. a Bereken de kans dat een tablet helpt. b Er vinden regelmatig controles plaats om te kijken of de gemiddelde hoeveelheid werkzame stof inderdaad gemiddeld 4 mg is. Een steekproef van 50 tabletten levert een gemiddelde op van 3,95 mg werkzame stof. Toets of hieruit volgt dat dit gemiddelde significant afwijkt van 4 mg. Neem 0,05. c Stel dat er gemiddeld 3,95 mg werkzame stof in een tablet zit. Hoeveel procent van de tabletten helpt dan niet? 18 Ga uit van een steekproef uit een normale verdeling met 8. We toetsen H 0 40 tegen H 1 40. a Stel dat we een steekproef gebruiken van 5 exemplaren. Bij welke steekproefgemiddelden verwerpen we H 0 bij 0,05? Rond af op één decimaal. b Hoe groot moet de steekproef zijn, opdat het steekproefgemiddelde 40,5 bij een significantieniveau van 5% aanleiding geeft H 0 te verwerpen? A 19 O 0 Zijn basketballers langer dan gemiddeld? De lengte van de Nederlandse man is normaal verdeeld met een gemiddelde van 183 cm en een standaardafwijking van 7 cm. De gemiddelde lengte van de 133 spelers in de hoogste afdeling van de Nederlandse basketbalbond is 1,97 meter. Kun je bij een significantieniveau van 1% zeggen dat basketballers inderdaad langer zijn dan gemiddeld? Een kabelfabrikant beweert dat zijn remkabels voor toerfietsen gemiddeld minstens een trekkracht van 800 newton kunnen weerstaan. De redactie van een fietstijdschrift vindt dit gemiddelde te optimistisch. Een aselect gekozen steekproef van 5 kabels levert een gemiddelde trekkracht op van 785 newton. Ga er vanuit dat de trekkracht normaal verdeeld is met 35 newton. a Onderzoek of er bij een significantieniveau van 5% voldoende aanleiding is de bewering van de fabrikant in twijfel te trekken. Gebruik de opmerking hieronder bij het formuleren van H 0. Opmerking Een eerste gedachte is wellicht om H 0 800 minstens 800 newton en H 1 800 te kiezen. Beide hypothesen zijn dan samengesteld en daar is niet mee te werken. De nulhypothese moet altijd van de vorm 0 zijn. Je kiest daarbij de voor de fabrikant meest gunstige 0, hier dus H 0 800. b Licht toe dat 800 voor de fabrikant gunstiger is dan een μ-waarde groter dan 800. Het toetsen van hypothesen 97

Enkelvoudige hypothese Niet altijd is duidelijk welke hypothese H 0 en welke H 1 is. De volgende opmerkingen kunnen je helpen de juiste keuze te maken. 1 H 0 is de hypothese die als uitgangspunt dient en die door middel van de alternatieve hypothese in twijfel wordt getrokken. H 0 dient een enkelvoudige hypothese te zijn, dus H 0 heeft de vorm H 0 0. Theorie C Beweert een fabrikant dat de houdbaarheid van zijn producten minstens acht dagen is en trekt een consumentenorganisatie dat in twijfel, dan kies je H 0 8enH 1 8. Bij H 0 hoort immers de bewering die in twijfel wordt getrokken. Je kiest niet H 0 8, want de nulhypothese moet enkelvoudig zijn. Je kiest de voor de fabrikant meest gunstige situatie. A 1 A Volgens Hans kijkt de Nederlander gemiddeld minstens 8,4 uur per week naar de tv. Een medewerker van reclamebureau De Ster trekt deze bewering in twijfel. Een aselecte steekproef van 30 personen levert het gemiddelde 7,6 uur op. Onderzoek of je het bij een significantieniveau van,5% eens kunt zijn met de uitspraak van de medewerker van De Ster. Ga er vanuit dat de tijd die een Nederlander per week naar de tv kijkt normaal verdeeld is met,4 uur. In een koffiebranderij worden pakken gevuld met koffiebonen. Het gewicht X in gram van de bonen in een pak is normaal verdeeld met een standaardafwijking van 4 gram. De fabrikant beweert dat de vulmachine zo is ingesteld, dat een pak gemiddeld 500 gram bevat. a Een consumentenorganisatie zegt dat de pakken gemiddeld minder dan 500 gram koffiebonen bevatten. Hoeveel moet het gemiddelde gewicht van de koffiebonen per pak in een steekproef van lengte 50 zijn om de consumentenorganisatie bij een significantieniveau van 5% in het gelijk te stellen? Rond af op één decimaal. b Het hoofd van de afdeling voorraad beweert dat het gewicht van de koffiebonen in een pak meer dan 500 gram is. Een steekproef van 5 pakken koffie levert het steekproefgemiddelde X 501,94 op. Is er bij een significantieniveau van,5% aanleiding het hoofd van de afdeling voorraad gelijk te geven? c De afdeling controle beweert dat ten gevolge van een defect aan de vulmachine het gewicht van de bonen in een pak niet 500 gram is. Bij een steekproef van 5 pakken is het gemiddelde gewicht per pak gelijk aan 50,48 gram. Wijkt dit steekproefresultaat significant af van 500 gram? Neem 0,05. 98 Hoofdstuk 15

terugblik Eenzijdige en tweezijdige toetsen Linkszijdige toets: H 0 0 tegen H 1 0 Verwerp H 0 als X g met g zo, dat P X g. Rechtszijdige toets H 0 0 tegen H 1 0 Verwerp H 0 als X g met g zo, dat P X g. Tweezijdige toets H 0 0 tegen H 1 0 Verwerp H 0 als X g l of X g r met g l zo, dat P X g l 0,5 en g r zo, dat P X g r 0,5. Overschrijdingskans van het steekproefgemiddelde Bij H 0 5 en H 1 5 is de overschrijdingskans van 3 gelijk aan P X 3 H 1 5 is de overschrijdingskans van 8 gelijk aan P X 8 H 1 5 is de overschrijdingskans van 8 gelijk aan P X 8 en is de overschrijdingskans van 3 gelijk aan P X 3. Je verwerpt H 0 als de overschrijdingskans kleiner is dan of gelijk is aan bij eenzijdig toetsen de overschrijdingskans kleiner is dan of gelijk is aan 0,5 bij tweezijdig toetsen. Toetsen van hypothesen Volg bij het toetsen van hypothesen de volgende stappen. 1 Formuleer H 0 en H 1 en vermeld het significantieniveau. Bereken de overschrijdingskans als het steekproefresultaat bekend is. Stel anders het beslissingsvoorschrift op. 3 Beantwoord de gestelde vraag. Bedenk dat H 0 de hypothese is die in twijfel wordt getrokken. Kies H 0 altijd enkelvoudig, dus H 0 0. Het toetsen van hypothesen 99

15.3 Binomiale toetsen O 3 BINOMIAAL KANSEXPERIMENT het herhaald uitvoeren van Frisdrankfabrikant Mol beweert in een advertentie een kansexperiment waarbij dat 40% van de Nederlanders zijn nieuwe frisdrank je alleen let op de gebeurtenissen succes en mislukking de lekkerste frisdrank vindt. Concurrent Franck vecht dit aan bij de reclamecodecommissie. Volgens hem is dit percentage lager. n is het aantal keer dat het De reclamecodecommissie besluit een steekproef experiment wordt uitgevoerd van 100 personen te nemen en op grond van het p is de kans op succes per keer steekproefresultaat zal Mol de advertentie al dan X is het aantal keer succes niet moeten herzien. P(X = k) = binompdf (n, p, k) De toetsingsgrootheid X is het aantal personen in de P(X k) = binomcdf (n, p, k) steekproef dat de frisdrank van fabrikant Mol de lekkerste vindt. a Is X een discrete of een continue toevalsvariabele? Licht toe. b Licht toe dat X een binomiaal verdeelde toevalsvariabele is. c Neem aan dat X 48. Zal Mol de advertentie moeten herzien? d Neem aan X 8. Welke partij krijgt dan volgens jou gelijk? Eenzijdige binomiale toets In opgave 3 moet op grond van een steekproefresultaat beslist worden of de firma Mol al dan niet gelijk krijgt. In de steekproef wordt het aantal personen X geteld dat de frisdrank van Mol het lekkerst vindt. De toetsingsgrootheid X is een binomiaal verdeelde toevalsvariabele. Indien Mol gelijk heeft is p 0,4, dus de nulhypothese is H 0 p 0,4. De alternatieve hypothese is H 1 p 0,4. Neem als significantieniveau 0,05. H 0 wordt verworpen als het aantal personen in de steekproef dat de frisdrank van Mol de lekkerste vindt, klein is. Dus het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X g. Hierbij is g het grootste gehele getal dat bij n 100 en p 0,4 voldoet aan P X g 0,05. Theorie A Neem aan dat uit de steekproef volgt dat 8 personen het met Mol eens zijn. Door de overschrijdingskans van 8 te berekenen, kom je er eenvoudig achter of H 0 al dan niet verworpen dient te worden. De overschrijdingskans van 8 is P X 8 binomcdf 100, 0.4, 8 0,008. Omdat P X 8 weet je dat 8 g, dus je verwerpt H 0. Mol zal de advertentie moeten herzien. Je hebt hier een voorbeeld van een binomiale toets. Bij een binomiale toets is de toetsingsgrootheid X een binomiaal verdeelde toevalsvariabele. 0,08 0,06 0,04 0,0 kans 0 x 0 30 40 50 60 figuur 15.6 Het kanshistogram bij de binomiale verdeling met n = 100 enp=0,4. 100 Hoofdstuk 15

Bij een binomiale toets heeft de nulhypothese de vorm H 0 p p 0. Bij een linkszijdige toets is H 1 p p 0 en bij een rechtszijdige toets is H 1 p p 0. BINOMIALE TOETS De toetsingsgrootheid X telt hoeveel elementen in de steekproef een bepaald kenmerk hebben. X is binomiaal verdeeld, waarbij n de steekproefomvang is. Linkszijdig: H 0 p p 0 en H 1 p p 0 De overschrijdingskans van k is P X k. Verwerp H 0 als P X k. Rechtszijdig: H 0 p p 0 en H 1 p p 0 De overschrijdingskans van k is P X k. Verwerp H 0 als P X k. Het voorbeeld kun je ook doornemen met de applet Eenzijdige binomiale toets. voorbeeld Een bandenfabrikant beweert dat hoogstens 10% van zijn banden minder dan 40000 km meegaat. Een consumentenorganisatie vermoedt dat dit percentage hoger is. Er wordt besloten tot een steekproef van 50 autobanden. Hiervan blijken er twaalf minder dan 40000 km mee te gaan. Is er aanleiding om de bewering van de fabrikant in twijfel te trekken? Neem 0,05. Aanpak H 0 is de bewering van de fabrikant, want die wordt aangevochten. Omdat H 0 enkelvoudig moet zijn, neem je niet H 0 p 0,1, maar H 0 p 0,1. Het steekproefresultaat is bekend, dus gebruik een overschrijdingskans. Ga op soortgelijke wijze te werk als in het werkschema op bladzijde 96. Uitwerking X is discreet, dus X het aantal banden dat minder dan 40000 km meegaat. P(X 1) = 1 P(X 11). H 0 p 0,1, H 1 p 0,1 en 0,05. De overschrijdingskans van 1 is P X 1 1 P X 11 1 binomcdf 50, 0.1, 11 0,003. P X 1, dus verwerp H 0. Er is inderdaad aanleiding om de bewering van de fabrikant in twijfel te trekken. 4 In een krant staat dat 35% van de Nederlanders in één keer slaagt voor het rijexamen. De eigenaar van een rijschool beweert dat bij zijn rijschool dit percentage hoger ligt. Bij een aselecte groep van 40 klanten van deze rijschool slagen er 19 in één keer voor het rijexamen. a Bereken de overschrijdingskans van 19. b Is er aanleiding de bewering van de rijschoolhouder in twijfel te trekken bij 0,05? Het toetsen van hypothesen 101

5 In de westerse wereld lijdt 8% van de mannen aan een vorm van kleurenblindheid. De bioloog mevrouw drs. E.D. Bouman beweert dat dit percentage onder Aziatische mannen hoger ligt. Een onderzoek onder 00 Aziatische mannen wijst uit dat er aan een vorm van kleurenblindheid lijden. Is er aanleiding om mevrouw Bouman gelijk te geven? Neem 0,05. Informatief: kleurenblindheid Het is een misvatting te denken dat kleurenblinde mensen de wereld geheel zwart/wit zien. De meeste kleurenblinde mensen zien wel kleuren, maar kunnen geen onderscheid maken tussen weinig contrasterende kleuren zoals groen en rood. Slechts 1 op de 30 000 mensen is echt kleurenblind. Een bijzondere situatie doet zich voor op het eiland Pingelap in de Stille Oceaan ten noorden van Australië. Omstreeks 1775 werd Pingelap getroffen door een verwoestende tyfoon. Slechts 0 mensen overleefden de catastrofe, waaronder een echt kleurenblinde man. Van de huidige 3000 inwoners van Pingelap heeft zo n 10% de kleurenblindheid geërfd van deze man. Over het eiland Pingelap kun je meer lezen in het boek Het eiland der kleurenblinden van Oliver Sacks. 6 In de westerse wereld heeft 30% van de bevolking last van een vorm van allergie. Amerikaanse onderzoekers beweren dat dit percentage lager ligt bij mensen die op jonge leeftijd regelmatig met honden en katten in contact zijn gekomen. Door de ontwikkeling van het immuunsysteem zijn ze op latere leeftijd dan minder vatbaar voor allergieën. De onderzoekers hebben 474 kinderen gevolgd die dagelijks met minstens twee honden of katten in contact kwamen. Het bleek dat 11 van hen later met een allergie te kampen kregen. Is er bij een significantieniveau van,5% voldoende aanleiding de Amerikaanse onderzoekers gelijk te geven? Informatief: de hygiënehypothese De hygiënehypothese stelt dat het nog steeds toenemende aantal allergieën in de westerse wereld een gevolg is van de schonere leefwijze. Door een beetje viezer te leven, zijn allergieën te voorkomen. Voorstanders van de hypothese wijzen op plattelandskinderen die meer weerstand hebben dan stadskinderen. Ook zijn er onderzoeken waaruit blijkt dat kinderen die naar een crèche gaan minder last van allergieën hebben. En omstreeks 1980 waren er in Oost- Duitsland ondanks een enorme luchtvervuiling veel minder allergiegevallen dan in West-Duitsland. Toch zijn er veel wetenschappers die de hypothese in twijfel trekken. Volgens professor Nanni uit Maastricht heeft het geen zin een kind op een vieze vloer te laten rondkruipen. 10 Hoofdstuk 15

7 Een televisierecensent beweert dat minstens 70% van alle tv-kijkers zich stoort aan reclameblokken tijdens een film. Een aselecte steekproef wijst uit dat 30 van 500 ondervraagden zich inderdaad aan zulke blokken stoort. Is er op grond van dit steekproefresultaat voldoende reden aanwezig om de mening van de recensent in twijfel te trekken? Neem 0,05. Vanwege het uitgelopen reclameblok kunnen we het einde van de film helaas niet meer uitzenden! A 8 A 9 Mirjam speelt een spel met een dobbelsteen. Volgens haar krijg je te weinig keer zes ogen. Bij het 80 keer gooien met de dobbelsteen krijgt ze maar liefst 7 keer geen zes. Is er bij een significantieniveau van 5% voldoende aanleiding om het met Mirjam eens te zijn? Simon beweert dat bij het draaien van de schijf in figuur 15.7 de wijzer te vaak op rood komt. Bij het 160 keer draaien van de schijf komt de wijzer maar liefst 5 keer op rood. Is dat voldoende reden om Simon bij een significantieniveau van 1% gelijk te geven? figuur 15.7 Beslissingsvoorschrift bij binomiale toets Bij een binomiale toets is H 0 p 0,4, H 1 p 0,4 en 0,05. Door middel van een steekproef van lengte 100 wordt beslist of H 0 al dan niet verworpen wordt. In het geval de steekproefuitslag niet bekend is, moet je berekenen voor welke steekproefresultaten H 0 verworpen wordt. Het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X g. De vraag is dus Wat is het kleinste gehele getal g waarvoor geldt P X g 0,05? ofwel Wat is het kleinste gehele getal g zo, dat 1 P X g 1 0,05? Theorie B TI 1 binomcdf 100, 0.4, g 1 0,05 Voer in y 1 1 binomcdf 100, 0.4, x 1. Maak een tabel en lees af voor x 50 krijg je y 1 0,065 voor x 51 krijg je y 1 0,043. Dus verwerp H 0 als X 51. Casio 1 P X g 1 0,05, ofwel P X g 1 0,95 binomcdf 100, 0.4, g 1 0,95 Proberen geeft P X 49 0,935 P X 50 0,957. Dus g 1 50, ofwel g 51. Dus verwerp H 0 als X 51. Het toetsen van hypothesen 103

Het voorbeeld kun je ook doornemen met de applet Beslissingsvoorschrift bij binomiale toets. voorbeeld Een woordvoerder van de NS beweert dat minstens 90% van de treinen op het traject Utrecht - Arnhem op tijd rijdt. Organisatie Rover vermoedt dat dit percentage lager is. Er wordt besloten van 150 treinen na te gaan of ze op tijd rijden. Hoeveel van deze treinen moeten op tijd rijden om de bewering van de NS bij een significantieniveau van 1% te verwerpen? Uitwerking X het aantal treinen dat op tijd rijdt. H 0 p 0,9, H 1 p 0,9 en 0,01. Verwerp H 0 als X g. Zoek het grootste gehele getal g zo, dat P X g 0,01, ofwel binomcdf 150, 0.9, g 0,01. 90% van 150 is 135, dus onder H 0 zal het aantal treinen dat op tijd rijdt niet te ver onder 135 liggen. TI Casio Voer in y 1 binomcdf 150, 0.9, x. Uit de tabel volgt Proberen geeft x 15 geeft y 1 0,00765 P X 15 0,00765 x 16 geeft y 1 0,01431. P X 16 0,01431. Verwerp H 0 als X 15. Verwerp H 0 als X 15. De bewering van de NS wordt verworpen als er 15 of minder treinen op tijd rijden. 30 De fabrikant van het geneesmiddel Pharmeaplus beweert dat dit middel in minstens 80% van de gevallen doeltreffend werkt. Een arts vindt dit percentage te optimistisch en daarom wordt van 500 patiënten die het middel hebben gebruikt het ziekteverloop nagegaan. Wat is bij een significantieniveau van 5% het kleinste aantal patiënten waarbij het middel Pharmeaplus een positieve uitwerking had, wil de bewering van de fabrikant niet verworpen worden? A 31 Volgens een tennisliefhebber wint een speler die in een set met serveren begint in minstens 55% van de gevallen de set. Commentator Jacco vindt dit percentage te optimistisch en daarom onderzoekt hij 500 gespeelde sets op Wimbledon. a Neem aan dat Jacco op grond van zijn steekproef gelijk krijgt. Wat weet je van het aantal sets waarbij de speler die begint met serveren de set wint? Neem 0,05. b Het werkelijke aantal blijkt 4 te zijn. Wat is je conclusie? De kans dat een serveerder de game wint, is voor op Wimbledon gespeelde partijen 81,5%. Volgens Jacco geven nieuwe ballen bij het serveren extra voordeel. Door middel van een steekproef van 300 met nieuwe ballen gespeelde games op Wimbledon wordt onderzocht of Jacco gelijk heeft. c Hoeveel van die games moet de serveerder winnen om bij een significantieniveau van,5% Jacco gelijk te geven? 104 Hoofdstuk 15

Informatief: tennis Tennis is een spel dat al bekend was bij de Grieken en de Romeinen. Met de ontwikkeling van de rubberen bal begon omstreeks 1870 het moderne tennis. Het eerste toernooi op Wimbledon vond plaats in 1877. Mede door de televisie is tennis een sport geworden die over de gehele wereld gespeeld en bekeken wordt. Van veel partijen is het spelverloop bekend en op grond van deze gegevens zijn heel wat hypothesen over tennis te toetsen, zoals Is het een voordeel om een set te beginnen met serveren? en Geven nieuwe ballen voordeel bij het serveren?. Tweezijdige binomiale toets In een krantenartikel is te lezen dat 38% van de Nederlandse huishoudens een breedbeeld tv bezit. Om deze bewering te toetsen wordt aselect een steekproef van 10 Nederlandse huishoudens genomen. We vragen ons af bij welke aantallen huishoudens met breedbeeld tv het percentage van 38% in twijfel wordt getrokken. We nemen 0,05. Theorie C De toetsingsgrootheid X is het aantal huishoudens in de steekproef dat een breedbeeld tv bezit. De nulhypothese is H 0 p 0,38. Het percentage 38% wordt in twijfel getrokken, dus H 1 p 0,38. Je hebt te maken met een tweezijdige binomiale toets. Onder H 0 is X binomiaal verdeeld met n 10 en p 0,38. Het beslissingsvoorschrift heeft de vorm Verwerp H 0 als X g l of X g r. Bereken g l en g r zo, dat P X g l of X g r 0,05. We kiezen g l en g r zo, dat P X g l 0,05 én P X g r 0,05. P X g l 0,05 binomcdf 10, 0.38, g l 0,05 Je krijgt binomcdf 10, 0.38, 34 0,017 binomcdf 10, 0.38, 35 0,07. Conclusie g l 34. P X g r 0,05 1 P X g r 1 0,05 1 binomcdf 10, 0.38, g r 1 0,05 Je krijgt 1 binomcdf 10, 0.38, 55 0,03 1 binomcdf 10, 0.38, 56 0,01. Conclusie g r 1 56, dus g r 57. Het percentage 38% wordt bij 0,05 in twijfel getrokken als het aantal huishoudens in de steekproef met een breedbeeld tv kleiner dan of gelijk is aan 34 of groter dan of gelijk aan 57. Het toetsen van hypothesen 105

TWEEZIJDIGE BINOMIALE TOETS Bij H 0 p p 0 tegen H 1 p p 0 verwerp je H 0 als X g l of X g r. Kies g l en g r zo, dat P X g l 0,5 en P X g r 0,5. Is het steekproefresultaat k bekend, dan heeft ook bij tweezijdige binomiale toetsen de overschrijdingskans de voorkeur. Van te voren moet je bedenken of je P X k of P X k moet berekenen. Bekijk de volgende situaties. Overschrijdingskans van k bij tweezijdige binomiale toetsen H 0 p 0,6, H 1 p 0,6 steekproefomvang n 60 steekproefresultaat k 4 De overschrijdingskans van 4 is P X 4, want 0,6 60 36 en 4 36. H 0 p 0,6, H 1 p 0,6 steekproefomvang n 80 steekproefresultaat k 4 De overschrijdingskans van 4 is P X 4, want 0,6 80 48 en 4 48. Verwerp H 0 als de overschrijdingskans van k kleiner dan of gelijk is aan 0,5. Het voorbeeld kun je ook doornemen met de applet Overschrijdingskans bij binomiale toets. voorbeeld Een nutsbedrijf beweert dat 30% van de particuliere gasafnemers de energiebespaarwijzer invult. Bij een aselecte steekproef onder 400 afnemers blijken er 6 de bespaarwijzer niet in te vullen. Is er bij een significantieniveau van 5% aanleiding om de bewering van het nutsbedrijf in twijfel te trekken? Uitwerking X het aantal afnemers dat de bespaarwijzer invult. H 0 p 0,3, H 1 p 0,3 en 0,05. Het steekproefresultaat is 400 6 138. De overschrijdingskans van 138 is P X 138 1 P X 137 1 binomcdf 400, 0.3, 137 0,09. P X 138 0,5, dus verwerp H 0 niet. Er is geen aanleiding de bewering van het nutsbedrijf in twijfel te trekken. 3 Judith toetst de zuiverheid van een geldstuk door het geldstuk 100 keer op te gooien. a Waarom is dit een tweezijdige toets? b Tot welke conclusie komt ze omtrent de zuiverheid bij 0,05 als er 59 keer kop boven komt? 33 Martin toetst de zuiverheid van een dobbelsteen. Hij neemt 0,05. Tot welke conclusie komt hij als hij bij 150 worpen 1 zessen telt? 106 Hoofdstuk 15

34 Bij het toetsen van H 0 p 0,3 tegen H 1 p 0,3 door middel van een steekproef van lengte 50 is de toetsingsgrootheid X een binomiaal verdeelde toevalsvariabele. Bij welke steekproefresultaten zal bij een significantieniveau van 10% de nulhypothese verworpen worden? 35 Omstreeks het jaar 000 waren er in Nederland onregelmatigheden bij de aanbesteding van overheidsprojecten. Aannemers verdeelden onder elkaar de opdrachten, waardoor ze hogere prijzen konden vragen. In een landelijk ochtendblad was te lezen dat in 1% van de dossiers bouwfraude voorkwam. Volgens de directeur van een bouwbedrijf is dit percentage lager. Bij een steekproef van 80 dossiers blijkt in acht gevallen sprake van fraude te zijn geweest. Wijst de steekproefuitslag significant af van de mededeling in het ochtendblad? Neem 0,05. A 36 A 37 A 38 Volgens de kappersbond gaat 68% van de Nederlandse mannen minstens één keer per twee maanden naar de kapper. Kapper Beerlage twijfelt aan dit percentage. Bij een aselecte steekproef onder 60 mannen blijken er 14 minder dan één keer per twee maanden naar de kapper te gaan. Is er bij een significantieniveau van 0,10 voldoende aanleiding om Beerlage gelijk te geven? In een krantenartikel is te lezen dat 68% van de Nederlanders het een goed idee vindt veroordeelden van lichte delicten thuis hun straf te laten uitzitten met behulp van een zender die aan de voet wordt bevestigd. Woordvoerder Wolfsen van een politieke partij zegt dat dit percentage lager is. In een aselecte steekproef van 66 Nederlanders blijken 38 personen het thuis uitzitten van de straf een goed idee te vinden. Is er bij een significantieniveau van 5% voldoende aanleiding woordvoerder Wolfsen gelijk te geven? De rouletteschijf in figuur 15.8 is verdeeld in vijf even grote sectoren. Bij een controle wordt nagegaan of de roulette zuiver is. a Men draait de roulette 500 keer en telt hoe vaak het balletje op de sector met het cijfer 1 blijft liggen. Dit blijkt 115 keer te zijn. Is er bij een significantieniveau van 1% aanleiding te vermoeden dat de roulette niet zuiver is? b Men draait de roulette 600 keer en telt hoe vaak het balletje op de sectoren met de cijfers 4 en 5 blijft liggen. figuur 15.8 Bij welke aantallen zal de zuiverheid van de roulette niet in twijfel worden getrokken? Neem 0,01. c Volgens Erik komt het balletje niet vaak genoeg op een sector met een even getal. Bij het 300 keer draaien gebeurt dit slechts 110 keer. Is er bij 0,05 voldoende reden om het met Erik eens te zijn? Het toetsen van hypothesen 107

A 39 A 40 A 41 A 4 Het ministerie van milieu veronderstelt dat minstens de helft van de woningen dubbele beglazing heeft. Bij een aselecte steekproef onder 375 woningen blijken er 1141 dubbele beglazing te hebben. Ga na of de uitslag van de steekproef bij een significantieniveau van,5% voldoende reden vormt om de veronderstelling van het ministerie te herzien. Een fabrikant beweert dat minstens 80% van de bespaarlampen een levensuur van meer dan 8000 uur heeft. Een steekproef levert de volgende aantallen branduren op. 7831 851 8471 931 687 577 8711 916 5317 9997 5317 961 8306 8711 8836 7189 773 9111 9991 990 8618 8817 8171 8356 7881 9158 8377 7583 9313 871 Ga na of deze steekproef voldoende aanleiding geeft om de fabrikant in het gelijk te stellen bij een significantieniveau van 10%. De diameter van de tomaten van tomatenexporteur Driessen is normaal verdeeld met 7,9 cm en 0,5 cm. De tomaten met een diameter minder dan 7, cm zijn niet geschikt voor de export. Deze worden doorgedraaid. a Toon aan dat de kans dat een tomaat van Driessen wordt doorgedraaid gelijk is aan 0,081. De heer Van Eijk, fabrikant van het middel S3Fb beweert dat door bespuiting van de tomatenplanten met zijn middel de diameter toeneemt. Van 900 met het middel S3Fb bespoten tomaten wordt de diameter gemeten. Van deze tomaten blijken er na meting 65 te moeten worden doorgedraaid. b Is met een significantieniveau van 1% aangetoond dat het middel S3Fb de diameter inderdaad vergroot? In Nederland wegen baby s bij de geboorte gemiddeld 350 gram. Het geboortegewicht is normaal verdeeld met een standaardafwijking van 45 gram. Op consultatiebureaus rekent men baby s met een geboortegewicht van meer dan 4000 gram tot de categorie zwaar. a Bereken de kans dat van 80 pasgeboren baby s er minstens vijf tot de categorie zwaar behoren. Medewerkers van het consultatiebureau in Appelscha beweren dat in hun omgeving het aantal zware baby s boven het landelijk gemiddelde ligt, want van de laatste 58 borelingen behoorden er maar liefst acht tot de categorie zwaar. b Onderzoek of bij een significantieniveau van 1% de medewerkers van het consultatiebureau gelijk hebben. 108 Hoofdstuk 15