HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN



Vergelijkbare documenten
Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Hoofdstuk 5 Een populatie: parametrische toetsen

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

15.1 Beslissen op grond van een steekproef [1]

Toetsen van Hypothesen. Het vaststellen van de hypothese

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Examen Statistiek I Januari 2010 Feedback

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Sheets K&S voor INF HC 10: Hoofdstuk 12

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Kansrekening en Statistiek

Kansrekening en Statistiek

Toetsen van hypothesen

7.1 Toets voor het gemiddelde van een normale verdeling

Les 7-8: Parameter- en Vergelijkingstoetsen

Hoofdstuk 4 BETROUWBAARHEIDSINTERVALLEN

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Samenvatting Wiskunde A

Statistiek voor A.I. College 10. Donderdag 18 Oktober

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Zin en onzin van normale benaderingen van binomiale verdelingen

Toegepaste Statistiek, Week 6 1

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Inhoudsopgave. Deel I Schatters en toetsen 1

. Dan geldt P(B) = a d. 3 8

Lesbrief hypothesetoetsen

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Statistiek voor A.I.

Toetsen van hypothesen

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Hoofdstuk 12: Eenweg ANOVA

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Samenvatting Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Wiskunde B - Tentamen 2

Examen Statistiek I Feedback

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en Statistiek

Beschrijvend statistiek

Les 1: Waarschijnlijkheidrekening

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Oefenvragen bij Statistics for Business and Economics van Newbold

SOCIALE STATISTIEK (deel 2)

Voorbeeldtentamen Statistiek voor Psychologie

Formules Excel Bedrijfsstatistiek

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Oplossingen hoofdstuk 7

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.

Les 1: Waarschijnlijkheidrekening

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Kansrekening en Statistiek

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Werkbladen 3 Terugzoeken

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Beslissen op grond van een steekproef Hoofdstuk 15

Statistiek = leuk + zinvol

Kansrekening en Statistiek

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Hoofdstuk 6 Hypothesen toetsen

Populaties beschrijven met kansmodellen

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Examen G0N34 Statistiek

15.1 Beslissen op grond van een steekproef

TOETSEN VAN HYPOTHESEN

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

Feedback examen Statistiek II Juni 2011

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Parametervrije toetsen

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Kansrekening en Statistiek

Data analyse Inleiding statistiek

Statistiek 2 deel A 30 minuten over statistisch toetsen

Hoofdstuk 10: Regressie

Les 1: Waarschijnlijkheidrekening

Transcriptie:

Toetsen van hypothesen 1 HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN 1. Inleiding...2 2. Beslissingsregels...5 2.1. Beslissen op grond van kritische grenzen...5 2.1.1. Het α-risico...6 2.1.2. Het β-risico...7 2.2. Beslissen op grond van betrouwbaarheidsintervallen...9 2.3. Beslissen op grond van overschrijdingskansen...1 2.4. Beslissen op grond van andere beslissingsregels...12 3. Toetsen omtrent µ via kritische grenzen...15 3.1. Eenzijdig alternatief 1...15 3.2. Eenzijdig alternatief 2...16 3.3. Tweezijdig alternatief...17 3.4. Uitbreidingen...19 3.4.1. Steekproef uit een andere verdeling...19 3.4.2. Ongekende variantie...19 4. Toetsen omtrent µ via betrouwbaarheidsintervallen...2 4.1. Eenzijdig alternatief 1...2 4.2. Eenzijdig alternatief 2...2 4.3. Tweezijdig alternatief...21 4.4. Opmerkingen...21 5. Toetsen omtrent µ via overschrijdingskansen...22 5.1. Eenzijdig alternatief 1...22 5.2. Eenzijdig alternatief 2...22 5.3. Tweezijdig alternatief...23 5.4. Opmerkingen...24 5.5. Slotopmerkingen...25 6. Oefeningen...26 7.1. Toetsen i.v.m. proporties...27 7.2. Toetsen i.v.m. varianties en/of standaardafwijkingen...29 7.3. Verschil tussen gemiddelden en quotiënt varianties...31 7.4. Toetsen i.v.m. correlatiecoëfficiënt...35 7. Oefeningen...37

Toetsen van hypothesen 2 1. Inleiding In de vorige hoofdstukken gebruikten we schatters om (de) parameter(s) van een verdeling te benaderen. Via betrouwbaarheidsintervallen kregen we een idee van de gemaakte benaderingsfout. In dit hoofdstuk gebruiken we schatters en betrouwbaarheidsintervallen om uitspraken omtrent parameters te toetsen. We zullen tevens uitspraken en beweringen aangaande verdelingen toetsen. Beweringen over een parameter of een verdeling aanvaarden of verwerpen gebeurt meestal op basis van een steekproef en gaan bijgevolg steeds gepaard met een zeker risico. Dit risico wordt o.m. gemeten door de kans op een verkeerde beslissing. We vertrekken van de volgende voorbeelden. Voorbeeld 1 Een bakker en een molenaar komen overeen dat de molenaar zakken bloem zal leveren met een verwacht gewicht µ van tenminste 5 kg. Omdat technische (of andere) volmaaktheid niet bestaat zullen er afwijkingen voorkomen in het gewicht van de zakken bloem. We veronderstellen dat het gewicht van de zakken toevallig varieert en in dit voorbeeld gaan we ervan uit dat het gewicht normaal verdeeld is met verwacht gewicht µ en standaardafwijking σ =.5 kg, dit betekent: X ~ N(µ, σ² =.25). Bij elke levering wil de bakker nagaan of de molenaar de overeenkomst naleeft. De bakker wenst m.a.w. na te gaan of de molenaar werkte met µ 5 of werkte met µ < 5. De uitspraak die de bakker wenst te controleren noemen we de nulhypothese H. De niet gewenste uitkomst (µ < 5) noemen we het alternatief H a. De bakker moet nu kiezen tussen: H : µ µ = 5 H a : µ < µ = 5 Bij het nemen van een beslissing moet de bakker rekening houden met twee soorten risico. We bekijken daartoe het volgende schema. Op basis van een beslissingsregel van de bakker komen we terecht in één van de vier vakjes van het schema.

Toetsen van hypothesen 3 SCHEMA mogelijkheden de consument verwerpt H de consument verwerpt H niet de producent heeft gelijk en de nulhypothese H is correct foutieve beslissing type I fout (α) correcte beslissing de producent heeft ongelijk en de alternatieve hypothese geldt H a (H is vals) correcte beslissing foutieve beslissing type II fout (β) Het is enerzijds mogelijk dat de bakker de levering ten onrechte verwerpt: op basis van empirische evidentie meent de bakker dat H a geldt, maar in feite is H correct. Deze foutieve beslissing noemen we een fout van de eerste soort. Nu wordt de beslissing meestal genomen op basis van een steekproef en deze hangt af van toevallige omstandigheden. De kans op een fout van de eerste soort noteren we met α en noemen we het α-risico of het producentenrisico: α = P(H verwerpen H juist) De kans dat een dergelijke fout niet gemaakt wordt is 1 α en noemt men soms de betrouwbaarheid van de toets: 1 α = P(H niet verwerpen H correct) Het is anderzijds ook mogelijk dat de bakker de levering ten onrechte aanvaardt: de bakker denkt dat H geldt en dat hij de molenaar kan vertrouwen, maar in feite is de molenaar een bedrieger die goederen levert met µ < 5. In realiteit is H a correct. Deze foutieve beslissing noemen we een fout van de tweede soort. De kans op een dergelijke fout noteren we met β en noemen we het β-risico of het consumentenrisico. We noteren: β = P(H niet verwerpen H vals) De kans dat een dergelijke fout niet gemaakt wordt is 1 β en noemt men het onderscheidingsvermogen van de beslissingsregel. De kans om het bedrog te doorzien is dus gelijk aan: 1 β = P(H verwerpen H vals) Als de molenaar zwaar liegt en zakken bloem levert met een gemiddeld gewicht gelijk aan µ = 45, dan zullen we dit makkelijker ontdekken dan in het geval waarin de molenaar een kleine leugenaar is en bloem levert in zakken van gemiddeld µ = 49.9.

Toetsen van hypothesen 4 Het is m.a.w. gemakkelijker om een onderscheid te maken tussen 5 en 45 dan tussen 5 en 49.9. Afhankelijk van de beslissingsregel die de bakker hanteert en afhankelijk van het (goed of slecht) karakter van de molenaar, zullen α en β andere waarden aannemen. Beide partijen hebben er alle belang bij dat deze kansen zo klein mogelijk zijn. Hoe kunnen we nu een goede beslissingsregel opstellen en formuleren? Voorbeeld 2 Een machine maakt spijkers waarvan de normlengte gelijk is aan 1 cm. Zowel té kleine als té grote spijkers zijn onbruikbaar. Op regelmatige tijdstippen zal men de productie van spijkers controleren om te kunnen kiezen tussen H : µ = µ = 1 en H a : µ µ = 1 Vanzelfsprekend geven beslissingsregels opnieuw aanleiding tot beide types van fouten. In vergelijking met voorbeeld 1 gaat het hier om een tweezijdig alternatief: afwijkingen aan beide zijden van de normlengte van 1 cm worden niet toegelaten. In voorbeeld 1 gaat het om een éénzijdig alternatief: de bakker zal niet boos zijn indien de zakken bloem méér dan het gemiddelde gewicht van 5 kg bevatten. Voorbeeld 3 Een wagenproducent beweert dat zijn wagens niet meer verbruiken dan 5 liter per 1 km. Om dit te controleren nemen we een steekproef en kiezen vervolgens tussen H : µ µ = 1 en H a : µ > µ = 1 In dit voorbeeld gaat het terug om een éénzijdig alternatief: een té groot verbruik zal voor de consumenten niet aanvaardbaar zijn.

Toetsen van hypothesen 5 2. Beslissingsregels Er zijn verschillende manieren om beslissingsregels te formuleren. We bekijken hier enkele beslissingsregels in de context van voorbeeld 1 over de bakker en de molenaar. Hier staan twee hypothesen tegenover elkaar: "De molenaar is eerlijk" (de nulhypothese) en "De door de molenaar gevulde zakken zijn lichter dan aangekondigd" (een alternatieve hypothese). De bakker wil op grond van gegevens beslissen of hij de nulhypothese zal verwerpen ten voordele van het alternatief. In het dagelijks leven worden de meeste beslissingen dikwijls impulsief en op subjectieve basis genomen worden. In statistiek zijn de meeste beslissingsregel gebaseerd op de resultaten van een steekproeftrekking. Via de steekproef bepaalt men een karakteristiek die vervolgens gebruikt wordt om te beslissen. De karakteristiek op basis van dewelke men zijn besluit neemt en fundeert noemt men meestal de toetsingsgrootheid. We illustreren verschillende beslissingsregels voor het voorbeeld van de bakker en de molenaar. 2.1. Beslissen op grond van kritische grenzen Een voorbeeld van een beslissingsregel is de volgende: uit elke lading neemt de bakker een staal van n = 16 zakken en hij bepaalt het steekproefgemiddelde X van deze 16 gevonden gewichten. Hij beslist nu als volgt: Hij kiest een kritische (of kritieke) grens K en beslist: als X < K, dan verwerpt hij H (en dus de lading) als X K, dan verwerpt hij H (en dus de lading) niet De toetsingsgrootheid is hier het steekproefgemiddelde X en de beslissingsregel is gebaseerd op de kritische grens K. Stel bijvoorbeeld K = 49.75. Als we in een concrete steekproef vinden dat X gelijk is aan 49.65, dan verwerpen we de lading; als X = 49.87 verwerpen we de lading niet. Bij de kritische grens K = 49.5 laat de bakker een afwijking toe van.5 kg. In dit geval zal de lading zowel bij X = 49.65 als bij X = 49.87 aangenomen worden. Vanzelfsprekend zal de keuze van de steekproefgrootte en de keuze van K het consumentenrisico en het producentenrisico beïnvloeden.

Toetsen van hypothesen 6 2.1.1. Het α-risico We bepalen het α-risico voor deze beslissingsregel. We vinden α = P(H verwerpen H juist) = P( X < K µ = µ = 5) Uit de gegevens weten we dat X N(µ, σ² =.25) en bijgevolg dat X N(µ, σ² / n) Indien µ = µ = 5 vinden we X N(µ, σ² / n) en na standardiseren dus dat α = P( X < K µ = µ = 5) = P(Z < Voor K = 49.8 vinden we α = P( Z < K µ σ / 49.8 5.5 / 4 n ) ) = P( Z < - 1.6) =.54 alfarisico bij K = 49.8 3,5 3 2,5 2 1,5 1 alfa,5 49,4 49,6 49,8 5 5,2 5,4 5,6 Voor K = 49.5 vinden we α = P( Z < 49.5 5.5 / 4 ) = P( Z < - 4) =.3 Voor andere kritische grenzen vinden we de volgende tabel en grafiek: K standardiseren alfa 5,5 49,95 -,4,344578 49,9 -,8,211855 49,85-1,2,1157 49,8-1,6,54799 49,75-2,2275 49,7-2,4,8198 49,65-2,8,2555 49,6-3,2,687 49,55-3,6,159 49,5-4 3,17E-5

Toetsen van hypothesen 7 alfa-risico in functie van K,6,5,4 alfa,3,2,1 49,4 49,5 49,6 49,7 49,8 49,9 5 5,1 K Wanneer we vooraf een bepaald risico α vastleggen, dan kunnen we de bijhorende kritische grens bepalen via de vergelijking K µ α = P(Z < ) σ / n In de notatie die we in het vorig hoofdstuk gebruikten vinden we dat K µ σ / n = z α of K = µ z α σ/ n 2.1.2. Het β-risico We bepalen nu eveneens het beta-risico bij deze beslissingsregel. We vinden β = P(H niet verwerpen H vals) = P( X K µ < µ ) Indien µ = µ a < µ dan vinden we X N(µ a, σ² / n) en na standaardiseren dat β = P( X K µ = µ a < µ ) = P( Z Bij K = 49.75 en µ a = 49 vinden we grafisch: K µ σ / a n )

Toetsen van hypothesen 8,9,8,7,6,5,4,3,2,1 47,4 4 7,7 4 7,9 48,2 48,4 4 8,7 48,9 49,2 4 9,4 4 9,7 49,9 5,2 5,4 5,7 5,9 5 1,2 51,4 51,7 5 1,9 5 2,2 52,4 Voor K = 49.75 en verschillende waarden van µ a vinden we de volgende tabel en grafiek: K = 49,75 µ(a) stand. beta 1 - beta 49,5 2,2275,97725 49,55 1,6,54799,94521 49,6 1,2,1157,88493 49,65,8,211855,788145 49,7,4,344578,655422 49,75 1,14E-13,5,5 49,8 -,4,655422,344578 49,85 -,8,788145,211855 49,9-1,2,88493,1157 49,95-1,6,94521,54799 5-2,97725,2275 beta-risico in functie van µ(a) voor K = 49.75 1,8 beta,6,4,2 49,4 49,5 49,6 49,7 49,8 49,9 5 µ(a) Naarmate de molenaar meer liegt daalt het beta-risico en stijgt het onderscheidend vermogen: er is een kleinere kans dat we de leugen niet ontdekken. Voor µ a < µ = 5

Toetsen van hypothesen 9 maar in de omgeving van µ = 5 vinden we dat β ongeveer gelijk is aan.2275. Dit is precies gelijk aan het alfa-risico van de beslissingsregel gebaseerd op K = 49.75. Voor elke andere kritische grens K kunnen we een dergelijke tabel en grafiek maken. De relatie tussen β, K en µ a wordt gegeven door z β = K µ σ / a n of K = µ a + z β σ / n Opmerking Bemerk dat voor elke beslissingsregel met een vooraf gegeven α, het β-risico kan variëren tussen % en (1 α)%. Het is dus met dit soort beslissingsregels niét mogelijk om tegelijkertijd zowel α als β klein te houden. Wat men wél kan doen is het volgende: voor een vooraf gegeven α, β en µ a, kunnen we de vereiste steekproefgrootte bepalen! Uit K = µ - z α σ/ n en K = µ a + z β σ / n volgt immers dat µ - z α σ/ n = µ a + z β σ / n zodat (µ - µ a ) = (z α + z β )σ / n en dus n = (z α + z β )σ /(µ - µ a ) 2.2. Beslissen op grond van betrouwbaarheidsintervallen Een tweede beslissingsregel is gebaseerd op betrouwbare uitspraken. Uit elke lading neemt de bakker n = 16 zakken en hij bepaalt het steekproefgemiddelde X. De beslissingsregel luidt nu als volgt: Kies een gewenste betrouwbaarheid 1 α en construeer een (1 α)% b.b. voor µ als µ > b.b., dan verwerpen we H (en dus de lading) als µ b.b., dan verwerpen we H (en dus de lading) niet In ons voorbeeld is X ~ N(µ,.25). Wanneer we kiezen voor een 95% b.b., dan vinden we voor µ de volgende b.b.: µ X + z 5% σ/ n = X + 1.645*.5/4 = X +.26 We vinden dus dat X +.26 groter is dan of gelijk aan de echte waarde van µ met een kans of betrouwbaarheid van 95 %. Stel nu dat we in een concrete steekproef de waarde X = 49.7 vinden. In dit geval vinden we als b.b. µ 49.7 +.26 = 49.96. We merken dat de vooropgestelde waarde van µ = 5 een onbetrouwbare waarde is! In dit geval verwerpen we bijgevolg de nulhypothese H.

Toetsen van hypothesen 1 Als we anderzijds in een concrete steekproef de waarde X = 49.9 vinden, dan vinden we als 95% b.b. voor µ de grens µ 49.9 +.26 = 51.16 In dit geval is de waarde die we vooropstellen in de nulhypothese (µ = 5) wel een betrouwbare waarde en verwerpen we H niet. Opmerking: verband met kritische grens. Bij deze beslissingsregel beslissen we om H te verwerpen van zodra µ > b.b. µ > X + z α σ/ n X < µ z α σ/ n Deze tweede beslissingsregel is dus equivalent met de beslissing om H te verwerpen op grond van de kritische grens K = µ z α σ/ n Deze kritische grens K = µ z α σ/ n noemen we daarom de 95% betrouwbare kritische grens. Het bepalen van α- en β-risico verloopt nu verder zoals in 2.1. 2.3. Beslissen op grond van overschrijdingskansen Bij deze aanpak verwerpt de bakker de lading als de steekproefresultaten niet voldoen aan zijn verwachtingen. Uit elke lading neemt de bakker n = 16 zakken en hij bepaalt de waarde van het steekproefgemiddelde X voor deze 16 gevonden gewichten. Indien X = 51.2 5, dan zal de bakker tevreden zijn en is het vrij evident dat hij niet zal twijfelen aan de goede trouw van molenaar. Als echter X = 49.9 < 5, dan zal de bakker misschien twijfelen aan de goede trouw van de molenaar. Als X = 49.6 < 5, dan zal de bakker grotere twijfels hebben: als de zakken echt gemiddeld µ = 5kg wegen, dan is een dergelijk steekproefresultaat niet geloofwaardig. De molenaar kan zich verweren en toevalsfactoren inroepen als verklaring voor de lage waarde van het steekproefgemiddelde: de molenaar beweert dat dit steekproefresultaat niet de regel, maar een uitzondering is. Om dit na te gaan veronderstelt de bakker dat de nulhypothese geldt en bepaalt de bakker de kans op een steekproefresultaat met een gemiddelde waarde X kleiner dan of gelijk aan 49.6. Deze kans noemen we de overschrijdingskans van het steekproefresultaat. De bakker beslist dan als volgt: Hij kiest een toegelaten overschrijdingskans α en beslist als de overschrijdingskans < α, dan verwerpt hij H en dus de lading als de overschrijdingskans α, dan verwerpt hij H niet

Toetsen van hypothesen 11 Als in een concrete situatie de berekende OK (= overschrijdingskans) te klein is, dan is het gevonden concrete steekproefresultaat in het licht van de nulhypothese - onwaarschijnlijk. In dit geval zal de bakker de bewering (en dus de lading) van de molenaar verwerpen. We bepalen nu deze OK bij twee voorbeelden. (a )Veronderstel dat X = 49.9 < 5. We weten dat X ~ N(µ,.25) waaruit volgt dat X ~ N(µ,.25/16) Indien H correct is, dan is µ 5. In het slechtste geval is µ = 5 en dan vinden we X ~ N(5,.25/16). De OK van ons steekproefresultaat bedraagt (via standaardiseren) P( X 49.9) = P(Z (49.9 5)/.5/4) = P(Z -.8) =.2219 Indien µ = 5, dan krijgen we in ongeveer 22% van de gevallen een steekproefresultaat waarbij X 49.9. Het is dus helemaal niet uitzonderlijk dat we een steekproefresultaat vinden waarbij X = 49.9. (b) Veronderstel nu dat X = 49.6 < 5. Als H correct is dan is X ~ N(5,.25/16). De OK van ons steekproefresultaat is nu: P( X 49.6) = P(Z (49.6 5)/.5/4) = P(Z - 3.2) =.687 Indien µ = 5, dan is het heel onwaarschijnlijk dat we bij een steekproef van omvang n = 16 een steekproefresultaat vinden waarbij X 49.6. De lading wordt bijgevolg verworpen. Afhankelijk van de keuze van α en ook van de steekproefomvang, zal de genomen beslissing bij deze beslissingsregel variëren. Opmerkingen. (1) De getallen -3.2 resp. -.8 die we berekenden noemen we de z-waarde van de gevonden steekproefresultaten X = 49.6 resp. 49.9. Wanneer µ = µ en X = x dan is de z-waarde gedefinieerd als z = z( x ) = x µ De gekozen toegelaten overschrijdingskans α noemt men soms het significantieniveau van de beslissingsregel. σ / n

Toetsen van hypothesen 12 (2) Verband met de vorige beslissingsregels De OK van x is gelijk aan OK = P(Z z-waarde H is correct). Bemerk nu dat H wordt verworpen P(Z z-waarde H is correct) α z-waarde -z α X µ σ / n -z α X µ z α σ/ n X + z α σ/ n µ De beslissing om H te verwerpen als de overschrijdingskans α overschreden wordt is dus equivalent met de beslissing om H te verwerpen als de waarde van het steekproefgemiddelde onder de kritische grens K = µ z α σ/ n ligt, en dus ook equivalent met de beslissing om H te verwerpen als µ boven de de (1 - α)% b.b. X z α σ/ n ligt. 2.4. Beslissen op grond van andere beslissingsregels De bovenstaande beslissingsregels (BR) waren telkens gebaseerd op het rekenkundig gemiddelde. We kunnen BR echter ook baseren op andere steekproefkarakteristieken zoals het maximum, de mediaan, bepaalde steekproefproporties, de empirische verdelingsfunctie. Een andere BR bestaat erin om getrapte beslissingen te nemen. Voorbeeld 1 Uit elke lading neemt de bakker een steekproef van grootte n = 5 en hij verdeelt de zakken in twee klassen: als het gewicht van een zak kleiner is dan 5, dan is dit een mislukking, zoniet is het een succes. Een beslissing wordt nu genomen op basis van het aantal successen (#S), en wel op de volgende manier

Toetsen van hypothesen 13 De bakker (beslisser) legt een kritische grens K vast en als #S < K, dan verwerpt hij H (en dus de lading) als #S K dan verwerpt hij H (en dus de lading)niet. Cijfervoorbeeld. Stel dat we de kritische grens K = 15 kiezen. Wanneer we in een concrete steekproef vinden dat #S = 17, dan verwerpen we H niet. Als we in een concrete steekproef vinden dat #S = 12, dan verwerpen we H wel. Ter illustratie bepalen we hier ook het α-risico van deze BR. Indien H correct is, dan is de kans op een succes p = P(X > 5) =.5. Bij een steekproef van omvang 5 is het aantal successen dus binomiaal verdeeld: #S BIN(n = 5, p =.5) Omdat n voldoende groot is benaderen we #S N(25, 12.5). We vinden nu (met CC) α = P(#S < K H correct) = P(#S < 15 µ = 5)= P(#S 14.5 µ = 5) Via de CLS vinden we dat α P(Z (14.5 25)/ 12.5) = P(Z -2.97) =.15. Varianten van beslissing volgens deze BR krijgen we door n anders te kiezen of door de kritieke grens K anders te kiezen. Voorbeeld 2 Uit elke lading neemt de bakker een steekproef van omvang n = 25 en bepaalt de empirische verdelingsfunctie EVF(x). Als EVF té veel afwijkt van de theoretische verdelingsfunctie TVF (dit is de verdelingsfunctie van de t.v. X ~ N(µ = 5,.25)), dan wordt de nulhypothese verworpen. We berekenen vervolgens D = max EVF(x) TVF(x) en een mogelijke BR luidt als volgt: De bakker (beslisser) legt een kritische grens K vast en beslist als D > K, dan verwerpt hij H (en dus de lading) als D K, dan verwerpt hij H (en dus de lading)niet. Voorbeeld 3 Een voorbeeld van een getrapte beslissingsregel is de volgende. We nemen een steekproef van n = 1 stuks en bepalen X Als X 49.85 dan verwerpt de bakker de lading niet

Toetsen van hypothesen 14 Als X < 49.85, dan neemt hij een tweede steekproef van grootte n = 9 als voor deze tweede steekproef X 5, dan wordt de lading niet verworpen als voor deze tweede steekproef X < 5, dan wordt de lading verworpen Voorbeeld 4 We nemen geregeld steekproeven van omvang n = 1. Wanneer we in een dergelijke steekproef 4 keer na elkaar een gewicht vinden dat lager is dan 5, dan verwerpen we de lading.

Toetsen van hypothesen 15 3. Toetsen omtrent µ via kritische grenzen We veralgemenen nu de situatie van het vorige voorbeeld. 3.1. Eenzijdig alternatief 1 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ < µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een kritische grens K alsx K, dan wordt H verworpen alsx > K, dan wordt H niet verworpen De relatie tussen K en het α-risico wordt gegeven door de volgende relatie: K = µ z α σ / n Bij een gegeven α-risico luidt de BR via kritische grenzen als volgt: alsx K = µ z α σ / n, dan wordt H verworpen alsx > K = µ z α σ / n, dan wordt H niet verworpen Bij een gegeven kritische grens K bepalen we het β-risico als volgt: indien H a correct is en µ = µ a < µ, dan is X ~ N(µ a, σ² / n) en β = P( X > K µ = µ a ) = P(Z < K µ σ / We vinden ook de relatie tussen β, K en µ a : a n ) z β = K µ σ / a n of K = µ a + z β σ / n

Toetsen van hypothesen 16 3.2. Eenzijdig alternatief 2 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ > µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een kritische grens K alsx K, dan wordt H verworpen alsx < K, dan wordt H niet verworpen De relatie tussen K en het α-risico wordt gegeven door de volgende relatie: K = µ + z α σ / n Bij een gegeven α-risico luidt de BR via kritische grenzen als volgt: alsx K = µ + z α σ / n, dan wordt H verworpen alsx < K = µ + z α σ / n, dan wordt H niet verworpen Bij een gegeven kritische grens K bepalen we het β-risico als volgt. Indien H a correct is en µ = µ a < µ, dan is X ~ N(µ a, σ² / n) en vinden we β = P( X < K µ = µ a ) = P(Z < We vinden ook de relatie tussen β, K en µ a : K µ σ / a n ) z β = K µ σ / a n of K = µ a z β σ / n

Toetsen van hypothesen 17 3.3. Tweezijdig alternatief Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ = µ en H a : µ µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen twee kritische grenzen K en L als L X K, dan wordt H niet verworpen alsx > K of als X < L, dan wordt H verworpen Omdat de normale verdeling symmetrisch is rond het gemiddelde µ, is het gebruikelijk om ook de kritische grenzen symmetrisch te kiezen. Men kiest gewoonlijk voor de kritische grenzen K, L = µ ± z α/2 σ / n Deze grenzen zijn gemakkelijk te onthouden en ze geven ook de relatie weer tussen het de grenzen K, L en het α-risico. Bij een gegeven α-risico luidt de BR via kritische grenzen dan als volgt: als µ z α/2 σ / n X µ + z α/2 σ / n, dan wordt H niet verworpen als X > µ + z α/2 σ / n of X < µ z α/2 σ / n, dan wordt H niet verworpen Bij gegeven kritische grenzen K en L bepalen we het β-risico als volgt: indien H a correct is en µ = µ a < µ, dan is X ~ N(µ a, σ² / n) en L µ a β = P(L X K µ = µ a ) = P( σ / n Wanneer K, L = µ ± z α/2 σ / n, dan vinden we Z µ µ β = P( a µ µ zα / 2 Z a + zα / 2 ) σ / n σ / n Cijfervoorbeeld K µ Flesjes parfum worden gevuld met een hoeveelheid X N(µ, σ² =.36). Het is van belang dat de inhoud van een flesje gemiddeld precies gelijk is aan 1 ml. We wensen daarom de volgende hypothesen te toetsen: H : µ = 1 H a : µ 1 σ / a n )

Toetsen van hypothesen 18 We nemen daartoe geregeld een steekproef van omvang n = 25 en berekenen X. De BR met een α-risico van 5% leidt tot de volgende kritische grenzen: K, L = µ ± z α/2 σ / n = 1 ± 1.96*.6/5 = 1 ±.2352 We beslissen dus: Als 99.7648 X 1.2352, dan wordt H niet verworpen als X > 1.2352 of X < 99.7648, dan wordt H niet verworpen We berekenen nu β en 1 β voor verschillende alternatieven: µ µ µ β = P( a µ zα / 2 Z a + zα / 2 ) σ / n σ / n 1 µ = P( a 1 µ 1. 96 Z a + 1. 96).6 / 5.6 / 5 In functie van µ a vinden we de volgende tabel en grafiek: µ(a) beta 1-beta 99,4,1183,998817 99,45,4354,995646 99,5,13669,986331 99,55,36727,963273 99,6,84824,915176 99,65,169367,83633 99,7,294594,7546 99,75,45895,54915 99,8,615223,384777 99,85,76484,239516 99,9,86745,13255 99,95,92989,711 1,954,49996 1,5,92989,711 1,1,86745,13255 1,15,76484,239516 1,2,615223,384777 1,25,45895,54915 1,3,294594,7546 1,35,169367,83633 1,4,84824,915176 1,45,36727,963273 1,5,13669,986331

Toetsen van hypothesen 19 onderscheidingsvermogen 1,9,8,7,6,5,4,3,2,1 9 9,4 9 9,5 9 9,6 9 9,7 9 9,8 9 9,9 1 1,1 1,2 1,3 1,4 1,5 1,6 µ(a) 3.4. Uitbreidingen 3.4.1. Steekproef uit een andere verdeling Als de steekproef niet uit een normale maar uit een niet gepreciseerde verdeling komt, dan gelden de bovenstaande formules nog steeds op voorwaarde dat de steekproefomvang n voldoende groot is. Dank zij de CLS kunnen we de verdeling van X immers benaderen door een geschikte normale verdeling. 3.4.2. Ongekende variantie Als de variantie niet bekend is, dan vervangen we in de bovenstaande formules de onbekende variantie σ² door s 2. - Bij kleine steekproeven uit een normale verdeling vervangen we de z α - of z α/2 -waarde door een geschikte t n-1 -waarde. De kritieke grenzen zijn dan K = µ t n-1,α s / n K = µ + t n-1,α s / n K = µ ± t n-1,α/2 s / n - Bij grote steekproeven uit een arbitraire verdeling blijven de formules ongewijzigd: K = µ z α s / n K = µ + z α s / n K = µ ± z α/2 s / n

Toetsen van hypothesen 2 4. Toetsen omtrent µ via betrouwbaarheidsintervallen 4.1. Eenzijdig alternatief 1 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ < µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een gewenste betrouwbaarheid 1 α en constureren de b.b. µ X + z α σ/ n als µ X + z α σ/ n, dan wordt H niet verworpen als µ > X + z α σ/ n, dan wordt H verworpen We merken dat H wordt verworpen enkel en alleen als µ > X + z α σ/ n en deze formule geldt enkel en alleen als X < µ - z α σ/ n. Deze grens is precies de kritische grens die we vonden in de vorige paragraaf! 4.2. Eenzijdig alternatief 2 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ > µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een gewenste betrouwbaarheid 1 α en construeren de b.o. µ X z α σ/ n als µ X z α σ/ n, dan wordt H niet verworpen als µ < X z α σ/ n, dan wordt H verworpen We merken dat H wordt verworpen enkel en alleen als µ < X z α σ/ n en deze formule geldt enkel en alleen als X > µ + z α σ/ n Deze grens is precies de kritische grens die we vonden in de vorige paragraaf!

Toetsen van hypothesen 21 4.3. Tweezijdig alternatief Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ = µ en H a : µ µ waarbij µ een gegeven getal is. Als BR hanteren we: we nemen een steekproef van omvang n en bepalen X we kiezen een gewenste betrouwbaarheid 1 α en constureren het b.i. µ = X ± z α σ/ n als µ b.i, dan wordt H niet verworpen als µ b.i., dan wordt H verworpen Deze beslissingsregel kunnen we eveneens herformuleren als volgt: we verwerpen H niet enkel en alleen als X z α σ/ n µ X + z α σ/ n enkel en alleen als µ z α σ/ n X µ + z α σ/ n Dit zijn de kritische grenzen die we in de vorige paragraaf vonden. 4.4. Opmerkingen - Het is duidelijk dat beide (kritieke grens b.i.) methodes volledig equivalent zijn! - Als hulpmiddel voor het onthouden van het soort betrouwbaarheidsinterval we nodig hebben kunnen we gebruik maken van het volgende: bij een tweezijdig alternatief (µ µ ) bepalen we een b.i. voor µ bij een eenzijdig alternatief van de vorm µ > µ, bepalen we een b.o. voor µ bij een eenzijdig alternatief van de vorm µ < µ, bepalen we een b.b. voor µ - Wanneer we de variantie niet kennen, werken we met s en voor - kleine steekproeven uit een normale verdeling - met een geschikte t-waarde.

Toetsen van hypothesen 22 5. Toetsen omtrent µ via overschrijdingskansen 5.1. Eenzijdig alternatief 1 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ < µ waarbij µ een gegeven getal is. Als BR hanteren we: We nemen een steekproef van omvang n en bepalen X We kiezen een maximaal toegelaten overschrijdingskans α Bij een concreet steekproefresultaat x berekenen we de z-waarde ervan z = z( x ) = x µ σ / n en de overschrijdingskans ervan: OK = P(Z < z) als OK α, dan wordt H niet verworpen als OK < α, dan wordt H verworpen De overschrijdingskans OK van z noemt men soms ook de P-waarde of Probability value van z. 5.2. Eenzijdig alternatief 2 Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ µ en H a : µ > µ waarbij µ een gegeven getal is. We beslissen zoals in de vorige paragraaf: We nemen een steekproef van omvang n en bepalen X We kiezen een maximaal toegelaten overschrijdingskans α Bij een concreet steekproefresultaat x berekenen we de z-waarde ervan z = z( x ) = x µ σ / n en de overschrijdingskans ervan: OK = P(Z > z) als OK α, dan wordt H niet verworpen als OK < α, dan wordt H verworpen

Toetsen van hypothesen 23 5.3. Tweezijdig alternatief Stel dat X ~ N(µ, σ²) en dat we willen kiezen tussen twee hypothesen van de vorm: H : µ = µ en H a : µ µ waarbij µ een gegeven getal is. Als BR hanteren we: We nemen een steekproef van omvang n en bepalen X We kiezen een maximaal toegelaten overschrijdingskans α Bij een concreet steekproefresultaat x berekenen we de z-waarde ervan z = z( x ) = x µ σ / n en de overschrijdingskans ervan: OK = P( Z > z ) als OK α, dan wordt H niet verworpen als OK < α, dan wordt H verworpen Indien z >, dan kunnen we OK vereenvoudigen tot OK = 2*P(Z > z); indien z <, dan vinden we OK = 2*P(Z > -z) Voorbeeld Een firma van autobanden beweert dat hun product een levensduur heeft van gemiddeld minstens 5 km met σ = 1 3 km. Bij een onderzoek van n = 1 banden vinden we X = 49 41 km. Is de bewering van de fabrikant houdbaar? Wij moeten hier onderzoeken of er een betekenisvolle afwijking is tussen de bewering van de fabrikant en ons vermoeden dat de levensduur gemiddeld lager is dan wat de fabrikant beweert. Wij toetsen H : µ µ = 5 vs H a : µ < 5 (In H plaatsten we de bewering van de fabrikant) a) via kritische grenzen. Wanneer α = 5 % vinden we K = µ - z α σ/ n = 5 1.64*13 /1 = 49 786.8 Daar ons steekproefresultaat X = 49 41 km < K, verwerpen we H. Ons steekproefresultaat wijst er op dat H niet houdbaar is. Opmerking. In het geval dat X = 49 84 km verwerpen we H niet. b) via betrouwbare uitspraken. Wanneer α = 5 % vinden we als 95% b.b. de grens

Toetsen van hypothesen 24 µ X + z α σ / n = 49 41 + 1.64*13/1 = 49 623.2 Daar µ = µ = 5 niet in dit betrouwbaar gebied ligt verwerpen we H. De waarde µ = 5 is immers onbetrouwbaar. Opmerking. Bij H : µ µ = 49 6 en H a : µ < 49 6 is µ = 49 6 wél een betrouwbare waarde en hebben we onvoldoende reden om H te verwerpen. c) via overschrijdingskansen. We vonden in onze steekproef van omvang n = 1 het steekproefgemiddelde 49 41. We vinden als z-waarde z = (49 41 5 )/(13/1) = - 4.54 De OK is dus OK = P(Z < - 4.54) =.1. Deze zeer kleine overschrijdingskans wijst erop dat H heel onwaarschijnlijk is. 5.4. Opmerkingen 1) Als de steekproef niet uit een normale verdeling komt, maar wel voldoende groot is, dan kunnen we dank zij de CLS dezelfde formules gebruiken. 2) Als de variantie niet gekend is, dan kan deze worden geschat door s 2. In plaats van de z-waarde berekenen we nu de t-waarde: t = t( x ) = x µ Bij grote steekproeven is t( X ) N(,1) en berekenen we via de standaardnormale verdeling de OK van de berekende t-waarde. We beslissen dan om H al dan niet te verwerpen. Bij kleine steekproeven uit een normale verdeling berekenen we de OK door gebruik te maken van t( X ) t n-1 en de t n-1 -verdeling. 3) De P-waarde van een steekproefresultaat is gelijk aan P t( x) t ). s / n ( < n 1 Voorbeeld De diameter van een knikker is normaal verdeeld en men beweert dat de gemiddelde diameter gelijk is aan µ = 4.4. Via een steekproef van omvang n = 1 vonden we X = 4.38 mm en s =.6 mm. We toetsen H : µ = 4.4 vs H a : µ < 4.4 * De 95% kritische grens is gelijk aan K = µ t n-1,5% s/ n = 4.4 2.26*.6/ 1 = 4.4.4 = 4.36 Omdat X = 4.38 > K verwerpen we H niet.

Toetsen van hypothesen 25 * Een 95% b.b. voor µ wordt gegeven door µ X + t n-1,5% s/ n = 4.38 +.4 = 4.42 Omdat µ = 4.4 een betrouwbare waarde is verwerpen we H niet. * De t-waarde van ons steekproefresultaat is t = x µ s / n = (4.38 4.4)/.6/ 1 = -1.5 Via de t 9 -verdeling vinden we OK = P(t 9 < -1.5) = 16% en we verwerpen H niet. 5.5. Slotopmerkingen 1) De drie werkwijzen leiden bij een gegeven steekproefgemiddelde X, α en µ steeds tot hetzelfde besluit. Alleen is de aanpak, de filosofie telkens lichtjes verschillend. - Bij de werkwijze gebaseerd op kritische grenzen bepalen we kritieke grenzen m.b.v. van µ en α. Pas op het laatste moment komt het steekproefresultaat X aan bod om een beslissing te nemen. Alle steekproefresultaten die een X geven die binnen de normen valt leiden tot het niet verwerpen van H. - Bij de werkwijze gebaseerd op b.i. bepalen we betrouwbare grenzen op basis van het steekproefresultaat X en α. Pas op het laatste ogenblik komt de waarde µ aan bod. Alle nulhypothesen van de vorm H : µ = µ waarbij µ b.i. zijn hypothesen die niet verworpen worden. Een betrouwbaarheidsinterval is m.a.w. de set van alle aanvaardbare nulhypothesen. - Bij de werkwijze gebaseerd op OK bepalen we de OK op basis van X en µ. Pas op het laatst ogenblik komt het significantieniveau α aan bod. Dit zorgt voor een zekere flexibiliteit: we zien precies voor welke α de nulhypothese wordt verworpen en voor welke α de nulhypothese niet wordt verworpen. 2) In de praktijk worden de drie aanpakken door elkaar gebruikt. Alleen kunnen we vaststellen dat voor de ene parameter veelal gewerkt wordt met OK en bij de andere parameters de voorkeur gaat naar b.i. of kritieke grenzen. In econometrie bijvoorbeeld is het gebruikelijk te werken met z- en t-waarden en de bijhorende OK of P-waarden.

Toetsen van hypothesen 26 6. Oefeningen 1. We onderzochten de uitgaven van klanten in een fastfoodrestaurant. In een steekproef van omvang n = 12 klanten vonden we X = 9.7 en s = 3. Toets H : µ = 1 vs H a : µ < 1 voor a) α = 1%, b) α = 5% en c) α = 1%. Maak ook telkens een grafiek van β in functie van µ < 1. 2. Formuleer de BR gebaseerd op een steekproef van omvang 64 en op 99% kritieke grenzen bij de keuze tussen H : µ = 3 en H a : µ > 3. Bepaal ook het risico van type II indien eigenlijk µ = 31. (K = 37; β = 15.87%) 3. (Controlekaarten) Onder normale omstandigheden produceert een machine bollen met een diameter N(µ = 5.75mm, σ =.8mm). Om te controleren of de machine moet bijgesteld worden neemt men elke uur een steekproef van omvang n = 6 en berekent men het rekenkundig gemiddelde X van de gevonden diameters. a) Bepaal grenzen tussen dewelke X moet liggen met een betrouwbaarheid van 99%. De gevonden grenzen noemt men controlegrenzen. b) Wat is uw besluit indien we de volgende steekproefresultaten vinden: X = 5.74, X = 5.81, X = 5.62, X = 5.87 4. Op de verpakking van koekjesdozen staat dat het gewicht gemiddeld gelijk is aan µ = 1 gram. Bij de controle van n = 2 dozen vonden we X = 995 gram en s = 25 gram. Klopt dat wat er op de verpakking staat? (α = 5%) 5. Bij een steekproef van omvang n = 72 arbeiders een bepaalde sector vond men een gemiddeld nettoloon van 1885 met s = 158. Mag men beweren dat de lonen in deze sector minstens 19 bedragen (α = 5% en α = 1%)? Bepaal het onderscheidend vermogen van de toets indien µ = 1895, µ = 189, µ = 1885.

Toetsen van hypothesen 27 7. Toetsen i.v.m. andere parameters Wanneer we hypothesen toetsen omtrent parameters die geschat worden via een toetsingsgrootheid of schatter waarvan de verdeling gerelateerd is aan een N-verdeling, dan kunnen we steeds gebruik maken van een van de drie klassieke beslissingsregels (betrouwbare uitspraken, kritische grenzen, OK). Parameters in deze categorie zijn o.a. * proportie p en verschil tussen proporties (ongepaard) * verschil tussen gemiddelden (gepaard of ongepaard) * correlatiecoëfficiënten (via Fisher-eigenschap) * variantie (bij grote steekproeven) Bij het toetsen van hypothesen omtrent andere parameters (o.a. varianties, correlaties, quotiënt van varianties bij ongepaarde steekproeven) zullen we meestal gebruik maken van de methode gebaseerd op betrouwbaarheidsintervallen of van z-waarden, t-waarden en hun overschrijdingskansen. We illustreren verschillende mogelijkheden via een aantal goed gekozen cijfervoorbeelden. 7.1. Toetsen i.v.m. proporties Voorbeeld 1 In 1999 had één gezin op twee een kleurenprinter thuis. Uit nieuw onderzoek blijkt dat 33 van de 5 onderzochte gezinnen een kleurenprinter hebben. Is dit een betekenisvolle vooruitgang? Dit is een voorbeeld van een toets op proporties: H : p = p = 5 % (géén) vs H a : p > p = 5 % (wél vooruitgang) Bij een steekproef van omvang n = 5 vinden we pˆ = 66% a) Via b.o. We kiezen (bijvoorbeeld) α = 5% en construeren en 95% b.o. voor p. Met de benaderende formule vinden we p.66 1.64* (.66*.34) / 5 =.66.11 =.55 Omdat p = p = 5% geen betrouwbare waarde is besluiten we (met een risico van α = 5%) dat er vooruitgang is! Voor een 99% b.o. vinden we p.66 2.33* (.66*.34) / 5 =.54. Opnieuw besluiten we dat er vooruitgang is (met een risico van α = 1%)

Toetsen van hypothesen 28 b) Via OK Aangezien de steekproef voldoende groot is berekenen we hier de t-waarde/z-waarde van het steekproefresultaat. We vinden t = z = pˆ p =.16/ 1/2 = 2.26 p (1 p ) / n We berekenen de OK (en mogen met de standaardnormale verdeling werken) en vinden OK = P(Z > 2.26) =.12 Bij α = 5% vinden we OK < α en verwerpen we H. Bij α = 1% vinden we OK > α en verwerpen H niet. Opmerking We komen tot verschillende besluiten omdat we bij het opstellen van de betrouwbare uitspraak de benadering pˆ N ( p, pˆ(1 pˆ) / n) gebruikten. Bij het berekenen van de OK maken we deze benadering niet. De methode via OK verdient dus de voorkeur. Voorbeeld 2 Bij de vorige verkiezingen behaalde partij K 19.5 % van de stemmen. Uit een enquête bij 118 personen vinden we dat 17.4 % de intentie hebben om voor partij K te stemmen. Is dit een betekenisvolle achteruitgang? (α = 5%). We toetsen hier H : p = 19.5 % (geen achteruitgang) vs H a : p < 19.5 % (wel achteruitgang) Hier is de z-waarde gelijk aan z = (.174 -.195)/ (.195*(1 -.195)/118) = -1.69 met OK = P(Z < 1.69) = 4.5% Bij α = 5% verwerpen we H terwijl we bij α = 2.5% H niet verwerpen. Oefeningen 1. Bij n = 1 worpen met een muntstuk vonden we 53 keer de beeldzijde. a) Mogen we ervan uitgaan dat het muntstuk onvervalst is? Kies tussen H : p =.5 en H a : p >.5 voor bijvoorbeeld α = 5%. b) Bepaal β indien eigenlijk p =.51. c) Bepaal de steekproefgrootte om een onderscheid te kunnen maken tussen p =.5 en p =.55 indien we wensen dat α = β 5%.

Toetsen van hypothesen 29 2. Via een steekproef van 15 lampen vonden we dat bij 11 lampen de levensduur meer bedroeg dan 14 u. Mogen we ervan uitgaan dat minstens 8% van de lampen deze eigenschap hebben? (α = 5% en ook OK) 3. Om een helderziende te controleren wordt het volgende experiment opgezet. In een kamer kiest een proefpersoon kaarten uit een kaartenboek. De helderziende is in een andere kamer en zegt telkens het kleur (rood of zwart) van de gekozen kaart. Bij 5 kaarten was de helderziende 32 keer correct. Is dit een betekenisvol resultaat? Toets H : p =.5 (gokken) vs H a : p >.5 (béter dan gokken) en kies α = 1%, α = 5%. 7.2. Toetsen i.v.m. varianties en/of standaardafwijkingen De toetsen die in deze paragraaf aan bod komen kunnen we enkel uitvoeren voor steekproeven uit een normale verdeling. Voorbeeld 1 Flesjes parfum worden door een machine gevuld met een hoeveelheid X ~ N(1, σ 2 ). Bij het productieproces is het van belang dat de variantie niet groter is dan.36. Om dit te controleren nemen we geregeld een steekproef en bekijken we de berekende steekproefvariantie s². Bij elke controle wensen we te kiezen tussen H : σ 2 =.36 vs H a : σ 2 >.36 In deze oefening werken we met een alfa-risico gelijk aan α= 5% en bekijken we de werkwijze voor een kleine steekproef en voor een grote steekproef. A. Uit een steekproef van omvang n = 21 vonden we s 2 =.64. Kritieke grenzen. Bij toetsen van hypothesen over varianties is het niet gebruikelijk om kritieke grenzen te bepalen. Betrouwbare uitspraken. We bepalen een 95% b.o. via de chikwadraat-verdeling met parameter 2. Omdat P((n 1)s²/σ² χ² 95%, 2 ) = 95% en χ² 95%, 2 = 31.41 vinden we als 95% b.o. de grens σ² (n 1)s²/31.41 = 2*.64/31.41 =.41 We besluiten H te verwerpen. Overschrijdingskansen. Omdat (n 1)s²/σ² χ² n-1 vinden we P(s² >.64) = P(χ² 2 > 2*.64/.36) = P(χ² 2 > 35.5) =.17 vinden we: bij α = 5% verwerpen we H en bij α = 1% verwerpen we H niet.

Toetsen van hypothesen 3 Opmerking Het getal χ²(s²) = (n 1)s²/σ ² noemen we de chikwadraatwaarde van het steekproefresultaat s². B. Uit een steekproef van omvang n = 121 vonden we s 2 =.4. Overschrijdingskansen. Voor grote steekproeven vonden we vroeger dat s² N(σ², 2σ 4 /n). We berekenen de z-waarde van ons steekproefresultaat en vinden z = (.4.36)/ 2 *.36² / 121 =.86 De bijhorende OK is gelijk aan OK = P(Z >.86) = 19.5% We verwerpen H niet. Voorbeeld 2 Een bestaand productieproces produceert lampen met een gemiddelde levensduur die normaal verdeeld is met µ = 12 uren met standaardafwijking σ = 3. We onderzoeken een nieuw proces dat door de technische diensten als beter bestempeld wordt. Bij een steekproef van n = 1 lampen vond men X = 1265 en s = 31. a) Is de gemiddelde levensduur inderdaad hoger? (α = 5%) b) Is de standaardafwijking betekenisvol groter? (α = 5%) We gaan ervan uit dat het nieuwe procédé ook normaal verdeelde levensduren geeft. Hier moeten we twee hypothesen toetsen a) H : µ 12 (nieuwe procédé niet beter) H a : µ > 12 (nieuwe procédé beter) b) H : σ 3 (nieuwe procédé niet slechter) H a : σ > 3 (nieuwe procédé slechter) a) Uit de steekproefresultaten (grote steekproef!) vinden we t/z-waarde en OK t = z = (1265-12)/(31/1) = 2.1 OK (via N(, 1)-verdeling) =.179 Besluit: we verwerpen H : het nieuwe procédé is betekenisvol beter! b) We herleiden het vraagstuk naar een vraagstuk over varianties. Via de steekproefresultaten bepalen we de OK van s² = 31². We vinden z = (31² - 3²)/ 2*3 4 / 1 =.48 en OK = P(Z >.48) = 31.5% We verwerpen H niet.

Toetsen van hypothesen 31 Voorbeeld 3 (Oefening) Een betonnen constructie moet kunnen weerstaan aan een (normaal verdeelde) druk van gemiddeld minstens 6 kg/cm 2 met een standaardafwijking van maximaal 3. Bij een steekproef van omvang n = 6 vond men X = 5 en s = 4. a) Is de afwijking t.o.v. het normgemiddelde betekenisvol? ( α = 1%) (Toets H : µ = 6 (voldoende) vs H a : µ < 6 (te laag)) b) Is de afwijking t.o.v. de normstandaardafwijking betekenisvol? (α = 5%) (Toets H : σ = 3 (norm) vs H a : σ > 3 (te hoog)) c) Werk ook telkens met OK. Voorbeeld 4 (Oefening) Op het etiket van naaigaren staat dat elk klosje gemiddeld 2 meter garen bevat met een standaardafwijking van 1.5 meter. We namen de proef op de som en maten de lengte van n = 2 klosjes. We vonden rekenkundig gemiddelde 195 en s = 3.7. Is de informatie op het etiket een correcte weergave van de realiteit (α = 5%)? (U mag ervan uitgaan dat de lengte normaal verdeeld is) 7.3. Verschil tussen gemiddelden en quotiënt varianties (varianties: enkel voor ongepaarde steekproeven uit normale verdelingen) Voorbeeld 1 Bij een onderzoek van een normaal verdeeld kenmerk bij twee onafhankelijke populaties vonden we: populatie 1: n = 5, X = 17 en s 1 = 1.18 populatie 2: m = 41, Y = 19 en s 2 = 1.64 a) Toets H : µ 1 = µ 2 vs H a : µ 1 < µ 2 (α = 5%) b) Toets H : σ 1 = σ 2 vs H a : σ 1 σ 2 (α = 1%) a) Dit is een voorbeeld van een toets omtrent het verschil tussen gemiddelden. We toetsen hier H : µ v = vs H a : µ v < waarbij µ v = µ 1 - µ 2 en we hanteren een α-risico van α = 5%. Omdat X Y N(µ v, σ² 1 /n + σ² 2 /m) kunnen we deze toets zonder probleem uitvoeren. We illustreren de drie werkwijzen.

Toetsen van hypothesen 32 * Kritische grenzen De 95% kritische grens is hier K = z 5% σ ² 1 σ ² + 2 n m De varianties schatten we met de s 2 -waarden en we vinden (n, m groot!) K = 1.64* 1.18² 1.64² + = 1.64*.357 =.5 5 41 Besluit: omdat het verschil X Y aan 17 19 = 2 < K, verwerpen we H. * Betrouwbare bovengrens voor µ v tussen de twee rekenkunidge gemiddelden gelijk is Als 95% b.b. vinden we µ v X Y + z 5% σ ² 1 σ ² + 2 n m Met de geschatte varianties vinden we µ v 2 +.5 = 1.5. Besluit: omdat µ v = en onbetrouwbare waarde is verwerpen we H. * Overschrijdingskans De z-waarde van ons steekproefresultaat z = ( 2 ) / σ ² 1 σ ² + 2 n m X Y = 2 is gelijk aan Na het schatten van de varianties vinden we z = 2/.357 = 6.54. De OK is gelijk aan P(Z < 6.54) is gelijk aan % < 5% en we verwerpen H. Opmerking De z-waarde van het steekproefresultaat is gelijk aan x y ( µ 1 µ 2 ) z = z( x, y ) = σ ² 1 σ ² + 2 n m Bij onbekende varianties werken we met de t-waarde: x y ( µ 1 µ 2 ) t = t( x, y ) = s² 1 s² 2 + n m Bij grote steekproeven berekenen we de OK met de standaardnormale verdeling. Bij kleine steekproeven berekenen we OK via ofwel de t n-1 -verdeling ofwel de t m-1 - verdeling. We gebruiken de t-verdeling die overeenstemt met de kleinste waarde van n of m. Bij deze waarde maken we immers de grootste benaderingsfout bij het benaderen van de variantie.

Toetsen van hypothesen 33 b) Dit is een toets i.v.m. het vergelijken van (ongepaarde) varianties. * Via betrouwbaarheidsintervallen Een 9% b.i. voor σ 2 1 /σ 2 2 vinden we via s 2 1 /s 2 2 en de F(49,4)-verdeling. Voor X F(49, 4) vinden we via de F(49, 4)- verdeling (met EXCEL) dat P(.61 X 1.66) = 9% Omdat s 2 1 /s 2 2 / σ 2 1 /σ 2 2 F(49, 4) vinden we achtereenvolgens.61 s 2 1 /s 2 2 / σ 2 1 /σ 2 2 1.66 en s 2 1 /s 2 2 / 1.66 σ 2 1 /σ 2 2 s 2 1 /s 2 2 /.61 of.61* s 2 1 /s 2 2 σ 2 1 /σ 2 2 1.64* s 2 2 1 /s 2 Invullen van de s²-waarden geeft het volgende 9% b.i.:.32 σ 2 1 /σ 2 2.85 Daar het quotiënt 1 onbetrouwbaar is, verwerpen we H. * Via overschrijdingskansen We berekenen de F-waarde van het steekproefresultaat: F = F(s² 1, s² 2 ) = s 2 1 /s 2 2 /σ 2 2 1 /σ 2 We herinneren dat F(s² 1, s² 2 ) F(n-1, m-1) = F(49, 4) In ons voorbeeld vinden we: indien H correct is, dan zijn de varianties gelijk en is de F- waarde gelijk aan F = s 2 1 /s 2 2 = (1.18)²/(1.64)² =.518 Met X F(49, 4) berekenen we P(X <.518) en vinden P(X <.518) =.144. Omdat deze OK kleiner is dan 1% verwerpen we H. Voorbeeld 2 (Oefening) Een consumentenorganisatie onderzocht de levensduur van twee types batterijen: type 1: n = 1, X = 118 en s 1 = 14 type 2: m = 11, Y = 116 en s 2 = 134 a) Toets H : µ 1 = µ 2 vs H a : µ 1 µ 2 (α = 1%) b) Toets H : σ 1 = σ 2 vs H a : σ 1 σ 2 (α = 5%) (Antwoord: a) H ; b) H ) Voorbeeld 3 Bij een bepaalde nieuwe behendigheidstest voerde men het volgende experiment uit. Een groep van 2 personen werd in twee deelgroepen (A en B) verdeeld van 1 personen. In groep A gaf men een tip en in groep B gaf men géén tip. Men telde dan het aantal mensen die de test konden uitvoeren binnen de voorziene tijd.

Toetsen van hypothesen 34 In groep A slaagden 64 mensen er in de test uit te voeren binnen de tijd en in groep B waren er 49 mensen die daarin slaagden. Mogen we stellen dat het geven van een tip ervoor zorgt dat een grotere proportie personen slagen in de test? (α = 5%) Hier toetsen we H : p A = p B (géén verschil) vs H a : p A > p B (verbetering) Dit is een toets over het verschil tussen proporties bij ongepaarde steekproeven: H : p A p B = vs H a : p A p B > Wij gebruiken hier (bijvoorbeeld) de toets gebaseerd op z/t-waarde en OK. We vinden t =.64.49.64*.36 1 +.49*.51 1 =.15/.69 = 2.16 OK = P(Z > 2.16) = 1.5% < α = 5% We verwerpen H. Voorbeeld 4 In de provincies West-Vlaanderen werden 3 kiesgerechtigden en in de provincie Oost- Vlaanderen werden 2 kiesgerechtigden gepeild naar hun opninie t.o.v. een nieuw wetsvoorstel. In W-Wl waren 56 % pro en in O-Vl waren er 48 % pro. a) Kunnen we stellen dat er een betekenisvol (α = 5%) verschil is? We toetsen H : p W p O = vs H a : p W p We vinden de z-waarde z = 1.75 met OK = 2P(Z > 1.75) = 8% en verwerpen H niet. b) Kunnen we stellen dat er in W-Vl betekenisvol (α = 5%) méér voorstanders zijn? We toetsen H : p W p O = vs H a : p W p > We vinden (opnieuw!) z = 1.75 met OK = P(Z > 1.75) = 4% < 5%. We verwerpen H. Voorbeeld 5 Om het effect van een nieuw medicijn te bepalen selecteert men 2 mensen met dezelfde ziekte en men verdeelt lukraak de 2 mensen in 2 groepen van elk 1. De mensen van groep A krijgen het medicijn. Afgezien hiervan worden de twee groepen op dezelfde manier behandeld. Later vinden we dat er bij groep A 75 mensen genezen zijn en dat bij groep B er 65 genezen zijn. Zorgde het medicijn voor een betekenisvolle verbetering? (α = 1%, 5% en 1%)

Toetsen van hypothesen 35 7.4. Toetsen i.v.m. correlatiecoëfficiënt Voorbeeld 1 (F-toets) We onderzochten de relatie tussen de uitslagen (X, Y) voor twee vakken. Bij een steekproef van omvang n = 75 vonden we een steekproefcorrelatiecoëfficiënt r =.35. We wensen de volgende toets uit te voeren (α = 5%): H : ρ =.3 vs H a : ρ >.3 Omdat de Fishertranformatie stijgend is is deze toets volledig equivalent met H : F(ρ) = F(.3) vs H a : F(ρ) > F(.3) We voeren de toets uit op twee manieren * Via betrouwbare uitspraken. We vinden het 95% b.o. zoals vroeger: F(ρ) F(.35) z 5% (1/(n-3)) 1/2.3654 1.64*.1178 =.3654.1933 =.1721 Omdat F(.3) =.395 een betrouwbare waarde is, verwerpen we H niet. * We berekenen de OK van de z-waarde. We vinden z = (F(.35) - F(.3))/(1/n-3)) 1/2 =.47 OK = P(Z >.47) = 31.92% Deze grote OK leidt tot het niet verwerpen van H. Voorbeeld 2 (t-toets) Bij een steekproef van 1 pasgehuwde koppels noteerden we de leeftijd van de partners en vonden r =.15. Wijst dit steekproefresultaat op een betekenisvolle positieve correlatie (α = 5%)? We toetsen hier H : ρ = vs H a : ρ >. * We vinden een 95% ondergrens zoals vroeger: F(ρ) F(.15) z 5% (1/(n-3)) 1/2.1511 1.64*.115 =.154 Omdat ρ = een betrouwbare waarde is verwerpen we H niet. * We berekenen de OK via de t-waarde (indien H geldt is ρ = en werken we immers met de t-transformatie!). We vinden t(r) = 1.52 met OK = P(t 98 > 1.52) = 6.7%. Met α = 5% verwerpen we H niet. Met α = 1% verwerpen we H wel. Voorbeeld 3 In atletiek is men geïnteresseerd in het verband tussen de startplaats (1 t.e.m. 8) en de plaats (1 t.e.m. 8) bij de uitslag. Bij 75 rennen vond men r =.31. Is dit resultaat betekenisvol groter dan? (α = 1%, 5%, 1%)