Toetsen van Hypothesen. Het vaststellen van de hypothese

Vergelijkbare documenten
Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Hoofdstuk 5 Een populatie: parametrische toetsen

Verwachtingswaarde, Variantie en Standaarddeviatie

15.1 Beslissen op grond van een steekproef [1]

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Kansrekening en Statistiek

Data analyse Inleiding statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Toetsen van hypothesen

Sheets K&S voor INF HC 10: Hoofdstuk 12

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Lesbrief hypothesetoetsen

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Hoofdstuk 6 Hypothesen toetsen

Statistiek = leuk + zinvol

Kansrekening en Statistiek

Hoofdstuk 3 Toetsen uitwerkingen

Beslissen op grond van een steekproef Hoofdstuk 15

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Voorbeeldtentamen Statistiek voor Psychologie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Uitleg significantieniveau en toetsen van hypothesen

Kansrekening en Statistiek

Kansrekening en Statistiek

Examen Statistiek I Januari 2010 Feedback

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

15.1 Beslissen op grond van een steekproef

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

c P( X 1249 of X 1751 µ = 1500 en σ = 100) = 1 P(1249 X 1751)

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Kansrekening en Statistiek

Samenvatting Wiskunde A

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Statistiek voor A.I.

Samenvatting Statistiek

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 12: Eenweg ANOVA

Kansrekening en Statistiek

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Hoofdstuk 4 Hypothese toetsen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Zin en onzin van normale benaderingen van binomiale verdelingen

5 Toetsen. 5.1 Nulhypothese en Alternatieve Hypothese

Examen G0N34 Statistiek

. Dan geldt P(B) = a d. 3 8

Les 1: Waarschijnlijkheidrekening

Toegepaste Statistiek, Week 6 1

Wiskunde B - Tentamen 2

Inleiding Statistiek

Data analyse Inleiding statistiek

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Uitwerkingen voortoets/oefentoets E3 maart/april 2009 MLN

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,

Schriftelijk tentamen - UITWERKINGEN

Kansrekening en Statistiek

werkcollege 6 - D&P9: Estimation Using a Single Sample

HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN

Wiskunde B - Tentamen 1

14.1 Kansberekeningen [1]

Beschrijvende statistiek

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

wordt niet verworpen, dus het gemiddelde wijkt niet significant af van 400 wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

Antwoordvel Versie A

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Statistiek II. Sessie 5. Feedback Deel 5

Voorbeeldtentamen Wiskunde A

13.1 Kansberekeningen [1]

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

= Oplossingen. 1 Beschrijvende statistiek (blz. 31) x = 5,08 m ; s = 0,56 m. x = 25,66 jaar ; s = 5,46 jaar

BASISVAARDIGHEDEN. Rekenen en wiskunde

wordt niet verworpen, dus het beïnvloedt de levensduur niet significant

Rechter overschrijdingskansen (in procenten) van z van de standaardnormale verdeling

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

Kansrekening en Statistiek

TOETSEN VAN HYPOTHESEN

Les 2: Toetsen van één gemiddelde

Transcriptie:

Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt nog niets berekend. 1.1 Voorbeeld Tweezijdige formulering Van een muntstuk wil je controleren of het zuier is, door voor een serie worpen bij te houden hoe vaak 'kop' en 'munt' gegooid worden. We spreken van 'zuiver' als P(kop) = π = ½. Het alternatief is dat de munt niet zuiver is. : π s 1 2 1.2 Voorbeeld (Rechts)Eenzijdige formulering Een fabrikant stelt dat een productieproces hoogstens 20% exemplaren van mindere kwaliteit oplevert. Om deze stelling te controleren, wordt een aantal producten gecontroleerd: : π & 0.20 : π O 0.20 1.3 Voorbeeld (Links)Eenzijdige formulering Een fabrikant garandeert dat het afgeleverde gewicht van een product gemiddeld minstens 1000 gram per verpakking bedraagt. Als we deze uitspraak willen toetsen, formuleren we een linkseenzijdige alternatieve hypothese: : μ S 1000 : μ! 1000

2. Vaststellen van de toetsingsgrootheid en doen van onderzoek met steekproef Nadat de hypothesen zijn vastgesteld, formuleren we het onderzoek. Er moet een steekproef genomen worden en er moet bepaald worden wat de toetsingsgrootheid is. Ga daarbij uit van het grensgeval dat aangegeven wordt door de nulhypothese en verdere informatie over de verdeling. Soms is van een verdeling de standaarddeviatie bekend. 2.1 Voorbeeld Tweezijdig toetsen, binomiaal, normaal benaderd Van een muntstuk wil je controleren of het zuier is, door voor een serie worpen bij te houden hoe vaak 'kop' en 'munt' gegooid worden. We spreken van 'zuiver' als P(kop) = π = ½. Stel dat het muntstuk zuiver is dus π = 1 2. : π s 1 2 We doen nu een onderzoek en nemen een steekproef van n =100 worpen. Als toetsingsgrootheid nemen we k het aantal malen 'kop'. Deze kansvariabele k volgt een binomiale verdeling met n = 100 en π = 1 2. Neem hiervan de normale benadering (n > 20) met verwachtingswaarde 50 en variantie 25 (= n π (1-π) ) en dus σ = 5. 2.2 Voorbeeld Eenzijdig, binomiaal, normaal benaderd Een fabrikant stelt dat een productieproces hoogstens 20% exemplaren van mindere kwaliteit oplevert. Om deze stelling te controleren, wordt een aantal producten gecontroleerd: : π & 0.20 : π O 0.20 Stel dat er gemiddeld 20% van de producten mindere kwaliteit heeft. We doen nu een onderzoek en nemen een steekproef van n =100 producten Als toetsingsgrootheid nemen we k het aantal producten van mindere kwaliteit. Deze kansvariabele k volgt een binomiale verdeling met n = 100 en π =0.2. Neem hiervan de normale benadering (n > 20) met verwachtingswaarde 20 en variantie 16 (= n π (1-π) ) en dus σ = 4. 2.3 Voorbeeld

Eenzijdig, normale verdeling Een fabrikant garandeert dat het afgeleverde gewicht van een product gemiddeld minstens 1000 gram per verpakking bedraagt. Als we deze uitspraak willen toetsen, formuleren we een linkseenzijdige alternatieve hypothese: : μ S 1000 : μ! 1000 Stel dat het gemiddelde gewicht van de producten gelijk is aan μ = 1000 g met een standaarddeviatie van 25 g. We doen nu een onderzoek en nemen een steekproef van n =100 producten Als toetsingsgrootheid nemen we nu het steekproefgemiddelde x. Voor deze x geldt dat deze normaal verdeeld is met μ = 1000 en σ = 2.5 g (wortel-nwet). 3. Kritieke gebied, voorspellingsinterval en significantieniveau α Als de hypothesen en zijn vastgesteld en de onderzoeksgrootheden zijn afgesproken, is het tijd om bij de opdrachtgever te achterhalen hoe groot de betrouwbaarheid moet zijn. De keuze van het significantieniveau α, wordt bepaald door het risico dat de onderzoeker wil lopen om de nulhypothese ten onrechte te verwerpen. Dit risico wordt het type I risico genoemd (fout van de eerste soort). Het significantieniveau α behoort voorafgaande aan de uitvoering van het onderzoek te worden vastgesteld en niet pas als de resultaten van het steekproefonderzoek bekend zijn. Er worden dan een kritiek gebied gedefinieerd en een acceptatiegebied gedefinieerd uitgaande van de hypothese en NIET uitgaande van de metingen! Vervolgens vindt pas het onderzoek plaats en als de uitkomst van het onderzoek in het kritieke gebied valt, wordt de nulhypothese verworpen en dan wordt de alternatieve hypothese voor waar aangenomen. 3.1 Enkele handige waarden Als het een 90%-betrouwbaarheidsinterval is, dan hoort daarbij z =1.645. (Rechter overschrijdingskans van 0.05) Als het een 95%-betrouwbaarheidsinterval is, dan hoort daarbij z =1.96. (Rechter overschrijdingskans van 0.025) Als het een 98%-betrouwbaarheidsinterval is, dan hoort daarbij z =2.33. (Rechter overschrijdingskans van 0.01) Als het een 99%-betrouwbaarheidsinterval is, dan hoort daarbij z =2.58. (Rechter overschrijdingskans van 0.005) Eenzijdige overschrijdingskans van 0.1 hoort bij z =1.28 Eenzijdige overschrijdingskans van 0.05 hoort bij z = 1.645 Eenzijdige overschrijdingskans van 0.02 hoort bij z =2.05

Eenzijdige overschrijdingskans van 0.01 hoort bij z =2.33 Eenzijdige overschrijdingskans van 0.005 hoort bij z =2.58 3.2 Voorbeeld Eenzijdig toetsen, binomiaalverdeling, normaal benaderd Een fabrikant stelt dat een productieproces hoogstens 20% exemplaren van mindere kwaliteit oplevert. Om deze stelling te controleren, wordt een aantal producten gecontroleerd: : π & 0.20 : π O 0.20 Stel dat er gemiddeld 20% van de producten mindere kwaliteit heeft. We doen nu een onderzoek en nemen een steekproef van n =100 producten Als toetsingsgrootheid nemen we k het aantal producten van mindere kwaliteit. Deze kansvariabele k volgt een binomiale verdeling met n = 100 en π =0.2. Neem hiervan de normale benadering (n>20) met verwachtingswaarde μ 0 = 20 en variantie 16 (= n π (1-π) ) en dus σ = 4. Kies nu het kritieke gebied met significantieniveau α met α = 0.05. De grens t α van het (eenzijdige) kritieke gebied wordt gevonden met: t α =20C1.645 $ 4 = 26.580 Het kritieke gebied (roze gearceerd) is dus Z = x x O 26.58 Om dit gebied terug te vertalen naar de discrete binomiale verdeling, moeten we rekening houden met de continuïteitscorrectie. Het kritieke gebied wordt dus: Z = k k S 27 Hou bij de continuïteitscorrectie altijd in de gaten dat als er sprake is van α = 0.05, dat deze kans altijd kleiner of gelijk aan 0.05 moet zijn. Als het onderzoek d.m.v. de steekproef is gedaan en de uitslag (aantal producten van mindere kwaliteit) ligt in het acceptatiegebied, dan wordt de Nulhypothese aangenomen.

Ligt het gemeten aantal van de steekproef inhet kritieke gebied, dan wordt de Nulhypothese verworpen en wordt de Alternatieve hypothese aangenomen. 3.3 Voorbeeld Eenzijdig, binomiale verdeling Asthma-patiënten worden behandeld met een nieuwe vorm van fysiotherapie. De uitkomsten kunnen zijn 'verbeterd' of 'verslechterd'. De onderzoeksvraag is of de therapie de toestand van de patiënten verbetert. De nulhypothese is dat het middel niet helpt. De alternatieve hypothese is dat de meerderheid van de patiënten verbetert. Stel de kans verbeterd π = ½. : π O 1 2 Er wordt een steekproef gedaan van 8 mensen. Onder de nulhypothese heeft het aantal verbeterde patiënten k de binomiale verdeling met π = 0.5 en n = 8. Spreek het significantieniveau af met α = 0.05. Het onderzoek wordt nu gedaan en het blijkt dat 7 van de 8 patiënten verbeterd zijn. De overschrijdingskans P k S 7 van deze uitkomst is gelijk aan (uit de tabel): P k S 7 =1KP k& 6 = 0.0352 De overschrijdingskans P k S 6 = 1KP k& 5 = 0.1445 De grens van het acceptatiegebied ( α = 0.05 ) ligt dus tussen k =6 en k =7. De uitkomst k =7 ligt dus in het kritieke gebied wat tot gevolg heeft dat de Nulhypothese verworpen moet worden. Het wil dus zeggen dat er wel al te veel mensen beter worden dan dat dit aan het toeval te wijten is. 3.4 Voorbeeld Tweezijdig, binomiaal, normale benadering

Een munt is eerlijk of niet eerlijk bij het opgooien met resultaat kop of munt. Stel de nulhypothese een eerlijke munt H : π s 1 1 2 Er wordt een steekproef gedaan met n =100. Als toetsingsgrootheid kiezen we k = aantal keren kop. Het is dus een binomiale verdeling B(n = 100,π = 0.5) Overgaan op een normale benadering (n > 20) met gemiddelde μ = 50 en σ = 5. (Immers de Variantie is Var = n π (1-π) = 25.) Bij teveel keren kop óf te weinig keren kop beslissen we dat de munt niet eerlijk is. We stellen het kritieke gebied Z vast met α = 0.05. Aan weerszijden ligt het kritieke gebied met kans α/2 = 0.025. De grenswaarden van het Acceptatiegebied (het Kritieke gebied is roze gearceerd) zijn: 50 K1.96$5! x! 50 C1.96$5 40.2! x! 59.8 41 # k # 59 Let op de continuïteitscorrectie! Als de uitkomst van de meting in dit gebied ligt, wordt de nulhypothese aangenomen. Dus als er 100 keer gegooid wordt met de munt en daarvan is 64 keer kop, dan veronderstellen we dat we te maken hebben met een oneerlijke munt.