Kansrekening en Statistiek

Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1

2 Statistiek Vandaag: Hypothese toetsen 2 / 1

Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html) Hoe meer Facebookvrienden iemand heeft, hoe groter bepaalde gebieden in de hersenen zijn en hoe meer vrienden hij/zij in de echte wereld heeft. 4 / 1

Hypothese toetsen 5 / 1

Hypothese toetsen: toepassingen Vb. Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. Er moet besloten worden of het medicijn werkt of niet. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. Er moet besloten worden of de lading goed genoeg is om bij de leverancier af te leveren. De schedelgrootte van enkele Egyptenaren uit de oudheid is bekend. Op grond van deze data wil men vaststellen of de gemiddelde schedelgrootte van mensen in het oude Egypte gelijk is aan die van de huidige mens. 6 / 1

Hypothese toetsen: de hypotheses Def. Bij hypothese toetsen wordt een hypothese H 0 getest tegen een hypothese H a. H 0 is de nulhypothese en H a is de alternatieve hypothese. H a wordt ook wel H 1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) wordt door de nulhypothese te verwerpen. Vaak is de nulhypothese de hypothese van geen verschil of geen onderscheid of geen relatie, en de test dient om aan te tonen dat er wel een verschil, onderscheid of relatie is. 7 / 1

Hypothese toetsen: de zijde Def. De hypotheses die we gaan beschouwen zijn meestal van de vorm: tweezijdig H 0 : µ = a H a : µ a linkszijdig H 0 : µ a H a : µ < a rechtszijdig H 0 : µ a H a : µ > a 8 / 1

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 en H a worden verworpen of aangenomen (niet verworpen). Als H 0 aangenomen wordt, wordt H a verworpen. Als H 0 verworpen wordt, wordt H a aangenomen. Def. H 0 is waar en wordt aangenomen: correcte beslissing. H 0 is waar en wordt verworpen: fout van de 1 e soort. H a is waar en wordt aangenomen: correcte beslissing. H a is waar en wordt verworpen: fout van de 2 e soort. Criterium voor het verwerpen van de nulhypothese: Voor een zekere constante x k (of xk l en xr k ) wordt op grond van een steekproef met gemiddelde X H 0 verworpen als X xk r of X xl k H 0 verworpen als X x k H 0 verworpen als X x k (tweezijdige toets) (rechtszijdige toets) (linkszijdige toets). 9 / 1

10 / 1

11 / 1

Hypothese toetsen: significantieniveau Def. Het significantieniveau is de kans op een fout van de 1 e soort en wordt aangeduid met α. Het criterium voor het verwerpen van H 0 wordt zo gekozen dat de kans op een fout van de 1 e soort het significantieniveau α is: P(X x r k of X xl k H 0) = α P(X x k H 0 ) = α P(X x k H 0 ) = α (tweezijdige toets) (rechtszijdige toets) (linkszijdige toets). Meestal wordt het H 0 weggelaten. 12 / 1

Hypothese toetsen: kritisch gebied Def. De kritische waarde is de waarde x k waarvoor P(X xk r of X xl k µ = a) = α (tweezijdige toets met H 0 : µ = a) P(X x k µ = a) = α (rechtszijdige toets met H 0 : µ a) P(X x k µ = a) = α (linkszijdige toets met H 0 : µ a). Het kritische gebied (region of rejection) zijn die waardes x die liggen in de intervallen (, xk l ] of [xr k, ) (tweezijdige toets) [x k, ) (rechtszijdige toets) (, x k ] (linkszijdige toets). Als X in the kritisch gebied ligt, dan geldt dat onder de aanname H 0 de kans dat het steekproefgemiddelde gelijk aan X is, α is. Daarom wordt H 0 verworpen als X in het kritische gebied ligt. Als X niet in het kritische gebied ligt wordt H 0 aangenomen ofwel niet verworpen. 13 / 1

Hypothese toetsen: verdeling van het steekproefgemiddelde Def. Wanneer het significantieniveau eenmaal gekozen is, kan de kritische waarde berekend worden als de verdeling P van het steekproefgemiddelde X bekend is. Als de standaardafwijking van de populatie bekend en gelijk aan σ is, dan wordt vaak aangenomen dat P de normale verdeling P s is met gemiddelde µ en standaardafwijking σ n, waarbij n de grootte van de steekproef is. De Centrale Limietstelling wordt beschouwd als rechtvaardiging voor die keuze. Als de standaardafwijking van de populatie niet bekend is, dan wordt vaak aangenomen dat P de t-verdeling P t is bij n 1 vrijheidsgraden, met gemiddelde µ en standaardafwijking s n, waarbij s de standaardafwijking van de steekproef is en n de grootte van de steekproef. Deze keuze kan gerechtvaardigd worden op dezelfde wijze als voor de normale verdeling. 14 / 1

Bij een rechtszijdige toets: Hypothese toetsen: kritisch gebied 1 µ x k P(X x k ) = α {z }.9 kritisch gebied 15 / 1

Hypothese toetsen Vb. Het gemiddelde aantal patiënten dat met 200 mg. van medicijn M geneest van een zekere ziekte is 30%. Men wil testen of een dosis van 300 mg. significant meer patiënten geneest. Men dient aan een steekproef van 25 patiënten 300 mg. M toe, waarvan 40% geneest. Laat µ het gemiddelde aantal patiënten in de populatie zijn dat bij 300 mg. M geneest. Als significantieniveau wordt 0.05 genomen. Er wordt aangenomen dat σ bekend en gelijk aan 4% is. H 0 : µ 30% H a : µ > 30%. Fout van de 1 e soort: µ = 30%, maar H 0 wordt verworpen. Voor de kritische waarde x k moet gelden dat P(X x k µ = 30) = α = 0.05. Aangenomen wordt dat X normaal verdeeld is. Dus moet gelden voor x k : P(X x k ) = P X 30 s( σ x k 30 σ ) = P X 30 s( 0.8 25 25 x k 30 ) = 0.05. 0.8 P s(z 1.645) = 0.05. Dus x k = 30 + (1.645)(0.8) = µ + 1.645 σ 25 = 31.316%. X = 40% > 31.316%. Dus X ligt in the kritische gebied, en H 0 wordt verworpen. Conclusie: bij een dosis van 300 mg. genezen significant meer patiënten. 16 / 1

Correlatie: alcohol Vb. Aantal maal uitgaan per maand (x-as) tegen aantal glazen alcohol per maand (y-as). stat4a 0 20 40 60 80 100 0 2 4 6 8 10 stat4b De Pearson correlatiecoëfficiënt: 0.75. 17 / 1

Correlatie: alcohol Vb. Aantal maanden op kamers (x-as) tegen aantal glazen alcohol per maand (y-as). stat4a 0 20 40 60 80 100 0 20 40 60 80 100 stat4c De Pearson correlatiecoëfficiënt: 0.50. 18 / 1

Hypothese toetsen: alcohol Vb. De UU wil kijken of het een anti-alcohol campagne moet beginnen en wil daartoe een toets laten uitvoeren waarbij wordt bekeken of het aantal glazen alcohol dat studenten per maand drinken significant groter is dan 20. Hypotheses H 0 : µ 20 en H a : µ > 20. Er wordt een steekproef ter grootte 35 genomen (jullie) en op grond daarvan wordt bepaald welke hypothese verworpen moet worden. Als significantieniveau wordt 0.01 genomen. Gemiddeld aantal glazen alcohol per maand: X = 23 en standaardafwijking s = 25. Voor de kritische waarde x k moet gelden: P(X x k µ = 20) = P X 20 t( x k 20 ) = P X 20 25 25 t( 4.2 35 35 x k 20 ) = 0.01. 4.2 Omdat de variantie van de populatie niet bekend is wordt met de t-verdeling P t getoetst bij 34 vrijheidsgraden, met gemiddelde 20 en de standaardafwijking van het gemiddelde 4.2. Uit C.3: P t(z 2.457) = 0.01 (bij 30 vrijheidsgraden omdat 35 niet in tabel voorkomt). Daarmee is de kritische waarde x k = 20 + (2.457)(4.2) = 30.32 en het kritische gebied [30.32, ). X ligt niet in het kritische gebied: H 0 wordt niet verworpen. De UU onderneemt geen actie. 19 / 1

Correlatie: downloaden Vb. Aantal films en albums dat je afgelopen maand illegaal gedownload hebt (x-as) tegen aantal euro dat je afgelopen maand aan films en muziek besteed hebt (y-as). stat1b 0 10 20 30 40 50 0 20 40 60 80 100 stat1a De Pearson correlatiecoëfficiënt: 0.57. 20 / 1

Correlatie: downloaden Vb. Aantal euro dat je afgelopen maand aan films en muziek besteed hebt (x-as) tegen aantal euro dat je per maand zou hebben besteed aan films en muziek als downloaden niet mogelijk was (y-as). stat1c 0 10 20 30 40 0 10 20 30 40 50 stat1b De Pearson correlatiecoëfficiënt: 0.58. 21 / 1

Hypothese toetsen: downloaden Vb. In opdracht van de regering wordt onderzocht wat het percentage mensen is dat illegaal films downloadt. De regering zal in actie komen als dat percentage meer dan 30% is. Een onderzoeksbureau voert een hypothesetoets uit met hypotheses (in %) H 0 : µ 30 en H a : µ > 30. In dit geval wordt aangenomen dat X een binomiale verdeling heeft (X = 1 als iemand illegaal films downloadt, X = 0 anders). Als significantieniveau wordt 0.02 genomen. Er een steekproef ter grootte 1000 genomen uit de populatie Nederlanders en op grond daarvan wordt bepaald welke hypothese verworpen moet worden. Van die 1000 Nederlanders downloadt 37% illegaal films. De kans op een fout van de eerste soort is in dit geval 1000 X 1000 P(X x k µ = 30) = (0.3) i (0.7) 1000 i. i i=x k Er geldt dat P(X 330) = 0.0215 en P(X 331) = 0.18, dus x k = 331 en het kritschie gebied is {331, 332,..., 1000}. X ligt in het kritische gebied: H 0 wordt verworpen. De regering onderneemt actie. 22 / 1

23 / 1

Finis 24 / 1