Kansrekening en Statistiek

Vergelijkbare documenten
Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Kansrekening en Statistiek

Statistiek voor A.I.

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Hoofdstuk 6 Twee populaties: parametrische toetsen

Kansrekening en Statistiek

Kansrekening en Statistiek

Hoofdstuk 5 Een populatie: parametrische toetsen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Hoofdstuk 3 Statistiek: het toetsen

Statistiek voor A.I. College 2. Donderdag 13 September 2012

15.1 Beslissen op grond van een steekproef [1]

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Kansrekening en Statistiek

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Les 2: Toetsen van één gemiddelde

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Toetsen van Hypothesen. Het vaststellen van de hypothese

Data analyse Inleiding statistiek

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Hoofdstuk 6 Hypothesen toetsen

Lesbrief hypothesetoetsen

Toetsen van hypothesen

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Statistiek voor A.I. College 9. Donderdag 11 Oktober

Les 1: Waarschijnlijkheidrekening

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Voorbeeldtentamen Statistiek voor Psychologie

Sheets K&S voor INF HC 10: Hoofdstuk 12

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

c P( X 1249 of X 1751 µ = 1500 en σ = 100) = 1 P(1249 X 1751)

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hoofdstuk 12: Eenweg ANOVA

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Hoofdstuk 3 Toetsen uitwerkingen

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Faculteit Economie en Bedrijfskunde studiejaar

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Oefenvragen bij Statistics for Business and Economics van Newbold

G0N11C Statistiek & data-analyse Project tweede zittijd

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Les 1: Waarschijnlijkheidrekening

Examen Statistiek I Januari 2010 Feedback

Statistiek voor A.I. College 6. Donderdag 27 September

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

7.1 Toets voor het gemiddelde van een normale verdeling

Kansrekening en Statistiek

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Tentamen Wiskunde A CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE. Datum: 19 december Aantal opgaven: 6

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling

Les 7-8: Parameter- en Vergelijkingstoetsen

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

Hoofdstuk 10: Regressie

Examen G0N34 Statistiek

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Toegepaste Statistiek, Week 6 1

Data analyse Inleiding statistiek

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Uitwerkingen voortoets/oefentoets E3 maart/april 2009 MLN

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

College 2 Enkelvoudige Lineaire Regressie

Les 5: ANOVA. Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 19 november 2018

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Beschrijvende statistiek

Transcriptie:

Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1

2 Statistiek Vandaag: Hypothese toetsen 2 / 1

3 / 1

Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html) Hoe meer Facebookvrienden iemand heeft, hoe groter bepaalde gebieden in de hersenen zijn en hoe meer vrienden hij/zij in de echte wereld heeft. 4 / 1

Hypothese toetsen 5 / 1

Hypothese toetsen: toepassingen Vb. Een medicijn wordt aan een groep patiënten toegediend en aan een controlegroep niet. Er moet besloten worden of het medicijn werkt of niet. Een fabriek laat een gedeelte van een lading geproduceerde auto s testen op een defect. Er moet besloten worden of de lading goed genoeg is om bij de leverancier af te leveren. De schedelgrootte van enkele Egyptenaren uit de oudheid is bekend. Op grond van deze data wil men vaststellen of de gemiddelde schedelgrootte van mensen in het oude Egypte gelijk is aan die van de huidige mens. 6 / 1

Hypothese toetsen: de hypotheses Def. Bij hypothese toetsen wordt een hypothese H 0 getest tegen een hypothese H a. H 0 is de nulhypothese en H a is de alternatieve hypothese. H a wordt ook wel H 1 genoemd. De alternatieve hypothese is meestal de onderzoekshypothese, die alleen aangenomen (ondersteund) wordt door de nulhypothese te verwerpen. Vaak is de nulhypothese de hypothese van geen verschil of geen onderscheid of geen relatie, en de test dient om aan te tonen dat er wel een verschil, onderscheid of relatie is. 7 / 1

Hypothese toetsen: de zijde Def. De hypotheses die we gaan beschouwen zijn meestal van de vorm: tweezijdig H 0 : µ = a H a : µ a linkszijdig H 0 : µ a H a : µ < a rechtszijdig H 0 : µ a H a : µ > a 8 / 1

Hypothese toetsen: criterium voor verwerpen H 0 Def. H 0 en H a worden verworpen of aangenomen (niet verworpen). Als H 0 aangenomen wordt, wordt H a verworpen. Als H 0 verworpen wordt, wordt H a aangenomen. Def. H 0 is waar en wordt aangenomen: correcte beslissing. H 0 is waar en wordt verworpen: fout van de 1 e soort. H a is waar en wordt aangenomen: correcte beslissing. H a is waar en wordt verworpen: fout van de 2 e soort. Criterium voor het verwerpen van de nulhypothese: Voor een zekere constante x k (of xk l en xr k ) wordt op grond van een steekproef met gemiddelde X H 0 verworpen als X xk r of X xl k H 0 verworpen als X x k H 0 verworpen als X x k (tweezijdige toets) (rechtszijdige toets) (linkszijdige toets). 9 / 1

10 / 1

11 / 1

Hypothese toetsen: significantieniveau Def. Het significantieniveau is de kans op een fout van de 1 e soort en wordt aangeduid met α. Het criterium voor het verwerpen van H 0 wordt zo gekozen dat de kans op een fout van de 1 e soort het significantieniveau α is: P(X x r k of X xl k H 0) = α P(X x k H 0 ) = α P(X x k H 0 ) = α (tweezijdige toets) (rechtszijdige toets) (linkszijdige toets). Meestal wordt het H 0 weggelaten. 12 / 1

Hypothese toetsen: kritisch gebied Def. De kritische waarde is de waarde x k waarvoor P(X xk r of X xl k µ = a) = α (tweezijdige toets met H 0 : µ = a) P(X x k µ = a) = α (rechtszijdige toets met H 0 : µ a) P(X x k µ = a) = α (linkszijdige toets met H 0 : µ a). Het kritische gebied (region of rejection) zijn die waardes x die liggen in de intervallen (, xk l ] of [xr k, ) (tweezijdige toets) [x k, ) (rechtszijdige toets) (, x k ] (linkszijdige toets). Als X in the kritisch gebied ligt, dan geldt dat onder de aanname H 0 de kans dat het steekproefgemiddelde gelijk aan X is, α is. Daarom wordt H 0 verworpen als X in het kritische gebied ligt. Als X niet in het kritische gebied ligt wordt H 0 aangenomen ofwel niet verworpen. 13 / 1

Hypothese toetsen: verdeling van het steekproefgemiddelde Def. Wanneer het significantieniveau eenmaal gekozen is, kan de kritische waarde berekend worden als de verdeling P van het steekproefgemiddelde X bekend is. Als de standaardafwijking van de populatie bekend en gelijk aan σ is, dan wordt vaak aangenomen dat P de normale verdeling P s is met gemiddelde µ en standaardafwijking σ n, waarbij n de grootte van de steekproef is. De Centrale Limietstelling wordt beschouwd als rechtvaardiging voor die keuze. Als de standaardafwijking van de populatie niet bekend is, dan wordt vaak aangenomen dat P de t-verdeling P t is bij n 1 vrijheidsgraden, met gemiddelde µ en standaardafwijking s n, waarbij s de standaardafwijking van de steekproef is en n de grootte van de steekproef. Deze keuze kan gerechtvaardigd worden op dezelfde wijze als voor de normale verdeling. 14 / 1

Bij een rechtszijdige toets: Hypothese toetsen: kritisch gebied 1 µ x k P(X x k ) = α {z }.9 kritisch gebied 15 / 1

Hypothese toetsen Vb. Het gemiddelde aantal patiënten dat met 200 mg. van medicijn M geneest van een zekere ziekte is 30%. Men wil testen of een dosis van 300 mg. significant meer patiënten geneest. Men dient aan een steekproef van 25 patiënten 300 mg. M toe, waarvan 40% geneest. Laat µ het gemiddelde aantal patiënten in de populatie zijn dat bij 300 mg. M geneest. Als significantieniveau wordt 0.05 genomen. Er wordt aangenomen dat σ bekend en gelijk aan 4% is. H 0 : µ 30% H a : µ > 30%. Fout van de 1 e soort: µ = 30%, maar H 0 wordt verworpen. Voor de kritische waarde x k moet gelden dat P(X x k µ = 30) = α = 0.05. Aangenomen wordt dat X normaal verdeeld is. Dus moet gelden voor x k : P(X x k ) = P X 30 s( σ x k 30 σ ) = P X 30 s( 0.8 25 25 x k 30 ) = 0.05. 0.8 P s(z 1.645) = 0.05. Dus x k = 30 + (1.645)(0.8) = µ + 1.645 σ 25 = 31.316%. X = 40% > 31.316%. Dus X ligt in the kritische gebied, en H 0 wordt verworpen. Conclusie: bij een dosis van 300 mg. genezen significant meer patiënten. 16 / 1

Correlatie: alcohol Vb. Aantal maal uitgaan per maand (x-as) tegen aantal glazen alcohol per maand (y-as). stat4a 0 20 40 60 80 100 0 2 4 6 8 10 stat4b De Pearson correlatiecoëfficiënt: 0.75. 17 / 1

Correlatie: alcohol Vb. Aantal maanden op kamers (x-as) tegen aantal glazen alcohol per maand (y-as). stat4a 0 20 40 60 80 100 0 20 40 60 80 100 stat4c De Pearson correlatiecoëfficiënt: 0.50. 18 / 1

Hypothese toetsen: alcohol Vb. De UU wil kijken of het een anti-alcohol campagne moet beginnen en wil daartoe een toets laten uitvoeren waarbij wordt bekeken of het aantal glazen alcohol dat studenten per maand drinken significant groter is dan 20. Hypotheses H 0 : µ 20 en H a : µ > 20. Er wordt een steekproef ter grootte 35 genomen (jullie) en op grond daarvan wordt bepaald welke hypothese verworpen moet worden. Als significantieniveau wordt 0.01 genomen. Gemiddeld aantal glazen alcohol per maand: X = 23 en standaardafwijking s = 25. Voor de kritische waarde x k moet gelden: P(X x k µ = 20) = P X 20 t( x k 20 ) = P X 20 25 25 t( 4.2 35 35 x k 20 ) = 0.01. 4.2 Omdat de variantie van de populatie niet bekend is wordt met de t-verdeling P t getoetst bij 34 vrijheidsgraden, met gemiddelde 20 en de standaardafwijking van het gemiddelde 4.2. Uit C.3: P t(z 2.457) = 0.01 (bij 30 vrijheidsgraden omdat 35 niet in tabel voorkomt). Daarmee is de kritische waarde x k = 20 + (2.457)(4.2) = 30.32 en het kritische gebied [30.32, ). X ligt niet in het kritische gebied: H 0 wordt niet verworpen. De UU onderneemt geen actie. 19 / 1

Correlatie: downloaden Vb. Aantal films en albums dat je afgelopen maand illegaal gedownload hebt (x-as) tegen aantal euro dat je afgelopen maand aan films en muziek besteed hebt (y-as). stat1b 0 10 20 30 40 50 0 20 40 60 80 100 stat1a De Pearson correlatiecoëfficiënt: 0.57. 20 / 1

Correlatie: downloaden Vb. Aantal euro dat je afgelopen maand aan films en muziek besteed hebt (x-as) tegen aantal euro dat je per maand zou hebben besteed aan films en muziek als downloaden niet mogelijk was (y-as). stat1c 0 10 20 30 40 0 10 20 30 40 50 stat1b De Pearson correlatiecoëfficiënt: 0.58. 21 / 1

Hypothese toetsen: downloaden Vb. In opdracht van de regering wordt onderzocht wat het percentage mensen is dat illegaal films downloadt. De regering zal in actie komen als dat percentage meer dan 30% is. Een onderzoeksbureau voert een hypothesetoets uit met hypotheses (in %) H 0 : µ 30 en H a : µ > 30. In dit geval wordt aangenomen dat X een binomiale verdeling heeft (X = 1 als iemand illegaal films downloadt, X = 0 anders). Als significantieniveau wordt 0.02 genomen. Er een steekproef ter grootte 1000 genomen uit de populatie Nederlanders en op grond daarvan wordt bepaald welke hypothese verworpen moet worden. Van die 1000 Nederlanders downloadt 37% illegaal films. De kans op een fout van de eerste soort is in dit geval 1000 X 1000 P(X x k µ = 30) = (0.3) i (0.7) 1000 i. i i=x k Er geldt dat P(X 330) = 0.0215 en P(X 331) = 0.18, dus x k = 331 en het kritschie gebied is {331, 332,..., 1000}. X ligt in het kritische gebied: H 0 wordt verworpen. De regering onderneemt actie. 22 / 1

23 / 1

Finis 24 / 1