Kansrekening en Statistiek

Vergelijkbare documenten
Kansrekening en Statistiek

Statistiek voor A.I.

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Kansrekening en Statistiek

Hoofdstuk 6 Twee populaties: parametrische toetsen

Kansrekening en Statistiek

Hoofdstuk 5 Een populatie: parametrische toetsen

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Kansrekening en Statistiek

Hoofdstuk 3 Statistiek: het toetsen

Kansrekening en Statistiek

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Kansrekening en Statistiek

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hoofdstuk 12: Eenweg ANOVA

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Data analyse Inleiding statistiek

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Toetsen van hypothesen

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Les 2: Toetsen van één gemiddelde

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Voorbeeldtentamen Statistiek voor Psychologie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Sheets K&S voor INF HC 10: Hoofdstuk 12

Kansrekening en Statistiek

Les 7-8: Parameter- en Vergelijkingstoetsen

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

15.1 Beslissen op grond van een steekproef [1]

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Oefenvragen bij Statistics for Business and Economics van Newbold

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Toetsen van Hypothesen. Het vaststellen van de hypothese

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

College 2 Enkelvoudige Lineaire Regressie

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

Hoofdstuk 10: Regressie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Les 1: Waarschijnlijkheidrekening

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,

Antwoordvel Versie A

Kansrekening en Statistiek

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Feedback examen Statistiek II Juni 2011

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Les 5: ANOVA. Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 19 november 2018

variantie: achtergronden en berekening

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Toegepaste Statistiek, Week 6 1

toetskeuze schema verschillen in gemiddelden

Beschrijvende statistiek

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Data analyse Inleiding statistiek

werkcollege 7 - D&P10: Hypothesis testing using a single sample

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Herkansing eindtoets statistiek voor HBO

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Inhoudsopgave. Deel I Schatters en toetsen 1

Les 1: Waarschijnlijkheidrekening

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

werkcollege 6 - D&P9: Estimation Using a Single Sample

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

7.1 Toets voor het gemiddelde van een normale verdeling

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

. Dan geldt P(B) = a d. 3 8

Transcriptie:

Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37

2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37

Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden gemiddelde was 0.1%. Er werd hen ook gevraagd hoeveel % van de tijd zij liegen om iemands gevoelens te sparen. Het gevonden gemiddelde was 1%. Zijn deze data consistent? 3 / 37

Vragen NRC 23 Oktober 2010: Visolie slikken van weinig nut tijdens zwangerschap. Maakt visolie intelligent? Een groep moeders kreeg tijdens de zwangerschap visolie toegediend en een controlegroep niet. Anderhalf jaar later werden hun kinderen onderzocht. De kinderen in de testgroep bleken niet snuggerder dan die in de controlegroep. Er worden hier twee steekproefgemiddeldes vergelijken. Hoe werd hier getoetst? 4 / 37

Hypothese toetsen 5 / 37

Hypothese toetsen: de zijde Def. Bij toetsen waarbij de gemiddeldes van twee populaties vergeleken worden zijn de hypothesen van de vorm: tweezijdig H 0 : µ 1 = µ 2 (µ 1 µ 2 = 0) H a : µ 1 µ 2 (µ 1 µ 2 0) linkszijdig H 0 : µ 1 µ 2 (µ 1 µ 2 0) H a : µ 1 < µ 2 (µ 1 µ 2 < 0) rechtszijdig H 0 : µ 1 µ 2 (µ 1 µ 2 0) H a : µ 1 > µ 2 (µ 1 µ 2 > 0) 6 / 37

Hypothese toetsen: criterium voor verwerpen H 0 Def. Criterium voor het verwerpen van de nulhypothese: Voor een zekere constante x k (xk l en xr k ) wordt op grond van de twee steekproeven met gemiddeldes X 1 en X 2 : H 0 verworpen als (X 1 X 2 ) x r k of (X 1 X 2 ) x l k H 0 verworpen als (X 1 X 2 ) x k H 0 verworpen als (X 1 X 2 ) x k (tweezijdige toets) (rechtszijdige toets) (linkszijdige toets). 7 / 37

Hypothese toetsen: kritisch gebied Def. De kritische waarde of de p-waarde (p-value) is de waarde x k (x r k en xl k ) waarvoor P((X 1 X 2 ) xk r of (X 1 X 2 ) xk l µ 1 = µ 2 ) = α P((X 1 X 2 ) x k µ 1 = µ 2 ) = α P((X 1 X 2 ) x k µ 1 = µ 2 ) = α (tweezijdige toets) (rechtszijdige toets) (linkszijdige toets). Het kritische gebied (region of rejection) zijn die waardes x die liggen in de intervallen (, xk l ] of [xr k, ) (tweezijdige toets) [x k, ) (rechtszijdige toets) (, x k ] (linkszijdige toets). Als (X 1 X 2 ) in the kritisch gebied ligt, dan geldt dat onder de aanname H 0 de kans dat het verschil tussen de twee steekproefgemiddelde gelijk aan (X 1 X 2 ) is, α is. Daarom wordt H 0 verworpen als (X 1 X 2 ) in het kritische gebied ligt en aangenomen als (X 1 X 2 ) niet in het kritische gebied ligt. 8 / 37

Hypothese toetsen: variantie bekend Def. Wanneer het significantieniveau eenmaal gekozen is, kan de kritische waarde berekend worden als de verdeling P van (X 1 X 2 ) gegeven µ 1 = µ 2, bekend is. De verdeling van (X 1 X 2 ) heet de verdeling van het verschil tussen de steekproefgemiddeldes. Stel dat n 1 en n 2 de groottes van de steekproeven zijn en dat standaardafwijkingen van de populaties bekend en gelijk zijn (de aanname van homogeniteit van de variantie). Dan wordt vaak aangenomen dat P de normale verdeling P s is met gemiddelde µ 1 µ 2 en standaardafwijking s σ X 1 X 2 = σ 2 ( 1 n 1 + 1 n 2 ), waarbij σ de standaardafwijking van de populaties is. σ X 1 X 2 heet de standaardfout van het verschil tussen de gemiddeldes. Aangenomen wordt dus dat P( (X 1 X 2 ) (µ 1 µ 2 ) ) de standaard normale verdeling σ X 1 X 2 heeft. 9 / 37

Hypothese toetsen: variantie onbekend Def. Stel dat standaardafwijkingen van de populaties onbekend maar verondersteld worden gelijk te zijn (de aanname van homogeniteit van de variantie). Stel dat s1 2 en s2 2 de varianties van de twee steekproeven zijn. Dan wordt vaak aangenomen dat P de t-verdeling P t is bij (n 1 + n 2 2) vrijheidsgraden, met gemiddelde µ 1 µ 2 en standaardafwijking s s s X 1 X 2 = s 2 ( 1 n 1 + 1 n 2 ) = s ( 1 n 1 + 1 n 2 ), waarbij s 2 is: s 2 = P n1 i=1 (X 1 i X 1 ) 2 + P n 2 j=1 (X 2 j X 2 ) 2 n 1 + n 2 2 = s2 1 (n 1 1) + s2 2(n 2 1). n 1 + n 2 2 s X 1 X 2 heet de geschatte standaardfout van het verschil tussen de gemiddeldes. s 2 heet de pooled estimate of the population variance. Aangenomen wordt dus dat P( (X 1 X 2 ) (µ 1 µ 2 ) ) de standaard t-verdeling heeft bij s X 1 X 2 n 1 + n 2 2 vrijheidsgraden. 10 / 37

Hypothese toetsen Vb. Mac wil testen of het gemiddeld aantal klachten µ 1 dat zij per dag in de eerste tien weken na het op de markt brengen van iphone 4 ontvingen significant lager is dan dat (µ 2 ) voor iphone 3. De steekproeven hebben beide dus grootte n 1 = n 2 = 10 7 = 70. Als significantieniveau wordt 0.0005 genomen. H 0 : (µ 1 µ 2 ) 0 H a : (µ 1 µ 2 ) < 0. Voor de kritische waarde x k moet gelden dat P((X 1 X 2 ) x k µ 1 = µ 2 ) = α = 0.0005. Uit de steekproef voor iphone 4 komt X 1 = 1000 en standaardafwijking s 1 = 5 en voor iphone 3 X 2 = 1005 en s 2 = 9. Dus is de Pooled estimate of the population variance: s 2 = s2 1 (n 1 1) + s2 2(n 2 1) 25 69 + 81 69 = = 53. n 1 + n 2 2 70 + 70 2 s s X 1 X = s 2 ( 1 + 1 r 2 ) = 53 2 n 1 n 2 70 = 1.23. Bij 138 vrijheidsgraden (neem ) geldt (C.3): P t(z 3.291) = 0.0005. Daaruit volgt dat x k = (µ 1 µ 2 ) + ( 3.291)s X 1 X 2 = 0 (3.291)(1.23) = 4.04793. (X 1 X 2 ) < 4.04793 : H 0 wordt verworpen. 11 / 37

Schatten 12 / 37

Schatten Statistisch schatten wordt toegepast wanneer men de waarde van een parameter wil benaderen. Op grond van de statistiek van een steekproef wordt de corresponderende waarde van de populatie geschat/benaderd. Sommige schatters produceren meerdere waarden (vaak een interval) en sommige schatters produceren één waarde. Vraag: Hoe accuraat is de schatter? 13 / 37

Schatten: betrouwbaarheidsinterval Def. Wanneer de standaardafwijking van de populatie σ bekend is dan is het betrouwbaarheidsinterval met betrouwbaarheidsniveau (1 α) op grond van een statistiek X van een steekproef ter grootte n: CI = (X z kw σ X, X + z kw σ X ), waarbij z kw de standaard kritische waarde corresponderend met significantieniveau α (twee-zijdig) op grond van de normale verdeling is. Wanneer de standaardafwijking van de populatie onbekend is dan is het betrouwbaarheidsinterval CI = ( X t kw s X, X + t kw s X ). waarbij t kw de standaard kritische waarde corresponderend met α (twee-zijdig) op grond van de t-verdeling bij (n 1) vrijheidsgraden is. CI wordt ook wel het (1 α)%-procent betrouwbaarheidsinterval genoemd. 14 / 37

Schatten Vb. Aan 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden gemiddelde was 0.4%. Aan een andere groep van 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen om iemands gevoelens te sparen. Het gevonden gemiddelde was 1%. Zijn die data 95% betrouwbaar, d.w.z. kunnen beide 95%-betrouwbaarheidsintervallen de ware gemiddeldes bevatten? Een 95% betrouwbaarheidsinterval op grond van de eerste steekproef, waarbij gegeven is dat s X = 0.0015, is CI 1 = (X t kw s X, X + t kw s X ) = (0.001, 0.007). Een 95% betrouwbaarheidsinterval op grond van de tweede steekproef, waarbij gegeven is dat s X = 0.0013, is CI 2 = (X t kw s X, X + t kw s X ) = (0.0074, 0.0126). Stel, Amerikanen liegen in werkelijkheid µ 1 % van de tijd en liegen µ 2 % van de tijd om iemands gevoelens te sparen. Dan moet gelden µ 1 µ 2. Omdat CI 2 rechts van CI 1 ligt kan het niet zo zijn dat beide intervallen de werkelijke gemiddeldes bevatten (CI i bevat µ i ). Het onderzoek is niet 95% betrouwbaar. 15 / 37

Finis 16 / 37