Sheets K&S voor INF HC 10: Hoofdstuk 12

Vergelijkbare documenten
Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Hoofdstuk 5 Een populatie: parametrische toetsen

Toetsen van Hypothesen. Het vaststellen van de hypothese

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Kansrekening en Statistiek

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.

Data analyse Inleiding statistiek

Les 7-8: Parameter- en Vergelijkingstoetsen

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Inhoudsopgave. Deel I Schatters en toetsen 1

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Hoofdstuk 12: Eenweg ANOVA

Kansrekening en Statistiek

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Toegepaste Statistiek, Week 6 1

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

15.1 Beslissen op grond van een steekproef [1]

Kansrekening en Statistiek

Toegepaste Statistiek, Week 3 1

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Voorbeeldtentamen Statistiek voor Psychologie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Kansrekening en Statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Toetsen van hypothesen

Statistiek voor A.I.

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en Statistiek

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Samenvatting Statistiek

5 Toetsen. 5.1 Nulhypothese en Alternatieve Hypothese

werkcollege 6 - D&P10: Hypothesis testing using a single sample

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Kansrekening en Statistiek

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Feedback examen Statistiek II Juni 2011

Kansrekening en Statistiek

Les 2: Toetsen van één gemiddelde

Hoofdstuk 10: Regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN

Kansverdelingen Inductieve statistiek met Geogebra 4.2

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Hoofdstuk 6 Hypothesen toetsen

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Kansrekening en Statistiek

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Testen omtrent µ (normale populatie): BI. Testen omtrent µ (normale populatie): fouten. Testen omtrent µ (normale populatie): P-waarde

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

werkcollege 7 - D&P10: Hypothesis testing using a single sample

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Antwoorden bij Inleiding in de Statistiek

Data analyse Inleiding statistiek

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek I voor B (2S410) op , uur.

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Les 1: Waarschijnlijkheidrekening

Les 7-8: Parameter- en Vergelijkingstoetsen

Inleiding Applicatie Software - Statgraphics

Hoofdstuk 4 Hypothese toetsen

toetskeuze schema verschillen in gemiddelden

Hoofdstuk 5: Steekproevendistributies

7.1 Toets voor het gemiddelde van een normale verdeling

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Zin en onzin van normale benaderingen van binomiale verdelingen

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

SOCIALE STATISTIEK (deel 2)

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Niet-Parametrische Statistiek

Wiskunde B - Tentamen 1

. Dan geldt P(B) = a d. 3 8

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Populaties beschrijven met kansmodellen

STUDEERWIJZER 2009/2010 voor STATISTIEK 1 (2DD29)

Transcriptie:

Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12)

Betrouwbaarheidsintervallen (H11) en toetsen (H12) Par. (1 α)1%-bi tabel Toets µ S n X c, X c S n t-tabel, df = n-1: P(T n-1 c) =1-½α? σ 2 (n-1)s c 2 2 (n-1)s, c 2 1 χ 2 -tabel, df = n-1: P(χ 2 n-1 c 1 )= ½α P(χ 2 n-1 c 2 )= ½α? p p(1 ˆ p) ˆ n (pˆ c, p(1 ˆ p) ˆ n ˆp + c ) N(, 1)-tabel: Φ(c) =1- ½α?

Toetsen van hypothesen: basisbegrippen (1) Hypothesen Hebben betrekking op de populatie en worden uitgedrukt in populatieparameters (µ, σ, p) hangen af van onderzoeksvraag, niet van waarnem. Nulhypothese H : oude/bestaande/algemene situatie Alternatieve hypothese H 1 : wat je wil bewijzen H en H 1 zijn niet gelijkwaardig. Sterke uitspraak: H verwerpen (als in de rechtsspraak: bewijs de schuld ) Zwakke uitspraak: H niet verwerpen (accepteren)

Toetsen: basisbegrippen (2) Aanpak om tot een uitspraak te komen: Ga uit van de juistheid van H. Verwerp H als de waargenomen waarden (data) sterk afwijken van wat je verwacht als H waar is. Toetsingsgrootheid T: een schatter van de populatieparameter waarmee de uitspraak wordt gedaan. Kritiek gebied: de waarden van de toetsingsgrootheid waarvoor H wordt verwerpen (bijv. T c) De onbetrouwbaarheid α van de toets: de kans op ten onrechte verwerpen van H (fout van de 1 ste soort) Voor de toets Verwerp H als T c is α = P(T c H ). T is dus de toetsingsgrootheid en T c het kritieke gebied

Toetsingsprocedure 1. Kansmodel 2. Hypothesen 3. Toetsingsgrootheid + verdeling 4. Kritiek Gebied 5.Waarneming 6. Statistische 7. Verwoorde De IQ s X 1,..., X 11 zijn o.o. en N(µ,σ 2 )- verdeeld met bekende σ 2 = 1 Toets H :µ=115 tegen H 1 :µ>115 met α=5% X is N(115, 1 11 3.15 2 ) als H waar is. Verwerp H als X c P(X c H ), dus.95 c115 3.15 c 115 1.645 3.15 119.96 x 122.45 x=122.45 > 119.96=c,dus H verwerpen Met onbetrouwbaarheid van 5% is bewezen dat het gemiddelde IQ van INF-studenten hoger is dan 115

Beslissen met de kritieke waarde c Verwerp H als X 119.96 x 122.45 119.96, dus H verwerpen Beslissen met de overschrijdingskans (p-waarde): Verwerp H als P(X 122.45 H ) α de overschrijdingskans bij waargenomen 122.45 122.45115 1/ 11 P(X 122.45 H ) = 1 - ( ) =.68%< verwerp H

Toetsen: basisbegrippen (3) Foute en juiste uitspraken BE- SLIS- SING H niet verwerpen H wel verwerpen WERKELIJKHEID H is waar H 1 is waar Juiste beslissing Fout van de eerste soort Fout van de tweede soort Juiste beslissing Voorbeeld: kritiek gebied T c Kans op fout van de 1 ste soort: P(T c H ) = α Kans op fout van de 2 de soort: P(T < c H 1 ) hangt af van gekozen waarde uit H 1 (bijv. H 1 : µ>8) Onderscheidend vermogen P(T c H 1 )

Kans op fout 2 de soort : P(X 119.96 118) Φ(.65) = 74.2%

Toetsingsprocedure normaal model onbekende σ 2 1. Kansmodel 2. Hypothesen 3. Toetsingsgrootheid + verdeling 4. Kritiek Gebied 5.Waarneming 6. Statistische 7. Verwoorde De IQ s X 1,..., X 11 zijn o.o. en N(µ,σ 2 )- verdeeld met σ 2 = 1 2 onbekende en Toets H :µ=115 tegen H 1 :µ>115 met α=5% X is X N(115, 1 T is t ) als H waar is. 11-1-verdeeld als H waar is. S / 11 Verwerp H als XT c c P(T c H ).5, dus c = 1.81 1 x x= 122.45 122.45-115 2 t = = 2.87 s = 74.7 74.7/11 x=122.45 t = 2.87 > > 1.86 119.96=c = c, dus H verwerpen Met onbetrouwbaarheid van 5% is bewezen dat het gemiddelde IQ van INF-studenten hoger is dan 115

Toetsen: basisbegrippen (4) Een- of tweezijdig toetsen De vorm van het kritieke gebied hangt af van alternatieve hypothese en toetingsgrootheid: Rechtseenzijdig toetsen: verwerp H als T c Linkseenzijdig toetsen: verwerp H als T c Tweezijdig toetsen: verwerp H als T c 1 of T c 2 Overschrijdingskans bij waarneming t van T: Rechtseenzijdig: verwerp H als P(T t H ) α Linkseenzijdig: verwerp H als P(T t H ) α Tweezijdig: verwerp H als P-waarde α P-waarde = min{ 2 P(T t H ), 2 P(T t H ) }

Is de standaardafw. van downloadsnelheden groter dan 1 Mb/s 1. Kansmodel De downloadsnelheden X 1,..., X 25 zijn o.o. en N(µ,σ 2 )-verdeeld met onbekende µ en σ 2 2. Hypothesen 3. Toetsingsgrootheid 4. Kritiek Gebied 5.Waarneming 6. Statistische 7. Verwoorde Toets H :σ 2 1 tegen H 1 :σ 2 >1 met α=5% 2 (251)S 2 2 1 24 T ~ als 1 Rechtseenzijdigetoets: verwerp H als T c 2 Uit P( 24 c) volgt c = 36.4 2 24144 1 s 144 waarg enomen t 34.56 t 34.56 36.4 c H niet verwerpen Met onbetrouwbaarheid 5% kan niet gesteld worden dat de spreiding in de downloadsnelheden lager is dan de norm (σ = 1)

Is de aanhang van het CDA (was 2%) gewijzigd? 1. Kansmodel X = # CDA-ers in aselecte steekproef van n =16 NL-ers X ~ B(16, p) 2. Hypothesen Toets H :p =.2 tegen H 1 :p.2 met α=5% 3. Toetsingsgrootheid X is onder H B(16,.2) dus X is bij benadering N(32, 256) 4. Kritiek De toets: Verwerp H als T c 1 of T c 2 c.5 32 Gebied P(X c 2 H ) 1 ( ).25 16 2 c = 32.5+ 1.96 16 = 351.86 Dus c 352 en (symmetrisch) c 288 5.Waarneming 6. Statistische 7. Verwoorde 2 1 x = 28 x 28 ( 288) ligt wel in het kritieke gebied H verwerpen Met onbetrouwbaarheid 5% is bewezen dat de CDA-aanhang is gewijzigd.

Gepaarde waarnemingen: een voorbeeld Werkt een homeopathisch middel tegen hoge bloeddruk? We meten de bloeddruk van 1 mensen met te hoge bloeddruk voor en drie maanden na het gebruik van het nieuwe middel: Voor 148 16 171 139 148 156 155 165 178 162 Na 143 145 175 139 14 153 148 167 157 157 Verschil +5 +15-4 +8 +3 +7-2 +21 +5 Aanpak: we berekenen de verschillen bloeddruk voor na en toetsen vervolgens of het gemiddelde verschil µ groter dan is: de een-steekproef t-toets op de verschillen Model: de verschillen X 1,,X 1 zijn o.o. en N(µ, σ 2 )-verdeeld Hypothesen: Toets H : µ = tegen H 1 : µ > met α = 1% H X 5.8 S / 1 9 7.613/ 1 T ~ t. Waarneming: t = 2.41 Uit de t 9 -tabel volgt de kritieke waarde c = 2.82, dus H niet verwerpen!

Betrouwbaarheidsintervallen en toetsen Par (1 α)1%-bi tabel Toetsingsgrooth X a T ~ t S S S / n X c, X c µ n n als H : μ = a n 1 σ 2 p (n-1)s c 2 2 (n-1)s, c 2 1 p(1 ˆ p) ˆ n (pˆ c, p(1 ˆ p) ˆ n ˆp + c ) 2 (n-1)s ~ 2 a als H : σ 2 = a X ~ B(n,a) of, bij grote n: N na, na(1 a) n1 als H : p = a