Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12)
Betrouwbaarheidsintervallen (H11) en toetsen (H12) Par. (1 α)1%-bi tabel Toets µ S n X c, X c S n t-tabel, df = n-1: P(T n-1 c) =1-½α? σ 2 (n-1)s c 2 2 (n-1)s, c 2 1 χ 2 -tabel, df = n-1: P(χ 2 n-1 c 1 )= ½α P(χ 2 n-1 c 2 )= ½α? p p(1 ˆ p) ˆ n (pˆ c, p(1 ˆ p) ˆ n ˆp + c ) N(, 1)-tabel: Φ(c) =1- ½α?
Toetsen van hypothesen: basisbegrippen (1) Hypothesen Hebben betrekking op de populatie en worden uitgedrukt in populatieparameters (µ, σ, p) hangen af van onderzoeksvraag, niet van waarnem. Nulhypothese H : oude/bestaande/algemene situatie Alternatieve hypothese H 1 : wat je wil bewijzen H en H 1 zijn niet gelijkwaardig. Sterke uitspraak: H verwerpen (als in de rechtsspraak: bewijs de schuld ) Zwakke uitspraak: H niet verwerpen (accepteren)
Toetsen: basisbegrippen (2) Aanpak om tot een uitspraak te komen: Ga uit van de juistheid van H. Verwerp H als de waargenomen waarden (data) sterk afwijken van wat je verwacht als H waar is. Toetsingsgrootheid T: een schatter van de populatieparameter waarmee de uitspraak wordt gedaan. Kritiek gebied: de waarden van de toetsingsgrootheid waarvoor H wordt verwerpen (bijv. T c) De onbetrouwbaarheid α van de toets: de kans op ten onrechte verwerpen van H (fout van de 1 ste soort) Voor de toets Verwerp H als T c is α = P(T c H ). T is dus de toetsingsgrootheid en T c het kritieke gebied
Toetsingsprocedure 1. Kansmodel 2. Hypothesen 3. Toetsingsgrootheid + verdeling 4. Kritiek Gebied 5.Waarneming 6. Statistische 7. Verwoorde De IQ s X 1,..., X 11 zijn o.o. en N(µ,σ 2 )- verdeeld met bekende σ 2 = 1 Toets H :µ=115 tegen H 1 :µ>115 met α=5% X is N(115, 1 11 3.15 2 ) als H waar is. Verwerp H als X c P(X c H ), dus.95 c115 3.15 c 115 1.645 3.15 119.96 x 122.45 x=122.45 > 119.96=c,dus H verwerpen Met onbetrouwbaarheid van 5% is bewezen dat het gemiddelde IQ van INF-studenten hoger is dan 115
Beslissen met de kritieke waarde c Verwerp H als X 119.96 x 122.45 119.96, dus H verwerpen Beslissen met de overschrijdingskans (p-waarde): Verwerp H als P(X 122.45 H ) α de overschrijdingskans bij waargenomen 122.45 122.45115 1/ 11 P(X 122.45 H ) = 1 - ( ) =.68%< verwerp H
Toetsen: basisbegrippen (3) Foute en juiste uitspraken BE- SLIS- SING H niet verwerpen H wel verwerpen WERKELIJKHEID H is waar H 1 is waar Juiste beslissing Fout van de eerste soort Fout van de tweede soort Juiste beslissing Voorbeeld: kritiek gebied T c Kans op fout van de 1 ste soort: P(T c H ) = α Kans op fout van de 2 de soort: P(T < c H 1 ) hangt af van gekozen waarde uit H 1 (bijv. H 1 : µ>8) Onderscheidend vermogen P(T c H 1 )
Kans op fout 2 de soort : P(X 119.96 118) Φ(.65) = 74.2%
Toetsingsprocedure normaal model onbekende σ 2 1. Kansmodel 2. Hypothesen 3. Toetsingsgrootheid + verdeling 4. Kritiek Gebied 5.Waarneming 6. Statistische 7. Verwoorde De IQ s X 1,..., X 11 zijn o.o. en N(µ,σ 2 )- verdeeld met σ 2 = 1 2 onbekende en Toets H :µ=115 tegen H 1 :µ>115 met α=5% X is X N(115, 1 T is t ) als H waar is. 11-1-verdeeld als H waar is. S / 11 Verwerp H als XT c c P(T c H ).5, dus c = 1.81 1 x x= 122.45 122.45-115 2 t = = 2.87 s = 74.7 74.7/11 x=122.45 t = 2.87 > > 1.86 119.96=c = c, dus H verwerpen Met onbetrouwbaarheid van 5% is bewezen dat het gemiddelde IQ van INF-studenten hoger is dan 115
Toetsen: basisbegrippen (4) Een- of tweezijdig toetsen De vorm van het kritieke gebied hangt af van alternatieve hypothese en toetingsgrootheid: Rechtseenzijdig toetsen: verwerp H als T c Linkseenzijdig toetsen: verwerp H als T c Tweezijdig toetsen: verwerp H als T c 1 of T c 2 Overschrijdingskans bij waarneming t van T: Rechtseenzijdig: verwerp H als P(T t H ) α Linkseenzijdig: verwerp H als P(T t H ) α Tweezijdig: verwerp H als P-waarde α P-waarde = min{ 2 P(T t H ), 2 P(T t H ) }
Is de standaardafw. van downloadsnelheden groter dan 1 Mb/s 1. Kansmodel De downloadsnelheden X 1,..., X 25 zijn o.o. en N(µ,σ 2 )-verdeeld met onbekende µ en σ 2 2. Hypothesen 3. Toetsingsgrootheid 4. Kritiek Gebied 5.Waarneming 6. Statistische 7. Verwoorde Toets H :σ 2 1 tegen H 1 :σ 2 >1 met α=5% 2 (251)S 2 2 1 24 T ~ als 1 Rechtseenzijdigetoets: verwerp H als T c 2 Uit P( 24 c) volgt c = 36.4 2 24144 1 s 144 waarg enomen t 34.56 t 34.56 36.4 c H niet verwerpen Met onbetrouwbaarheid 5% kan niet gesteld worden dat de spreiding in de downloadsnelheden lager is dan de norm (σ = 1)
Is de aanhang van het CDA (was 2%) gewijzigd? 1. Kansmodel X = # CDA-ers in aselecte steekproef van n =16 NL-ers X ~ B(16, p) 2. Hypothesen Toets H :p =.2 tegen H 1 :p.2 met α=5% 3. Toetsingsgrootheid X is onder H B(16,.2) dus X is bij benadering N(32, 256) 4. Kritiek De toets: Verwerp H als T c 1 of T c 2 c.5 32 Gebied P(X c 2 H ) 1 ( ).25 16 2 c = 32.5+ 1.96 16 = 351.86 Dus c 352 en (symmetrisch) c 288 5.Waarneming 6. Statistische 7. Verwoorde 2 1 x = 28 x 28 ( 288) ligt wel in het kritieke gebied H verwerpen Met onbetrouwbaarheid 5% is bewezen dat de CDA-aanhang is gewijzigd.
Gepaarde waarnemingen: een voorbeeld Werkt een homeopathisch middel tegen hoge bloeddruk? We meten de bloeddruk van 1 mensen met te hoge bloeddruk voor en drie maanden na het gebruik van het nieuwe middel: Voor 148 16 171 139 148 156 155 165 178 162 Na 143 145 175 139 14 153 148 167 157 157 Verschil +5 +15-4 +8 +3 +7-2 +21 +5 Aanpak: we berekenen de verschillen bloeddruk voor na en toetsen vervolgens of het gemiddelde verschil µ groter dan is: de een-steekproef t-toets op de verschillen Model: de verschillen X 1,,X 1 zijn o.o. en N(µ, σ 2 )-verdeeld Hypothesen: Toets H : µ = tegen H 1 : µ > met α = 1% H X 5.8 S / 1 9 7.613/ 1 T ~ t. Waarneming: t = 2.41 Uit de t 9 -tabel volgt de kritieke waarde c = 2.82, dus H niet verwerpen!
Betrouwbaarheidsintervallen en toetsen Par (1 α)1%-bi tabel Toetsingsgrooth X a T ~ t S S S / n X c, X c µ n n als H : μ = a n 1 σ 2 p (n-1)s c 2 2 (n-1)s, c 2 1 p(1 ˆ p) ˆ n (pˆ c, p(1 ˆ p) ˆ n ˆp + c ) 2 (n-1)s ~ 2 a als H : σ 2 = a X ~ B(n,a) of, bij grote n: N na, na(1 a) n1 als H : p = a