Hoofdstuk 10 : Het testen van hypothesen. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.



Vergelijkbare documenten
HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Hoofdstuk 3 Statistiek: het toetsen

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Hoofdstuk 6 Twee populaties: parametrische toetsen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

TECHNISCHE UNIVERSITEIT EINDHOVEN

Statistiek 2 deel A 30 minuten over statistisch toetsen

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Toetsen van Hypothesen. Het vaststellen van de hypothese

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Kansrekening en Statistiek

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Les 1: Waarschijnlijkheidrekening

7.1 Toets voor het gemiddelde van een normale verdeling

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 5 Een populatie: parametrische toetsen

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Hoofdstuk 12: Eenweg ANOVA

HOOFDSTUK VII REGRESSIE ANALYSE

. Dan geldt P(B) = a d. 3 8

Toetsen van hypothesen

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Lesbrief hypothesetoetsen

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

Kansrekening en Statistiek

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

15.1 Beslissen op grond van een steekproef [1]

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Kansrekening en Statistiek

Examen G0N34 Statistiek

Sheets K&S voor INF HC 10: Hoofdstuk 12

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Les 2: Toetsen van één gemiddelde

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Toetsen van hypothesen

Les 7-8: Parameter- en Vergelijkingstoetsen

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Schriftelijk tentamen - UITWERKINGEN

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Kansrekening en Statistiek

Formules Excel Bedrijfsstatistiek

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Hoofdstuk 10: Regressie

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Testen omtrent µ (normale populatie): BI. Testen omtrent µ (normale populatie): fouten. Testen omtrent µ (normale populatie): P-waarde

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Verslag consumentenonderzoek zorgsector Breda

Examen Statistiek I Januari 2010 Feedback

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Kruis per vraag slechts één vakje aan op het antwoordformulier.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Kansrekening en Statistiek

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Schriftelijk tentamen - UITWERKINGEN

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Vergelijken van twee groepen (voorbeeldoefeningen)

Niet-Parametrische Statistiek

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Schriftelijk tentamen - UITWERKINGEN

Statistiek II. Sessie 5. Feedback Deel 5

Kansrekening en Statistiek

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Statistiek voor A.I.

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Beschrijvende statistiek

G0N11C Statistiek & data-analyse Project tweede zittijd

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 3 1

Wiskunde B - Tentamen 1

Analyse van kruistabellen

8. Analyseren van samenhang tussen categorische variabelen

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Oplossingen hoofdstuk 9

Data analyse Inleiding statistiek

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Transcriptie:

Hoofdstuk 10 : Het testen van hypothesen Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Het testen van hypothesen p 1/52

Een statistische test Doel : het testen van een hypothese omtrent de waarden van één of meer populatieparameters Een statistische test wordt bepaald door 4 elementen : de nulhypothese H 0 : ω=ω 0 proberen te weerleggen door een redenering uit het ongerijmde de alternatieve hypothese H 1 wordt door de onderzoeker gesteund de teststatistiek Een veranderlijke die berekend wordt uit de steekproef het verwerpingsgebied Als de waarde van de teststatistiek hierin valt verwerpen we de nulhypothese Het testen van hypothesen p 2/52

Een statistische test De beslissing om de nulhypothese te verwerpen of te aanvaarden is gebaseerd op informatie uit een steekproef, getrokken uit de populatie waarover de hypothese is geformuleerd De steekproefwaarden worden gebruikt om één enkele waarde, corresponderend met een punt op een lijn, van een teststatistiek te berekenen Deze waarde zal de beslissing bepalen Daartoe worden alle waarden die de teststatistiek kan aannemen, verdeeld in twee gebieden : het gebied van waarden dat de alternatieve hypothese ondersteunt wordt het verwerpingsgebied (VG) genoemd, het gebied dat waarden bevat die de nulhypothese bijtreden wordt het aanvaardingsgebied (AG) genoemd Het testen van hypothesen p 3/52

Een statistische test Indien de waarde van de teststatistiek ligt in het verwerpingsgebied, dan wordt de nulhypothese verworpen en de alternatieve hypothese aanvaard Indien de waarde van de teststatistiek in het aanvaardingsgebied valt, dan doen zich twee mogelijkheden voor : ofwel wordt de nulhypothese aanvaard, ofwel wordt beslist dat de test geen besluit toelaat H 0 aanvaarden betekent H 0 (nog) niet verwerpen Het testen van hypothesen p 4/52

Een- of tweezijdig testen Stel : we willen H 0 verwerpen zodra de waarde y van de teststatistiek Y groter is dan ω 0 H 0 : ω = ω 0 H 1 : ω>ω 0 We verwerpen de nulhypothese als y te groot wordt te groot : groter dan de zgn kritische waarde die de grens bepaalt tussen AG en VG verwerpingsgebied = kritisch gebied Het testen van hypothesen p 5/52

Opmerking Als H 1 : ω>ω 0, dan stellen we niet H 0 : ω ω 0 maar H 0 : ω = ω 0 Immers, de alternatieve hypothese drukt reeds uit dat we alleen te grote waarden willen opsporen Als we reeds de hypothese H 0 : ω = ω 0 verwerpen ten voordele van H 1 : ω>ω 0, dan verwerpen we zeker de hypothese H 0 : ω<ω 0 Het testen van hypothesen p 6/52

1- of 2-zijdig y ω 0 ω c1 ω c2 (a) ϕ Y (y/ω = ω 0 ) ω 0 tweezijdige test H 0 : ω = ω 0 H 1 : ω ω 0 y ω c (b) ϕ Y (y/ω = ω 0 ) ω 0 links-eenzijdige test H 0 : ω = ω 0 H 1 : ω<ω 0 y ω c ω 0 (c) ϕ Y (y/ω = ω 0 ) rechts-eenzijdige test H 0 : ω = ω 0 H 1 : ω>ω 0 Het testen van hypothesen p 7/52

Fout van eerste en tweede soort Een fout van de eerste soort in een statistische test treedt op indien een ware nulhypothese wordt verworpen (omdat de waarde van de teststatistiek in het verwerpingsgebied ligt) α =P(H 0 verwerpen H 0 waar) Een fout van de tweede soort in een statistische test treedt op indien een valse nulhypothese wordt aanvaard (omdat de waarde van de teststatistiek in het aanvaardingsgebied valt) terwijl een alternatieve hypothese waar is β =P(H 0 aanvaarden H 0 vals) Het testen van hypothesen p 8/52

Fout van eerste en tweede soort Nulhypothese Besluit Waar Vals Verwerp P(verwerp H 0 H 0 waar)= α P(verwerp H 0 H 0 vals)= 1 β H 0 Fout van eerste soort Correct besluit Aanvaard P(aanvaard H 0 H 0 waar)= 1 α P(aanvaard H 0 H 0 vals)= β H 0 Correct besluit Fout van tweede soort Het testen van hypothesen p 9/52

Voorbeeld x µ 0 α/2 α/2 AG ϕ X (x/µ X = µ 0 ) x µ 1 β AG ϕ X (x/µ X = µ 1 ) Als α daalt, wordt AG groter, zodat β stijgt Besluit : α en β kunnen, bij een gegeven n, niet tegelijkertijd willekeurig klein gemaakt worden Het testen van hypothesen p 10/52

Macht van een test H 0 : ω = ω 0 β = P(H 0 aanvaarden H 0 vals) 1 β = P(H 0 verwerpen H 0 vals) = de macht van de test 1 β hangt af van de echte waarde van de parameter ω Hoe dichter de echte waarde van ω bij ω 0 hoe moeilijker het wordt om de valse hypothese te verwerpen 1 β α ω 0 machtskromme van een tweezijdige test ω Het testen van hypothesen p 11/52

Keuze α en β Heeft men sterk vertrouwen in de nulhypothese, dan zal men geneigd zijn de kans te beperken dat men de nulhypothese verwerpt, maw men kiest dan een kleine waarde voor α morele en financiële overwegingen Is het verkeerdelijk verwerpen van H 0 kostelijk of kan het ernstige gevolgen hebben, dan kiest men α klein Is het verkeerdelijk aanvaarden van H 0 kostelijk of kan het ernstige gevolgen hebben, dan kiest men β klein Het testen van hypothesen p 12/52

Voorbeeld Stel dat een medisch onderzoek heeft uitgewezen dat als het gemiddelde nicotinegehalte van een sigaret 25 mg of meer bedraagt de kans op longkanker groot is, terwijl de roker relatief veilig is als het gemiddelde nicotinegehalte minder is dan 25 mg Stel dat je roker bent, dat (nog een hele tijd) wil blijven, maar een merk wil kiezen dat relatief veilig is Hoe zou je de hypothesen formuleren? Waarop zul je testen? Hoe kies je α en β? Het testen van hypothesen p 13/52

Voorbeeld Oplossing : is de teststatistiek X, dan is het mogelijk dat - x>25 zelfs al is µ<25 (deze kans neemt vanzelfsprekend toe naarmate µ groter wordt), - x<25 zelfs al is µ>25 (deze kans neemt toe naarmate µ kleiner wordt) H 0 : µ =25 H 1 : µ<25 α K 25 ϕ X (x/µ X = 25) AG P ( X<K µ =25 ) = α β = P ( X>K µ<25 ) x Het testen van hypothesen p 14/52

Het testen van 1 µ 0 nulhypothese? H 0 : µ = µ 0 alternatieve hypothese? H 1 : µ µ 0 : tweezijdige test H 1 : µ<µ 0 : links-eenzijdige test H 1 : µ>µ 0 : rechts-eenzijdige test teststatistiek Y? is X : N(µ, σ), dan Y = T = X µ 0 S/ n 1 de T-test voor 1 gemiddelde waarde is n groot genoeg, dan Y = Z = X µ 0 σ/ n de Z-test voor 1 gemiddelde waarde : T(n 1) : N(0, 1) Het testen van hypothesen p 15/52

De tweezijdige T-test voor 1 µ Voorwaarde : X : N(µ, σ) H 0 : µ = µ 0 H 1 : µ µ 0 Als H 0 waar is, dan is T = X µ 0 S/ n 1 ϕ T (t/µ = µ 0 ) p 2 % P ( T >T p (n 1)) = p 2 % p 100 = α T p (n 1) 0 T p (n 1) t Is t >T p (n 1) dan wordt H 0 verworpen : T(n 1) Besluit : bereken t = x µ 0 s/ n 1 Is t <T p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 16/52

Links-eenzijdige T-test voor 1 µ Voorwaarde : X : N(µ, σ) H 0 : µ = µ 0 H 1 : µ<µ 0 Als H 0 waar is, dan is T = X µ 0 S/ n 1 P (T < T 2 p (n 1)) = ϕ T (t/µ = µ 0 ) p% T 2p (n 1) 0 : T(n 1) p 100 = α Is t< T 2 p (n 1) dan wordt H 0 verworpen t Besluit : bereken t = x µ 0 s/ n 1 Is t> T 2 p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 17/52

Rechts-eenzijdige T-test voor 1 µ Voorwaarde : X : N(µ, σ) H 0 : µ = µ 0 H 1 : µ>µ 0 Als H 0 waar is, dan is T = X µ 0 S/ n 1 ϕ T (t/µ = µ 0 ) P (T >T 2 p (n 1)) = p% p 100 = α 0 T 2p (n 1) t Is t>t 2 p (n 1) dan wordt H 0 verworpen : T(n 1) Besluit : bereken t = x µ 0 s/ n 1 Is t<t 2 p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 18/52

Samenvatting ivm T-test Doel Test op de gemiddelde waarde µ van 1 populatie aan de hand van 1 steekproef van n onafhankelijke steekproefwaarden Voorwaarde De populatie is normaal verdeeld Type test Tweezijdig Eenzijdig links rechts H 0 µ = µ 0 µ = µ 0 µ = µ 0 H 1 µ µ 0 µ<µ 0 µ>µ 0 Verwerpingsgebied t >T p (n 1) t< T 2p (n 1) t>t 2p (n 1) Teststatistiek T = X µ 0 S/ n 1 : T(n 1) Het testen van hypothesen p 19/52

De tweezijdige Z-test voor 1 µ Voorwaarde : n voldoende groot H 0 : µ = µ 0 H 1 : µ µ 0 Als H 0 waar is, dan is Z = X µ 0 σ/ n X µ 0 S/ n 1 p 2 % P ( Z >λ p )= φ Z (z) p 2 % p 100 = α λ p 0 λ p z Is z >λ p, dan wordt H 0 verworpen : N(0, 1) Besluit : bereken z = x µ 0 σ/ n x µ 0 s/ n 1 Is z <λ p, dan wordt H 0 aanvaard Het testen van hypothesen p 20/52

Samenvatting ivm Z-test Doel Voorwaarde Test op de gemiddelde waarde µ van 1 populatie aan de hand van 1 steekproef van n onafhankelijke steekproefwaarden De populatie is willekeurig verdeeld n is voldoende groot Type test Tweezijdig Eenzijdig links rechts H 0 µ = µ 0 µ = µ 0 µ = µ 0 H 1 µ µ 0 µ<µ 0 µ>µ 0 Verwerpingsgebied z >λ p z< λ 2p z>λ 2p Teststatistiek Z = X µ 0 S/ n 1 : N(0, 1) Het testen van hypothesen p 21/52

Het testen van µ X µ Y nulhypothese? H 0 : µ X µ Y = alternatieve hypothese? H 1 : µ X µ Y : tweezijdige test H 1 : µ X µ Y < : links-eenzijdige test H 1 : µ X µ Y > : rechts-eenzijdige test teststatistiek Y? zijn X : N(µ X,σ) en Y : N(µ Y,σ) onafhankelijk? T-test voor het verschil van twee gemiddelde waarden zijn n X en n Y groot genoeg? Z-test voor het verschil van twee gemiddelde waarden Het testen van hypothesen p 22/52

Tweezijdige T-test voor µ X µ Y ϕ X (x) ϕ Y (y) Voorwaarden : X : N(µ X,σ) en Y : N(µ Y,σ) zijn onafhankelijk N(µ X,σ) N(µ Y,σ) H 0 : µ X µ Y = µ X µ x, Y y H 1 : µ X µ Y Het testen van hypothesen p 23/52

Tweezijdige T-test voor µ X µ Y Voorwaarden : X : N(µ X,σ) en Y : N(µ Y,σ) zijn onafhank H 0 : µ X µ Y = ( ) σ X : N µ X, nx ( ) σ Y : N µ Y, ( ny X Y : N µ X µ Y, T = σ 2 n X Als H 0 waar is X Y : (X Y ) 1 σ + 1 n X n Y n X SX 2 + n Y SY 2 σ 2 (n X + n Y 2) = + σ2 n Y ) N H 1 : µ X µ Y n X SX 2 : χ 2 (n σ 2 X 1) n Y SY 2 : χ 2 (n σ 2 Y 1) nx S 2 X +n Y S 2 Y (,σ (X Y ) 1 n X + 1 n Y n X S 2 X + n Y S 2 Y n X + n Y 2 : χ 2 (n σ 2 X + n Y 2) 1 + 1 ) n X n Y : T(n X +n Y 2) Het testen van hypothesen p 24/52

Tweezijdige T-test voor µ X µ Y H 0 : µ X µ Y = Als H 0 waar is, is T = (X Y ) 1 + 1 n X n Y n X S 2 X + n Y S 2 Y n X + n Y 2 H 1 : µ X µ Y : T(n X + n Y 2) Besluit : n X n Y (n X + n Y 2) bereken t =((x y) ) (n X s 2 X + n Y s 2 Y )(n X + n Y ) Is t >T p (n X + n Y 2), dan wordt H 0 verworpen Is t <T p (n X + n Y 2), dan wordt H 0 aanvaard Het testen van hypothesen p 25/52

Tweezijdige Z-test voor µ X µ Y ϕ X (x) ϕ Y (y) Voorwaarden : 2 grote steekproeven uit onafhankelijke populaties H 0 : µ X µ Y = µ X µ Y x, ẏ H 1 : µ X µ Y Het testen van hypothesen p 26/52

Tweezijdige Z-test voor µ X µ Y Voorwaarden : 2 grote steekproeven uit onafhankelijke populaties H 0 : µ X µ Y = H 1 : µ X µ Y ( ) ( ) σ X S X X : N µ X, N µ X, ( nx ) ( nx 1) σ S Y Y : N µ Y, N µ Y, ( ny ny ) 1 S 2 X Y : N µ X µ Y, X n X 1 + S2 Y n Y 1 SX Als H 0 waar is X Y : N, 2 n X 1 + S2 Y n Y 1 Besluit : bereken z = Is z >λ p, dan wordt H 0 verworpen x y S 2 X n X 1 + S2 Y n Y 1 Is z <λ p, dan wordt H 0 aanvaard Het testen van hypothesen p 27/52

Voorbeeld : slijtage van 2 types banden t =(x A x B ) Auto Band A Band B 1 106 102 2 98 94 3 123 118 4 97 91 5 88 83 x A =1024 x B =976 s 2 A = 139 H 0 : =0 s2 B =141 H 1 : 0 n A n B (n A + n B 2) (n A s 2 A + n Bs 2 B )(n A + n B ) =057 <T 5(8) H 0 wordt aanvaard 95%BI : µ A µ B =048 ± 193 = [ 145, 241] Klopt dit wel? Het testen van hypothesen p 28/52

Voorbeeld : slijtage van 2 types banden Auto Band A Band B 1 106 102 2 98 94 3 123 118 4 97 91 5 88 83 teken A-B + + + + + H 0 : =0 H 1 : 0 als H 0 waar is, dan is P(A B) =P(A B) = 1 2 P(5 keer +) = P(5 keer ) = ( 1 2 ) 5 003 Op basis van deze tekentest zou men eerder geneigd zijn H 0 te verwerpen, want het significantieniveau is ongeveer 006 Probleem bij T-test? paarsgewijze onafhankelijkheid Het testen van hypothesen p 29/52

Tweezijdige gepaarde T-test Voorwaarde : 2 paarsgewijs afhankelijke steekproeven uit X : N(µ X,σ) en Y : N(µ Y,σ) H 0 : µ X µ Y = H 1 : µ X µ Y ( D = X Y = D : N µ X µ Y, σ ) D nsd 2 : χ 2 (n 1) n σd 2 T = D (µ X µ Y ) σ D / n ns2 D σ 2 D (n 1) = D (µ X µ Y ) S D / n 1 : T(n 1) Als H 0 waar is, dan is T = D S D / : T(n 1) n 1 Besluit : bereken t = d s D / n 1 Is t >T p (n 1) dan wordt H 0 verworpen Is t <T p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 30/52

Voorbeeld : slijtage van 2 types banden Auto Band A Band B 1 106 102 2 98 94 3 123 118 4 97 91 5 88 83 x A =1024 x B =976 D 04 04 05 06 05 d =048 s D =00748 H 0 : =0 H 1 : 0 t = d s D / n 1 =1283 >T 5(4) = 2776 Dit is een zeer significant testresultaat : H 0 wordt verworpen Het significantieniveau bedraagt zelfs minder dan 05 want T 05 (4) = 559 < 1283 Het testen van hypothesen p 31/52

Samenvatting gepaarde T-test Doel Voorwaarde Test op het verschil van 2 gemiddelde waarden aan de hand van 2 steekproeven van grootte n met paarsgewijs afhankelijke steekproefwaarden Beide populaties zijn normaal verdeeld en hebben dezelfde σ De enige afhankelijkheid is paarsgewijs Type test Tweezijdig Eenzijdig links rechts H 0 µ X µ Y = µ X µ Y = µ X µ Y = H 1 µ X µ Y µ X µ Y < µ X µ Y > Verwerp geb t >T p (n 1) t< T 2p (n 1) t>t 2p (n 1) Teststatistiek T = X Y S X Y n 1 : T(n 1) Het testen van hypothesen p 32/52

De tweezijdige χ 2 -test voor 1 σ Voorwaarde : X : N(µ, σ) H 0 : σ = σ 0 H 1 : σ σ 0 Als H 0 waar is, dan is χ 2 = ns2 : χ 2 (n 1) σ0 2 P ( χ 2 p 1 (n 1) <χ 2 <χ 2 p 2 (n 1) ) = p 1 p 2 =1 α 100 ϕ ns 2 σ 2 0 (t) χ 2 p 2 (n 1) χ 2 p 1 (n 1) t Besluit : bereken χ 2 = ns2 σ0 2 Is χ 2 [χ 2 p 1 (n 1), χ 2 p 2 (n 1)] dan wordt H 0 verworpen Is χ 2 [χ 2 p 1 (n 1), χ 2 p 2 (n 1)] dan wordt H 0 aanvaard Het testen van hypothesen p 33/52

De links-eenz χ 2 -test voor 1 σ Voorwaarde : X : N(µ, σ) H 0 : σ = σ 0 H 1 : σ<σ 0 Als H 0 waar is, dan is χ 2 = ns2 : χ 2 (n 1) σ0 2 Is σ = σ 1 <σ 0, dan is E[χ 2 ]= σ2 1 E[ ns2 ] <n 1 σ0 2 σ1 2 P ( χ 2 100 p(n 1) <χ 2) = 100 p 100 =1 α ϕ ns 2 σ 2 0 (t) Besluit : bereken χ 2 100 p (n 1) t χ 2 = ns2 σ 2 0 Is χ 2 <χ 2 100 p(n 1) dan wordt H 0 verworpen Is χ 2 >χ 2 100 p(n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 34/52

Samenvatting χ 2 test voor 1 σ Doel Voorwaarde Test op de variantie σ 2 van 1 populatie aan de hand van 1 steekproef van n onafhankelijke steekproefwaarden De populatie is normaal verdeeld Type test Tweezijdig Eenzijdig links rechts H 0 σ 2 = σ 2 0 σ 2 = σ 2 0 σ 2 = σ 2 0 H 1 σ 2 σ 2 0 σ 2 <σ 2 0 σ 2 >σ 2 0 Verwerpingsgebied χ 2 >χ 2 p/2 en χ2 <χ 2 100 p/2 χ 2 <χ 2 100 p χ 2 >χ 2 p Teststatistiek χ 2 = ns2 σ 2 0 : χ 2 (n 1) Het testen van hypothesen p 35/52

De F-test voor de verhouding van 2 σ s Voorwaarden : X : N(µ X,σ X ) en Y : N(µ Y,σ Y ) onafh noem X de populatie met de grootste S 2 H 0 : σ 2 X = σ2 Y H 1 : σ 2 X σ2 Y n X S 2 X σ 2 X : χ 2 (n X 1) n Y S 2 Y σ 2 Y : χ 2 (n Y 1) n X S 2 X F X, Y = (n X 1) σ 2 X n Y S 2 Y (n Y 1) σ 2 Y = S 2 X S 2 Y σy 2 σx 2 : F(n X 1,n Y 1) Als H 0 waar is, dan is F X, Y = S 2 X S 2 Y : F(n X 1,n Y 1) Het testen van hypothesen p 36/52

De F-test voor de verhouding van 2 σ s Voorwaarden : X : N(µ X,σ X ) en Y : N(µ Y,σ Y ) onafh noem X de populatie met de grootste S 2 H 0 : σ 2 X = σ2 Y H 1 : σ 2 X σ2 Y Als H 0 waar is, dan is F X, Y = S 2 X ϕ FX, Y (t) S Y 2 α/2 =p/2% 0 F p/2 (n X 1,n Y 1) : F(n X 1,n Y 1) Besluit : bereken f = s 2 X s 2 Y Is f>f p 2 (n X 1,n Y 1), dan wordt H 0 verworpen Is f<f p 2 (n X 1,n Y 1), dan wordt H 0 aanvaard Het testen van hypothesen p 37/52

Samenvatting ivm F-test Doel Voorwaarde Test op de gelijkheid van 2 varianties aan de hand van 2 onafhankelijke steekproeven van n X en n Y steekproefwaarden De twee steekproeven zijn onafhankelijk De populaties zijn normaal verdeeld Type test Tweezijdig Eenzijdig H 0 σ 2 X = σ2 Y σ 2 X = σ2 Y H 1 σ 2 X σ2 Y σ 2 X >σ2 Y Verwerpgeb F X, Y >F p/2 (n X 1,n Y 1) F X, Y >F p (n X 1,n Y 1) Teststatistiek F X, Y = n X S 2 X n X 1 n Y S 2 Y n Y 1 : F(n X 1,n Y 1) Het testen van hypothesen p 38/52

De χ 2 -test van Pearson Een medisch tijdschrift publiceert statistieken die aantonen dat vier belangrijke ziekten - noem ze A, B, C, en D - respectievelijk verantwoordelijk zijn voor 15, 21, 18 en 14 % van alle sterftegevallen die niet te wijten zijn aan ongelukken Een studie van de doodsoorzaken in een ziekenhuis toonde aan dat van 308 niet-accidentele sterftegevallen respectievelijk 43, 76, 85, 21 te wijten waren aan de ziektes A, B, C en D Is er reden om aan te nemen dat de verhoudingen die in het hospitaal worden opgemeten verschillen van de cijfers die in het medisch vakblad werden bekendgemaakt? Het testen van hypothesen p 39/52

De χ 2 -test van Pearson Algemene formulering : Stel dat men beschikt over een steekproef x 1, x 2,, x n uit een bepaalde populatie waarvan verondersteld wordt dat de distributie gegeven wordt door de functie Φ X (x; p 1,, p l ), waarbij p 1, p 2,,p l parameterwaarden voorstellen die uit de steekproef geschat worden Men vraagt zich af of de steekproefwaarnemingen deze veronderstelling bevestigen, maw men vraagt zich af of de populatie in kwestie inderdaad deze distributiewet Φ X bezit goodness of fit test H 0 : De populatie bezit de distributiewet Φ X (x; p 1,, p l ) H 1 : De populatie bezit de distributiewet Φ X (x; p 1,, p l ) niet Het testen van hypothesen p 40/52

De χ 2 -test van Pearson Algemene probleemstelling : Er zijn k klassen met n 1, n 2,, n k waarnemingen met n 1 + n 2 + + n k = n Elke N i is binomiaal verdeeld : µ Ni = nθ i en σn 2 i = nθ i (1 θ i ) Is n voldoende groot (en θ i niet te klein of te groot) Z i = N i nθ i nθi N(0, 1 θ i ) N(0, 1) Z = k Z 2 i = k ( Ni nθ i nθi ) 2 : χ 2 (k l 1) i=1 i=1 Als H 0 waar is, dan zal z klein zijn Besluit : bereken z en verwerp H 0 als z χ 2 p(k l 1) Het testen van hypothesen p 41/52

De χ 2 -test van Pearson A B C D Andere θ i 15 % 21 % 18 % 14 % 32 % nθ i 462 6448 5544 4312 9856 n i 43 76 85 21 85 zi 2 022 198 1576 1135 246 3177 k k z = zi 2 (n i nθ i ) 2 = =3177 >χ 2 nθ 5(4) = 949 i=1 i=1 i Hetgeen in dat particuliere hospitaal wordt geconstateerd wijkt significant af van de gepubliceerde gegevens, maw H 0 wordt verworpen Het testen van hypothesen p 42/52

Contingentietabellen kruistabellen In een productieproces worden fouten geconstateerd Deze fouten kunnen geklassicificeerd worden volgens het type defect en anderzijds ook volgens de productieploeg die ze heeft vervaardigd De vraag die men zich nu hierbij stelt is : hangt de aard van de productiefout af van ploeg tot ploeg? Type Defect Shift A B C D Totaal 1 15 21 45 13 94 2 26 31 34 5 96 3 33 17 49 20 119 Totaal 74 69 128 38 309 Het testen van hypothesen p 43/52

Contingentietabellen kruistabellen H 0 : de classificaties zijn onafhankelijk H 1 : de classificaties zijn afhankelijk Neem als voorbeeld de cel (1, A) De absolute frequentie N 1A van cel (1, A) is binomiaal verdeeld θ 1A = P(een defect door shift 1 van type A) Als H 0 waar is, dan is P(defect door shift 1 van type A) = P(defect door shift 1) P(defect van type A) θ 1A = θ 1 θ A Vraag : wat zijn θ 1 en θ A? θ 1 en θ A moeten geschat worden Het testen van hypothesen p 44/52

Contingentietabellen kruistabellen Type Defect Shift A B C D Totaal 1 15(2251) 21 (2099) 45 (3894) 13 (1156) 94 ˆθ1 = 94 309 2 26(2299) 31 (2144) 34 (3977) 5 (1181) 96 ˆθ2 = 96 309 3 33(2850) 17 (2657) 49 (4929) 20 (1463) 119 ˆθ 3 = 119 309 Totaal 74 69 128 38 309 χ 2 = θˆ A = 74 θˆ 309 B = 69 θˆ 309 C = 128 θˆ 309 D = 38 309 µ 1A ˆn 1A = nθ 1A = nθ 1 θ A = 309 74 309 r c χ 2 (N ij ˆn ij ) 2 = i=1 (15 2251)2 2251 j=1 + 94 309 ˆn ij : χ 2 (k l 1) (26 2299)2 2299 (20 1463)2 ++ 1463 =1918 Het testen van hypothesen p 45/52

Contingentietabellen kruistabellen H 0 : de classificaties zijn onafhankelijk H 1 : de classificaties zijn afhankelijk χ 2 = r i=1 c j=1 (N ij ˆn ij ) 2 ˆn ij =1918 : χ 2 (k l 1) k = rc l=(r 1) + (c 1) k l 1=(r 1) (c 1) 1918 >χ 2 5(6) = 125916 Voor α =005 wordt H 0 verworpen, maw de classificaties zijn afhankelijk Het testen van hypothesen p 46/52

Probabiliteitsplot Is een gegeven steekproef afkomstig uit een populatie met een gegeven distributiewet? Deze vraag kan beantwoord worden mbv een probabiliteitsplot Q-Q plot : kwantielen van de gegeven steekproef worden uitgezet tov de kwantielen van de distributie P-P plot : cumulatieve proporties van de gegeven steekproef worden uitgezet tov de cumulatieve proporties van de distributie probitdiagram : kwantielen worden uitgezet tov cumulatieve proporties Indien de steekproef uit een populatie met de gegeven distributiewet komt, liggen de uitgezette punten rond een rechte Het testen van hypothesen p 47/52

Probitdiagram Doel : langs grafische weg testen of een steekproef van n onafhankelijke steekproefwaarden x 1,x 2,,x n uit een normaal verdeelde populatie komt ( ) x µ X : N(µ, σ) = y(x) =Φ X (x) = Ψ σ y(x)(%) z(x) z(x) =Ψ 1 (Φ X (x)) = x µ σ 97725 +2 84134 +1 50000 0 15866 1 2275 2 µ 2σµ σ µ µ + σ µ +2σ x Het testen van hypothesen p 48/52

Probitdiagram en T -verdelingen Φ T (t) 8 6 4 2 0 2 4 6 8 t 99 95 90 80 70 60 50 40 30 20 10 5 1 n =1 n =4 n =10 n = 100 Het testen van hypothesen p 49/52

P-P plot gewicht van de mannen Normal P-P Plot of GEWICHT 100 75 50 Expected Cum Prob 25 000 000 25 50 75 100 Observed Cum Prob Het testen van hypothesen p 50/52

Q-Q plot gewicht van de mannen Normal Q-Q Plot of GEWICHT 100 90 80 Expected Normal Value 70 60 50 40 40 50 60 70 80 90 100 Observed Value Het testen van hypothesen p 51/52

Probitdiagram Dit is een normaliteitstest H 0 : X :N(µ, σ) en H 1 : X : niet N(µ, σ) H 0 wordt aanvaard als alle punten binnen een beperkt gebied rond een rechte liggen α : omwille van het niet op een rechte liggen van de punten in het probitdiagram weigeren te erkennen dat de steekproef uit een N(µ, σ) populatie komt als dat wel zo is β : toegeven dat de steekproef uit een N(µ, σ) populatie komt (omdat de bepaalde punten lijken op een rechte te liggen) als dat niet zo is Het testen van hypothesen p 52/52