Hoofdstuk 10 : Het testen van hypothesen. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Maat: px
Weergave met pagina beginnen:

Download "Hoofdstuk 10 : Het testen van hypothesen. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent."

Transcriptie

1 Hoofdstuk 10 : Het testen van hypothesen Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Het testen van hypothesen p 1/52

2 Een statistische test Doel : het testen van een hypothese omtrent de waarden van één of meer populatieparameters Een statistische test wordt bepaald door 4 elementen : de nulhypothese H 0 : ω=ω 0 proberen te weerleggen door een redenering uit het ongerijmde de alternatieve hypothese H 1 wordt door de onderzoeker gesteund de teststatistiek Een veranderlijke die berekend wordt uit de steekproef het verwerpingsgebied Als de waarde van de teststatistiek hierin valt verwerpen we de nulhypothese Het testen van hypothesen p 2/52

3 Een statistische test De beslissing om de nulhypothese te verwerpen of te aanvaarden is gebaseerd op informatie uit een steekproef, getrokken uit de populatie waarover de hypothese is geformuleerd De steekproefwaarden worden gebruikt om één enkele waarde, corresponderend met een punt op een lijn, van een teststatistiek te berekenen Deze waarde zal de beslissing bepalen Daartoe worden alle waarden die de teststatistiek kan aannemen, verdeeld in twee gebieden : het gebied van waarden dat de alternatieve hypothese ondersteunt wordt het verwerpingsgebied (VG) genoemd, het gebied dat waarden bevat die de nulhypothese bijtreden wordt het aanvaardingsgebied (AG) genoemd Het testen van hypothesen p 3/52

4 Een statistische test Indien de waarde van de teststatistiek ligt in het verwerpingsgebied, dan wordt de nulhypothese verworpen en de alternatieve hypothese aanvaard Indien de waarde van de teststatistiek in het aanvaardingsgebied valt, dan doen zich twee mogelijkheden voor : ofwel wordt de nulhypothese aanvaard, ofwel wordt beslist dat de test geen besluit toelaat H 0 aanvaarden betekent H 0 (nog) niet verwerpen Het testen van hypothesen p 4/52

5 Een- of tweezijdig testen Stel : we willen H 0 verwerpen zodra de waarde y van de teststatistiek Y groter is dan ω 0 H 0 : ω = ω 0 H 1 : ω>ω 0 We verwerpen de nulhypothese als y te groot wordt te groot : groter dan de zgn kritische waarde die de grens bepaalt tussen AG en VG verwerpingsgebied = kritisch gebied Het testen van hypothesen p 5/52

6 Opmerking Als H 1 : ω>ω 0, dan stellen we niet H 0 : ω ω 0 maar H 0 : ω = ω 0 Immers, de alternatieve hypothese drukt reeds uit dat we alleen te grote waarden willen opsporen Als we reeds de hypothese H 0 : ω = ω 0 verwerpen ten voordele van H 1 : ω>ω 0, dan verwerpen we zeker de hypothese H 0 : ω<ω 0 Het testen van hypothesen p 6/52

7 1- of 2-zijdig y ω 0 ω c1 ω c2 (a) ϕ Y (y/ω = ω 0 ) ω 0 tweezijdige test H 0 : ω = ω 0 H 1 : ω ω 0 y ω c (b) ϕ Y (y/ω = ω 0 ) ω 0 links-eenzijdige test H 0 : ω = ω 0 H 1 : ω<ω 0 y ω c ω 0 (c) ϕ Y (y/ω = ω 0 ) rechts-eenzijdige test H 0 : ω = ω 0 H 1 : ω>ω 0 Het testen van hypothesen p 7/52

8 Fout van eerste en tweede soort Een fout van de eerste soort in een statistische test treedt op indien een ware nulhypothese wordt verworpen (omdat de waarde van de teststatistiek in het verwerpingsgebied ligt) α =P(H 0 verwerpen H 0 waar) Een fout van de tweede soort in een statistische test treedt op indien een valse nulhypothese wordt aanvaard (omdat de waarde van de teststatistiek in het aanvaardingsgebied valt) terwijl een alternatieve hypothese waar is β =P(H 0 aanvaarden H 0 vals) Het testen van hypothesen p 8/52

9 Fout van eerste en tweede soort Nulhypothese Besluit Waar Vals Verwerp P(verwerp H 0 H 0 waar)= α P(verwerp H 0 H 0 vals)= 1 β H 0 Fout van eerste soort Correct besluit Aanvaard P(aanvaard H 0 H 0 waar)= 1 α P(aanvaard H 0 H 0 vals)= β H 0 Correct besluit Fout van tweede soort Het testen van hypothesen p 9/52

10 Voorbeeld x µ 0 α/2 α/2 AG ϕ X (x/µ X = µ 0 ) x µ 1 β AG ϕ X (x/µ X = µ 1 ) Als α daalt, wordt AG groter, zodat β stijgt Besluit : α en β kunnen, bij een gegeven n, niet tegelijkertijd willekeurig klein gemaakt worden Het testen van hypothesen p 10/52

11 Macht van een test H 0 : ω = ω 0 β = P(H 0 aanvaarden H 0 vals) 1 β = P(H 0 verwerpen H 0 vals) = de macht van de test 1 β hangt af van de echte waarde van de parameter ω Hoe dichter de echte waarde van ω bij ω 0 hoe moeilijker het wordt om de valse hypothese te verwerpen 1 β α ω 0 machtskromme van een tweezijdige test ω Het testen van hypothesen p 11/52

12 Keuze α en β Heeft men sterk vertrouwen in de nulhypothese, dan zal men geneigd zijn de kans te beperken dat men de nulhypothese verwerpt, maw men kiest dan een kleine waarde voor α morele en financiële overwegingen Is het verkeerdelijk verwerpen van H 0 kostelijk of kan het ernstige gevolgen hebben, dan kiest men α klein Is het verkeerdelijk aanvaarden van H 0 kostelijk of kan het ernstige gevolgen hebben, dan kiest men β klein Het testen van hypothesen p 12/52

13 Voorbeeld Stel dat een medisch onderzoek heeft uitgewezen dat als het gemiddelde nicotinegehalte van een sigaret 25 mg of meer bedraagt de kans op longkanker groot is, terwijl de roker relatief veilig is als het gemiddelde nicotinegehalte minder is dan 25 mg Stel dat je roker bent, dat (nog een hele tijd) wil blijven, maar een merk wil kiezen dat relatief veilig is Hoe zou je de hypothesen formuleren? Waarop zul je testen? Hoe kies je α en β? Het testen van hypothesen p 13/52

14 Voorbeeld Oplossing : is de teststatistiek X, dan is het mogelijk dat - x>25 zelfs al is µ<25 (deze kans neemt vanzelfsprekend toe naarmate µ groter wordt), - x<25 zelfs al is µ>25 (deze kans neemt toe naarmate µ kleiner wordt) H 0 : µ =25 H 1 : µ<25 α K 25 ϕ X (x/µ X = 25) AG P ( X<K µ =25 ) = α β = P ( X>K µ<25 ) x Het testen van hypothesen p 14/52

15 Het testen van 1 µ 0 nulhypothese? H 0 : µ = µ 0 alternatieve hypothese? H 1 : µ µ 0 : tweezijdige test H 1 : µ<µ 0 : links-eenzijdige test H 1 : µ>µ 0 : rechts-eenzijdige test teststatistiek Y? is X : N(µ, σ), dan Y = T = X µ 0 S/ n 1 de T-test voor 1 gemiddelde waarde is n groot genoeg, dan Y = Z = X µ 0 σ/ n de Z-test voor 1 gemiddelde waarde : T(n 1) : N(0, 1) Het testen van hypothesen p 15/52

16 De tweezijdige T-test voor 1 µ Voorwaarde : X : N(µ, σ) H 0 : µ = µ 0 H 1 : µ µ 0 Als H 0 waar is, dan is T = X µ 0 S/ n 1 ϕ T (t/µ = µ 0 ) p 2 % P ( T >T p (n 1)) = p 2 % p 100 = α T p (n 1) 0 T p (n 1) t Is t >T p (n 1) dan wordt H 0 verworpen : T(n 1) Besluit : bereken t = x µ 0 s/ n 1 Is t <T p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 16/52

17 Links-eenzijdige T-test voor 1 µ Voorwaarde : X : N(µ, σ) H 0 : µ = µ 0 H 1 : µ<µ 0 Als H 0 waar is, dan is T = X µ 0 S/ n 1 P (T < T 2 p (n 1)) = ϕ T (t/µ = µ 0 ) p% T 2p (n 1) 0 : T(n 1) p 100 = α Is t< T 2 p (n 1) dan wordt H 0 verworpen t Besluit : bereken t = x µ 0 s/ n 1 Is t> T 2 p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 17/52

18 Rechts-eenzijdige T-test voor 1 µ Voorwaarde : X : N(µ, σ) H 0 : µ = µ 0 H 1 : µ>µ 0 Als H 0 waar is, dan is T = X µ 0 S/ n 1 ϕ T (t/µ = µ 0 ) P (T >T 2 p (n 1)) = p% p 100 = α 0 T 2p (n 1) t Is t>t 2 p (n 1) dan wordt H 0 verworpen : T(n 1) Besluit : bereken t = x µ 0 s/ n 1 Is t<t 2 p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 18/52

19 Samenvatting ivm T-test Doel Test op de gemiddelde waarde µ van 1 populatie aan de hand van 1 steekproef van n onafhankelijke steekproefwaarden Voorwaarde De populatie is normaal verdeeld Type test Tweezijdig Eenzijdig links rechts H 0 µ = µ 0 µ = µ 0 µ = µ 0 H 1 µ µ 0 µ<µ 0 µ>µ 0 Verwerpingsgebied t >T p (n 1) t< T 2p (n 1) t>t 2p (n 1) Teststatistiek T = X µ 0 S/ n 1 : T(n 1) Het testen van hypothesen p 19/52

20 De tweezijdige Z-test voor 1 µ Voorwaarde : n voldoende groot H 0 : µ = µ 0 H 1 : µ µ 0 Als H 0 waar is, dan is Z = X µ 0 σ/ n X µ 0 S/ n 1 p 2 % P ( Z >λ p )= φ Z (z) p 2 % p 100 = α λ p 0 λ p z Is z >λ p, dan wordt H 0 verworpen : N(0, 1) Besluit : bereken z = x µ 0 σ/ n x µ 0 s/ n 1 Is z <λ p, dan wordt H 0 aanvaard Het testen van hypothesen p 20/52

21 Samenvatting ivm Z-test Doel Voorwaarde Test op de gemiddelde waarde µ van 1 populatie aan de hand van 1 steekproef van n onafhankelijke steekproefwaarden De populatie is willekeurig verdeeld n is voldoende groot Type test Tweezijdig Eenzijdig links rechts H 0 µ = µ 0 µ = µ 0 µ = µ 0 H 1 µ µ 0 µ<µ 0 µ>µ 0 Verwerpingsgebied z >λ p z< λ 2p z>λ 2p Teststatistiek Z = X µ 0 S/ n 1 : N(0, 1) Het testen van hypothesen p 21/52

22 Het testen van µ X µ Y nulhypothese? H 0 : µ X µ Y = alternatieve hypothese? H 1 : µ X µ Y : tweezijdige test H 1 : µ X µ Y < : links-eenzijdige test H 1 : µ X µ Y > : rechts-eenzijdige test teststatistiek Y? zijn X : N(µ X,σ) en Y : N(µ Y,σ) onafhankelijk? T-test voor het verschil van twee gemiddelde waarden zijn n X en n Y groot genoeg? Z-test voor het verschil van twee gemiddelde waarden Het testen van hypothesen p 22/52

23 Tweezijdige T-test voor µ X µ Y ϕ X (x) ϕ Y (y) Voorwaarden : X : N(µ X,σ) en Y : N(µ Y,σ) zijn onafhankelijk N(µ X,σ) N(µ Y,σ) H 0 : µ X µ Y = µ X µ x, Y y H 1 : µ X µ Y Het testen van hypothesen p 23/52

24 Tweezijdige T-test voor µ X µ Y Voorwaarden : X : N(µ X,σ) en Y : N(µ Y,σ) zijn onafhank H 0 : µ X µ Y = ( ) σ X : N µ X, nx ( ) σ Y : N µ Y, ( ny X Y : N µ X µ Y, T = σ 2 n X Als H 0 waar is X Y : (X Y ) 1 σ + 1 n X n Y n X SX 2 + n Y SY 2 σ 2 (n X + n Y 2) = + σ2 n Y ) N H 1 : µ X µ Y n X SX 2 : χ 2 (n σ 2 X 1) n Y SY 2 : χ 2 (n σ 2 Y 1) nx S 2 X +n Y S 2 Y (,σ (X Y ) 1 n X + 1 n Y n X S 2 X + n Y S 2 Y n X + n Y 2 : χ 2 (n σ 2 X + n Y 2) ) n X n Y : T(n X +n Y 2) Het testen van hypothesen p 24/52

25 Tweezijdige T-test voor µ X µ Y H 0 : µ X µ Y = Als H 0 waar is, is T = (X Y ) n X n Y n X S 2 X + n Y S 2 Y n X + n Y 2 H 1 : µ X µ Y : T(n X + n Y 2) Besluit : n X n Y (n X + n Y 2) bereken t =((x y) ) (n X s 2 X + n Y s 2 Y )(n X + n Y ) Is t >T p (n X + n Y 2), dan wordt H 0 verworpen Is t <T p (n X + n Y 2), dan wordt H 0 aanvaard Het testen van hypothesen p 25/52

26 Tweezijdige Z-test voor µ X µ Y ϕ X (x) ϕ Y (y) Voorwaarden : 2 grote steekproeven uit onafhankelijke populaties H 0 : µ X µ Y = µ X µ Y x, ẏ H 1 : µ X µ Y Het testen van hypothesen p 26/52

27 Tweezijdige Z-test voor µ X µ Y Voorwaarden : 2 grote steekproeven uit onafhankelijke populaties H 0 : µ X µ Y = H 1 : µ X µ Y ( ) ( ) σ X S X X : N µ X, N µ X, ( nx ) ( nx 1) σ S Y Y : N µ Y, N µ Y, ( ny ny ) 1 S 2 X Y : N µ X µ Y, X n X 1 + S2 Y n Y 1 SX Als H 0 waar is X Y : N, 2 n X 1 + S2 Y n Y 1 Besluit : bereken z = Is z >λ p, dan wordt H 0 verworpen x y S 2 X n X 1 + S2 Y n Y 1 Is z <λ p, dan wordt H 0 aanvaard Het testen van hypothesen p 27/52

28 Voorbeeld : slijtage van 2 types banden t =(x A x B ) Auto Band A Band B x A =1024 x B =976 s 2 A = 139 H 0 : =0 s2 B =141 H 1 : 0 n A n B (n A + n B 2) (n A s 2 A + n Bs 2 B )(n A + n B ) =057 <T 5(8) H 0 wordt aanvaard 95%BI : µ A µ B =048 ± 193 = [ 145, 241] Klopt dit wel? Het testen van hypothesen p 28/52

29 Voorbeeld : slijtage van 2 types banden Auto Band A Band B teken A-B H 0 : =0 H 1 : 0 als H 0 waar is, dan is P(A B) =P(A B) = 1 2 P(5 keer +) = P(5 keer ) = ( 1 2 ) Op basis van deze tekentest zou men eerder geneigd zijn H 0 te verwerpen, want het significantieniveau is ongeveer 006 Probleem bij T-test? paarsgewijze onafhankelijkheid Het testen van hypothesen p 29/52

30 Tweezijdige gepaarde T-test Voorwaarde : 2 paarsgewijs afhankelijke steekproeven uit X : N(µ X,σ) en Y : N(µ Y,σ) H 0 : µ X µ Y = H 1 : µ X µ Y ( D = X Y = D : N µ X µ Y, σ ) D nsd 2 : χ 2 (n 1) n σd 2 T = D (µ X µ Y ) σ D / n ns2 D σ 2 D (n 1) = D (µ X µ Y ) S D / n 1 : T(n 1) Als H 0 waar is, dan is T = D S D / : T(n 1) n 1 Besluit : bereken t = d s D / n 1 Is t >T p (n 1) dan wordt H 0 verworpen Is t <T p (n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 30/52

31 Voorbeeld : slijtage van 2 types banden Auto Band A Band B x A =1024 x B =976 D d =048 s D =00748 H 0 : =0 H 1 : 0 t = d s D / n 1 =1283 >T 5(4) = 2776 Dit is een zeer significant testresultaat : H 0 wordt verworpen Het significantieniveau bedraagt zelfs minder dan 05 want T 05 (4) = 559 < 1283 Het testen van hypothesen p 31/52

32 Samenvatting gepaarde T-test Doel Voorwaarde Test op het verschil van 2 gemiddelde waarden aan de hand van 2 steekproeven van grootte n met paarsgewijs afhankelijke steekproefwaarden Beide populaties zijn normaal verdeeld en hebben dezelfde σ De enige afhankelijkheid is paarsgewijs Type test Tweezijdig Eenzijdig links rechts H 0 µ X µ Y = µ X µ Y = µ X µ Y = H 1 µ X µ Y µ X µ Y < µ X µ Y > Verwerp geb t >T p (n 1) t< T 2p (n 1) t>t 2p (n 1) Teststatistiek T = X Y S X Y n 1 : T(n 1) Het testen van hypothesen p 32/52

33 De tweezijdige χ 2 -test voor 1 σ Voorwaarde : X : N(µ, σ) H 0 : σ = σ 0 H 1 : σ σ 0 Als H 0 waar is, dan is χ 2 = ns2 : χ 2 (n 1) σ0 2 P ( χ 2 p 1 (n 1) <χ 2 <χ 2 p 2 (n 1) ) = p 1 p 2 =1 α 100 ϕ ns 2 σ 2 0 (t) χ 2 p 2 (n 1) χ 2 p 1 (n 1) t Besluit : bereken χ 2 = ns2 σ0 2 Is χ 2 [χ 2 p 1 (n 1), χ 2 p 2 (n 1)] dan wordt H 0 verworpen Is χ 2 [χ 2 p 1 (n 1), χ 2 p 2 (n 1)] dan wordt H 0 aanvaard Het testen van hypothesen p 33/52

34 De links-eenz χ 2 -test voor 1 σ Voorwaarde : X : N(µ, σ) H 0 : σ = σ 0 H 1 : σ<σ 0 Als H 0 waar is, dan is χ 2 = ns2 : χ 2 (n 1) σ0 2 Is σ = σ 1 <σ 0, dan is E[χ 2 ]= σ2 1 E[ ns2 ] <n 1 σ0 2 σ1 2 P ( χ p(n 1) <χ 2) = 100 p 100 =1 α ϕ ns 2 σ 2 0 (t) Besluit : bereken χ p (n 1) t χ 2 = ns2 σ 2 0 Is χ 2 <χ p(n 1) dan wordt H 0 verworpen Is χ 2 >χ p(n 1) dan wordt H 0 aanvaard Het testen van hypothesen p 34/52

35 Samenvatting χ 2 test voor 1 σ Doel Voorwaarde Test op de variantie σ 2 van 1 populatie aan de hand van 1 steekproef van n onafhankelijke steekproefwaarden De populatie is normaal verdeeld Type test Tweezijdig Eenzijdig links rechts H 0 σ 2 = σ 2 0 σ 2 = σ 2 0 σ 2 = σ 2 0 H 1 σ 2 σ 2 0 σ 2 <σ 2 0 σ 2 >σ 2 0 Verwerpingsgebied χ 2 >χ 2 p/2 en χ2 <χ p/2 χ 2 <χ p χ 2 >χ 2 p Teststatistiek χ 2 = ns2 σ 2 0 : χ 2 (n 1) Het testen van hypothesen p 35/52

36 De F-test voor de verhouding van 2 σ s Voorwaarden : X : N(µ X,σ X ) en Y : N(µ Y,σ Y ) onafh noem X de populatie met de grootste S 2 H 0 : σ 2 X = σ2 Y H 1 : σ 2 X σ2 Y n X S 2 X σ 2 X : χ 2 (n X 1) n Y S 2 Y σ 2 Y : χ 2 (n Y 1) n X S 2 X F X, Y = (n X 1) σ 2 X n Y S 2 Y (n Y 1) σ 2 Y = S 2 X S 2 Y σy 2 σx 2 : F(n X 1,n Y 1) Als H 0 waar is, dan is F X, Y = S 2 X S 2 Y : F(n X 1,n Y 1) Het testen van hypothesen p 36/52

37 De F-test voor de verhouding van 2 σ s Voorwaarden : X : N(µ X,σ X ) en Y : N(µ Y,σ Y ) onafh noem X de populatie met de grootste S 2 H 0 : σ 2 X = σ2 Y H 1 : σ 2 X σ2 Y Als H 0 waar is, dan is F X, Y = S 2 X ϕ FX, Y (t) S Y 2 α/2 =p/2% 0 F p/2 (n X 1,n Y 1) : F(n X 1,n Y 1) Besluit : bereken f = s 2 X s 2 Y Is f>f p 2 (n X 1,n Y 1), dan wordt H 0 verworpen Is f<f p 2 (n X 1,n Y 1), dan wordt H 0 aanvaard Het testen van hypothesen p 37/52

38 Samenvatting ivm F-test Doel Voorwaarde Test op de gelijkheid van 2 varianties aan de hand van 2 onafhankelijke steekproeven van n X en n Y steekproefwaarden De twee steekproeven zijn onafhankelijk De populaties zijn normaal verdeeld Type test Tweezijdig Eenzijdig H 0 σ 2 X = σ2 Y σ 2 X = σ2 Y H 1 σ 2 X σ2 Y σ 2 X >σ2 Y Verwerpgeb F X, Y >F p/2 (n X 1,n Y 1) F X, Y >F p (n X 1,n Y 1) Teststatistiek F X, Y = n X S 2 X n X 1 n Y S 2 Y n Y 1 : F(n X 1,n Y 1) Het testen van hypothesen p 38/52

39 De χ 2 -test van Pearson Een medisch tijdschrift publiceert statistieken die aantonen dat vier belangrijke ziekten - noem ze A, B, C, en D - respectievelijk verantwoordelijk zijn voor 15, 21, 18 en 14 % van alle sterftegevallen die niet te wijten zijn aan ongelukken Een studie van de doodsoorzaken in een ziekenhuis toonde aan dat van 308 niet-accidentele sterftegevallen respectievelijk 43, 76, 85, 21 te wijten waren aan de ziektes A, B, C en D Is er reden om aan te nemen dat de verhoudingen die in het hospitaal worden opgemeten verschillen van de cijfers die in het medisch vakblad werden bekendgemaakt? Het testen van hypothesen p 39/52

40 De χ 2 -test van Pearson Algemene formulering : Stel dat men beschikt over een steekproef x 1, x 2,, x n uit een bepaalde populatie waarvan verondersteld wordt dat de distributie gegeven wordt door de functie Φ X (x; p 1,, p l ), waarbij p 1, p 2,,p l parameterwaarden voorstellen die uit de steekproef geschat worden Men vraagt zich af of de steekproefwaarnemingen deze veronderstelling bevestigen, maw men vraagt zich af of de populatie in kwestie inderdaad deze distributiewet Φ X bezit goodness of fit test H 0 : De populatie bezit de distributiewet Φ X (x; p 1,, p l ) H 1 : De populatie bezit de distributiewet Φ X (x; p 1,, p l ) niet Het testen van hypothesen p 40/52

41 De χ 2 -test van Pearson Algemene probleemstelling : Er zijn k klassen met n 1, n 2,, n k waarnemingen met n 1 + n n k = n Elke N i is binomiaal verdeeld : µ Ni = nθ i en σn 2 i = nθ i (1 θ i ) Is n voldoende groot (en θ i niet te klein of te groot) Z i = N i nθ i nθi N(0, 1 θ i ) N(0, 1) Z = k Z 2 i = k ( Ni nθ i nθi ) 2 : χ 2 (k l 1) i=1 i=1 Als H 0 waar is, dan zal z klein zijn Besluit : bereken z en verwerp H 0 als z χ 2 p(k l 1) Het testen van hypothesen p 41/52

42 De χ 2 -test van Pearson A B C D Andere θ i 15 % 21 % 18 % 14 % 32 % nθ i n i zi k k z = zi 2 (n i nθ i ) 2 = =3177 >χ 2 nθ 5(4) = 949 i=1 i=1 i Hetgeen in dat particuliere hospitaal wordt geconstateerd wijkt significant af van de gepubliceerde gegevens, maw H 0 wordt verworpen Het testen van hypothesen p 42/52

43 Contingentietabellen kruistabellen In een productieproces worden fouten geconstateerd Deze fouten kunnen geklassicificeerd worden volgens het type defect en anderzijds ook volgens de productieploeg die ze heeft vervaardigd De vraag die men zich nu hierbij stelt is : hangt de aard van de productiefout af van ploeg tot ploeg? Type Defect Shift A B C D Totaal Totaal Het testen van hypothesen p 43/52

44 Contingentietabellen kruistabellen H 0 : de classificaties zijn onafhankelijk H 1 : de classificaties zijn afhankelijk Neem als voorbeeld de cel (1, A) De absolute frequentie N 1A van cel (1, A) is binomiaal verdeeld θ 1A = P(een defect door shift 1 van type A) Als H 0 waar is, dan is P(defect door shift 1 van type A) = P(defect door shift 1) P(defect van type A) θ 1A = θ 1 θ A Vraag : wat zijn θ 1 en θ A? θ 1 en θ A moeten geschat worden Het testen van hypothesen p 44/52

45 Contingentietabellen kruistabellen Type Defect Shift A B C D Totaal 1 15(2251) 21 (2099) 45 (3894) 13 (1156) 94 ˆθ1 = (2299) 31 (2144) 34 (3977) 5 (1181) 96 ˆθ2 = (2850) 17 (2657) 49 (4929) 20 (1463) 119 ˆθ 3 = Totaal χ 2 = θˆ A = 74 θˆ 309 B = 69 θˆ 309 C = 128 θˆ 309 D = µ 1A ˆn 1A = nθ 1A = nθ 1 θ A = r c χ 2 (N ij ˆn ij ) 2 = i=1 ( ) j= ˆn ij : χ 2 (k l 1) ( ) ( ) =1918 Het testen van hypothesen p 45/52

46 Contingentietabellen kruistabellen H 0 : de classificaties zijn onafhankelijk H 1 : de classificaties zijn afhankelijk χ 2 = r i=1 c j=1 (N ij ˆn ij ) 2 ˆn ij =1918 : χ 2 (k l 1) k = rc l=(r 1) + (c 1) k l 1=(r 1) (c 1) 1918 >χ 2 5(6) = Voor α =005 wordt H 0 verworpen, maw de classificaties zijn afhankelijk Het testen van hypothesen p 46/52

47 Probabiliteitsplot Is een gegeven steekproef afkomstig uit een populatie met een gegeven distributiewet? Deze vraag kan beantwoord worden mbv een probabiliteitsplot Q-Q plot : kwantielen van de gegeven steekproef worden uitgezet tov de kwantielen van de distributie P-P plot : cumulatieve proporties van de gegeven steekproef worden uitgezet tov de cumulatieve proporties van de distributie probitdiagram : kwantielen worden uitgezet tov cumulatieve proporties Indien de steekproef uit een populatie met de gegeven distributiewet komt, liggen de uitgezette punten rond een rechte Het testen van hypothesen p 47/52

48 Probitdiagram Doel : langs grafische weg testen of een steekproef van n onafhankelijke steekproefwaarden x 1,x 2,,x n uit een normaal verdeelde populatie komt ( ) x µ X : N(µ, σ) = y(x) =Φ X (x) = Ψ σ y(x)(%) z(x) z(x) =Ψ 1 (Φ X (x)) = x µ σ µ 2σµ σ µ µ + σ µ +2σ x Het testen van hypothesen p 48/52

49 Probitdiagram en T -verdelingen Φ T (t) t n =1 n =4 n =10 n = 100 Het testen van hypothesen p 49/52

50 P-P plot gewicht van de mannen Normal P-P Plot of GEWICHT Expected Cum Prob Observed Cum Prob Het testen van hypothesen p 50/52

51 Q-Q plot gewicht van de mannen Normal Q-Q Plot of GEWICHT Expected Normal Value Observed Value Het testen van hypothesen p 51/52

52 Probitdiagram Dit is een normaliteitstest H 0 : X :N(µ, σ) en H 1 : X : niet N(µ, σ) H 0 wordt aanvaard als alle punten binnen een beperkt gebied rond een rechte liggen α : omwille van het niet op een rechte liggen van de punten in het probitdiagram weigeren te erkennen dat de steekproef uit een N(µ, σ) populatie komt als dat wel zo is β : toegeven dat de steekproef uit een N(µ, σ) populatie komt (omdat de bepaalde punten lijken op een rechte te liggen) als dat niet zo is Het testen van hypothesen p 52/52

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4.1 PARAMETERTOESTEN 1 A. Toetsen van het gemiddelde Beschouw een steekproef X 1, X,, X n van n onafhankelijke N(µ, σ) verdeelde kansveranderlijken Men

Nadere informatie

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet? Verklarende Statistiek: Toetsen Zat ik nou in dat kritische gebied of niet? Toetsen, Overzicht Nulhypothese - Alternatieve hypothese (voorbeeld: toets voor p = p o in binomiale steekproef) Betrouwbaarheid

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen 8.1. Stel dat medisch onderzoek heeft uitgewezen dat als het gemiddelde nicotinegehalte van een sigaret 25 mg of meer bedraagt, de kans op longkanker

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN

TECHNISCHE UNIVERSITEIT EINDHOVEN TECHNISCHE UNIVERSITEIT EINDHOVEN Tentamen Biostatistiek voor BMT (2S390) op 17-11-2003 U mag alleen gebruik maken van een onbeschreven Statistisch Compendium (dikt. nr. 2218) en van een zakrekenmachine.

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995

Schriftelijk examen statistiek, data-analyse en informatica. Maandag 29 mei 1995 Schriftelijk examen statistiek, data-analyse en informatica Maandag 29 mei 1995 Tweede jaar kandidaat arts + Tweede jaar kandidaat in de biomedische wetenschappen Naam: Voornaam: Vraa Kengetal g Blad 1

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Toetsen van Hypothesen. Het vaststellen van de hypothese Toetsen van Hypothesen Wisnet-hbo update maart 2008 1. en Het vaststellen van de hypothese De nulhypothese en de Alternatieve hypothese. Het gaat in deze paragraaf puur alleen om de formulering. Er wordt

Nadere informatie

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter. STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden

Nadere informatie

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent. Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26 Regressielijn Vraag : vind het

Nadere informatie

Les 1: Waarschijnlijkheidrekening

Les 1: Waarschijnlijkheidrekening Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het

Nadere informatie

7.1 Toets voor het gemiddelde van een normale verdeling

7.1 Toets voor het gemiddelde van een normale verdeling Hoofdstuk 7 Toetsen van hypothesen Toetsen van hypothesen is, o.a. in de medische en chemische wereld, een veel gebruikte statistische techniek. Het wordt vaak gebruikt om een gevestigde norm eventueel

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Toetsen van hypothesen 1 Het probleem 25 maart 2003 De busmaatschappij De Lijn heeft gemiddeld per dag 20000 reizigers in de stad Antwerpen. Tegenwoordig zijn er heel wat reizigers die proberen met de

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Lesbrief hypothesetoetsen

Lesbrief hypothesetoetsen Lesbrief hypothesetoetsen 00 "Je gaat het pas zien als je het door hebt" Johan Cruijff Willem van Ravenstein Inhoudsopgave Inhoudsopgave... Hoofdstuk - voorkennis... Hoofdstuk - mens erger je niet... 3

Nadere informatie

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015

EXAMEN : Basisbegrippen statistiek. Examen 16 januari 2015 EXAMEN : Basisbegrippen statistiek Examen 16 januari 2015 Oplossingen 1 Vraag 1 a) Leg in max. 3 lijnen uit wat een dichtheidsfunctie is en illustreer met 3 duidelijk verschillende voorbeelden. Een (kans)

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

15.1 Beslissen op grond van een steekproef [1]

15.1 Beslissen op grond van een steekproef [1] 15.1 Beslissen op grond van een steekproef [1] Voorbeeld 1: Een vulmachine vult flessen met een inhoud van X ml. X is normaal verdeeld met μ = 400 en σ = 4 Er wordt een steekproef genomen van 40 flessen.

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 10 Donderdag 20 Oktober 1 / 1 2 Statistiek Vandaag: Hypothese toetsen 2 / 1 3 / 1 Terzijde NU.nl 19 oktober 2011: Veel Facebookvrienden wijst op grotere hersenen. (http://www.nu.nl/wetenschap/2645008/veel-facebookvrienden-wijst-groterehersenen-.html)

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

Sheets K&S voor INF HC 10: Hoofdstuk 12

Sheets K&S voor INF HC 10: Hoofdstuk 12 Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12) Betrouwbaarheidsintervallen (H11) en toetsen (H12)

Nadere informatie

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k) 11.0 Voorkennis Let op: Cumulatieve binomiale verdeling: P(X k) = binomcdf(n,p,k) Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k) Voorbeeld 1: Binomiaal kanseperiment

Nadere informatie

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Statistiek voor A.I. College 14. Dinsdag 30 Oktober Statistiek voor A.I. College 14 Dinsdag 30 Oktober 1 / 16 2 Deductieve statistiek Orthodoxe statistiek 2 / 16 Grootte steekproef Voorbeeld NU.nl 26 Oktober 2012: Helft broodjes döner kebab vol bacteriën.

Nadere informatie

Les 2: Toetsen van één gemiddelde

Les 2: Toetsen van één gemiddelde Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter

Nadere informatie

Les 7-8: Parameter- en Vergelijkingstoetsen

Les 7-8: Parameter- en Vergelijkingstoetsen Les 7-8: Parameter- en Vergelijkingstoetsen I Theorie : A. Algemeen :. Hypothese formuleren. H 0 : nul-hypothese H : alternatieve hypothese 2. teekproef nemen. x en 2 zijn te berekenen uit de steekproefresultaten.

Nadere informatie

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) 8.16. Men wenst H 0 : p 0.2 te testen tegenover H 1 : p 0.4 voor een binomiale distributie met n 10. Bepaal α en β als de testfunctie gegeven

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Schriftelijk tentamen - UITWERKINGEN

Schriftelijk tentamen - UITWERKINGEN Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB0019t Soort tentamen : gesloten

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Formules Excel Bedrijfsstatistiek

Formules Excel Bedrijfsstatistiek Formules Excel Bedrijfsstatistiek Hoofdstuk 2 Data en hun voorstelling AANTAL.ALS vb: AANTAL.ALS(A1 :B6,H1) Telt hoeveel keer (frequentie) de waarde die in H1 zit in A1:B6 voorkomt. Vooral bedoeld voor

Nadere informatie

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing M, M & C, Chapter 6, Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Use and Abuse

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607 1. Om na te gaan of de gemiddelde bijdrage dezelfde is voor ziekenkas A en voor ziekenkas B heeft men op een toevallige wijze 30 personen geselecteerd waarvan 15 aangesloten zijn bij ziekenkas A en 15

Nadere informatie

Testen omtrent µ (normale populatie): BI. Testen omtrent µ (normale populatie): fouten. Testen omtrent µ (normale populatie): P-waarde

Testen omtrent µ (normale populatie): BI. Testen omtrent µ (normale populatie): fouten. Testen omtrent µ (normale populatie): P-waarde Testen omtrent µ (normale populatie) Hoofdstuk VII: HYPOTHESETESTEN Voorbeeld : X: Mortaliteit N(µ, σ ) µ = 1000 of µ 1000? x = 940.35 X µ S/ n tn 1 als µ = 1000: Terminologie: X 1000 S/ 60 t59 P ( t 59,0.05

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Kansverdelingen Inductieve statistiek met Geogebra 4.2 Kansverdelingen Inductieve statistiek met Geogebra 4.2 Brecht Dekeyser Pedic 20 november 2013 Gent 1 Inhoud Nieuw in Geogebra 4.2 Kansverdelingen: Berekeningen en grafische voorstellingen Manueel in rekenblad

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Verslag consumentenonderzoek zorgsector Breda

Verslag consumentenonderzoek zorgsector Breda Verslag consumentenonderzoek zorgsector Breda Inleiding: In het kader van het project economische barometer is in 2012 gekozen voor het onderwerp zorgverlening en vooral het gebruik van de zorgverleners,

Nadere informatie

Examen Statistiek I Januari 2010 Feedback

Examen Statistiek I Januari 2010 Feedback Examen Statistiek I Januari 2010 Feedback Correcte alternatieven worden door een sterretje aangeduid. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Twee derden van de mannen

Nadere informatie

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen. Oplossingen hoofdstuk IX 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 00 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2S27), dinsdag 14 juni 25, 9. - 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kruis per vraag slechts één vakje aan op het antwoordformulier. Toets Stroom 1.2 Methoden en Statistiek tul, MLW 7 april 2006 Deze toets bestaat uit 25 vierkeuzevragen. Kruis per vraag slechts één vakje aan op het antwoordformulier. Vraag goed beantwoord dan punt voor

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 13 Dinsdag 26 Oktober 1 / 24 2 Statistiek Indeling: Hypothese toetsen Filosofie 2 / 24 Hypothese toetsen 3 / 24 Hypothese toetsen: toepassingen Vb. Een medicijn wordt

Nadere informatie

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Technische Universiteit Delft Mekelweg 4 Faculteit Elektrotechniek, Wiskunde en Informatica 2628 CD Delft Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Formulebladen, rekenmachines,

Nadere informatie

Schriftelijk tentamen - UITWERKINGEN

Schriftelijk tentamen - UITWERKINGEN Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB0019t Soort tentamen : gesloten

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Vergelijken van twee groepen (voorbeeldoefeningen)

Vergelijken van twee groepen (voorbeeldoefeningen) Vergelijken van twee groepen (voorbeeldoefeningen) Vergelijking van gemiddeldes van onafhankelijke steekproeven met gelijke varianties In een onderzoek geven studenten aan hoeveel keer per week ze een

Nadere informatie

Niet-Parametrische Statistiek

Niet-Parametrische Statistiek 10-11. Niet-Parametrische Statistiek I. Theorie : A Algemeen schema : 1 Steekproef willekeurige verdeling Teken-Toets symmetrische verdeling Wilcoxon-Rank-Toets 2 Steekproeven gepaarde waarnemingen Wilcoxon-Rank-Toets

Nadere informatie

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Hoofdstuk 3 : Numerieke beschrijving van data Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Numerieke beschrijving van data p 1/31 Beschrijvende

Nadere informatie

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Statistiek voor A.I. College 12. Dinsdag 23 Oktober Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Schriftelijk tentamen - UITWERKINGEN

Schriftelijk tentamen - UITWERKINGEN Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB009t Soort tentamen : gesloten boek

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen

Tentamen Wiskunde A. Het gebruik van een mobiele telefoon of andere telecommunicatieapparatuur tijdens het tentamen CENTRALE COMMISSIE VOORTENTAMEN WISKUNDE Tentamen Wiskunde A Datum: 29 juli 2013 Tijd: 14.00-17.00 uur Aantal opgaven: 7 Zet uw naam op alle in te leveren blaadjes. Laat bij elke opgave door middel van

Nadere informatie

HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN

HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN Toetsen van hypothesen 1 HOOFDSTUK 5 TOETSEN VAN HYPOTHESEN 1. Inleiding...2 2. Beslissingsregels...5 2.1. Beslissen op grond van kritische grenzen...5 2.1.1. Het α-risico...6 2.1.2. Het β-risico...7 2.2.

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Beschrijvende statistiek

Beschrijvende statistiek Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend

Nadere informatie

G0N11C Statistiek & data-analyse Project tweede zittijd

G0N11C Statistiek & data-analyse Project tweede zittijd G0N11C Statistiek & data-analyse Project tweede zittijd 2014-2015 Naam : Raimondi Michael Studierichting : Biologie Gebruik deze Word-template om een antwoord te geven op onderstaande onderzoeksvragen.

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

Wiskunde B - Tentamen 1

Wiskunde B - Tentamen 1 Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Statistische toetsen 2 / 17 Toetsen - algemeen - 1 Setting: observatie X in X, model {P θ : θ Θ}. Gegeven partitie Θ = Θ 0 Θ 1, met Θ 0 Θ 1

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling Bijlage II Aanvullende analyses 1 Inleiding In aanvulling op de kwantitatieve informatie over de diverse arbeid-en-zorg thema s, is een aantal analyses verricht Aan deze analyses lagen de volgende onderzoeksvragen

Nadere informatie

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

DEZE PAGINA NIET vóór 8.30u OMSLAAN! STTISTIEK 1 VERSIE MT15303 1308 1 WGENINGEN UNIVERSITEIT LEERSTOELGROEP MT Tentamen Statistiek 1 (MT-15303) 5 augustus 2013, 8.30-10.30 uur EZE PGIN NIET vóór 8.30u OMSLN! STRT MET INVULLEN VN NM, REGISTRTIENUMMER,

Nadere informatie

Oplossingen hoofdstuk 9

Oplossingen hoofdstuk 9 Oplossingen hoofdstuk 9 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 200 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie