Theoretche kanverdelngen Onderzoekmethoden: Stattek Worden bepaald door een wkundge funkte Geven theoretche ba Worden gebrukt om hypothee te teten Worden gebrukt om te modelleren Marjan van den Akker 1 Babegrppen Dcrete tochatche varabele Experment: proce waarvan de utkomt onzeker Mogeljke utkomten x1, x,,xn p P ( x ) Stochatche varabele repreenteert de utkomt van een experment 0 p 1, Stochatche varabele Dcreet Contnu n p 1 1 Voorbeeld: Dobbelteen Goo 4 keer met een munt: het aantal keren kop 3 4
Contnue tochatche varabele Contnue tochatche varabele () Kan elke waarde n een nterval aannemen Kandchthed f: (probablty denty functon) Totale oppervlakte onder de grafek 1 b P(a b) f (x)dx a f(x) Verdelngfuncte (probablty dtrbuton functon): F(x) P( x) f (y)dy x a b x 5 6 Modu, medaan Verwachte waarde (gemddelde) Modu: Dcreet: waarde met maxmale kan Contnu: waarde met maxmale kandchthed Medaan: Een medaan een waarde m waarvoor geldt: P( m) 1 en P( m ) 1 µ E() p x µ E() xf (x)dx E(c) ce() E( + Y) E() + E(Y) 7 8
Varante, tandaarddevate Covarante, correlate Varante σ var() E(( E()) var(a + b) a Standaardd evate : : var() var() var( + Y) var() + var(y) + σ ) E( cov(, Y) ) (E()) Gegeven tochatche varabelen en Y : covarante : cov(, Y) E(( E())(Y E(Y))) cov(, Y) correlate: σ σ Y Voorbeeld: Goo een dobbelteen: aantal ogen van dobbelteen Y 7 aantal ogen van dobbelteen 9 10 Covarante, correlate Onafhankeljkhed Gegeven tochatche varabelen en Y : covarante : cov(, Y) E(( E())(Y E(Y))) cov(, Y) correlate: σ σ Y Twee tochatche varabelen en Y zjn onafhankeljk al: Contnu P( A en Y B) P( A)P(Y B) Dcreet verzamelngen A, B Voorbeeld: Goo ederlande Euro, goo Greke Euro utkomt L Euro (kop 0, munt 1) Y utkomt GR Euro (kop 0, munt 1) P( x en Y y) P( x)p(y y) x, y 11 1
Onafhankeljkhed () Voorbeeld Al en Y onafhankeljke tochatche varabelen: E (Y) cov(, Y) 0 E()E(Y) var( + Y) var() + var(y) Jonathan peelt computer game Op level 3 de ucce kan 60 % Bj ucce door naar volgende ronde Wat de kan dat Jonathan na 4 ronde doorgaat naar volgende level. 13 14 Geometrche verdelng Voorbeeld Aantal falure tot het eerte ucce bj ucce kan p P( k) p(1 p) 1 p E() p k Computerpel van 8 ronden Elke ronde 40% kan op ucce Bj ucce krjgt de peler 1 punt Speler mag na 8 ronden altjd door naar volgend level Wat de kan op 8 punten? Wat de kan op prece 1 punt? Wat de kan op prece 5 punten? 15 16
Bnomale verdelng Aantal ucceen ut n onafhankeljke pogngen met elk uccekan p n P( k) p k E() np k (1 p) n k Varante: Populate en teekproef Populate: We weten het gemddelde µ. ( ) µ σ We weten echte waarden! Steekproef: electe van elementen ut de populate Gemddelde wordt gechat: 1 ( ) 1 Schatter! 17 18 Steekproef, populate en nog een tap verder. We weten de kanverdelng: theoretch model. u kun je er goed mee rekenen. Her kom je om moeljk achter Hoe zjn de reultaten van datatructuren verdeeld? Som kun je aanname maken. z-core tandaardcore de de aftand tot het gemddelde utdrukt n termen van tandaardafwjkng oftewel het aantal tandaarddevate () dat een bepaalde core () van het gemddelde af lgt z ( ) 1 Standaard-devate teekproef 19 0
Z-core leeftjd Kenmerken van z-core z getandaardeerde varabelen lneare tranformate van ruwe core µ 0, σ σ 1 dmeneloo maakt vergeljkng varabelen mogeljk 1 De normale verdelng; een theoretche verdelng (µ,σ ) 1 f (y) exp[ (y µ ) σ π µ : gemddelde σ :tandaarddevate /(σ )] De normale verdelng Afgeled door Adran (1808) en Gau (1809) 3 Gau (183) 4
ormale verdelngen De normale verdelng Symmetrch Contnue varabele Medan Modu Mean Van veel natuurljke egenchappen wordt aangenomen dat zj bj benaderng een normale verdelng volgen. Voorbeelden: lengte van ederlander, choleterolgehalte n het bloed, IQ, gewchten van erwten van één erwtenra Afwjkngen, fouten volgen normale verdelng, `wtte ru 5 6 De tandaardnormale verdelng de core van een normale verdelng omzetten n tandaardcore (z) levert de tandaardnormaalverdelng deze heeft altjd een gemddelde van 0, en een tandaardafwjkng van 1 Du al normaal verdeeld (µ,σ ), dan z tandaard normaal verdeeld µ σ Toepangen v/d normale verdelng al norm: Kanutpraken n twee rchtngen Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90 -te percentel?. Hoeveel procent van de mannen groter dan 17? 3. I het waarchjnljk dat een gevonden core van 180 of meer afkomtg ut een normaal verdeelde populate met µ 170 en σ 5? De tweede rchtng peelt een crucale rol bj toetende (verklarende) tattek 7 8
Voorbeeld Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90 -tepercentel? Voorbeeld Gebruk Tabel tandaard normale verdelng Tabel A: z 1 1.8 want de oppervlakte tuen o en z 1 1.8 ongeveer.40 Tabel B: z 1 1.8 want de oppervlakte recht van z 1 1.8 ongeveer.10 90 % 10 % 90 % 10 % 0 z 1 9 30 Voorbeeld Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90-te percentel? µ z σ 90 % µ 170 p 90? 10 % 1.8 176.4 170 5 Du p 90 176.4 Wat al core ut de echte wereld helemaal net ljken op een theoretche verdelng? Oplong: 1. kjk net kjk net naar core van ndvduen, maar naar core van teekproeven. Verbnd deze geoberveerde core (van bjv. gemddelden van teekproeven) met de theoretche norm m.b.v. de centrale lmettellng 3. Voorbeeld: Kanverdelng een dobbelteen Kanverdelng gemddelde twee dobbeltenen 31 3
Centrale lmettellng Steekproef 1,,, 1,,, onafhankeljk en dentek verdeeld, gemddelde µ, varante σ Z () µ σ 1 Stellng: Al wordt µ () normaal verdeeld Z tandaard normaal verdeeld (0,1) σ Student t-verdelng Door W.S. Goet gepublceerd n 1908, Stattcu Gunne berbrouwerj., Peudonem Student k vrjhedgraden k : normale verdelng Leuk, meetal weten we µ en σ helemaal net. 33 34 Student t-verdelng () Student t-verdelng (3) Steekproef 1,,, onafhankeljk en normaal verdeeld gemddelde µ, varante σ α0.05 t(-1) α/ ut tabel C 35 t t () µ () µ heeft Student t-verdelng met -1 vrjhedgraden ( ) 1 ( ) 1 teekproefvarante tandaarddevate.5% α/ -t(-1) α/ 95% 1 -α 36.5% α/ t(-1) α/
Toeten Toeten Steekproef aantal uren gamen per week UU nformatca tudenten We wllen nu een utpraak doen over gemddelde over de hele populate van alle UU nformatca tudenten Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ 0 Bepaal teekproefgemddelde 37 38 Toeten Fouten Bj welk teekproefgemddelde zjn we het een met H 0 Stattche toet Tweezjdg toeten: Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ 0 Eenzjdg toeten: Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ>0 Voorbeeld teekproef 18, 5, 8, 1, 3, 18, 18, 6, 5, 1 Toetand H 0 waar Belng Accepteer H 0 OK 1-α betrouwbaarhed Verwerp H 0 Type 1 Kan α gnfcantenveau H 0 net waar Type OK 39 40
t-toet met één teekproef Tweezjdge t-toet met één teekproef vergeljkng van één teekproefgemddelde met een norm (een van te voren bepaald gemddelde) H 0 : µ 0 (aantal uren gamen per week) H 1 : µ 0 probleem: σ ut populate net bekend en het teekproefaantal klen (<10) meetwaarden onafhankeljk en dentek normaal verdeeld (met zelfde gemddeldeen varante) eem aan: waarden n de teekproef zjn onafhankeljk, dentek verdeeld en normaal verdeeld Al H 0 waar geldt: oplong: t-verdelngen (vrjhedgraden pelen een rol) () µ t ob / t-tabel: ze boek van Wjk blz. 71 t ob () 0 () 0 heeft t-verdelng met df9 (9 vrjhedgraden) 41 4 Tweezjdge t-toet met één teekproef Tweezjdge t-toet met één teekproef Belngregel: Verwerp H 0 nden t ob -t crt of t crt t ob Accepteer H 0 nden -t crt < t ob < t crt We wllen α0.05, ofwel de kan dat we H 0 verwerpen terwjl hj waar, 5%. Crterum wordt: Ke t crt zodat P(t t crt ) α.05 en P(t -t crt ) α.05 voor t-verdelng met 9 vrjhedgraden, du α 0.05 aan edere kant met tabel C t crt (df 9).6 43 44
Tweezjdge t-toet met één teekproef Eenzjdge t-toet met één teekproef Bepaal toetnggroothed: Het teekproefgemddelde.3 en 3.65. µ 0, en 10 Bepaal de waarde van toetnggroothed. () µ t ob / t crt (df 9).6 du t ob.3 / 1.155 1.991 H 0 : µ 0 (aantal uren gamen per week) H 1 : µ > 0 og teed H 0 waar geldt: () 0 () 0 t ob heeft t-verdelng met df9 (9 vrjhedgraden) H 0 Accepteren!!!! 45 46 Eenzjdge t-toet met één teekproef Eenzjdge t-toet met één teekproef u belngregel van de vorm: Toetnggroothed: Verwerp H 0 nden t crt t ob Accepteer H 0 nden t ob < t crt () µ t ob / t ob.3 / 1.155 1.991 We wllen α0.05, ofwel de kan dat we H 0 verwerpen terwjl hj waar, 5%. Crterum wordt: Ke t crt zodat P(t t crt ) α.05 voor t-verdelng met 9 vrjhedgraden Tabel C t crt (df 9) 1.81 u t ob > t crt 1.81 H 0 verwerpen! 47 48
1,,, onafhankeljk en normaal verdeeld met gemddelde µ, varante σ : 1,,, looptjd algortme pzza-koerer: Betrouwbaarhednterval Goed Htogram heeft `ongeveer vorm normale verdelng (hoeft net al te treng) Vergeljkebare of zelfde ntante Zelfde parameter ntellngen Fout Waarden gebaeerd op verchllend aantal klanten Waarden gebaeerd op verchllende parameter-ntellngen () t( 1) α,() + t( 1) α (1-α)100 % betrouwbaarhednterval, bjv α 0.05 µ valt bnnen het nterval met kan 1-α, et (1-α)100% van de waarnemngen valt bnnen het nterval t(-1) α/ ut tattche tabel t(-1) α/ z α/ (normale verdelng) voor grote (>10) Pag 90 vwjk mag allleen bj een grote teekproef. 49 50 Betrouwbaarhednterval: voorbeeld Opmerkng S (5) 9 t(4) Hoeveel uur per week beteden nformatca tudenten aan gamen? 0.05.776 95% betrouwbaarhednterval: Student Marcel 18 Thoma 4 Wouter 4 Steven 1 Paktw 18 Aantal uren gamen p week H 0 : µ µ 0 wordt geaccepteerd n tweezjdge t-toet met α kan op type 1 fout dan en lecht dan al µ 0 lgt n het (1- α)* 100 % betrouwbaarhednterval [1.776 9 5,1+.776 9 5 ] [17.8,4.7] 51 5