Onderzoeksmethoden: Statistiek 2

Vergelijkbare documenten
De Collegereeks Statistiek. Vandaag 0. Recapitulatie. Meetniveau van variabelen. Frequentieverdelingen in SPSS. Descriptieve maten Verhoudingsmaten

Statistiek Hoorcollege 6. Variantie analyse. Variantie & Variatie 10/13/2009. σ X. De Collegereeks Statistiek

Uitwerkingen tentamen Statistiek 2 voor TeMa Maandag

Gegevensverwerving en verwerking

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Les 2 / 3: Meetschalen en Parameters

Variantie-analyse (ANOVA)

Aanbevolen literatuur

College 2 Enkelvoudige Lineaire Regressie

Bij een invalshoek i =(15.0 ± 0.5) meet hij r =(9.5 ± 0.5). 100%-intervallen. Welke conclusie kan de onderzoeker trekken?

Toepassing: Codes. Hoofdstuk 3

t-toets met één steekproef Onderzoeksmethoden: Statistiek 3 t obs = s N Marjan van den Akker Tweezijdige t-toets met één steekproef

PROEFEXAMEN SOCIALE STATISTIEK

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Van beschrijvende naar verklarende statistiek

Statica in een notendop

Statistiek Hoorcollege 4

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Modellen en Simulatie Speltheorie

MRT/RT MKT/KT. Wormwielreductoren.

Kansrekening en Statistiek

Statistiek voor A.I.

VOOR HET SECUNDAIR ONDERWIJS. Correlatie: exploratieve methoden. Werktekst voor de leerling. Prof. dr. Herman Callaert

C.P. van Splunter. Grote afwijkingen. Bachelorscriptie, 21 april Scriptiebegeleiders: prof.dr. F. Redig prof.dr. E.A.

Sheets K&S voor INF HC 10: Hoofdstuk 12

is gelijk aan de open-klemmen spanning van het netwerk. De impedantie Z th

Bijlage I Concentraties van gewasteelten in Nederland

Data analyse Inleiding statistiek

Rekenen met rente en rendement

Standaardisatiemethoden. 9 10Abby Israëls. Statistische Methoden (10003)

Opgaves Hoofdstuk 3: Toevalsveranderlijken en Distributiefuncties

Samenvatting Farmaco-epidemiologie april 2011

Hoofdstuk 3 Statistiek: het toetsen

Toelichting advies gemeenteraad bij aanvraag aanwijzing als lokale publieke media-instelling

Zelf statistiek oefenen

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Hoofdstuk 6 Hypothesen toetsen

Hoofdstuk 4: Aanvullende Begrippen (Extra Oefeningen)

Statistiek 2 voor TeMa Associaties tussen kwantitatieve variabelen. Statistiek 2 voor TeMa Associaties tussen kwantitatieve variabelen

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Set 2 Inleveropgaven Kansrekening (2WS20)

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Kansrekening en Statistiek

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

5.1 Elektrische stroom en spanning

Examen Statistiek I Feedback

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Kansrekening en Statistiek

De standaardafwijking

Verslag Regeltechniek 2

Set 3 Inleveropgaven Kansrekening (2WS20) Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje.

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Module 8 Uitwerkingen van de opdrachten

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en Statistiek

1.1 Oplossingen. + 1 x ( ) Oplossing oefening 2.1. Oplossing oefening 2.2

Hoofdstuk 5 Een populatie: parametrische toetsen

lus+ De klachtencommissie en de rol van de vertrouwenspersoon ongewenste omgangsvormen

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Data analyse Inleiding statistiek

Transcriptie:

Theoretche kanverdelngen Onderzoekmethoden: Stattek Worden bepaald door een wkundge funkte Geven theoretche ba Worden gebrukt om hypothee te teten Worden gebrukt om te modelleren Marjan van den Akker 1 Babegrppen Dcrete tochatche varabele Experment: proce waarvan de utkomt onzeker Mogeljke utkomten x1, x,,xn p P ( x ) Stochatche varabele repreenteert de utkomt van een experment 0 p 1, Stochatche varabele Dcreet Contnu n p 1 1 Voorbeeld: Dobbelteen Goo 4 keer met een munt: het aantal keren kop 3 4

Contnue tochatche varabele Contnue tochatche varabele () Kan elke waarde n een nterval aannemen Kandchthed f: (probablty denty functon) Totale oppervlakte onder de grafek 1 b P(a b) f (x)dx a f(x) Verdelngfuncte (probablty dtrbuton functon): F(x) P( x) f (y)dy x a b x 5 6 Modu, medaan Verwachte waarde (gemddelde) Modu: Dcreet: waarde met maxmale kan Contnu: waarde met maxmale kandchthed Medaan: Een medaan een waarde m waarvoor geldt: P( m) 1 en P( m ) 1 µ E() p x µ E() xf (x)dx E(c) ce() E( + Y) E() + E(Y) 7 8

Varante, tandaarddevate Covarante, correlate Varante σ var() E(( E()) var(a + b) a Standaardd evate : : var() var() var( + Y) var() + var(y) + σ ) E( cov(, Y) ) (E()) Gegeven tochatche varabelen en Y : covarante : cov(, Y) E(( E())(Y E(Y))) cov(, Y) correlate: σ σ Y Voorbeeld: Goo een dobbelteen: aantal ogen van dobbelteen Y 7 aantal ogen van dobbelteen 9 10 Covarante, correlate Onafhankeljkhed Gegeven tochatche varabelen en Y : covarante : cov(, Y) E(( E())(Y E(Y))) cov(, Y) correlate: σ σ Y Twee tochatche varabelen en Y zjn onafhankeljk al: Contnu P( A en Y B) P( A)P(Y B) Dcreet verzamelngen A, B Voorbeeld: Goo ederlande Euro, goo Greke Euro utkomt L Euro (kop 0, munt 1) Y utkomt GR Euro (kop 0, munt 1) P( x en Y y) P( x)p(y y) x, y 11 1

Onafhankeljkhed () Voorbeeld Al en Y onafhankeljke tochatche varabelen: E (Y) cov(, Y) 0 E()E(Y) var( + Y) var() + var(y) Jonathan peelt computer game Op level 3 de ucce kan 60 % Bj ucce door naar volgende ronde Wat de kan dat Jonathan na 4 ronde doorgaat naar volgende level. 13 14 Geometrche verdelng Voorbeeld Aantal falure tot het eerte ucce bj ucce kan p P( k) p(1 p) 1 p E() p k Computerpel van 8 ronden Elke ronde 40% kan op ucce Bj ucce krjgt de peler 1 punt Speler mag na 8 ronden altjd door naar volgend level Wat de kan op 8 punten? Wat de kan op prece 1 punt? Wat de kan op prece 5 punten? 15 16

Bnomale verdelng Aantal ucceen ut n onafhankeljke pogngen met elk uccekan p n P( k) p k E() np k (1 p) n k Varante: Populate en teekproef Populate: We weten het gemddelde µ. ( ) µ σ We weten echte waarden! Steekproef: electe van elementen ut de populate Gemddelde wordt gechat: 1 ( ) 1 Schatter! 17 18 Steekproef, populate en nog een tap verder. We weten de kanverdelng: theoretch model. u kun je er goed mee rekenen. Her kom je om moeljk achter Hoe zjn de reultaten van datatructuren verdeeld? Som kun je aanname maken. z-core tandaardcore de de aftand tot het gemddelde utdrukt n termen van tandaardafwjkng oftewel het aantal tandaarddevate () dat een bepaalde core () van het gemddelde af lgt z ( ) 1 Standaard-devate teekproef 19 0

Z-core leeftjd Kenmerken van z-core z getandaardeerde varabelen lneare tranformate van ruwe core µ 0, σ σ 1 dmeneloo maakt vergeljkng varabelen mogeljk 1 De normale verdelng; een theoretche verdelng (µ,σ ) 1 f (y) exp[ (y µ ) σ π µ : gemddelde σ :tandaarddevate /(σ )] De normale verdelng Afgeled door Adran (1808) en Gau (1809) 3 Gau (183) 4

ormale verdelngen De normale verdelng Symmetrch Contnue varabele Medan Modu Mean Van veel natuurljke egenchappen wordt aangenomen dat zj bj benaderng een normale verdelng volgen. Voorbeelden: lengte van ederlander, choleterolgehalte n het bloed, IQ, gewchten van erwten van één erwtenra Afwjkngen, fouten volgen normale verdelng, `wtte ru 5 6 De tandaardnormale verdelng de core van een normale verdelng omzetten n tandaardcore (z) levert de tandaardnormaalverdelng deze heeft altjd een gemddelde van 0, en een tandaardafwjkng van 1 Du al normaal verdeeld (µ,σ ), dan z tandaard normaal verdeeld µ σ Toepangen v/d normale verdelng al norm: Kanutpraken n twee rchtngen Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90 -te percentel?. Hoeveel procent van de mannen groter dan 17? 3. I het waarchjnljk dat een gevonden core van 180 of meer afkomtg ut een normaal verdeelde populate met µ 170 en σ 5? De tweede rchtng peelt een crucale rol bj toetende (verklarende) tattek 7 8

Voorbeeld Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90 -tepercentel? Voorbeeld Gebruk Tabel tandaard normale verdelng Tabel A: z 1 1.8 want de oppervlakte tuen o en z 1 1.8 ongeveer.40 Tabel B: z 1 1.8 want de oppervlakte recht van z 1 1.8 ongeveer.10 90 % 10 % 90 % 10 % 0 z 1 9 30 Voorbeeld Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90-te percentel? µ z σ 90 % µ 170 p 90? 10 % 1.8 176.4 170 5 Du p 90 176.4 Wat al core ut de echte wereld helemaal net ljken op een theoretche verdelng? Oplong: 1. kjk net kjk net naar core van ndvduen, maar naar core van teekproeven. Verbnd deze geoberveerde core (van bjv. gemddelden van teekproeven) met de theoretche norm m.b.v. de centrale lmettellng 3. Voorbeeld: Kanverdelng een dobbelteen Kanverdelng gemddelde twee dobbeltenen 31 3

Centrale lmettellng Steekproef 1,,, 1,,, onafhankeljk en dentek verdeeld, gemddelde µ, varante σ Z () µ σ 1 Stellng: Al wordt µ () normaal verdeeld Z tandaard normaal verdeeld (0,1) σ Student t-verdelng Door W.S. Goet gepublceerd n 1908, Stattcu Gunne berbrouwerj., Peudonem Student k vrjhedgraden k : normale verdelng Leuk, meetal weten we µ en σ helemaal net. 33 34 Student t-verdelng () Student t-verdelng (3) Steekproef 1,,, onafhankeljk en normaal verdeeld gemddelde µ, varante σ α0.05 t(-1) α/ ut tabel C 35 t t () µ () µ heeft Student t-verdelng met -1 vrjhedgraden ( ) 1 ( ) 1 teekproefvarante tandaarddevate.5% α/ -t(-1) α/ 95% 1 -α 36.5% α/ t(-1) α/

Toeten Toeten Steekproef aantal uren gamen per week UU nformatca tudenten We wllen nu een utpraak doen over gemddelde over de hele populate van alle UU nformatca tudenten Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ 0 Bepaal teekproefgemddelde 37 38 Toeten Fouten Bj welk teekproefgemddelde zjn we het een met H 0 Stattche toet Tweezjdg toeten: Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ 0 Eenzjdg toeten: Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ>0 Voorbeeld teekproef 18, 5, 8, 1, 3, 18, 18, 6, 5, 1 Toetand H 0 waar Belng Accepteer H 0 OK 1-α betrouwbaarhed Verwerp H 0 Type 1 Kan α gnfcantenveau H 0 net waar Type OK 39 40

t-toet met één teekproef Tweezjdge t-toet met één teekproef vergeljkng van één teekproefgemddelde met een norm (een van te voren bepaald gemddelde) H 0 : µ 0 (aantal uren gamen per week) H 1 : µ 0 probleem: σ ut populate net bekend en het teekproefaantal klen (<10) meetwaarden onafhankeljk en dentek normaal verdeeld (met zelfde gemddeldeen varante) eem aan: waarden n de teekproef zjn onafhankeljk, dentek verdeeld en normaal verdeeld Al H 0 waar geldt: oplong: t-verdelngen (vrjhedgraden pelen een rol) () µ t ob / t-tabel: ze boek van Wjk blz. 71 t ob () 0 () 0 heeft t-verdelng met df9 (9 vrjhedgraden) 41 4 Tweezjdge t-toet met één teekproef Tweezjdge t-toet met één teekproef Belngregel: Verwerp H 0 nden t ob -t crt of t crt t ob Accepteer H 0 nden -t crt < t ob < t crt We wllen α0.05, ofwel de kan dat we H 0 verwerpen terwjl hj waar, 5%. Crterum wordt: Ke t crt zodat P(t t crt ) α.05 en P(t -t crt ) α.05 voor t-verdelng met 9 vrjhedgraden, du α 0.05 aan edere kant met tabel C t crt (df 9).6 43 44

Tweezjdge t-toet met één teekproef Eenzjdge t-toet met één teekproef Bepaal toetnggroothed: Het teekproefgemddelde.3 en 3.65. µ 0, en 10 Bepaal de waarde van toetnggroothed. () µ t ob / t crt (df 9).6 du t ob.3 / 1.155 1.991 H 0 : µ 0 (aantal uren gamen per week) H 1 : µ > 0 og teed H 0 waar geldt: () 0 () 0 t ob heeft t-verdelng met df9 (9 vrjhedgraden) H 0 Accepteren!!!! 45 46 Eenzjdge t-toet met één teekproef Eenzjdge t-toet met één teekproef u belngregel van de vorm: Toetnggroothed: Verwerp H 0 nden t crt t ob Accepteer H 0 nden t ob < t crt () µ t ob / t ob.3 / 1.155 1.991 We wllen α0.05, ofwel de kan dat we H 0 verwerpen terwjl hj waar, 5%. Crterum wordt: Ke t crt zodat P(t t crt ) α.05 voor t-verdelng met 9 vrjhedgraden Tabel C t crt (df 9) 1.81 u t ob > t crt 1.81 H 0 verwerpen! 47 48

1,,, onafhankeljk en normaal verdeeld met gemddelde µ, varante σ : 1,,, looptjd algortme pzza-koerer: Betrouwbaarhednterval Goed Htogram heeft `ongeveer vorm normale verdelng (hoeft net al te treng) Vergeljkebare of zelfde ntante Zelfde parameter ntellngen Fout Waarden gebaeerd op verchllend aantal klanten Waarden gebaeerd op verchllende parameter-ntellngen () t( 1) α,() + t( 1) α (1-α)100 % betrouwbaarhednterval, bjv α 0.05 µ valt bnnen het nterval met kan 1-α, et (1-α)100% van de waarnemngen valt bnnen het nterval t(-1) α/ ut tattche tabel t(-1) α/ z α/ (normale verdelng) voor grote (>10) Pag 90 vwjk mag allleen bj een grote teekproef. 49 50 Betrouwbaarhednterval: voorbeeld Opmerkng S (5) 9 t(4) Hoeveel uur per week beteden nformatca tudenten aan gamen? 0.05.776 95% betrouwbaarhednterval: Student Marcel 18 Thoma 4 Wouter 4 Steven 1 Paktw 18 Aantal uren gamen p week H 0 : µ µ 0 wordt geaccepteerd n tweezjdge t-toet met α kan op type 1 fout dan en lecht dan al µ 0 lgt n het (1- α)* 100 % betrouwbaarhednterval [1.776 9 5,1+.776 9 5 ] [17.8,4.7] 51 5