Onderzoeksmethoden: Statistiek 2

Vergelijkbare documenten
De Collegereeks Statistiek. Vandaag 0. Recapitulatie. Meetniveau van variabelen. Frequentieverdelingen in SPSS. Descriptieve maten Verhoudingsmaten

Statistiek Hoorcollege 6. Variantie analyse. Variantie & Variatie 10/13/2009. σ X. De Collegereeks Statistiek

Uitwerkingen tentamen Statistiek 2 voor TeMa Maandag

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Gegevensverwerving en verwerking

Regressie en correlatie

Regressie en correlatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Les 2 / 3: Meetschalen en Parameters

Variantie-analyse (ANOVA)

1. In de hoofdstad van Ivoorkust, Yamoussoukro, meet men de lengte van 100 mannen (in cm) :

Aanbevolen literatuur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Examen Neurale Netwerken (2L490), op woensdag 28 juni 2006, uur.

College 2 Enkelvoudige Lineaire Regressie

Meten en experimenteren

Bij een invalshoek i =(15.0 ± 0.5) meet hij r =(9.5 ± 0.5). 100%-intervallen. Welke conclusie kan de onderzoeker trekken?

Toepassing: Codes. Hoofdstuk 3

Tentamen van Wiskunde B voor CiT (151217) Tentamen van Statistiek voor BIT (153031) Vrijdag 27 januari 2006 van 9.00 tot uur

t-toets met één steekproef Onderzoeksmethoden: Statistiek 3 t obs = s N Marjan van den Akker Tweezijdige t-toets met één steekproef

Onderzoeksmethoden en techieken I

PROEFEXAMEN SOCIALE STATISTIEK

Toegepaste Statistiek, Week 2 1

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Stochastische loadflow. Beschrijving algoritme van de stochastische loadflow.

Onderzoeksmethoden en techieken I

Tentamen Econometrie 1, 4 juli 2006, uur Dit tentamen duurt 2 uur! Toiletbezoek is niet toegstaan.

Van beschrijvende naar verklarende statistiek

Naar de abstracte algebra?

Statica in een notendop

Statistiek Hoorcollege 4

De Collegereeks Statistiek. Stel je wilt wat weten over. Complexe begrippen: construct. Homogeniteit. Verder met. Statistiek

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Modellen en Simulatie Speltheorie

Toets spectrometrie 6 november 2007 blz 1

MRT/RT MKT/KT. Wormwielreductoren.

Onderdelen cursus. Betreft week 4: Vr 8:45-10:30 uur: college VANDAAG: 10:45-12:30: practicum onder begeleiding. Betreft de weken 2 en 3:

Kansrekening en Statistiek

Statistiek voor A.I.

- X i ~ kansverdeling: N(µ A, σ 2 ) Y i ~ N(µ B, σ 2 ) (onafhankelijk) - X i ~ kansverdeling: F A (u)=p(x<u) Y i ~

Tentamen Voortgezette Kansrekening (WB006C)

VOOR HET SECUNDAIR ONDERWIJS. Correlatie: exploratieve methoden. Werktekst voor de leerling. Prof. dr. Herman Callaert

C.P. van Splunter. Grote afwijkingen. Bachelorscriptie, 21 april Scriptiebegeleiders: prof.dr. F. Redig prof.dr. E.A.

Statistiek Hoorcollege 7. Correlatie en Predictie 10/20/2009. De Collegereeks Statistiek. Volgende week. Deze week. Keuze van de statistische toets

Sheets K&S voor INF HC 10: Hoofdstuk 12

MEERJAREN OPBRENGSTEN VO 2013 TOELICHTING

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

is gelijk aan de open-klemmen spanning van het netwerk. De impedantie Z th

VOOR HET SECUNDAIR ONDERWIJS. Exploratieve statistiek. Infoboekje. Prof. dr. Herman Callaert

Bijlage I Concentraties van gewasteelten in Nederland

Data analyse Inleiding statistiek

Rekenen met rente en rendement

Standaardisatiemethoden. 9 10Abby Israëls. Statistische Methoden (10003)

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Opgaves Hoofdstuk 3: Toevalsveranderlijken en Distributiefuncties

Samenvatting Farmaco-epidemiologie april 2011

Lucia de B. Gonny Hauwert 12 september 2007

Hoofdstuk 3 Statistiek: het toetsen

Toelichting advies gemeenteraad bij aanvraag aanwijzing als lokale publieke media-instelling

Zelf statistiek oefenen

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

aantallen in van de prooiresten gewicht min of meer mogelijk, doch als de gebitsmaten van een groot aantal gevangen dat de gewichtsfaktor

Hoofdstuk 6 Hypothesen toetsen

Hoofdstuk 4: Aanvullende Begrippen (Extra Oefeningen)

Logica voor Informatica

Statistiek 2 voor TeMa Associaties tussen kwantitatieve variabelen. Statistiek 2 voor TeMa Associaties tussen kwantitatieve variabelen

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Set 2 Inleveropgaven Kansrekening (2WS20)

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Kansrekening en Statistiek

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

5.1 Elektrische stroom en spanning

Zelf statistiek oefenen

Examen Statistiek I Feedback

OefenDeeltentamen 2 Kansrekening 2011/ Beschouw een continue stochast X met kansdichtheidsfunctie cx 4, 0 x 1 f X (x) = f(x) = 0, anders.

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Kansrekening en Statistiek

De standaardafwijking

Ondersteuning en hulp bij leren

Verslag Regeltechniek 2

Set 3 Inleveropgaven Kansrekening (2WS20) Opgaven met sterretjes zijn lastiger dan opgaven zonder sterretje.

x z vonden we dat de z-score aangeeft hoeveel standaardafwijkingen de waarde

Kengetallen E-38 Pseudo-records

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Is de app een onmisbaar onderdeel van de les of het leerproces? nee. Is de leerling/student 16 jaar of ouder?

Module 8 Uitwerkingen van de opdrachten

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN

Kansrekening en Statistiek

1.1 Oplossingen. + 1 x ( ) Oplossing oefening 2.1. Oplossing oefening 2.2

Hoofdstuk 5 Een populatie: parametrische toetsen

lus+ De klachtencommissie en de rol van de vertrouwenspersoon ongewenste omgangsvormen

Detectie van gekende signalen in Gaussiaanse ruis

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Voor de beoordeling zijn de volgende passages van de artikelen 41, 41a en 42 van het Eindexamenbesluit van belang:

Data analyse Inleiding statistiek

officiële bijdrage aan het CMMI. Jan Jaap Cannegieter

Transcriptie:

Theoretche kanverdelngen Onderzoekmethoden: Stattek Worden bepaald door een wkundge funkte Geven theoretche ba Worden gebrukt om hypothee te teten Worden gebrukt om te modelleren Marjan van den Akker 1 Babegrppen Dcrete tochatche varabele Experment: proce waarvan de utkomt onzeker Mogeljke utkomten x1, x,,xn p P ( x ) Stochatche varabele repreenteert de utkomt van een experment 0 p 1, Stochatche varabele Dcreet Contnu n p 1 1 Voorbeeld: Dobbelteen Goo 4 keer met een munt: het aantal keren kop 3 4

Contnue tochatche varabele Contnue tochatche varabele () Kan elke waarde n een nterval aannemen Kandchthed f: (probablty denty functon) Totale oppervlakte onder de grafek 1 b P(a b) f (x)dx a f(x) Verdelngfuncte (probablty dtrbuton functon): F(x) P( x) f (y)dy x a b x 5 6 Modu, medaan Verwachte waarde (gemddelde) Modu: Dcreet: waarde met maxmale kan Contnu: waarde met maxmale kandchthed Medaan: Een medaan een waarde m waarvoor geldt: P( m) 1 en P( m ) 1 µ E() p x µ E() xf (x)dx E(c) ce() E( + Y) E() + E(Y) 7 8

Varante, tandaarddevate Covarante, correlate Varante σ var() E(( E()) var(a + b) a Standaardd evate : : var() var() var( + Y) var() + var(y) + σ ) E( cov(, Y) ) (E()) Gegeven tochatche varabelen en Y : covarante : cov(, Y) E(( E())(Y E(Y))) cov(, Y) correlate: σ σ Y Voorbeeld: Goo een dobbelteen: aantal ogen van dobbelteen Y 7 aantal ogen van dobbelteen 9 10 Covarante, correlate Onafhankeljkhed Gegeven tochatche varabelen en Y : covarante : cov(, Y) E(( E())(Y E(Y))) cov(, Y) correlate: σ σ Y Twee tochatche varabelen en Y zjn onafhankeljk al: Contnu P( A en Y B) P( A)P(Y B) Dcreet verzamelngen A, B Voorbeeld: Goo ederlande Euro, goo Greke Euro utkomt L Euro (kop 0, munt 1) Y utkomt GR Euro (kop 0, munt 1) P( x en Y y) P( x)p(y y) x, y 11 1

Onafhankeljkhed () Voorbeeld Al en Y onafhankeljke tochatche varabelen: E (Y) cov(, Y) 0 E()E(Y) var( + Y) var() + var(y) Jonathan peelt computer game Op level 3 de ucce kan 60 % Bj ucce door naar volgende ronde Wat de kan dat Jonathan na 4 ronde doorgaat naar volgende level. 13 14 Geometrche verdelng Voorbeeld Aantal falure tot het eerte ucce bj ucce kan p P( k) p(1 p) 1 p E() p k Computerpel van 8 ronden Elke ronde 40% kan op ucce Bj ucce krjgt de peler 1 punt Speler mag na 8 ronden altjd door naar volgend level Wat de kan op 8 punten? Wat de kan op prece 1 punt? Wat de kan op prece 5 punten? 15 16

Bnomale verdelng Aantal ucceen ut n onafhankeljke pogngen met elk uccekan p n P( k) p k E() np k (1 p) n k Varante: Populate en teekproef Populate: We weten het gemddelde µ. ( ) µ σ We weten echte waarden! Steekproef: electe van elementen ut de populate Gemddelde wordt gechat: 1 ( ) 1 Schatter! 17 18 Steekproef, populate en nog een tap verder. We weten de kanverdelng: theoretch model. u kun je er goed mee rekenen. Her kom je om moeljk achter Hoe zjn de reultaten van datatructuren verdeeld? Som kun je aanname maken. z-core tandaardcore de de aftand tot het gemddelde utdrukt n termen van tandaardafwjkng oftewel het aantal tandaarddevate () dat een bepaalde core () van het gemddelde af lgt z ( ) 1 Standaard-devate teekproef 19 0

Z-core leeftjd Kenmerken van z-core z getandaardeerde varabelen lneare tranformate van ruwe core µ 0, σ σ 1 dmeneloo maakt vergeljkng varabelen mogeljk 1 De normale verdelng; een theoretche verdelng (µ,σ ) 1 f (y) exp[ (y µ ) σ π µ : gemddelde σ :tandaarddevate /(σ )] De normale verdelng Afgeled door Adran (1808) en Gau (1809) 3 Gau (183) 4

ormale verdelngen De normale verdelng Symmetrch Contnue varabele Medan Modu Mean Van veel natuurljke egenchappen wordt aangenomen dat zj bj benaderng een normale verdelng volgen. Voorbeelden: lengte van ederlander, choleterolgehalte n het bloed, IQ, gewchten van erwten van één erwtenra Afwjkngen, fouten volgen normale verdelng, `wtte ru 5 6 De tandaardnormale verdelng de core van een normale verdelng omzetten n tandaardcore (z) levert de tandaardnormaalverdelng deze heeft altjd een gemddelde van 0, en een tandaardafwjkng van 1 Du al normaal verdeeld (µ,σ ), dan z tandaard normaal verdeeld µ σ Toepangen v/d normale verdelng al norm: Kanutpraken n twee rchtngen Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90 -te percentel?. Hoeveel procent van de mannen groter dan 17? 3. I het waarchjnljk dat een gevonden core van 180 of meer afkomtg ut een normaal verdeelde populate met µ 170 en σ 5? De tweede rchtng peelt een crucale rol bj toetende (verklarende) tattek 7 8

Voorbeeld Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90 -tepercentel? Voorbeeld Gebruk Tabel tandaard normale verdelng Tabel A: z 1 1.8 want de oppervlakte tuen o en z 1 1.8 ongeveer.40 Tabel B: z 1 1.8 want de oppervlakte recht van z 1 1.8 ongeveer.10 90 % 10 % 90 % 10 % 0 z 1 9 30 Voorbeeld Stel: de lengte van mannen n een populate normaal verdeeld met µ 170 en σ 5? 1. Wat het 90-te percentel? µ z σ 90 % µ 170 p 90? 10 % 1.8 176.4 170 5 Du p 90 176.4 Wat al core ut de echte wereld helemaal net ljken op een theoretche verdelng? Oplong: 1. kjk net kjk net naar core van ndvduen, maar naar core van teekproeven. Verbnd deze geoberveerde core (van bjv. gemddelden van teekproeven) met de theoretche norm m.b.v. de centrale lmettellng 3. Voorbeeld: Kanverdelng een dobbelteen Kanverdelng gemddelde twee dobbeltenen 31 3

Centrale lmettellng Steekproef 1,,, 1,,, onafhankeljk en dentek verdeeld, gemddelde µ, varante σ Z () µ σ 1 Stellng: Al wordt µ () normaal verdeeld Z tandaard normaal verdeeld (0,1) σ Student t-verdelng Door W.S. Goet gepublceerd n 1908, Stattcu Gunne berbrouwerj., Peudonem Student k vrjhedgraden k : normale verdelng Leuk, meetal weten we µ en σ helemaal net. 33 34 Student t-verdelng () Student t-verdelng (3) Steekproef 1,,, onafhankeljk en normaal verdeeld gemddelde µ, varante σ α0.05 t(-1) α/ ut tabel C 35 t t () µ () µ heeft Student t-verdelng met -1 vrjhedgraden ( ) 1 ( ) 1 teekproefvarante tandaarddevate.5% α/ -t(-1) α/ 95% 1 -α 36.5% α/ t(-1) α/

Toeten Toeten Steekproef aantal uren gamen per week UU nformatca tudenten We wllen nu een utpraak doen over gemddelde over de hele populate van alle UU nformatca tudenten Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ 0 Bepaal teekproefgemddelde 37 38 Toeten Fouten Bj welk teekproefgemddelde zjn we het een met H 0 Stattche toet Tweezjdg toeten: Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ 0 Eenzjdg toeten: Hypothee H 0 : µ0 Alternateve hypothee H 1 : µ>0 Voorbeeld teekproef 18, 5, 8, 1, 3, 18, 18, 6, 5, 1 Toetand H 0 waar Belng Accepteer H 0 OK 1-α betrouwbaarhed Verwerp H 0 Type 1 Kan α gnfcantenveau H 0 net waar Type OK 39 40

t-toet met één teekproef Tweezjdge t-toet met één teekproef vergeljkng van één teekproefgemddelde met een norm (een van te voren bepaald gemddelde) H 0 : µ 0 (aantal uren gamen per week) H 1 : µ 0 probleem: σ ut populate net bekend en het teekproefaantal klen (<10) meetwaarden onafhankeljk en dentek normaal verdeeld (met zelfde gemddeldeen varante) eem aan: waarden n de teekproef zjn onafhankeljk, dentek verdeeld en normaal verdeeld Al H 0 waar geldt: oplong: t-verdelngen (vrjhedgraden pelen een rol) () µ t ob / t-tabel: ze boek van Wjk blz. 71 t ob () 0 () 0 heeft t-verdelng met df9 (9 vrjhedgraden) 41 4 Tweezjdge t-toet met één teekproef Tweezjdge t-toet met één teekproef Belngregel: Verwerp H 0 nden t ob -t crt of t crt t ob Accepteer H 0 nden -t crt < t ob < t crt We wllen α0.05, ofwel de kan dat we H 0 verwerpen terwjl hj waar, 5%. Crterum wordt: Ke t crt zodat P(t t crt ) α.05 en P(t -t crt ) α.05 voor t-verdelng met 9 vrjhedgraden, du α 0.05 aan edere kant met tabel C t crt (df 9).6 43 44

Tweezjdge t-toet met één teekproef Eenzjdge t-toet met één teekproef Bepaal toetnggroothed: Het teekproefgemddelde.3 en 3.65. µ 0, en 10 Bepaal de waarde van toetnggroothed. () µ t ob / t crt (df 9).6 du t ob.3 / 1.155 1.991 H 0 : µ 0 (aantal uren gamen per week) H 1 : µ > 0 og teed H 0 waar geldt: () 0 () 0 t ob heeft t-verdelng met df9 (9 vrjhedgraden) H 0 Accepteren!!!! 45 46 Eenzjdge t-toet met één teekproef Eenzjdge t-toet met één teekproef u belngregel van de vorm: Toetnggroothed: Verwerp H 0 nden t crt t ob Accepteer H 0 nden t ob < t crt () µ t ob / t ob.3 / 1.155 1.991 We wllen α0.05, ofwel de kan dat we H 0 verwerpen terwjl hj waar, 5%. Crterum wordt: Ke t crt zodat P(t t crt ) α.05 voor t-verdelng met 9 vrjhedgraden Tabel C t crt (df 9) 1.81 u t ob > t crt 1.81 H 0 verwerpen! 47 48

1,,, onafhankeljk en normaal verdeeld met gemddelde µ, varante σ : 1,,, looptjd algortme pzza-koerer: Betrouwbaarhednterval Goed Htogram heeft `ongeveer vorm normale verdelng (hoeft net al te treng) Vergeljkebare of zelfde ntante Zelfde parameter ntellngen Fout Waarden gebaeerd op verchllend aantal klanten Waarden gebaeerd op verchllende parameter-ntellngen () t( 1) α,() + t( 1) α (1-α)100 % betrouwbaarhednterval, bjv α 0.05 µ valt bnnen het nterval met kan 1-α, et (1-α)100% van de waarnemngen valt bnnen het nterval t(-1) α/ ut tattche tabel t(-1) α/ z α/ (normale verdelng) voor grote (>10) Pag 90 vwjk mag allleen bj een grote teekproef. 49 50 Betrouwbaarhednterval: voorbeeld Opmerkng S (5) 9 t(4) Hoeveel uur per week beteden nformatca tudenten aan gamen? 0.05.776 95% betrouwbaarhednterval: Student Marcel 18 Thoma 4 Wouter 4 Steven 1 Paktw 18 Aantal uren gamen p week H 0 : µ µ 0 wordt geaccepteerd n tweezjdge t-toet met α kan op type 1 fout dan en lecht dan al µ 0 lgt n het (1- α)* 100 % betrouwbaarhednterval [1.776 9 5,1+.776 9 5 ] [17.8,4.7] 51 5