1) Beschrijvende statistiek - herhaling

Vergelijkbare documenten
Via de grafische rekenmachine krijg je o.a. de volgende statistische resultaten: . In rekenmachinetaal wordt dit 3, 3248.

x z vonden we dat de z-score aangeeft hoeveel standaardafwijkingen de waarde

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS

De standaardafwijking

Vergelijken van verdelingen

SAMENVATTING STATISTIEK I

Combinatoriek groep 2

Regressie, correlatie en modelvorming

Statistiek voor Informatiekunde (I00099)

Statistiek II (A) ( ) H1: Puntschatters. Samenvatting Statistiek II (A) 9/01/2009 Y.W.

Zelf statistiek oefenen

Het gemiddelde. Prof. dr. Herman Callaert. Inhoudstafel

De vele werelden van de statistiek

In samenwerking met. ECU

Statistiek 2 voor TeMa Associaties tussen kwantitatieve variabelen. Statistiek 2 voor TeMa Associaties tussen kwantitatieve variabelen

Zelf statistiek oefenen

Combinatoriek groep 2

Combinatoriek-mix groep 2

Wegwijzer in de statistiek

REGRESSIE met de TI-83

2 Financieel rekenen

Een toelichting op het belang en het berekenen van de steekproefomvang in marktonderzoek.

Snel, sneller, snelst: statistiek en 1500 m schaatsen

Vlaamse Wiskunde Olympiade

VOOR HET SECUNDAIR ONDERWIJS. Verklarende statistiek. 6. Proporties. Werktekst voor de leerling. Prof. dr. Herman Callaert

Beste EWers, Nog veel succes, Vincent Jacobs.

Eindexamen wiskunde A1-2 vwo 2008-II

Steekproeftrekking Onderzoekspopulatie Steekproef

α ψ n Eigenwaardevergelijkingen ψ n (i = 1, g n ) Eigenvectoren en eigenwaarden van een operator eigenket eigenvector eigenwaarde is ook eigenvector

Betrouwbaarheidsintervallen

VOOR HET SECUNDAIR ONDERWIJS

De standaardafwijking die deze verdeling bepaalt is gegeven door

BIJLAGE A BIJ METHODEBESLUIT

2de bach PSW. Statistiek 2. Smvt. uickprinter Koningstraat Antwerpen B EUR

Lagrange-polynomen. Dick Klingens september 2004

Opgave 1 Zij θ R, n 1 en X 1, X 2,..., X n onafhankelijk, identiek verdeelde stochasten met kansdichtheidsfunctie. f θ (x) =

Statistiek Voor studenten Bouwkunde College 3

Rijen. 6N5p

Zoekersrubriek P Q R S [ ] respectievelijk, zodanig dat Q tussen A en R ligt en zodanig dat

Examen HAVO. wiskunde A. tijdvak 2 woensdag 19 juni uur. Bij dit examen hoort een uitwerkbijlage.

2de bach TEW. Statistiek 2. Van Driessen. uickprinter Koningstraat Antwerpen ,00

Opgeloste Oefeningen Hoofdstuk 5: Wet van de grote aantallen en Centrale limietstelling

Hoorcollege 1. Modus: meest voorkomende waarde in een dataset De dataset kan multi-modaal zijn meerdere modi hebben.

Betrouwbaarheid van een steekproefresultaat m.b.t. de hele populatie

Les 7-8: Parameter- en Vergelijkingstoetsen

FOTO-ELEKTRISCH EFFECT

Fourierreeksen. Calculus II voor S, F, MNW. 14 november 2005

Eindexamen wiskunde A1 vwo 2008-II

Schatters en betrouwbaarheidsintervallen

Variantie-analyse (ANOVA)

Eindexamen wiskunde B vwo II

G0N34a Statistiek: Examen 7 juni 2010 (review)

Toelichting bij Opbrengstgegevens VAVO

Werktekst 1: Een bos beheren

2.1 De normale verdeling

en haar gekke uitvindingen

Statistiek = leuk + zinvol

Statistiek Voor studenten Bouwkunde College 2

B O V E N D E U R B V

1. In de hoofdstad van Ivoorkust, Yamoussoukro, meet men de lengte van 100 mannen (in cm) :

Julian gooit 20 keer met een dobbelsteen. Bereken de kans dat hij precies 5 keer een zes gooit.

Convergentie, divergentie en limieten van rijen

HOOFDSTUK III. SCHATTEN VAN PARAMETERS Schatters en Betrouwbaarheidsintervallen. Theorie Statistiek Les 6

VOOR HET SECUNDAIR ONDERWIJS. Verklarende statistiek. 9. Toetsen van hypothesen. Werktekst voor de leerling. Prof. dr.

Eindexamen wiskunde A vwo I

PARADOXEN 9 Dr. Luc Gheysens

7.1 Recursieve formules [1]

Opgaven OPGAVE OPGAVE 2. = x ( 5 stappen ). a. Itereer met F( x ) = en als startwaarden 1 en

Statistiek Voor studenten Bouwkunde College 5

7. Betrouwbaarheidsintervallen voor proporties

Betrouwbaarheidsintervallen en het testen van hypothesen

Aandrijfelektronica \ Aandrijfautomatisering \ Systeemintegratie \ Service. Handboek. Prefabriceren van kabels Kabels voor synchrone servomotoren

Periodiciteit bij breuken

Steekproeven en schatters

PROEFEXAMEN SOCIALE STATISTIEK November 2009 REEKS 1

Rijen met de TI-nspire vii

Praktische opdracht: Complexe getallen en de Julia-verzameling

Uitwerkingen toets 11 juni 2011

Bij een invalshoek i =(15.0 ± 0.5) meet hij r =(9.5 ± 0.5). 100%-intervallen. Welke conclusie kan de onderzoeker trekken?

Hoofdstuk 1: Ideale Gassen

Stelling. Overzicht van de voordracht

nfraphil w wl il.nl nf r P h l w, i. P t" w l. nf rs w n i ww w.infraphil.nl ww Genezing door warmte Schoonheidsbehandeling

Van beschrijvende naar verklarende statistiek

Betrouwbaarheid. Betrouwbaarheidsinterval

Eindexamen wiskunde B1 vwo 2007-I

n n n bedoelen we uiteraard dat n N : 0 f x divergeert naar + of.

Ongelijkheden. IMO trainingsweekend 2013

Een Nieuw Conceptueel Model Voor Boekhouden Met Verschillende Abstractniveaus Sweere, A.M.J.

Correctievoorschrift VWO. Wiskunde B1,2 (nieuwe stijl)

1. Hebben de volgende rijen een limiet, en zo ja, bepaal die dan: (i) u n = sin(πn) (d) u n = cos(2πn) (l) u n = log n

Statistiek. (relatieve) frequenties: histogram cumulatieve (relatieve) frequenties: cumulatief frequentiepolygoon of ogief

Opgave 5 Onderzoek aan β -straling

www. POspiegel.nl Online Instrument voor CB Het Talent schooljaar februari DigiDoc

Een Nieuw Conceptueel Model Voor Boekhouden Met Verschillende Abstractniveaus Sweere, A.M.J.

Gemengde opgaven. 10 Mathematische statistiek. w 2,50 2,50 47,50 997, ,50. P(W = w) 0,95 0,049 0,0007 0,0002 0,0001

Complexe getallen. c(a+ib)=ca+i(cb) id(a+ib)=i(ad)+i 2 (bd)=(-bd)+i(ad) (a+ib)(c+id)=ac+i(ad)+i(bc)+i 2 (bd)= ac-bd+i(ad+bc)

Examen VWO. wiskunde B1. tijdvak 1 woensdag 16 mei uur. Bij dit examen hoort een uitwerkbijlage.

n -wet Wisnet-hbo update mei. 2008

WISKUNDE 5 PERIODEN DEEL B

Transcriptie:

Statstek

) Beschrjvede statstek - herhalg Wat s statstek? Beschrjvede statstek De beschrjvede statstek verzamelt gegeves e beschrjft de toestad door de gegeves te ordee tabelle, te verwerke, same te vatte e grafsch voor te stelle. Ook worde gemddelde, stadaardafwjkge, vormcoëffcëte e evetuele correlates (statstsche verbade) bereked. De gegeves worde dus letterljk beschreve aa de had va ee beperkt aatal typerede parameters. Dt s het oderwerp va dt eerste hoofdstuk e s egeljk ee herhalg va wat vroeger reeds werd geze. Verklarede (ducteve) statstek De verklarede statstek steut op de resultate ut de beschrjvede statstek e op de kasrekeg om op bass va steekproeve utsprake te doe over de gase populate. Dt vormt het tweede deel va deze cursus e her wordt deper op gegaa uverstare cursusse. Steekproef e populate De groep dvdue of objecte waarva we éé of meerdere kemerke wlle oderzoeke, oeme we de populate. Meestal s het opraktsch of omogeljk om de gehele populate te oderwerpe aa ee oderzoek. Vaak eme we daarom ee kle gedeelte va de populate, ee steekproef. Ee kok eet mmers ook et de hele pa soep leeg om utsprake te doe over de kwaltet. Wel belagrjk s dat voor het proeve goed wordt geroerd. De eetlepel soep de beoordeeld wordt, moet represetatef zj voor het geheel. Kemerke va ee (goede) steekproef: De steekproef moet represetatef zj. Dat wl zegge dat de steekproef ee correct beeld moet geve va de verschedehed be de populate, dus dat de steekproef alle deelverzamelge va de populate everedg vertegewoordgd moete zj (we oeme dt ook wel gestratfceerd). Ook moet de omvag va de steekproef voldoede groot zj. De steekproef moet aselect zj. Dat beteket dat elk elemet va de populate dezelfde kas hebbe om opgeome te worde de steekproef. Me spreekt vaak va ekelvoudg aselecte steekproeve (EAS) deze cotext (ekelvoudg dudt da op het fet dat elk dvdu of object maar éé keer de steekproef ka ztte). Foute de et te wjte zj aa de steekproef bestaa uteraard ook. Zo bestaa er oresposfoute als mese et wlle meewerke aa ee equête. Ook resposfoute zj mogeljk door bjvoorbeeld slechte commucate of leuges. Ee typsch voorbeeld va ee et-represetateve steekproef treedt op bj het zogeaamde coveece samplg. Dt s je steekproef zo orgasere dat het gemak va de oderzoeker voorop staat. Voorbeelde zj straatequêtes, telefosche equêtes, ez. Cursus statstek - - S. Mettepege

Frequetetabel hstogram - ogef We bekjke twee ledede voorbeelde. Net-gegroepeerde gegeves We telle bj 5 geze het aatal kdere e we verkrjge volgede data (gegeves): 0 0 0 4 3 3 5 3 0 4 5 0 Om meer overzcht te krjge, kue we de waaremgsgetalle ordee: 0 0 0 0 0 3 3 3 4 4 5 5 Nog overzchteljker s ee frequetetabel: waaremgsgetalle x absolute frequete ekelvoudge frequetes relateve frequete f procetuele frequete absolute frequete c cumulateve frequetes relateve frequete cf procetuele frequete 0 5 0, 0% 5 0, 0% 6 0,4 4% 0,44 44% 7 0,8 8% 8 0,7 7% 3 3 0, % 0,84 84% 4 0,08 8% 3 0,9 9% 5 0,08 8% 5 00% De ekelvoudge absolute frequete s het aatal keer dat ee waaremgsgetal x voorkomt. De cumulateve absolute frequete c s het aatal waaremgsgetalle kleer of geljk aa x. De relateve frequetes geve de verhoudg va de absolute frequetes tot de omvag va de c steekproef of populate weer. Dus: f = e cf = De relateve frequetes worde ook vaak procete weergegeve. Dt zj da procetuele frequetes. Grafsch kue deze resultate weergegeve worde ee staaf- e taartdagram: staafdagram schjfdagram 8 7 6 5 4 3 0 3 4 5 6 aatal kdere 3 % 4 8% 5 8% 8% 0 0% 4% Cursus statstek - 3 - S. Mettepege

Gegroepeerde gegeves We bepale de lchaamslegte cm va 00 6-jarge joges, afgerod op de eehed: 75 68 77 67 76 67 7 66 73 7 70 86 68 80 65 59 55 79 84 55 88 63 56 7 6 6 74 59 6 69 7 79 70 65 57 68 67 66 7 74 83 73 68 50 8 54 60 59 89 53 6 66 57 79 64 69 65 93 54 80 7 68 80 8 7 76 65 76 7 69 6 67 59 69 76 85 76 64 69 66 60 64 63 70 58 68 75 73 65 65 66 83 64 67 59 80 58 63 69 77 Door de omvag va deze gegeves zou ee et-gegroepeerde frequetetabel zoals herbove zeer ooverzchteljk zj. Daarom keze we er her voor om de gegeves te groepere klasse. We doe dt op zo maer dat: elk waaremgsgetal tot preces éé klasse behoort; elke klasse vertegewoordgd wordt door het klassemdde; Voor het bepale va de klassebreedte, berekee we de varatebreedte va de steekproef: VB = xmax xm = 93 50 = 43 Deel de varatebreedte door het geweste aatal klasse (bvb. 0) e rod af: 43 0 = 4,3 4. Ee vustregel de soms ook gehateerd wordt om de klassebreedte te bepale s de verkatswortel eme va de varatebreedte (dat had her ogeveer 7 gegeve). Klasse Mdde x [ 50,54 [ 5 % % [ 54,58 [ 56 7 9 7% 9% [ 58,6 [ 60 0 % 0% [ 6,66 [ 64 6 36 6% 36% [ 66,70 [ 68 58 % 58% [ 70,74 [ 7 4 7 4% 7% [ 74,78 [ 76 83 % 83% [ 78,8 [ 80 8 9 8% 9% [ 8,86 [ 84 5 96 5% 96% [ 86,90 [ 88 3 99 3% 99% [ 90,94 [ 9 00 % 00% Deze tabel ka grafsch worde voorgesteld met ee hstogram. Dt s ee specaal soort staafdagram waarbj de hoogte va de rechthoekjes zo s bepaald dat de oppervlaktes erva recht everedg zj c f cf Cursus statstek - 4 - S. Mettepege

met de frequetes va de klasse. Als alle klasse eve breed zj da ka voor de hoogte zowel de absolute als de relateve frequete geome worde. We oeme het hstogram geormalseerd als de hoogte va de rechthoekjes zo s dat de totale oppervlakte va het hstogram s (de hoogte s da de relateve frequete gedeeld door de klassebreedte). Op de fguur heraast ze je aast het hstogram ook het rood het ekelvoudg frequetepolygoo geteked. Dt verbdt de pute met als x-waarde de klassemddes e als y -waarde de hoogte va de rechthoekjes (frequete). Bj ee geormalseerd hstogram zal ook de oppervlakte oder deze kromme zj. We oeme dt da ee dchthedskromme. Op de fguur heraast s het ogef geteked dat bj deze data hoort. Dt s het cumulateve frequetepolygoo. Dt verbdt de pute met als x -waarde de rechtergreze va de klasse e als y -waarde de cumulateve frequete (her relatef, maar dat mag ook absoluut zj). Cetrummate Cetrummate zj getalle de kemerked voor de cetrale lggg va de waaremgsgetalle. De bekedste zj het (rekekudg) gemddelde, de medaa e de modus. Het gemddelde Het (rekekudg) gemddelde x va ee groep waaremgsgetalle s de som va alle waaremgsgetalle gedeeld door hu aatal. I formulevorm geeft dt x = x = of voor gegroepeerde gegeves p klasse: p x = x. = Alle gegeves zj betrokke bj de berekeg e hebbe dus vloed op de grootte va het rekekudg gemddelde. Het adeel s dat utbjters e utscheters (extreem klee of grote waaremgsgetalle) het rekekudg gemddelde eorm beïvloede. Cursus statstek - 5 - S. Mettepege

Medaa e kwartele - boxplot De medaa Me va ee groep getalle s het mddelste getal als deze volgorde va grootte zj geragschkt. Als het aatal eve s da eem je het gemddelde va de twee mddelste getalle. Het eerste kwartel Q va ee groep getalle s de medaa va alle getalle de kleer zj da de medaa. Het derde kwartel Q 3 va ee groep getalle s de medaa va alle getalle de groter zj da de medaa. Ee boxplot s ee grafsche weergave waarop je het kleste e het grootste gegeve ka afleze aast de kwartele e de medaa. Op de fguur heraast ze je de boxplot geteked de hoort bj het tweede voorbeeld ut de vorge paragraaf. Modus De modus Mo va ee groep waaremgsgetalle s het getal met de grootste absolute frequete of het klassemdde va de klasse met de grootste ekelvoudge frequete. Spredgsmate Spredgsmate va ee groep waaremgsgetalle zj getalle de aageve of de waaremge dcht bj elkaar lgge of et eerder verspred zj. We bekjke er ekele: De varatebreedte e de terkwartelafstad De varatebreedte s het verschl tusse de grootste e de kleste waaremg. De terkwartelafstad s het verschl tusse het derde e het eerste kwartel. Dt s veel mder afhakeljk va extreme waarde da de varatebreedte. Varate e stadaardafwjkg De varate s va ee groep gegeves s de gemddelde kwadratsche afwjkg va de gegeves t.o.v. het rekekudg gemddelde. De stadaardafwjkg s de posteve verkatswortel herut. = I formulevorm s dt: s = ( x x) of voor gegroepeerde gegeves: s = ( ) x x p =. De stadaardafwjkg s s da uteraard de verkatswortel va de varate: s = s. Deze twee spredgsmate zj eorm afhakeljk va extreme meetwaarde. Opmerkg: Als het om populates gaat worde het gemddelde e de stadaardafwjkg met de Grekse letters µ e σ (mu e sgma) geoteerd. Als het om steekproeve gaat otere we het zoals gedefeerd met x e s. I de formule wordt er bj s da soms gedeeld door plaats va omdat we later zulle ze dat dt ee betere schatter s voor de stadaardafwjkg σ va de populate waarut de steekproef werd geome. Cursus statstek - 6 - S. Mettepege

) De ormale verdelg Voorschrft Als we het voorbeeld va de lchaamslegte herbekjke da ze we dat de gegeves zch vrj symmetrsch verdele rod de gemddelde waarde va x = 68,97 (cm). Het (ekelvoudg) frequetepolygoo zet er ee beetje ut als ee klok. De oppervlakte oder deze kromme s. We oemde dt reeds het vorge hoofdstuk ee dchthedskromme. Je ka de oppervlakte be ee terval oder deze kromme dus terpretere als de kas dat ee waaremgsgetal be dt terval zal lgge. Carl Fredrch Gauss bewees dat het voorschrft va zo ee symmetrsche klokvormge dchthedskromme (met gemddelde µ e stadaardafwjkg σ ) ka geschreve worde als: ( ) f x = e π σ ( x µ ). σ. Va heel veel gegeves ut de realtet s gewete dat ze m of meer ormaal verdeeld zj: het geboortegewcht, het IQ, de hoofdomtrek,... Maar je mag zeker et deke dat alles ormaal verdeeld s. Zo zj bjvoorbeeld de selhed bj overtredge de bebouwde kom of het gezskome zeker et ormaal verdeeld. De vustregel Bj ee ormale verdelg zal altjd 68% va de gegeves het terval [ µ σ, µ σ] het terval [ µ σ, µ + σ ] lgge e 99,75% zal het terval [ µ 3 σ, µ 3σ ] + lgge, 95% zal + lgge. We oeme dt de vustregel va ee ormale verdelg. Het geeft os ee crterum om a te rekee of gegeves al da et ormaal verdeeld zj. Grafsch geeft dt het volgede: Cursus statstek - 7 - S. Mettepege

De grafek va de ormale verdelgsfucte Zoals reeds vermeld s het voorschrft va de ormale verdelgsfucte: N ( x) ( x µ ) σ = e. πσ Ee ormale verdelg hagt dus ekel af va twee parameters: het gemddelde µ e de stadaardafwjkg σ. We otere deze verdelgsfucte korter als N ( µ, σ ). Grafsch kue we de parameters afleze als volgt: Het gemddelde µ s de x -waarde va de top. De stadaardafwjkg σ s de horzotale afstad tusse top e bugput. Het gemddelde µ bepaalt het mdde va de grafek. De stadaardafwjkg σ bepaalt hoe stel de grafek s, dus welke mate de gegeves de buurt va het gemddelde lgge. De stadaard ormale verdelg De ormale verdelg met gemddelde µ = 0 e stadaardafwjkg σ = oeme we de stadaard. ormale verdelg. De stadaard ormale verdelg otere we met Z, dus Z N ( 0,) Elke ormale verdelg kue we va ee eevoudge trasformate herlede tot de stadaard ormale verdelg. We zegge da dat we de verdelg stadaardsere. Dt gebeurt aa de had va µ de formule: Z =, of omgekeerd = µ + σ. Z. σ : We stadaardsere als voorbeeld de verdelg N ( 68,) 68 Z= Je zet dat de praktjk ekel de jk op de asse veradert (de x -as wordt de z -as). I oefege zal het vaak uttg zj oder de grafek zowel x -waarde als z -waarde te plaatse. De z-score Het fet dat elke ormale verdelg gestadaardseerd ka worde laat os ook toe gegeves objectef met elkaar te vergeljke. We llustrere dt met ee eevoudg voorbeeld: Cursus statstek - 8 - S. Mettepege

Ja scoort 45/60 op ee toets waar het gemddelde 36 was e de stadaarddevate 4. Eva scoort op ee adere toets 48/60 waar het gemddelde 4 was e de stadaardafwjkg 6. We stadaardsere bede pute (we oeme dt hu z -scores berekee): 45 36 9 48 4 6 z Ja = = =,5 e z Eva = = = 4 4 6 6 Relatef geze scoort Ja dus (veel) beter! Rekee met de ormale verdelg Percetages berekee met de GRM Je rekemache ka voor elke ormale verdelg berekee hoeveel % va de gegeves er tusse twee waarde lgge. Je gebrukt daarvoor de fucte ormalcdf. Deze fucte heeft 4 parameters odg. Om te berekee hoeveel % va de gegeves er tusse x e x bj de ormale verdelg N ( µ, σ ) typ je : ormalcdf( x, x, µ, σ ). Je rekemache geeft da het percetage decmale vorm. (Als het om de stadaard ormale verdelg gaat hoef je µ = 0 e σ = et te type). Bj de euwste besturgssysteme gebeurt dt al ee GUI, maar dt komt op hetzelfde eer. Voorbeeld: De lchaamslegte va de vrouwe ut ee bevolkgsgroep s ormaal verdeeld met ee gemddelde va 68 cm e ee stadaardafwjkg va cm. a) wat s de kas dat ee vrouw kleer s da 50cm? b) wat s de kas dat ee vrouw groter s da 80cm? c) wat s de kas dat ee vrouw ee legte heeft tusse 60cm e 80cm? a) b) We krjge ekel ee bovegres gegeve. Alle gegeves kleer da 50 voldoe dus aa het gegeve. Als odergres gebruke we da ( de rekemache typ je : E99 ). We berekee: ormalcdf(-e99, 50, 68, ) = 0.06680787 ogeveer 6,68% va de vrouwe s kleer da 50 cm. Her krjge we ekel ee odergres. Aaloog aa de voorgaade oefeg berekee we: ormalcdf(80, E99, 68, ) = 0.58655596 ogeveer 5,87% va de vrouwe s groter da 80 cm. c) Her zj bede greze gegeve. We berekee: ormalcdf(60, 80, 68, ) = 0.58885734 ogeveer 58,89% va de vrouwe s tusse 60 cm e 80 cm groot. Greze berekee met de GRM Aderzjds ka de rekemache ook de gres berekee waarvoor ee gegegeve percetage va de gegeves kleer zal zj. We gebruke hervoor de fucte vnorm. Deze fucte heeft 3 parameters odg. Cursus statstek - 9 - S. Mettepege

Om te berekee wat de gres s waarvoor 00 p % va de gegeves kleer s bj ee ormale verdelg N ( µ, σ ) typ je vnorm( p, µ, σ ). Herbj s dus p het percetage decmale vorm. (Als het om de stadaard ormale verdelg gaat hoef je µ = 0 e σ = et te type). Voorbeeld: De lchaamslegte va de vrouwe ut ee bevolkgsgroep s ormaal verdeeld met ee gemddelde va 68 cm e ee stadaardafwjkg va cm. a) De kortste 0% vrouwe oeme we zeer kle. Tot welke grootte s dt? b) De grootste % va de vrouwe oeme we reuze. Vaaf welke grootte s dt? a) b) Dt kue we berekee met: vnorm(0.0, 68, ) = 5.638 0% va de vrouwe s korter da ogeveer 5,6 cm. Dek eraa dat de fucte vnorm de gres bereket waarvoor ee bepaald percetage kleer s. Vermts de totale oppervlakte oder de kromme 00% s, zoeke we dus her de gres waarvoor 98% va de vrouwe kleer s: vnorm(0.98, 68, ) = 9.6449869 % va de vrouwe s groter da ogeveer 9,64 cm. Oefege met de stadaard ormale verdelg Tot og toe hebbe we de oefege de stadaard ormale verdelg og et odg gehad. We zulle ze echter wel odg hebbe als we ee obeked gemddelde of stadaardafwjkg hebbe. Voorbeeld: Veroderstel dat ee mache de flesse water vult gesteld s op ee gemddelde va lter e ee stadaardafwjkg va 5 gram (=0,005 lter). Da zal de helft va alle flesse ee houd hebbe va mder da lter. Op welk gemddelde moet de mache worde afgesteld (met dezelfde stadaardafwjkg) als slechts 5% va de flesse mder da lter water mag bevatte? We krjge her ee gres é ee percetage gegeve, maar het gemddelde s obeked. De maer om dt op te losse s om dezelfde gres te berekee voor de stadaard ormale verdelg e da de stadaardsergsformule te gebruke om µ te vde. De gres waarvoor 5% va de gegeves s voor de stadaard ormale verdelg vd je met je rekemache: z g = vnorm(0.05) -,645. Ivulle de stadaardsergsformule geeft: xg µ zg = zg. σ = xg µ µ = xg zg. σ (, 645 ).0, 005 =, 0085. σ De mache moet gesteld worde op ee gemddelde va ogeveer,0085 lter. Cursus statstek - 0 - S. Mettepege

3) Kasverdelge Stochaste I de kasrekeg s ee stochastsche varabele (kortweg stochast) ee groothed waarva de waarde ee reëel getal s dat afhagt va ee toevallge utkomst ee kasexpermet. Soms wordt dt ook ee toevalsveraderljke geoemd. We oderschede twee soorte stochaste: dscrete stochaste e cotue stochaste. Dscrete stochaste Ee dscrete stochast ka slechts ee edg aatal waarde x, x,..., x aaeme. We otere de kas dat x optreedt met moet uteraard zj. p, of aders geformuleerd: P( x ) = = p. De som va al deze kase De fucte f ( x) = P( = x) oeme we de kasverdelgsfucte (er geldt dus f ( x ) De cumulateve verdelgsfucte F defëre we als F ( x) = P( x) = p ). Voorbeeld: We beschouwe het kasexpermet dremaal opgooe va ee mutstuk, e we oeme de stochast het aatal keer dat je mut hebt gegood. 3 Herbj geldt voor de kasverdelg: f ( 0) = f ( 3) = P( = 0) =, f ( ) = f ( ) = P( = ) =. 8 8 Heraast ze je zowel de kasverdelgsfucte f als de cumulateve verdelgsfucte F geteked. Merk op dat f ekel gedefeerd s voor de waarde 0,, e 3, e F voor alle reële waarde. Cotue stochaste Ee cotue toevalsveraderljke ka alle waarde aaeme ee terval. Voor elke cotue b toevalsveraderljke bestaat er ee kasdchthedsfucte f zodat P( a b) ( ) = f x dx. De kas dat ee waarde aaeemt tusse a e b s dus geljk aa de oppervlakte begrepe tusse de x -as e de dchthedsfucte f het terval [ a, b ]. Rekeg houded met de defte va het begrp kas, moet ee dchthedsfucte f voldoe aa: x R f ( x) + : 0 (de totale oppervlakte oder de dchthedskromme moet zj) f ( x) dx = x De cumulateve verdelgsfucte F defëre we als F ( x) P( x) ( ) Ut de tegraalrekeg wete we da dat D F( x) ( ) f ( x) =. = = f t dt. Ee hele reeks stochaste hebbe we reeds geze: zj met ee ormale kasverdelgsfucte. Cursus statstek - - S. Mettepege a

Verwachtgswaarde va ee stochast Bj dscrete stochaste De verwachtgswaarde va ee dscrete stochast de de waarde x ka aaeme met kas ) wordt gegeve door: E( x) met µ = x p = =. p (e Voor het voorbeeld ut de vorge paragraaf (aatal keer mut bj het opgooe va 3 mute) s dt: 3 3 3 E( ) = 0 + + + 3 = =, 5. 8 8 8 8 Dt resultaat s heel logsch, wat je verwacht de helft va de kere dat je goot mut. Merk op dat de verwachtgswaarde,5 zelf gee mogeljke utkomst va het kasexpermet s. Dat hoeft ook et. De verwachtgswaarde s de gemddelde waarde va de stochast als je het expermet oedg veel zou herhale (wat uteraard praktjk oot mogeljk s). Bj cotue stochaste De verwachtgswaarde bj ee cotue stochast met kasdchthedsfucte f defëre we als: + ( ) = µ = ( ) E x f x dx. De stadaardafwjkg va ee stochast Bj dscrete stochaste De varate va ee toevalsveraderljke s de verwachte gemddelde kwadratsche afwjkg va de stochast te opzchte va zj verwachtgswaarde. Var = σ = x µ p I formulevorm wordt dt: ( ) ( ) = σ =. De stadaardafwjkg va ee stochast s de verkatswortel ut zj varate: Var ( ) Stellg: Ee alterateve maer om de varate te berekee s Var( ) E( ) ( E( )) = x p = x p x p + p = = = = σ µ µ µ Bewjs: ( ) ( ) ( ) σ = E µ x p + µ p = E µ = = = µ = =. Dt reket ets makkeljke oefege. Hereme we ogmaals het voorbeeld ut de vorge paragraaf (aatal keer mut bj het opgooe va 3 mute) da geeft dt: 3 3 9 3 3 Var( ) = x p µ = 0 + + 4 + 9 =, e dus ook σ =. 8 8 8 8 4 4 = Bj cotue stochaste Herbj geldt: ( ) + ( ) ( ) + ( ). Var = σ = x µ f x dx = x f x dx µ Cursus statstek - - S. Mettepege

We bekjke ee voorbeeld va ee cotue stochast: Noem de tjdsduur ( mute) va ee les wskude op het Oscar Romerocollege. We defëre de kasdchthedsfucte als volgt: 6 x, x [ 40, 45] 75 5 f ( x) = x+, x [ 45,55 ] 75 5 0, x [ 40,55] Dat dt ee kasdchthedsfucte s kue we eevoudg arekee, wat: + 45 6 55 f ( x) dx = x dx x dx 40 + + = 75 5 45 75 5 De kas dat ee lesuur lager da 50 mute duurt wordt bereked als volgt: + 55 P( > 50) = f ( x) dx = x dx 50 50 + = 75 5 6 De verwachtgswaarde voor deze stochast s: + 45 6 55 40 E( ) = µ = x f ( x) dx= x x dx x x dx 46,67 40 + + = 75 5 45 75 5 3 De varate e de stadaardafwjkg zj: Var + ( ) ( ) = σ = x f x dx µ 45 55 6 40 75 75 = x x dx x x dx σ 3,8 40 + 75 5 45 + = = 75 5 3 8 8 Ee lesuur wskude duurt op het Oscar Romerocollege dus gemddeld 46 mute e 40 secode met ee stadaardafwjkg va ogeveer 3 mute e 7 secode. Rekeregels Stellg: Als ee dscrete stochast s, e a R ee costate, da geldt: E( + a) = E( ) + a e Var( + a) = Var( ) E( a. ) = ae. ( ) e Var( a. ) = a. Var( ) E + a = x + a p = xp + ap = E + a p = E + a = = = = Bewjs: ( ) ( ) ( ) ( ) ( ( ) ) = ( ) ( ) ( ( )) ( ) Var + a = x + a E + a p = x E p = Var = = Bewjs: E( a. ) = ( ax. ) p = a. x p = ae. ( ) = = (. ) = (.. ( )) =. ( ( )) =. ( ) Var a ax ae p a x E p a Var = = Cursus statstek - 3 - S. Mettepege

Deze stellge gelde ook voor cotue stochaste (bewjs als oefeg met tegraalrekeg). Va de volgede stellge valt het bewjs bute het bestek va deze cursus. Stellg: Als e Y oafhakeljke stochaste zj, da geldt: E( + Y) = E( ) + E( Y) e Var( + Y) = Var( ) + Var( Y) E( Y) = E( ) E( Y) Stellg: Als e Y oafhakeljke, ormaal verdeelde stochaste zj, da s ook de leare combate S = a + b Y ormaal verdeeld met µ S = a µ + b µ Y e σ = a s + b s. S Y Voorbeeld: Kev loopt zj 400m gemddeld op 50s met ee stadaardafwjkg va s. Joatha loopt zj 400m op gemddeld 5s met ee stadaardafwjkg va 3s. Wat s de kas dat Joatha ee wedstrjd seller loopt da Kev als je erva utgaat dat bede stochaste ormaal verdeeld zj. Voor bede stochaste geldt dus: K N ( 50,) e J N ( 5,3) ( ) P( J K 0). We moete de kas berekee P J < K = <. Weges de vorge stellg s ook J K ormaal verdeeld met gemddelde µ = 5 50 = e σ = + 3 = 3. De kas kue we dus berekee met oze ( ) rekemache e s geljk aa P( J K 0) 0, 895 ormalcdf ( E99, 0,, 3) De - wet < = =. Ut de rekeregels volgt omddelljk dat als,,..., allemaal oafhakeljke stochaste zj met hetzelfde gemddelde µ e dezelfde stadaardafwjkg σ, dat da geldt: Voor de stochast S = + +... + : µ S =. µ e σs = σ + +... + σ Voor de stochast = : µ = µ e σ = Voorbeeld: Fay haalt op haar toetse va wskude gemddeld 6 op 0 met ee stadaardafwjkg va (deze pute zj ormaal verdeeld). a) Voor ee rapportperode worde 3 toetse samegeteld. Wat s de kas dat Fay daar meer da 0 op 30 haalt? De stochaste T de de pute per toets voorstelle zj ormaal verdeeld T N ( 6,) som S va dre toetse s ook ormaal verdeeld, met µ S = 3.6 = 8 e σ = 3.= 3. De kas dat Fay meer da 0 haalt s dus: ( ) ( > 0) = 0,4 = ormalcdf ( 0, E99, 8, 3) P S b) Op het ede va het jaar heeft Fay 6 toetse gemaakt. Bereke de kas dat Fay haar gemddelde oder de helft zt. Voor het gemddelde geldt N 6, σt, wat µ = µ T 6 4 = e σ = =. 6 4 De gevraagde kas s P( 5) 0, 00003 ( ormalcdf ( E99, 5, 6, 4) ) < = =. S. De Cursus statstek - 4 - S. Mettepege

4) De bomale verdelg Beroull expermete Ee Beroull-expermet s ee toevalsexpermet met twee mogeljke utkomste, meestal aagedud als "succes" e "mslukkg". Ee Beroull-expermet wordt beschreve door ee stochast de de waarde (succes) e 0 (mslukkg) ka aaeme. Is B ee stochast met P( B = ) = p e ( ) P B = 0 = q = p ( p s de kas op succes dus s q = p de kas op mslukkg), da worde de verwachtgswaarde e de stadaardafwjkg gegeve door: µ = 0. q +. p = p ( 0 ). ( ). ( ) σ = p q+ p p = p q + q p = pq p+ q = pq Bomale verdelg De bomale verdelg s de kasverdelg va het aatal successe ee reeks va oafhakeljke Beroull-expermete met kas op succes geljk aa p. We otere de verdelg als (, ) B p. I het geval =, komt de bomale verdelg overee met de Beroull-verdelg. I ee reeks va Beroull-expermete kue 0 tot e met successe voorkome. Het aatal successe s dus derdaad ee toevalsveaderljke. De kas op preces k successe, P( = k), ka gemakkeljk bereked worde als we bedeke dat elke reeks utkomste met k successe (e dus k mslukkge) dezelfde kas k k p q heeft. Omdat er k C verschllede reekse zj met k k preces k successe, wordt de kasverdelgsfucte gegeve door: P( k) C p ( ) k p = =. Voorbeeld : Je goot 0 keer met ee dobbelstee. Wat s de kas dat je twee keer ee 6 goode?. De stochast de aageeft hoeveel keer er 6 werd gegood s bomaal verdeeld: B( 0, 6) Dus P( ) 8 5 = = C0.. = 0,907. 6 6 Je ka dt je rekemache makkeljk berekee met de fucte bompdf ( 0, 6, ). Voorbeeld : Wat s hetzelfde expermet de kas dat je hoogstes 4 keer ee 6 goode. ( 4) = ( = 0) + ( = ) + ( = ) + ( = 3) + ( = 4) P P P P P P ( 4) P ( ) P 0 0 9 8 3 7 4 6 0 5 5 5 3 5 4 5 0 0 0 C0 C0 = C 6 6 + C + C + 6 6 6 6 + 6 6 6 6 4 0,984538 Het s heel wat werk om dt te geve je rekemache. Gelukkg bestaat er her ook ee sellere maer voor, wat ook de cumulateve verdelgsfucte voor de bomale verdelg zt je rekemache. Je ka dus plaats va het voorgaade smpelweg bomcdf ( 0, 6,4 ) voere. Cursus statstek - 5 - S. Mettepege

De karaktersteke Ee bomale verdelg B B(, p) s eevoudgweg de som va oafhakeljke Beroull expermete met kas op succes geljk aa p. Ut het voorgaade volgt dus omddelljk dat: µ B =. µ Ber =. p σ =. σ =. pq = pq Voorbeeld : Wat s de verwachtgswaarde e de stadaardafwjkg voor het aatal keer dat je 6 goot als je 0 worpe doet met ee gewoe dobbelstee? 5 5 5 µ = 0 = e σ = 0 = 6 3 6 6 6 De ormale beaderg Tekee we de grafek va de bomale verdelgsfucte ut het vorge voorbeeld da krjge we de grafek rechts. Als we het aatal keer dat het expermet wordt utgevoerd ( ) opdrjve, da krjge we grafeke de meer e meer gaa ljke op ee ormale verdelg. We llustrere dt met = 0 e = 50 : B Ber We stelle dus dat als voldoede groot dat da de bomale verdelg B(, p ) ka beaderd worde door de ormale verdelg N ( p, pq ). Me heeft afgesproke dat dt mag va zodra dre voorwaarde gelde: 0 p 5 q 5 De cotuïtetscorrecte Er s bj deze beaderg wel ee belagrjk ets op te merke: ee dscrete stochast beadere met ee cotue stochast vraagt om ee aapassg va je greze. We llustrere met ee voorbeeld: Beschouw de stochast als het aatal keer dat je 6 goot als je 00 keer met ee dobbelstee werpt.. Voor de stochast geldt dat B( 00, 6) Deze stochast ka beaderd worde met de stochast 50 5 5 5 µ = p = 00 = e σ = pq = 00 = 6 3 6 6 3 00 5 5 ' N,, wat de parameters zj: 6 3 a) Bereke de kas dat je va de 00 keer dat je goot totaal 0 keer ee 6 goode. Cursus statstek - 6 - S. Mettepege

Exact s dt P( ) 0 90 0 5 = 0 = C 00 0, 040 6 6 = 0 9, 5 ' < 0,5 0, 075 Beaderd: P( ) P( ) (met de GRM: bompdf ( 00, 6,0 ) e ormalcdf ( 9.5,0.5,50 3, 5 5 3 ) ) Je eemt deze greze omdat je de waarde het terval [9,5 ; 0,5[ afrodt tot 0. b) Bereke de kas dat je va de 00 keer mstes 0 keer ee 6 goode. 0 = 9 = 0, 97 Exact s dt P( ) P( ) Beaderd s dt P( ) P( ) 0 ' 9,5 0, 35 -bomcdf 00, 6,9 e ormalcdf ( 9.5, 99,50 3, 5 5 3) (met de GRM: ( ) De cetrale lmetstellg E ) De beaderg de herbove gebrukt wordt s ee specaal geval va de cetrale lmetstellg. Dt s mssche wel de belagrjkste stellg heel de statstek. Ze zegt: De som va ee aatal oafhakeljke toevalsveraderljke zal altjd aar ee ormaal verdeelde stochast ege als het aatal maar groot geoeg s. Het bewjs va deze stellg valt (ver) bute het bestek va deze cursus. 5) Schatte met putschatters e betrouwbaarhedstervalle Het doel va statstek s altjd om op bass va ee goede steekproef ee utspraak te kue doe over de populate. De meest eevoudge maer om dt te doe s met behulp va putschatters. Putschatters Als we ee parameter va ee populate (voorbeelde zj p, µ e σ ) wlle schatte kue we gebruk make va ee waarde de we berekee aa de had va ee steekproef. Deze waarde s ee stochast, wat hj s afhakeljk va het toeval (de steekproef). We oeme zulke stochaste ook wel ees steekproefgroothede. We spreke af dat we steekproefgroothede de parameters schatte (putschatters geoemd) otere met dezelfde letters als de parameter de ze wlle schatte, maar da met ee hoedje op. Zo schat ˆp de parameter p, schat ˆµ de parameter µ ezovoort. Goede putschatters voldoe aa twee egeschappe: Hj moet zuver zj: dt wl zegge dat de verwachtgswaarde va de putschatter geljk s aa de parameter de hj schat. Hj moet effcët zj: dt wl zegge dat de stadaardafwjkg va de putschatter zo kle mogeljk s. Er ka beweze worde dat het gemddelde va ee steekproef ee zuvere e effcëte schatter s voor het gemddelde µ va ee populate, e dat S, de stochast de de stadaardafwjkg bereket bj ee steekproef, ee zuvere e effcëte schatter s voor de stadaardafwjkg σ va de populate. Betrouwbaarhedstervalle Ee putschattg s teressat maar het s zeer beperkt. Het s veel zvoller om ee terval te geve waarbe de te schatte parameter met ee zekere betrouwbaarhed lgt. Cursus statstek - 7 - S. Mettepege

Om dt probleem op te losse bekjke we eerst het begrp krteke z -waarde: Krteke z-waarde De krteke z -waarde z α de bj ee bepaald percetage α % hoort wordt gegeve door de z-score waarvoor geldt dat P( z Z z ) % < < =. α α α Ekele bekede krteke z -waarde zj z 90 =, 65, z 95 =,96 e z 99 =,58. Dt s eevoudg geïllustreerd op de fguur heraast. Waarschjljkhedstervalle voor steekproefproportes We bekjke eerst de eevoudge rchtg: Als de proporte p va ee egeschap geked s ee populate, da stelle we ee symmetrsch terval op rod p zodat 95% va de steekproeve met grootte de je eemt de proporte ˆp va de egeschap de steekproef dat terval lgt. Aa de had va de krteke z -waarde ka je da de krteke x-waarde berekee met behulp va de formule = µ + σ Z. Voorbeeld: Va ee bepaalde mut s gewete dat hj vervalst s. Hj werpt 40% va de gevalle mut. Stel het waarschjljkhedsterval op voor de steekproefproporte ˆp symmetrsch om de gekede proporte p = 0, 4 waarbe de steekproefproporte met 95% waarschjljkhed zal lgge, als de steekproefgrootte = 5 s. Weges de cetrale lmetstellg s de steekproefproporte ogeveer ormaal verdeeld met 0,4.0,6 6 parameters µ = p = 0, 4 e σ = pq = =. 5 5 De krteke z -waarde voor 95% s z95,96, dus de krteke x -waarde zj: x 0,4+,96 6 5 0,59 e x 0, 4,96 6 5 0, 08. We kue dus zegge dat er voor elke steekproef ee kas s va 95% dat de steekproefproporte ˆp (hoeveel % va de 5 keer je mut goot met de valse mut) het terval [ 0,08; 0,59 ] zal lgge. De formule de we her hebbe opgesteld valt heel eevoudg te veralgemee: Komt ee kemerk ee populate voor met proporte p da wordt het α % - pq waarschjljkhedsterval voor ˆp gegeve door p zα ; p+ zα Betrouwbaarhedstervalle voor proportes pq. Draae we deze redeerg om, da kue we stelle dat α % va de steekproeve met grootte ( ) ( ) ˆ ˆ ˆ ˆ de populateproporte p het terval ˆ p p z p ; pˆ z p p α + α zal lgge. We oeme dt het α % -betrouwbaarhedsterval dat we met de steekproef bekome. ( ) pˆ pˆ De waarde m = zα oeme we de foutemarge va het betrouwbaarhedsterval. Cursus statstek - 8 - S. Mettepege

!Belagrjk!: Dt terval drukt gee kas ut. De werkeljke proporte p zal ofwel het terval lgge, ofwel et. Vadaar dat we her spreke va betrouwbaarhed plaats va waarschjljkhed. De betekes va ee betrouwbaarhedsterval kue we ook eevoudg grafsch llustrere. Op de fguur heraast staa voor 00 verschllede steekproeve telkes het bjhorede betrouwbaarhedsterval geteked. Je zet dat 95% va de gevalle de populateparameter de je wl schatte (de horzotale bordeaux lj) het terval lgt. Betrouwbaarhedstervalle voor het populategemddelde µ Volledg aaloog aa de tervalle voor proportes kue we ook tervalle opstelle voor het steekproefgemddelde ˆ µ = e het populategemddelde µ. We zage de vorge hoofdstukke reeds dat als ee stochast s met gemddelde µ e stadaardafwjkg σ, dat da bj beaderg ormaal verdeeld s als voldoede groot s σ (cetrale lmetstellg) met parameters µ = µ e σ = (de -wet). Met adere woorde: σ σ P µ zα ; µ + zα = α %. De redeerg omdraae mplceert dat we u ook ee α % -betrouwbaarhedsterval kue opstelle voor µ als we ee steekproef eme va grootte met gemddelde x, ameljk: σ σ x zα ; x + zα.!belagrjk!: deze formule geldt ekel als de populatestadaardafwjkg σ geked s. Aders moet er ee adere formule gebrukt worde de gebruk maakt va de studet t -verdelg met behulp va de steekproefstadaardafwjkg s, maar dat valt bute het bestek va deze cursus. σ De waarde m = zα oeme we de foutemarge va het betrouwbaarhedsterval. Voorbeeld: De legte va ee laatstejaarsstudet op het Oscar Romerocollege s ormaal verdeeld met ee stadaardafwjkg va 3 cm. Je eemt ee steekproef va 5 persoe e bekomt ee gemddelde legte va 70 cm. a) Stel ee 95%-betrouwbaarhedsterval op voor de gemddelde legte va ee laatstejaarsstudet op het Oscar Romerocollege. 3 3 Het terval s 70, 96 ; 70+, 96 5 5, of eevoudger [ 64,904;75,096 ]. b) Hoe groot moete we oze steekproef eme als ee 99%-betrouwbaarhedsterval maxmaal cm breed mag zj. Da mag de foutemarge dus maar zj, dus >,58 3 > (,58.3) 5. Dt s uteraard omogeljk. Cursus statstek - 9 - S. Mettepege

6) Toetse va hypothese Cocept Met het toetse va hypothese tracht je op ee statstsch veratwoorde maer aa de had va ee steekproef ee utspraak (de ulhypothese) over de populate te aavaarde of et te weerlegge (je aavaardt da ee alterateve hypothese). Statstsch veratwoord wl zegge dat we met ee bepaalde kas deze ulhypothese aavaarde of et et. De kas dat we de ulhypothese et aavaarde terwjl ze toch just zou zj oeme we het sgfcateveau α va de toets. We bekjke 3 ledede voorbeelde om dt cocept te verdudeljke. Utgewerkte voorbeelde Ee test met behulp va de bomale verdelg Voorbeeld: Ee leerlg haalt 7/0 op ee multple choce toets terwjl hj beweert op alles gegokt te hebbe. Bj elke vraag ware er 3 atwoordmogeljkhede. Test zj bewerg op het 5% sgfcateveau. We berekee de kas dat deze leerlg door puur te gokke 7/0 haalt (of og beter), oder de aaame dat hj derdaad op alles gegokt heeft. De ulhypothese H 0 s dus de aaame dat hj alles zou gegokt hebbe, e dat dus de stochast T de zj pute aageeft bomaal verdeeld zou zj. Aders gezegd geldt da H T B ( ) 0 : 0, 3. Is deze kas kleer da het sgfcateveau da verwerpe we de ulhypothese e aavaarde we de alterateve hypothese ( H : hj heeft et op alles puur gegokt maar had wel degeljk voorkes, of dus : a De kas dat hj 7 of meer haalt s P( T ) P( T ) H T ( 0, 3) B ). 7 = 6 = 0, 097 ( = bomcdf(0, 3, 6) ) Er s dus slechts % kas dat deze leerlg 7 of meer zou hale als hj op alles had gegokt. We verwerpe dus deze hypothese op het 5% sgfcateveau. (merk op dat we ze wel hadde aavaard op het % sgfcateveau). De overschrjdgskas de we berekede ( p = 0, 097 ) oeme we de p-waarde va deze toets. Ee test verbad met proportes (Bj het toetse va hypothese otere we proportes met π de populate e ˆ π de steekproef om verwarrg met de p -waarde te vermjde). Voorbeeld: Er s gewete dat 6% va de pasgeboree Vlaadere ee bepaalde afwjkg heeft. Ee gyaecoloog twjfelt her echter aa e dekt dat dt bj hem de praktjk et zo s. Hj doet ee steekproef bj 400 geboortes e komt ut dat bj hem slechts 7 va de baby s deze afwjkg vertoe. Test de bewerg 6% va de pasgeboree Vlaadere heeft de afwjkg op het 0% sgfcateveau. Weges de cetrale lmetstellg s zj de steekproefproportes ˆ π ogeveer ormaal verdeeld met parameters µ π 0, 06 = = e σ π ( π ) 0, 06.0,94 = = 0, 087. 400 De ulhypothese s H 0 : π = 0,06, e de alterateve hypothese s H a : π 0,06 De kas dat de proporte dus zo ver afwjkt va de gegeve waarde of og extremer s, s geljk aa: p =. P ˆ π < 0, 045 0,405. We aavaarde dus de ulhypothese. ( ) Cursus statstek - 0 - S. Mettepege a

Alterateve methode : Je ka de krteke ˆ π -waarde berekee de het aavaardgsgebed voor de ulhypothese afbakee. Dt s makkeljk te ze als je de verdelg va ˆ π grafsch voorstelt. De krteke greze zj vorm( 0.05, 0.06, 0.087) = 0, 0405 e vorm( 0.95, 0.06, 0.087) = 0, 0795. Oze steekproefproporte ( ˆ π = 0,045 ) lgt dus het aavaardgsgebed. Alterateve methode : Je ka de z -score va de geobserveerde 0,045 0,06 steekproefproporte berekee. Dt s z =,474. 0, 087 De krteke z -waarde zj geked voor 90%-tervalle, ameljk,65 e -,65. Oze geobserveerde waarde lgt herbe dus aavaarde we de ulhypothese. I het grootste deel va de lteratuur wordt de voorkeur gegeve aa het tweede alteratef. De berekede z -score wordt da de toetsgsgroothed geoemd. Je ka deze bj deze soort toetse ˆ π π bereke met de formule: z =. π π ( ) Belagrjk om op te merke s dat we her tweezjdg hebbe getoetst. Dat wl zegge dat de alterateve hypothese gee voorkeur utdrukt voor groter of kleer (> of <) maar ekel ee verschl met de ulhypothese aadudt ( ). Bj tweezjdge toetse s het verwerpgsgebed twee gedeeld (vadaar dat je bj het berekee va de p -waarde ook maal twee moet doe). Had de gyaecoloog her het vermoede gehad dat er bj hem mder afwjkge zoude zj, da was de alterateve hypothese Ha : π < 0, 06 geweest e da hadde we de ulhypothese wel verworpe (wat da lag het verwerpgsgebed volledg lks e da lag oze geobserveerde steekproefproporte er. De p - waarde had da 0,0703 geweest). Ee petere leerlg ka her ook opmerke dat we helemaal de cetrale lmetstellg et odg hebbe, maar dat we exact kue werke met de bomale verdelg. De p -waarde (dus de kas dat we deze, of og ee extremere, steekproef zoude observere) s: ( ( ) ) p =. P B 400 ; 0, 06 7 0,6. De rede waarom er de lteratuur vaak beadered wordt gewerkt s omdat de methode veel uverseler s (weges de cetrale lmetstellg) e het vaak makkeljker s om cotu te werke da om dscreet te werke (dt geldt zeker als je deze matere zj hstorsche cotext zet). Ee test verbad met gemddelde Voorbeeld: Kurt loopt al heel zj leve marathos. De tjd ( mute) waar hj deze loopt s ormaal verdeeld met ee gemddelde va µ = 60 e ee stadaardafwjkg va σ = 5. Ee metal coach zegt dat hj hem seller ka doe lope. De volgede te marathos (gesteud door de metal coach) loopt hj gemddeld 50 mute. Test of de coach geljk heeft met ee sgfcate va α =,5%. De ulhypothese s H : 60 0 µ =, de alterateve hypothese s H : µ < 60 (eezjdge toets). Er geldt: N 60, og seller: p P( ) 5. De p -waarde voor deze toets s de kas dat het gemddelde 50 s of 0 = < 50 = 0, 075< 0, 05 = α. We verwerpeh 0. De coach heeft geljk! a Cursus statstek - - S. Mettepege

Alterateve methode : De krteke x -waarde de het aavaardgsgebed afbaket s vorm( 0.05, 60, 5 0) = 50, 70. Os geobserveerd gemddelde s og seller, het lgt het verwerpgsgebed. Alterateve methode : De z -score va het geobserveerde steekproefgemddelde s 50 60,. Dt s kleer da de 5 0 krteke z -waarde (-,96) e lgt dus het verwerpgsgebed. Ook her wordt meestal de voorkeur gegeve aa tweede alteratef. De toetsgsgroothed ka deze x µ bj deze soort toetse bereked worde met de formule: z =. σ Soorte foute Bj het opstelle va de toets defëre we ee sgfcateveau α. Dt s de kas op ee fout va de eerste soort: het verwerpe va de ulhypothese terwjl ze just s. Uteraard bestaat ook het omgekeerde. Dt heet da ee fout va de tweede soort: het aavaarde va de ulhypothese terwjl ze fout s. We otere de kas herop met β. Het complemet β wordt ook wel ees de power va de toets geoemd (dt s de kas dat je de ulhypothese verwerpt als ze fout s). Voorbeeld: Boer Bavo beweert dat de aardappelplate op zj boerderj elk gemddeld kg aardappele oplevere met ee stadaardafwjkg va 0, kg (ormaal verdeeld). Zj vrouw Jeae dekt dat dt mder s e doet ee steekproef va 0 platjes e vdt ee gemddelde va 0,85 kg. a) Voer ee test ut op het 5% sgfcateveau. De krteke x -waarde de het aavaardgsgebed afbaket s 0,964, wat s ormaal 0, verdeeld met parameters µ = e σ =, e vorm( 0.05,, 0. 0) 0, 964. 0 We verwerpe dus de ulhypothese e aavaarde het alteratef, ameljk dat µ <. b) Stel dat Jeae geljk heeft e dat het gemddelde derdaad mder s, ameljk 0,9 kg s, wat s da de kas dat we toch de ulhypothese aavaardde met deze toets? We gaa da ut va ee adere kasverdelg voor 0, N 0,9 ; (geteked rood). 0 De kas dat we de ulhypothese hadde aavaard s aagedud rood, e bedraagt: β = ormalcdf ( 0.964,E99, 0.9, 0. 0) β 0, 7749 Dt s ee vrj grote kas. Wat belagrjk s om te beseffe (e wat je eevoudg ka ze op de fguur) s dat je oot bede kase α e β kle ka houde. Hoe kleer je α maakt, hoe groter β wordt, e omgekeerd. Cursus statstek - - S. Mettepege