Van beschrijvende naar verklarende statistiek

Vergelijkbare documenten
1. In de hoofdstad van Ivoorkust, Yamoussoukro, meet men de lengte van 100 mannen (in cm) :

Variantie-analyse (ANOVA)

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Regressie en correlatie

Regressie en correlatie

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

Tentamen van Wiskunde B voor CiT (151217) Tentamen van Statistiek voor BIT (153031) Vrijdag 27 januari 2006 van 9.00 tot uur

Les 2 / 3: Meetschalen en Parameters

Bij een invalshoek i =(15.0 ± 0.5) meet hij r =(9.5 ± 0.5). 100%-intervallen. Welke conclusie kan de onderzoeker trekken?

Meten en experimenteren

1 Rekenen met complexe getallen

iv. Laat zien dat dit volgt uit de algemene rekenregel van onderdeel i.

i i Datzelfde aggregaat in een vorig jaar 0 stellen we voor door

Toepassing: Codes. Hoofdstuk 3

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , UUR

VOOR HET SECUNDAIR ONDERWIJS. Exploratieve statistiek. Infoboekje. Prof. dr. Herman Callaert

Gegevensverwerving en verwerking

Aanbevolen literatuur

VOOR HET SECUNDAIR ONDERWIJS. Correlatie: exploratieve methoden. Werktekst voor de leerling. Prof. dr. Herman Callaert

Verslag Regeltechniek 2

De standaardafwijking

anwb.nl/watersport, de site voor watersporters

PROEFEXAMEN SOCIALE STATISTIEK

Waardeoverdracht. Uw opgebouwde pensioen meenemen naar uw nieuwe pensioenuitvoerder

Gemeentefonds verevent minder dan gedacht

Via de grafische rekenmachine krijg je o.a. de volgende statistische resultaten: . In rekenmachinetaal wordt dit 3, 3248.

MEERJAREN OPBRENGSTEN VO 2013 TOELICHTING

MRT/RT MKT/KT. Wormwielreductoren.

Rekenen met rente en rendement

is gelijk aan de open-klemmen spanning van het netwerk. De impedantie Z th

Inhoudstafel Regressie: exploratieve methoden

VOOR HET SECUNDAIR ONDERWIJS

Onderzoeksmethoden en techieken I

Ondersteuning en hulp bij leren

Stochastische loadflow. Beschrijving algoritme van de stochastische loadflow.

Kansrekening en Statistiek

Zwaartepunten, traagheidsmomenten en verdeelde belasting

Statica in een notendop

Onderzoeksmethoden en techieken I

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

DETERGENTEN IN UW DAGELIJKS LEVEN

w 73 »EFSTATIŒN VOOR DE GROENTEN- EN FRUITTEELT ONDER GLAS, te NAALDWIJK. Verslag andijvierassenproef onder staand glas,

7. Behandeling van communicatie en mondmotoriek

Beroepsregistratie en vooraanmelden voor beroepsregistratie. in de jeugdhulp en jeugdbescherming

EH SmartView. Een slimme kijk op risico s en mogelijkheden. Monitoring van uw kredietverzekering. Euler Hermes Online Services

Is de app een onmisbaar onderdeel van de les of het leerproces? nee. Is de leerling/student 16 jaar of ouder?

Appendix F: Het Snelheid-Wegdiagram, trekkracht en indicatie

lus+ De klachtencommissie en de rol van de vertrouwenspersoon ongewenste omgangsvormen

C.P. van Splunter. Grote afwijkingen. Bachelorscriptie, 21 april Scriptiebegeleiders: prof.dr. F. Redig prof.dr. E.A.

Minix 3. Andrew Tanenbaum

Standaardisatiemethoden. 9 10Abby Israëls. Statistische Methoden (10003)

Onderzoeksmethoden: Statistiek 2

VOOR EEN GOED RESULTAAT IS HET ABSOLUUT NOODZAKELIJK DEZE LEGINSTRUCTRIES NAUWKEURIG TE VOLGEN.

Samenvatting Farmaco-epidemiologie april 2011

Bronnen & Methoden bij Marktscan medischspecialistische zorg 2015

Methode met ladder operatoren deel 2

Meeneemset Herkansing Deterrninanten-3:Fysische Factoren dd

Examen Statistiek I Feedback

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Examen Neurale Netwerken (2L490), op woensdag 28 juni 2006, uur.

Hoofdstuk 5: Het Miller-effect

ACCU-CHEK. Compact Plus. Gebruiksaanwijzing SYSTEEM VOOR DE BEPALING VAN BLOEDGLUCOSE

Regressie, correlatie en modelvorming

De Collegereeks Statistiek. Stel je wilt wat weten over. Complexe begrippen: construct. Homogeniteit. Verder met. Statistiek

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

1.1 Oplossingen. + 1 x ( ) Oplossing oefening 2.1. Oplossing oefening 2.2

Ontvlechting van ICT vereist nieuwe samenwerking

Hoe schrijf je een tekst die opvalt? 80. Hoe zorg je dat je tekst er goed uitziet? 85. Extra opdrachten 89

1 Gedeelde differenties

Zo krijg je wél grip op IT-investeringen

VOOR HET SECUNDAIR ONDERWIJS

Cats. Den Haag, ~ '' Kenmerk: DGB

aantallen in van de prooiresten gewicht min of meer mogelijk, doch als de gebitsmaten van een groot aantal gevangen dat de gewichtsfaktor

3.7.3 Welke meetinstrumenten zijn geschikt voor het vastleggen van motorische vaardigheden?

Numerieke methoden voor stelsels gewone differentiaalvergelijkingen. Prof. Dr. Marnix Van Daele

Toelichting advies gemeenteraad bij aanvraag aanwijzing als lokale publieke media-instelling

officiële bijdrage aan het CMMI. Jan Jaap Cannegieter

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 3. Populatie en steekproef. Werktekst voor de leerling. Prof. dr. Herman Callaert

MRKOMNO. káéìï=î~å~ñw. pfabufp=ud. aáöáí~~ä=ê åíöéå hçêíé=ü~åçäéáçáåö= kéçéêä~åçë

donkerstraat samen de stad ontwerpen Masterplan Leieboorden park cafe parel

effectief inzetten? Bert Dingemans

Tentamen Econometrie 1, 4 juli 2006, uur Dit tentamen duurt 2 uur! Toiletbezoek is niet toegstaan.

Digital Image Processing

Vaker een trein, da s pas fijn!?

6. Behandeling van kinderen met spastische cerebrale parese gericht op verbetering van handvaardigheid

Zelf statistiek oefenen

TECHNISCHE UNIVERSITEIT EINDHOVEN

PARADOXEN 4 Dr. Luc Gheysens

~~i~il' 1025 VS Amsterdam. Geacht bestuur,

ALCOHOLKENNIS DOORGESPEELD

Een levensloopregeling voor software

TECHNISCHE UNIVERSITEIT EINDHOVEN

Centraal Bureau voor de Statistiek Keten Economische Statistieken

dag 34-einde: 23 uur licht, 1 uur donker Pluimvee nr. 31 1

Spanningsverdeling onder een kade volgens elastische berekening. d-7 I 053. *v**wwun>ns CENTRUM VOOR ONDERZOEK WAT ER KE R I N GEN

1. De wereld van de kansmodellen.

Lucia de B. Gonny Hauwert 12 september 2007

DLK Pro De all-round uitlee s apparatuur voor onderweg Maatwerk voor verschillende toepassingen

De Waarde van Toekomstige Kasstromen

Zelf statistiek oefenen

Transcriptie:

Hoofdstuk 5 Van beschrjvende naar verklarende statstek We hebben gezen n de beschrjvende statstek hoe we data grafsch kunnen voorstellen en samenvatten door centrum- en spredngsmaten als we beschkken over de data van een volledge populate. Inden we echter enkel beschkken over steekproefdata, wat meestal het geval s, dan wensen we net alleen deze beschrjvng van de data. We wensen nu ook utspraken te doen over de volledge, voor ons onbekende, populate. Deze statstsche beslutvormng omtrent de populate wordt bestudeerd n de verklarende statstek. In dergeljke utspraken speelt het kansbegrp een belangrjke rol. Het begrp stochastsche veranderljke staat centraal n de verklarende statstek. 5. Gemddelde en varante m.b.v. relateve frequente Om het verband te begrjpen tussen de beschrjvende en de verklarende statstek s het belangrjk de formules voor het rekenkundg gemddelde en de standaardafwjkng van de data te schrjven n functe van de relateve frequente van de verschllende data. Als voorbeeld beschouwen we de volgende data bestaande ut n = 0 numereke gegevens : x 3 3 3 9 3 5 9 3 Hernner je dat we voor het (rekenkundg) gemddelde de notate µ gebruken voor het populategemddelde en x voor een steekproefgemddelde. Voor de bovenstaande ljst, als steekproef, vnden we 0 x = x = 4. 0 = 75

Inden we van de bovenstaande data een frequentetabel construeren, noteren we de verschllende meetresultaten, van klen naar groot, samen met hun frequente en de relateve frequente. Voor de bovenstaande data geeft dt, met x ( =,..., m) de m verschllende data, de volgende tabel : x f f / n 0. 3 5 0.5 5 0. 9 0. (n = ) 0 We verkrjgen, op bass van deze tabel, voor het rekenkundg gemddelde : x m f. x f m = = = x met m n n = n en n het totale aantal gegevens. Ut de laatste formule volgt dat we het rekenkundg gemddelde kunnen nterpreteren als het gewogen gemddelde van de verschllende getallen x, waarbj elke x vermengvuldgd wordt met het gewcht f / n. Dt gewcht s de relateve frequente van x. De som van de relateve frequentes s steeds. De frequenteverdelng of relateve frequenteverdelng wordt aanschouweljk voorgesteld n onderstaande grafek of staafdagram: f / n 0.5 0. 0. x 0. 3 5 6 7 8 9 x We kunnen x mechansch als volgt nterpreteren : Plaats een gewchtsloze staaf op de x -as en massa s f / n n de punten x. Nu s x het zwaartepunt van de massaverdelng. De staaf s n evenwcht nden we hem ondersteunen ter hoogte van x. 76

Voor de populatevarante σ en de steekproefvarante s van n getallen geldt : populatevarante steekproefvarante zonder frequentetabel met frequentetabel = N = σ s = = ( x ) µ f ( ) x µ n N = M = σ ( x ) x f ( ) x x n s = m = N n We plaatsen de data n de ljsten L en L van de TI-83, n de vorm van de frequentetabel, en berekenen vervolgens de kengetallen. Reken manueel na dat s = 74/9 = 8.. 5. Stochastsche veranderljken De utkomsten van een experment hoeven geen getallen te zjn. Vaak zjn het zelfs net de utkomsten de ons nteresseren maar bepaalde getallen geassoceerd met de utkomsten. Als voorbeeld beschouwen we het experment dat bestaat ut het twee keer opwerpen van een muntstuk. De mogeljke utkomsten zjn KK, KM, MK, MM. We zjn echter alleen beneuwd naar het aantal keer kop. We stellen het aantal keer kop voor door X. We kunnen net op voorhand zeggen welke waarde X zal aannemen bj de start van het experment. Dt hangt af van het toeval. We noemen X een toevalsveranderljke of stochastsche veranderljke of kortweg stochast. Stochasten noteren we steeds met hoofdletters. 77

Pas na utvoeren van het experment weten we hoeveel keer kop er tevoorschjn s gekomen. De stochast X heeft een concrete waarde aangenomen. Deze waarde noteren we met de bjbehorende klene letter x. Inden we het experment nog eens herhalen, kunnen we een andere x krjgen. Dt ondersched tussen hoofdletters voor stochasten en klene letters voor de concrete aangenomen waarden na het utvoeren van het experment s zeer belangrjk n de verklarende statstek. Zo spreken we over de kans P( X = x ), d.w.z. de kans dat X de waarde x aanneemt. De stochast X s volledg gekenmerkt door de verschllende waarden de X kan aannemen en de bjbehorende kans dat dt gebeurt. Dergeljke tabel noemen we de kansverdelng van X : x 0 P ( X = x ) 4 4 Heronder vnd je een grafsche voorstellng van de kansverdelng : Merk op dat P( X = ) = P ({KM, MK}). In dt voorbeeld s X een dscrete stochast. Dt s een stochast waarvan je de verschllende waarden de kunnen aangenomen worden, kan ordenen als een rj. Bovenden kan een dscrete stochast onendg veel waarden aannemen. PX ( = x) 0.5 0.5 0 x Een stochast s egenljk een functe van de utkomstenverzamelng van het experment naar. In het vorge voorbeeld assoceert X met de utkomsten KK, KM, MK, MM als beelden respecteveljk de getallen,,, 0. De verzamelng van al de beelden levert ons een neuwe utkomstenverzamelng { 0,,} waarn we geïnteresseerd zjn. De kansen op de utkomsten 0,, worden gegeven door de kansverdelng van X. 5.3 Verwachtngswaarde De verwachtngswaarde of het gemddelde van een dscrete stochast X wordt gedefneerd door : E( X) = x P( X = x). We sommeren over alle waarden de de stochast aanneemt. Steeds geldt : PX ( = x ) =. 78

Voor ons vorg voorbeeld vnden we : Wat s de betekens van E( X )? E( X ) = 0 + + =. 4 4 Herhaal het experment werp twee keer een muntstuk heel vaak en noteer telkens het aantal keer kop. Het gemddelde van al de getallen s geljk aan het gewogen gemddelde van de getallen 0, en met als gewchten hun relateve frequentes. Op de lange duur zullen de relateve frequentes evolueren naar de kansen PX ( = 0), PX ( = ), PX ( = ). Op de lange duur benadert het gemddelde van de getallen bjgevolg E( X ). We noteren het gemddelde van een stochast met µ ; E( X ) = µ. De Grekse letter µ hebben we vroeger ook reeds gebrukt als notate voor het gemddelde van een populate van getallen. E( X ) = µ s nderdaad te beschouwen als het gemddelde van de populate van alle getallen x de we verkrjgen door het experment heel vaak ut te voeren. De kracht van de smulate van een experment met het rekentoestel bestaat hern dat we de frequenteverdelng van de verkregen data snel kunnen genereren. Dt geeft, nden we de smulate van het experment maar vaak genoeg utvoeren, meteen ook de relateve frequenteverdelng van de data als goede benaderng van de kansverdelng van de stochast. Dt s soms de enge maner van werken om de kansverdelng van een stochast te achterhalen, nden de kansberekenng te moeljk wordt. We smuleren het experment werp twee keer een muntstuk 00 keer en noteren telkens het aantal keer kop. We coderen kop met en munt met 0. De resultaten plaatsen we n ljst L. Defneer de WINDOW- en MODE-nstellngen zoals heronder om een staafdagram te tekenen en bereken het gemddelde van L. 79

De smulate leverde 4 keer 0, 9 keer en 39 keer als aantal keer kop. Het 4 9 39 gemddelde aantal s 0 + + = 0.985. Dt s een goede benaderng 00 00 00 of schattng van de theoretsche waarde E( X ). Ook de relateve frequentes 0., 0.595, 0.95 geven reeds een ruw dee van de theoretsche kansverdelng 0.5, 0.5, 0.5 van de stochast X. Klasopgave Combneer de smulates van alle studenten. Wat verwacht je van de relateve frequenteverdelng? Met de stochast X = aantal keer kop bj twee keer werpen van een muntstuk kunnen we neuwe stochasten defnëren. Stel bjvoorbeeld dat men jou n het casno het volgende kansspel voorstelt. Je werpt twee keer een muntstuk en telt het aantal keer kop. Tel herbj op en kwadrateer. Dt s het bedrag dat je krjgt n Euro. Als nzet moet je echter 5 Euro betalen per spel. Ga je dt spel een ganse avond spelen, n de veronderstellng dat je rjk genoeg bent om steeds je nzet te betalen? We smuleren dt met behulp van de ljst L van voorgaande smulate. De bedragen de we ontvangen komen terecht n ljst L = (L + ). Vlug even narekenen wat we verlezen of wnnen na 00 keer spelen. De resultaten zjn onhelspellend. Bj de eerste smulate verles je 3 Euro. Een tweede en derde smulate zjn snel utgevoerd dankzj het koppelen van de formule n ljst L. Ook her verlezen we respecteveljk 74 en 3 Euro na telkens 00 keer spelen. Dt spel s af te raden. Ook zonder smulate kun je de gemddelde wnst per spel na lang spelen berekenen. De stochast Y = ( X + ) 5 s de wnst per spel. Deze neemt de waarden 4, en 4 aan met respecteveljke kansen,, 4 4. 80

Het gemddelde van Y s EY ( ) = 4 + ( ) + 4 = 0.5. 4 4 Dt s de gemddelde wnst na lang spelen. Op de lange duur verles je gemddeld 0.5 Euro per spel. Na 00 keer spelen mag je een verles verwachten n de buurt van 00 Euro. Als we de dre smulates combneren, hebben we 3 + 3 + 74 = 38 Euro verles na 600 keer spelen. Dt s aardg dcht bj de theoretsche voorspellng van 600 0.5 = 300. Voor een eerljk spel moet de gemddelde wnst per spel nul zjn en dt s her net het geval. Voor een dscrete stochast X met waarden x kan men bewjzen dat de verwachtngswaarde van een stochast Y = g( X ) gegeven wordt door : E( g( X)) = g( x ) P( X = x ) 5.4 Varante Een belangrjke llustrate van de laatste formule s de varante van X : ( ) µ Var( X ) = E ( X µ ) met µ = E( X ) of Var( X ) = ( x ) P( X = x ) Voor X = aantal keer kop bj twee keer werpen van een muntstuk geldt : 4 4 Var( X ) = (0 ) + ( ) + ( ) =. We noteren de varante van X met σ : Var( X ) = σ. De standaardafwjkng, σ, s de posteve verkantswortel van de varante. In ons voorbeeld geldt : σ = 0.5 = 0.707. De steekproefvarante van de getallen de we verkrjgen bj het heel vaak herhalen van het experment, s = m = ( ) f x x n (), benadert het best Var( X ). 8

Je zou n () eerder n verwachten als noemer als je de formule Var( X ) = ( x µ ) P( X = x) bekjkt en daar we op de lange duur bekomen dat f PX ( = x ). Maar vergeet net dat we n de teller van () als benaderng voor n µ = E( X ) het steekproefgemddelde x gebruken. In paragraaf 5.8 zen we waarom s de beste schattng s van Var( X ) = σ. Het gemddelde en de standaardafwjkng (of de varante) zjn de belangrjkste kenmerken van een dscrete of contnue (ze verder) stochast. Om het gemddelde en de standaardafwjkng van een dscrete stochast te berekenen met het rekentoestel volstaat het een populate van getallen n te voeren waarvan de relateve frequenteverdelng samenvalt met de kansverdelng van de stochast. Voor X = aantal keer kop bj twee keer werpen van een muntstuk kan dt als volgt : L,L L,L3 We kunnen ook de relateve frequentes nvoeren n L, ze onderaan. Maar dan gebeurt er ets met Sx, kan je dat verklaren? Waarom bljft σx wel just? L,L 5.5 Lukrake trekkng ut een populate Beschouw als populate de schoenmaten van n = 30 volwassen mannen (ze ook 4.4) met onderstaande frequentetabel: x 38 39 40 4 4 43 44 46 f 4 7 5 6 3 Het populategemddelde s µ = 4., de populatestandaardafwjkng s σ =.89. 8

Schrjf de 30 schoenmaten op een kaartje en leg de kaarten n een doos. Vraag aan emand, de de nhoud van de doos net kent, om lukraak een getal te trekken ut deze populate. We noemen dt getal X. Dt s een stochast daar we net op voorhand kunnen zeggen welk getal er zal gekozen worden. Elke kaart heeft dezelfde kans om getrokken te worden. De kansverdelng van X valt samen met de relateve frequenteverdelng van de populate : x 38 39 40 4 4 43 44 46 f P( X x ) n = = 30 4 30 7 30 5 30 6 30 30 3 30 30 Bjgevolg zjn E( X ) en Var( X ) respecteveljk geljk aan het gemddelde µ en de varante σ van de gegeven populate. Voor een lukrake trekkng X ut een populate van getallen geldt steeds : E( X ) = populategemddelde µ, Var( X )= populatevarante σ. Dt s een belangrjke vaststellng. We noemen X ook een populatestochast. 5.6 Afhankeljke en onafhankeljke stochasten Bj draaen van de heronder afgebeelde raderen van fortun komen we terecht n één van de ver kwadranten. Stel X het butenste en Y het bnnenste getal. 0 30 4 4 0 0 30 0 0 0 50 0 0 50 0 0 83

Voor het rechtse rad geldt : E( X ) = 0 + 0 = 5 en EY ( ) = 0 + 50 = 5. De verwachtngswaarden van X + Y en X Y zjn n dt geval : E( X + Y) = 50 + 0 = 30 = E( X) + E( Y) E( X Y) = E(0) = 0 E( X) E( Y) Reken na dat Var( X + Y ) Var( X ) + Var( Y ). Voor het lnkse rad, met dezelfde betekens van X en Y, geldt : E( X ) = 0 + 30 = 5 en EY ( ) = 4 + 0 = 7 E( X + Y) = 40 + 4 + 34 + 30 = 3 = E( X) + E( Y) 4 4 4 4 E( X Y) = 300 + 80 + 0 + 00 = 75 = E( X) E( Y) 4 4 4 4 Reken na dat n dt geval geldt dat Var( X + Y ) = Var( X ) + Var( Y ). Voor het lnkse rad zegt men dat de stochasten X en Y onafhankeljk zjn. D.w.z. dat nformate over de ene stochast geen extra nformate geeft over de andere stochast. Zo geldt voor het hele lnkse rad dat de gebeurtenssen Y = 4 en Y = 0 als kans / hebben. Zegt men je dat de gebeurtens X = 0 s opgetreden, hebben Y = 4 en Y = 0 (bekjk enkel het tweede en verde kwadrant) nog steeds kans /. Bj het rechtse rad zjn X en Y afhankeljk. De gebeurtens Y = 0 heeft kans /. Maar als je weet dat X = 0 s opgetreden, heeft Y = 0 kans. 5.7 Egenschappen van de operatoren E en Var Stel X, Y stochasten bj eenzelfde experment en a een reëel getal. Er geldt : EX ( + Y) = EX ( ) + EY ( ) Ea ( X) = aex ( ) de operator E s lnear. E( X Y) = E( X) E( Y) Var( X + Y ) = Var( X ) + Var( Y ) als X en Y onafhankeljk zjn. 84

Bovenden geldt : E( a) = aen Var( a ) = 0 Var( X + a) = Var( X ) en Var a X a Var X ( ) = ( ) Deze egenschappen zjn geldg voor dscrete en contnue (ze verder) stochasten. 5.8 Het begrp steekproef n de verklarende statstek In de volgende tabel beschouwen we als populate de lengte (n cm) van 00 knderen van 0 jaar 0 3 5 4 37 8 33 4 36 37 44 6 35 4 35 34 40 49 37 9 8 40 9 37 4 37 35 9 33 39 3 5 4 3 9 39 3 45 40 38 37 33 37 38 3 37 3 7 34 34 50 40 44 37 33 39 30 4 36 4 30 35 4 36 3 33 33 4 7 4 30 35 5 36 3 53 45 3 3 34 45 39 3 36 43 38 4 4 4 36 48 8 37 34 38 30 45 35 4 3 43 46 3 7 9 33 4 57 33 39 8 3 40 40 5 36 5 30 53 30 6 9 57 44 4 8 38 4 35 4 39 3 35 45 34 40 36 38 43 4 3 36 9 38 30 9 35 34 4 33 8 3 37 40 33 35 38 3 40 45 8 40 34 8 46 3 3 4 33 37 6 8 9 4 37 7 39 4 57 46 8 36 30 4 9 43 37 43 39 4 3 8 33 36 46 We bepalen de statstsche kengetallen en een hstogram. Stel X een lukraak gekozen getal ut deze populate. Daar de kansverdelng van X samenvalt met de relateve frequenteverdelng van de gegeven populate geldt dat E( X ) = populategemddelde µ en Var( X )= populatevarante σ. 85

In plaats van de dscrete voorstellng te geven van de (relateve)frequentes van de 34 verschllende data bedt een hstogram een beter beeld. Bepaal een frequentetabel met het programma FREQTAB (ze opdracht 9 - paragraaf 4.8), met als resultaat het plaatje hernaast. We kezen n keer lukraak een getal, dat we telkens terugleggen, ut de populate. Dt geeft een rj van onafhankeljke stochasten X, X,, X n met dezelfde (kans)verdelng als X. Zo een rj noemen we een steekproef van grootte n ut een populate met populatestochast X. Utgaande van een steekproef berekent men vaak het steekproefgemddelde X : X = X + X + X n n Dt s een stochast. Pas na het utvoeren van een steekproef krjgen we één x+ x + xn concrete getalwaarde x =, afhankeljk van het toeval. Als we nog n een steekproef utvoeren, krjgen we wellcht een andere getalwaarde x. Als je dat heel vaak doet, zal de (relateve) frequenteverdelng van de zo verkregen gemddelden langzaam maar zeker evolueren naar de kansverdelng van de stochast X. De exacte kansverdelng van X s de relateve frequenteverdelng van de populate van de gemddelden van alle geordende n-tallen de we kunnen vormen met elementen ut de gegeven populate. We genereren enkele steekproeven van grootte 4 ut de populate van de 00 lengtes de we n een ljst plaatsten. We berekenen telkens het steekproefgemddelde en de steekproefstandaardafwjkng. We zen dat er veel varate s n de resultaten. Theoretsch vnden we voor een steekproef van grootte n ut een populate met populatestochast X : X+ X + + Xn E( X) = E = ( E( X ) + + E( Xn )) = n E( X) = E( X) = µ n n n 86

De verwachtngswaarde van het steekproefgemddelde X s steeds geljk aan het populategemddelde µ. Daarom noemt men X een onvertekende schatter van µ. De concrete verkregen waarde x na het utvoeren van een steekproef noemen we een schattng van µ. Zo verkregen we bj de bovenstaande steekproeven als schattngen ( x ) voor µ = 35.575 achtereenvolgens 35.5, 36.75, 9,. Deze schattngen schommelen om en bj Ec Xh = µ. In het hoofdstuk over betrouwbaarhedsntervallen gaan we deper n op de kwaltet van zo een schattng. De steekproefvarante S s per defnte : stochast. Men kan bewjzen dat ES n ( X ) X = S =. Dt s ook een n VarX ( ) σ, m.a.w. dat S een c h = = onvertekende schatter s van de populatevarante σ. Voor deze egenschap s het noodzakeljk dat n de defnte van steekproefvarante gedeeld wordt door n. Dt s de reden waarom we s als schattng gebruken voor σ en bjgevolg schatten we σ met s. Bj bovenstaande steekproeven vonden we als schattngen (s ) van σ = 7.7 achtereenvolgens de volgende steekproefstandaardafwjkngen : 5.06, 4.03, 6.6. We kunnen aantonen dat voor de varante van het steekproefgemddelde X geldt : ( ) Var X Var( X ) σ = = of n n σ σ = n X X Dt s de populatevarante gedeeld door de steekproefgrootte. Dt s een belangrjk resultaat. De varante van het steekproefgemddelde wordt klener naarmate de steekproefomvang n toeneemt. M.a.w. hoe groter de steekproef, hoe mnder varate er zal zjn n de verkregen steekproefgemddelden x en hoe beter we µ kunnen schatten. Ook Var S σ c h wordt klener naarmate n groter wordt zodat we met s ook beter kunnen schatten. De steekproefgrootte heeft alvast nvloed op de kwaltet van een schattng. 87

We llustreren dat we betere schattngen krjgen door enkele steekproeven te genereren van grootte 0 (telkens steekproeven met terugleggen). Er s nderdaad mnder varate n de resultaten en je krjgt betere schattngen voor µ en σ. Tenslotte genereren we 00 steekproeven van grootte ver ut onze populate van 00 getallen de zch n ljst L bevnden. De steekproefgemddelden komen n L. Je zet bjvoorbeeld dat de zesde steekproef als gemddelde 38.5 heeft. We vergeljken het hstogram van de gegeven populate n L en dat van de 00 steekproefgemddelden n L. Voor bede grafeken s Xmn=0, Xmax=60 en Xscl=4. We merken op dat er een klenere spredng s n de gemddelden, zoals verwacht. In ons voorbeeld vonden we 35.475 als gemddelde. Dt s een schattng van 4 µ = 35.575, het gemddelde van de 00 mogeljke steekproefgemddelden van steekproeven van grootte ver ut onze populate met 00 getallen! In de smulate was de steekproefstandaardafwjkng van de 00 steekproefgemddelden geljk aan 3.36. σ X σ X 7.7 Dt s een schattng van de theoretsche σ X = = = = 3.585. 4 88

5.9 Steekproeven met en zonder terugleggen In voorgaande paragraaf beschouwden we steekproeven met terugleggen. Een getrokken getal werd telkens teruggelegd vooraleer een neuw getal werd getrokken. Dt garandeert dat elke X van de steekproef dezelfde verdelng heeft als de populatestochast X. Bj steekproeven zonder terugleggen zjn de Her geldt wel nog dat E( X ) = µ. X 's echter net onafhankeljk. Deze ntuïtef effcëntere maner van werken resulteert dan ook n een klenere σ X N n standaardafwjkng van X : σ =, met N de populategrootte en n X n N de steekproefgrootte. De formule voor σ wordt dus ngewkkelder. X Voor grote N, waarbj n gevoelg klener s dan N, wordt de reductefactor ongeveer. N n N σ X In dt geval kunnen we de eenvoudge formule σ = bljven gebruken. X n 89

5.0 Opdrachten c h µ.. Stel X een stochast met E( X ) = µ. Toon aan dat Var( X ) = E X. Zeher de verdelng van het aantal nwoners bj husgeznnen n Amerka : aantal nwoners 3 4 5 6 7 fracte van de.5.3.7.5.07.03.0 husgeznnen Kes lukraak een husgezn en stel X het aantal nwoners. De stochast X heeft een kansverdelng de gegeven wordt door de bovenstaande tabel. Bereken E( X ) en Var( X ). 3. Werp een dobbelsteen en stel X het aantal ogen. Bereken E( X ) en Var( X ). Bereken tevens E ( X ). Smuleer honderd worpen met een dobbelsteen. Bereken het gemddelde en de steekproefvarante van het aantal ogen en vergeljk dt met de theoretsche waarden E( X ) en Var( X ). 4. Werp twee dobbelstenen. Stel X het aantal ogen op de eerste dobbelsteen, Y het aantal ogen op de tweede dobbelsteen en S = X + Y het totaal aantal ogen. Bereken E( S) en Var( S ) : (a) met behulp van de resultaten van opdracht 3 en (b) utgaande van de kansverdelng van S. 5. Stel X en Y onafhankeljke stochastsche veranderljken met EX ( ) =, ( ) E X = 7 en EY ( ) =, Var( Y ) = 5. Bereken : (a) E ( X 3) (b) Var( X ) (c) E(3X Y + 8) (d) Var(X 4 Y ) (e) Var( Y + X + 0) (f) Var( ax ± by ) 90

6. Beschouw het volgende kansspel. Werp twee dobbelstenen en tel het totaal aantal ogen. Inden dt groter s dan 7, krjg je 5 Euro. Zonet betaal je 4 Euro. Is dt een eerljk spel? Stel X de wnst per spel. Voor een eerljk spel moet EX ( ) = 0, het spel s ongunstg voor de speler nden EX ( ) < 0 en gunstg als EX ( ) > 0. Smuleer 00 spelen en bereken naden de verwachte wnst. 7. Trek twee getallen ut onderstaande vaas. Noem X het eerste getal en Y het tweede getal. 0 3 Stel M = max( XY, ) en S = X + Y. Bepaal de kansverdelng van M en S en hun gemddelde. (a) voor een trekkng met terugleggen, (b) voor een trekkng zonder terugleggen. Smuleer dt experment 00 keer, bereken het gemddelde en vergeljk met de theoretsche waarde. 8. Beschouw de 3 onderstaande vazen. Een letter wordt ut de eerste vaas getrokken. Is dt de letter a, dan trekken we een getal ut de tweede vaas. Is het de letter b, dan trekken we een getal ut de derde vaas. Noem X het getrokken getal. Teken een kansboom en bereken E( X ). a b 0 b 0 30 0 0 0 0 9. Ut Amerka komt het spel chuck a luck met dobbelstenen. De speler mag nzetten op één van de getallen,,3,4,5,6. Vervolgens werpt hj dre dobbelstenen. Komt zjn getal, of 3 keer tevoorschjn, dan krjgt hj, of 3 keer zjn nzet met daarbj zjn nzet terug. Stel X de wnst met als nzet dollar. Bereken E( X ). 9

0. In een bepaalde wjk valt gedurende een maand een aantal straatlantaarns ut. Dt aantal X heeft de volgende kansverdelng: x 0 3 4 5 P X = x 0.5 0.5 0.30 0.5 0.0 0.05 ( ) Een monteur gaat één keer per maand op controle n de wjk en vervangt de defecte lampen. De kosten herbj zjn 5 Euro vast plus 5 Euro per vervangen lamp. Stel K het bedrag te betalen aan de monteur. Bereken E( X ) en E( K ). 9