Kansrekening en Statistiek

Vergelijkbare documenten
Kansrekening en Statistiek

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 6. Donderdag 27 September

Statistiek voor A.I.

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Statistiek voor A.I. College 4. Donderdag 20 September 2012

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

13.1 Kansberekeningen [1]

Kansrekening en Statistiek

14.1 Kansberekeningen [1]

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

SOCIALE STATISTIEK (deel 2)

Kansrekening en Statistiek

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Tentamen Voortgezette Kansrekening (WB006C)

Radboud Universiteit Nijmegen Heyendaalse weg 135

Statistiek voor A.I. College 9. Donderdag 11 Oktober

Kansrekening en Statistiek

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Kansrekening en Statistiek

Tentamen Inleiding Kansrekening 25 juni 2009, uur Docent: F. den Hollander

Statistiek I Samenvatting. Prof. dr. Carette

Oefeningen statistiek

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Kansrekening en Statistiek

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Statistiek voor A.I. College 2. Donderdag 13 September 2012

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

4.1 Eigenschappen van de normale verdeling [1]

Medische Statistiek Kansrekening

Kansrekening en Statistiek

Samenvatting Statistiek

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Hoofdstuk 5 Een populatie: parametrische toetsen

Tentamen Inleiding Kansrekening wi juni 2010, uur

Het tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden.

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Examen Statistiek I Feedback

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

Antwoorden bij 4 - De normale verdeling vwo A/C (aug 2012)

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Hoofdstuk 5: Steekproevendistributies

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Statistiek voor A.I. College 3. Dinsdag 18 September 2012

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

3.1 Het herhalen van kansexperimenten [1]

Kansrekening en Statistiek

. Dan geldt P(B) = a d. 3 8

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt.

Hoofdstuk 6 Twee populaties: parametrische toetsen

b) Uit Bayes volgt, gebruik makend van onderdeel a) P (T V )P (V ) P (T ) = (0.09)(0.07)

Tentamen Inleiding Kansrekening 9 juni 2016, 10:00 13:00 Docent: Prof. dr. F. den Hollander

VOOR HET SECUNDAIR ONDERWIJS

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Kansrekening en Statistiek

Schatten en simuleren

Kansrekening en stochastische processen 2DE18

Data analyse Inleiding statistiek

Kansrekening en stochastische processen 2S610

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

Lesbrief de normale verdeling

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Een Bernoulli experiment is een experiment met slechts twee mogelijke uitkomsten, die we succes ( S ) en mislukking ( M ) noemen.

1. De wereld van de kansmodellen.

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling.

Handout limietstellingen Kansrekening 2WS20

Toetsen van Hypothesen. Het vaststellen van de hypothese

Handout limietstellingen Kansrekening 2WS20

Statistiek voor A.I. College 5. Dinsdag 25 September 2012

Hoofdstuk 3 Statistiek: het toetsen

Tentamen Inleiding Kansrekening 11 augustus 2011, uur

Tentamen Kansrekening (NB004B)

Meten en experimenteren

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Data analyse Inleiding statistiek

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Transcriptie:

Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23

2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23

Stochast en populatie 3 / 23

Stochast en populatie Def. Voor een discrete stochast X met eindige veel waardes X 1,..., X n is de variantie van X : nx Var(X ) = E((X E(X )) 2 ) = P(X = X i )(X i E(X )) 2. St. Bij het beschouwen van een eindige populatie en een parameter met eindig veel waardes X 1,..., X n, is de variantie van de bijbehorende stochast X gelijk aan de variantie σ 2 van de parameter in de populatie: Var(X ) = σ 2. Bew. Zij N het aantal elementen in de populatie en f i de frequentie (het aantal) van de elementen in de populatie met waarde i. Omdat de gehele populatie beschouwd wordt, en niet een steekproef, geldt: i=1 P(X = X i ) = f i N. Uit de vorige stelling volgt dat voor het gemiddelde µ van de populatie geldt dat µ = E(X ). Daaruit volgt dat σ 2 = P n i=1 f i (X i µ) 2 N nx f i (X i E(X )) 2 = N i=1 nx = P(X = X i )(X i E(X )) 2 = Var(X ). i=1 4 / 23

Experimenten herhalen 5 / 23

Experimenten herhalen Def. Stel dat X een stochast is bij een experiment dat als uitkomsten getallen heeft. Als dat experiment n maal wordt herhaald, dan staat X n voor de gemiddelde waarde van de n uitkomsten. X n is ook een stochast. Een steekproef ter grootte n kan gezien worden als het n maal herhalen van een experiment. Daarom zijn beide notaties X (voor steekproef en stochast) met elkaar in overeenstemming. 6 / 23

Experimenten herhalen Vb. X is de stochast bij het 1 maal werpen van een munt: X = 1 bij K en X = 0 bij M. Het n maal werpen van een munt is het n maal herhalen van het experiment. Laat X i de uitkomst van het i e experiment zijn. Dan geldt P n i=1 X n = X i. n (Hetzelfde als bij het gemiddelde van een steekproef.) De mogelijke waardes van X n zijn: 0, 1 n, 2 n,..., n 1 n, 1. X n heeft een binomiale verdeling: P(X n = k n ) = n k (0.5) n. 7 / 23

Experimenten herhalen Vb. Stel de populatie bestaat uit vier mensen met respectievelijke lengtes (in meters) m 1 = 1.73, m 2 = 1.60, m 3 = 1.81 en m 4 = 1.74. µ = 1.72. Stel dat er telkens een steekproef ter grootte 3 uit de populatie genomen wordt, wat is dan de kansverdeling van X 3? Er zijn vier mogelijke steekproeven en dus vier mogelijke waardes voor X 3 : steekproef steekproefgemiddelde X 3 {m 1, m 2, m 3 } 1.71 {m 1, m 2, m 4 } 1.69 {m 1, m 3, m 4 } 1.76 {m 2, m 3, m 4 } 1.72 Merk op: Het gemiddelde van de steekproefgemiddeldes is 1.72 = X. De variantie van de populatie is: (1.73 1.72) 2 + (1.60 1.72) 2 + (1.81 1.72) 2 + (1.74 1.72) 2 4 = 0.00375. De variantie van het steekproefgemiddelde is (1.71 1.72) 2 + (1.69 1.72) 2 + (1.76 1.72) 2 + (1.72 1.72) 2 4 = 0.00065. 8 / 23

Experimenten herhalen St. Als X een stochast is met E(X ) = µ en Var(X ) = σ 2 en het bijbehorende experiment wordt n maal herhaald, dan geldt E(X n) = µ Var(X n) = σ2 n. St. Wanneer uit een populatie met gemiddelde µ en variantie σ 2 steekproeven ter grootte n worden genomen, dan is het steekproefgemiddelde X n een stochast, met als gemiddelde en variantie respectievelijk E(X n) = µ Var(X n) = σ2 n. 9 / 23

Wet van de Grote Getallen 10 / 23

Wet van de Grote Getallen Vb. Experiment: het aantal malen succes k bij het 100 maal werpen van een munt. Dit experiment is 25 maal herhaald. 21 van de 25 keer gold 45 k 55, d.w.z. dat 21 van de 25 keer 0.45 X 100 0.55. Histogram of f Frequency 0 2 4 6 8 10 12 40 45 50 55 60 f 11 / 23

Wet van de Grote Getallen Vb. Experiment: het aantal malen succes k bij het 100 maal werpen van een munt. Dit experiment is 50 maal herhaald. 36 van de 50 keer gold 45 k 55, d.w.z. dat 36 van de 50 keer 0.45 X 100 0.55. 45 van de 50 keer gold 45 k 60, d.w.z. dat 45 van de 50 keer 0.45 X 100 0.6 Histogram of f Frequency 0 5 10 15 20 40 45 50 55 60 65 70 f 12 / 23

Wet van de Grote Getallen: de Markov ongelijkheid St. (Markov Ongelijkheid) Zij X een stochast waarvan alle waardes positief zijn. Dan geldt voor elk getal t 0: P(X t) E(X ). t Bew. We bewijzen de stelling voor een discrete stochast met waardes X 1,..., X n. Dan E(X ) = nx i=1 X i P(X = X i ) = X X i <t X i P(X = X i ) + X X i t Omdat alle waardes van X positief zijn volgt hieruit E(X ) X X i t X i P(X = X i ) X X i t X i P(X = X i ). tp(x = X i ) = tp(x t). 13 / 23

Wet van de Grote Getallen: de Chebyshev ongelijkheid St. (Chebyshev Ongelijkheid) Voor elk getal t > 0 geldt: P( X E(X ) t) Var(X ) t 2. Bew. Laat Y de stochast (X E(X )) 2 zijn. Dan zijn alle waardes van Y positief en E(Y ) = Var(X ). Uit de Markov ongelijkheid volgt: P( X E(X ) t) = P(Y t 2 ) E(Y ) t 2 = Var(X ) t 2. St. Voor elk getal t > 0 geldt: P( X E(X ) < t) 1 Var(X ) t 2. St. Voor elk getal ɛ > 0 geldt: P( X n µ < ɛ) 1 σ2 nɛ 2. Bew. Laat µ en σ 2 het gemiddelde en de variantie van X zijn. We zagen dat geldt: Dus volgt met Chebyshev: E(X n) = µ Var(X n) = σ2 n. P( X n µ < ɛ) 1 σ2 nɛ 2. 14 / 23

Wet van de Grote Getallen St. (Wet van de Grote Getallen) Voor een stochast X met verwachtingswaarde µ geldt voor elke ɛ > 0: lim P( X n µ < ɛ) = 1. n Bij toenemende n neemt de waarschijnlijkheid dat X n dicht bij µ ligt toe. Bew. Dit volgt uit de laatste stelling op de vorige stelling en het feit dat lim n σ 2 nɛ 2 = 0. 15 / 23

Wet van de Grote Getallen Vb. Kan door vaak een munt te gooien de waarschijnlijkheid dat het gemiddelde aantal keren dat kop gegooid wordt meer dan 0.3 afwijkt van 0.5, kleiner dan 0.01 worden? X n is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X n 0.5 0.3) 0.01. Met Chebyshev: P( X n 0.5 0.3) 0.25 n(0.3) 2. Dus P( X n 0.5 0.3) 0.01 voor n 0.25 0.01(0.3) 2 = 2500 9. 16 / 23

Wet van de Grote Getallen Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de waarschijnlijkheid dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? X n is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X n 0.5 < 0.01) δ. Met Chebyshev: P( X n 0.5 < 0.01) 1 0.25 n(0.01) 2. Daarmee P( X n 0.5 < 0.01) δ voor n waarvoor 1 0.25 n(0.01) 2 δ. Dus n 2500 1 δ. Merk op: als δ x maal zo groot, dan n x maal zo groot. 17 / 23

Wet van de Grote Getallen Vb. Een wijnboer verkoopt wijn per doos en wil dat de kans dat het percentage bedorven flessen in een doos meer dan 0.4% afwijkt van gemiddelde µ hoogstens 0.2 is. Hij weet µ niet en neemt voor de variantie 0.0005. Hoeveel flessen wijn moeten de dozen minimaal bevatten? Met Chebyshev: P( X n µ 0.004) 0.0005 n(0.004) 2. Dus P( X n µ 0.004) 0.2 voor n 0.0005 2(0.004) 2 = 15.625. De dozen moeten minimaal 16 flessen bevatten. 18 / 23

Centrale Limietstelling 19 / 23

Centrale Limietstelling Vb. Benadering van een binomiale verdeling door de normale verdeling. 20 / 23

Centrale Limietstelling St. (Centrale Limietstelling) Voor een stochast X met verwachtingswaarde µ en standaardafwijking σ geldt voor elke a: lim P( X n µ n σ a) = P s(z a). n Bij toenemende n benadert X n de normale verdeling met gemiddelde µ en standaardafwijking σ n. De Centrale Limietstelling is een versterking en precisering van de Wet van de Grote Getallen. Def. σ X = σ n is de standaardfout van het gemiddelde. 21 / 23

Centrale Limietstelling Vb. Zij X een stochast met E(X ) = 3 en Var(X ) = 4 waarvoor de verdeling onbekend is of moeilijk te berekenen. Er wordt gevraagd naar de kans dat het steekproef gemiddelde van een willekeurige steekproef ter grootte n = 10.000 kleiner is dan 2.95. Aangenomen wordt dat n voldoende groot is om de verdeling van X = X 10.000 als een normale verdeling met verwachtingswaarde µ = 3 en standaardafwijking 4 n = 2 = 0.02 te beschouwen. 100 Onder die aanname geldt: P(X 2.95) = P X 3 s( 0.02 2.95 3 ) = P X 3 s( 0.02 0.02 0.05 0.02 ) = P s( X 3 0.02 2.25). Wegens de symmetrie van de standaard normale verdeling rond 0 geldt P s( X 3 0.02 2.25) = Ps( X 3 0.02 2.25). Uit tabel C.1 blijkt dat P s(z 2.25) = 0.0122. Dus P(X 2.95) = 0.0122. 22 / 23

Finis 23 / 23