Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23
2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23
Stochast en populatie 3 / 23
Stochast en populatie Def. Voor een discrete stochast X met eindige veel waardes X 1,..., X n is de variantie van X : nx Var(X ) = E((X E(X )) 2 ) = P(X = X i )(X i E(X )) 2. St. Bij het beschouwen van een eindige populatie en een parameter met eindig veel waardes X 1,..., X n, is de variantie van de bijbehorende stochast X gelijk aan de variantie σ 2 van de parameter in de populatie: Var(X ) = σ 2. Bew. Zij N het aantal elementen in de populatie en f i de frequentie (het aantal) van de elementen in de populatie met waarde i. Omdat de gehele populatie beschouwd wordt, en niet een steekproef, geldt: i=1 P(X = X i ) = f i N. Uit de vorige stelling volgt dat voor het gemiddelde µ van de populatie geldt dat µ = E(X ). Daaruit volgt dat σ 2 = P n i=1 f i (X i µ) 2 N nx f i (X i E(X )) 2 = N i=1 nx = P(X = X i )(X i E(X )) 2 = Var(X ). i=1 4 / 23
Experimenten herhalen 5 / 23
Experimenten herhalen Def. Stel dat X een stochast is bij een experiment dat als uitkomsten getallen heeft. Als dat experiment n maal wordt herhaald, dan staat X n voor de gemiddelde waarde van de n uitkomsten. X n is ook een stochast. Een steekproef ter grootte n kan gezien worden als het n maal herhalen van een experiment. Daarom zijn beide notaties X (voor steekproef en stochast) met elkaar in overeenstemming. 6 / 23
Experimenten herhalen Vb. X is de stochast bij het 1 maal werpen van een munt: X = 1 bij K en X = 0 bij M. Het n maal werpen van een munt is het n maal herhalen van het experiment. Laat X i de uitkomst van het i e experiment zijn. Dan geldt P n i=1 X n = X i. n (Hetzelfde als bij het gemiddelde van een steekproef.) De mogelijke waardes van X n zijn: 0, 1 n, 2 n,..., n 1 n, 1. X n heeft een binomiale verdeling: P(X n = k n ) = n k (0.5) n. 7 / 23
Experimenten herhalen Vb. Stel de populatie bestaat uit vier mensen met respectievelijke lengtes (in meters) m 1 = 1.73, m 2 = 1.60, m 3 = 1.81 en m 4 = 1.74. µ = 1.72. Stel dat er telkens een steekproef ter grootte 3 uit de populatie genomen wordt, wat is dan de kansverdeling van X 3? Er zijn vier mogelijke steekproeven en dus vier mogelijke waardes voor X 3 : steekproef steekproefgemiddelde X 3 {m 1, m 2, m 3 } 1.71 {m 1, m 2, m 4 } 1.69 {m 1, m 3, m 4 } 1.76 {m 2, m 3, m 4 } 1.72 Merk op: Het gemiddelde van de steekproefgemiddeldes is 1.72 = X. De variantie van de populatie is: (1.73 1.72) 2 + (1.60 1.72) 2 + (1.81 1.72) 2 + (1.74 1.72) 2 4 = 0.00375. De variantie van het steekproefgemiddelde is (1.71 1.72) 2 + (1.69 1.72) 2 + (1.76 1.72) 2 + (1.72 1.72) 2 4 = 0.00065. 8 / 23
Experimenten herhalen St. Als X een stochast is met E(X ) = µ en Var(X ) = σ 2 en het bijbehorende experiment wordt n maal herhaald, dan geldt E(X n) = µ Var(X n) = σ2 n. St. Wanneer uit een populatie met gemiddelde µ en variantie σ 2 steekproeven ter grootte n worden genomen, dan is het steekproefgemiddelde X n een stochast, met als gemiddelde en variantie respectievelijk E(X n) = µ Var(X n) = σ2 n. 9 / 23
Wet van de Grote Getallen 10 / 23
Wet van de Grote Getallen Vb. Experiment: het aantal malen succes k bij het 100 maal werpen van een munt. Dit experiment is 25 maal herhaald. 21 van de 25 keer gold 45 k 55, d.w.z. dat 21 van de 25 keer 0.45 X 100 0.55. Histogram of f Frequency 0 2 4 6 8 10 12 40 45 50 55 60 f 11 / 23
Wet van de Grote Getallen Vb. Experiment: het aantal malen succes k bij het 100 maal werpen van een munt. Dit experiment is 50 maal herhaald. 36 van de 50 keer gold 45 k 55, d.w.z. dat 36 van de 50 keer 0.45 X 100 0.55. 45 van de 50 keer gold 45 k 60, d.w.z. dat 45 van de 50 keer 0.45 X 100 0.6 Histogram of f Frequency 0 5 10 15 20 40 45 50 55 60 65 70 f 12 / 23
Wet van de Grote Getallen: de Markov ongelijkheid St. (Markov Ongelijkheid) Zij X een stochast waarvan alle waardes positief zijn. Dan geldt voor elk getal t 0: P(X t) E(X ). t Bew. We bewijzen de stelling voor een discrete stochast met waardes X 1,..., X n. Dan E(X ) = nx i=1 X i P(X = X i ) = X X i <t X i P(X = X i ) + X X i t Omdat alle waardes van X positief zijn volgt hieruit E(X ) X X i t X i P(X = X i ) X X i t X i P(X = X i ). tp(x = X i ) = tp(x t). 13 / 23
Wet van de Grote Getallen: de Chebyshev ongelijkheid St. (Chebyshev Ongelijkheid) Voor elk getal t > 0 geldt: P( X E(X ) t) Var(X ) t 2. Bew. Laat Y de stochast (X E(X )) 2 zijn. Dan zijn alle waardes van Y positief en E(Y ) = Var(X ). Uit de Markov ongelijkheid volgt: P( X E(X ) t) = P(Y t 2 ) E(Y ) t 2 = Var(X ) t 2. St. Voor elk getal t > 0 geldt: P( X E(X ) < t) 1 Var(X ) t 2. St. Voor elk getal ɛ > 0 geldt: P( X n µ < ɛ) 1 σ2 nɛ 2. Bew. Laat µ en σ 2 het gemiddelde en de variantie van X zijn. We zagen dat geldt: Dus volgt met Chebyshev: E(X n) = µ Var(X n) = σ2 n. P( X n µ < ɛ) 1 σ2 nɛ 2. 14 / 23
Wet van de Grote Getallen St. (Wet van de Grote Getallen) Voor een stochast X met verwachtingswaarde µ geldt voor elke ɛ > 0: lim P( X n µ < ɛ) = 1. n Bij toenemende n neemt de waarschijnlijkheid dat X n dicht bij µ ligt toe. Bew. Dit volgt uit de laatste stelling op de vorige stelling en het feit dat lim n σ 2 nɛ 2 = 0. 15 / 23
Wet van de Grote Getallen Vb. Kan door vaak een munt te gooien de waarschijnlijkheid dat het gemiddelde aantal keren dat kop gegooid wordt meer dan 0.3 afwijkt van 0.5, kleiner dan 0.01 worden? X n is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X n 0.5 0.3) 0.01. Met Chebyshev: P( X n 0.5 0.3) 0.25 n(0.3) 2. Dus P( X n 0.5 0.3) 0.01 voor n 0.25 0.01(0.3) 2 = 2500 9. 16 / 23
Wet van de Grote Getallen Vb. Kan voor elk willekeurig getal 0 < δ < 1 door vaak te gooien de waarschijnlijkheid dat het gemiddelde minder dan 0.01 afwijkt van 0.5, groter dan δ worden? X n is het steekproefgemiddelde bij het n maal gooien van de munt. Gevraagd wordt naar n waarvoor P( X n 0.5 < 0.01) δ. Met Chebyshev: P( X n 0.5 < 0.01) 1 0.25 n(0.01) 2. Daarmee P( X n 0.5 < 0.01) δ voor n waarvoor 1 0.25 n(0.01) 2 δ. Dus n 2500 1 δ. Merk op: als δ x maal zo groot, dan n x maal zo groot. 17 / 23
Wet van de Grote Getallen Vb. Een wijnboer verkoopt wijn per doos en wil dat de kans dat het percentage bedorven flessen in een doos meer dan 0.4% afwijkt van gemiddelde µ hoogstens 0.2 is. Hij weet µ niet en neemt voor de variantie 0.0005. Hoeveel flessen wijn moeten de dozen minimaal bevatten? Met Chebyshev: P( X n µ 0.004) 0.0005 n(0.004) 2. Dus P( X n µ 0.004) 0.2 voor n 0.0005 2(0.004) 2 = 15.625. De dozen moeten minimaal 16 flessen bevatten. 18 / 23
Centrale Limietstelling 19 / 23
Centrale Limietstelling Vb. Benadering van een binomiale verdeling door de normale verdeling. 20 / 23
Centrale Limietstelling St. (Centrale Limietstelling) Voor een stochast X met verwachtingswaarde µ en standaardafwijking σ geldt voor elke a: lim P( X n µ n σ a) = P s(z a). n Bij toenemende n benadert X n de normale verdeling met gemiddelde µ en standaardafwijking σ n. De Centrale Limietstelling is een versterking en precisering van de Wet van de Grote Getallen. Def. σ X = σ n is de standaardfout van het gemiddelde. 21 / 23
Centrale Limietstelling Vb. Zij X een stochast met E(X ) = 3 en Var(X ) = 4 waarvoor de verdeling onbekend is of moeilijk te berekenen. Er wordt gevraagd naar de kans dat het steekproef gemiddelde van een willekeurige steekproef ter grootte n = 10.000 kleiner is dan 2.95. Aangenomen wordt dat n voldoende groot is om de verdeling van X = X 10.000 als een normale verdeling met verwachtingswaarde µ = 3 en standaardafwijking 4 n = 2 = 0.02 te beschouwen. 100 Onder die aanname geldt: P(X 2.95) = P X 3 s( 0.02 2.95 3 ) = P X 3 s( 0.02 0.02 0.05 0.02 ) = P s( X 3 0.02 2.25). Wegens de symmetrie van de standaard normale verdeling rond 0 geldt P s( X 3 0.02 2.25) = Ps( X 3 0.02 2.25). Uit tabel C.1 blijkt dat P s(z 2.25) = 0.0122. Dus P(X 2.95) = 0.0122. 22 / 23
Finis 23 / 23