Hoofdstuk 6 Discrete distributies

Vergelijkbare documenten
Hoofdstuk 7 : Continue distributies als stochastische modellen. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Hoofdstuk 5. Toevalsveranderlijken en waarschijnlijkheidsdistributies. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

5.0 Voorkennis. Voorbeeld 1: In een vaas zitten 10 rode, 5 witte en 6 blauwe knikkers. Er worden 9 knikkers uit de vaas gepakt.

Opgaves Hoofdstuk 3: Toevalsveranderlijken en Distributiefuncties

Statistiek voor A.I. College 6. Donderdag 27 September

36, P (5) = 4 36, P (12) = 1

Kansrekening en stochastische processen 2S610

Examen Statistiek I Feedback

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling.

Kern 1 Rekenen met binomiale kansen

3.1 Het herhalen van kansexperimenten [1]

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

9.0 Voorkennis. Bij samengestelde kansexperimenten maak je gebruik van de productregel.

werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

Binomiale verdelingen

Kansrekening en stochastische processen 2DE18

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

De verstrooide professor

Medische Statistiek Kansrekening

Voorbeeld 1: kansverdeling discrete stochast discrete kansverdeling

Samenvatting Statistiek

14.1 Kansberekeningen [1]

Opgeloste Oefeningen Hoofdstuk 4: Numerieke Karakteristieken

13.1 Kansberekeningen [1]

uitwerkingen OefenTentamen kansrekening 2007

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Statistiek I Samenvatting. Prof. dr. Carette

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Statistiek voor A.I. College 9. Donderdag 11 Oktober

Zo geldt voor o.o. continue s.v.-en en X en Y dat de kansdichtheid van X + Y gegeven wordt door

b. de aantallen aankomsten in disjuncte tijdsintervallen zijn onafhankelijk van elkaar

In de Theorie worden de begrippen toevalsvariabele, kansverdeling en verwachtingswaarde toegelicht.

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

WenS eerste kans Permutatiecode 0

Uitwerking Tentamen Inleiding Kansrekening 11 juni 2015, uur Docent: Prof. dr. F. den Hollander

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Uitwerkingen Hst. 10 Kansverdelingen

11.1 Kansberekeningen [1]

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Data analyse Inleiding statistiek

Tentamen Inleiding Kansrekening 11 augustus 2011, uur

Kansrekening en Statistiek

Inleiding Modelmatige beschrijving Kansverdelingen Het overgangsdiagram De stellingen van Little M/M/1 M/M/1/N Afsluiti.

Kansrekening en Statistiek

b) Uit Bayes volgt, gebruik makend van onderdeel a) P (T V )P (V ) P (T ) = (0.09)(0.07)

Zeldzame en extreme gebeurtenissen

werkcollege 6 - D&P9: Estimation Using a Single Sample

Set 2 Inleveropgaven Kansrekening (2WS20)

Tentamen Kansrekening (NB004B)

Kansrekening en stochastische processen 2S610

Kansrekening en Statistiek

Hoofdstuk 20 Wachtrijentheorie

Eindexamen wiskunde A vwo I

Voorbeelden van gebruik van 5 VUSTAT-apps

Biofysische Scheikunde: Statistische Mechanica

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

module SC 12 Inleiding Risicotheorie donderdag 7 november uur

Kansrekening en Statistiek

Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Schatten en simuleren

5,1. Samenvatting door een scholier 1647 woorden 18 oktober keer beoordeeld. Wiskunde A

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Statistiek voor A.I. College 3. Dinsdag 18 September 2012

4.1 Eigenschappen van de normale verdeling [1]

Antwoordmodel VWO wa I. Vogels die voedsel zoeken

Hoofdstuk 5: Steekproevendistributies

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Vraag Antwoord Scores

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Hoofdstuk 11: Kansverdelingen 11.1 Kansberekeningen Opgave 1: Opgave 2: Opgave 3: Opgave 4: Opgave 5:

Hoofdstuk 4 Kansrekening

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

WenS tweede kans Permutatiecode 0

Tentamen Inleiding Kansrekening wi juni 2010, uur

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Kansrekening en Statistiek. Overzicht Kansrekening

Hoe bereken je een kans? Voorbeeld. aantal gunstige uitkomsten aantal mogelijke uitkomsten P(G) =

Kansrekening en Statistiek

Gezamenlijke kansverdeling van twee stochasten

E(A 1 ) = 1/λ. De functie G(s) wordt gedefiniëerd als. G(s) = E(e sa 1

Statistiek voor A.I.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Toetsen van Hypothesen. Het vaststellen van de hypothese

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Paragraaf 9.1 : De Verwachtingswaarde

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

P (X n+1 = j X n = i, X n 1,..., X 0 ) = P (X n+1 = j X n = i).

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

IJkingstoets Wiskunde-Informatica-Fysica september 2018: algemene feedback

Stochastiek voor Informatici Sara van de Geer 1993

7.0 Voorkennis , ,

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Transcriptie:

Hoofdstuk 6 Discrete distributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Discrete distributies p 1/33

Discrete distributies binomiale verdeling Poisson verdeling hypergeometrische verdeling uniforme discrete verdeling Discrete distributies p 2/33

De binomiale verdeling De binomiaal verdeelde toevalsveranderlijke I is het aantal keer dat een verschijnsel A optreedt in een reeks van n enkelvoudige waarnemingen Hierbij moet de kans op het optreden van een verschijnsel A bij een enkelvoudige waarneming de constante waarde θ bedragen : P(A) =θ Voorbeeld : zij I is het aantal keer dat 5 gegooid wordt bij 7 onafhankelijke worpen met een dobbelsteen n =7 I is binomiaal verdeeld met θ I = 1 6 Discrete distributies p 3/33

Distributie P( A A A }{{} i = } θ θ {{ θ} i A} A {{ A} ) n i (1 θ)(1 θ) (1 θ) }{{} n i = θ i (1 θ) n i P(A A A }{{} A A A }{{} ) n i i = (1 θ)(1 θ) (1 θ) }{{}} θ θ {{ θ} = θ i (1 θ) n i n i i ( ) aantal mogelijke sequenties : Cn i n! n = i!(n i)! = i elke sequentie ( ) heeft kans θ i (1 θ) n i n Besluit : ϕ I (i) = θ i (1 θ) n i i =0, 1,, n i Discrete distributies p 4/33

Distributie ϕ I (i) = ( n i ) θ i (1 θ) n i Φ I (w) =P(I w) = i w i =0, 1,, n ( ) n θ i (1 θ) n i i binomium van Newton : (a + b) n = n i=0 ( ) n a i b n i i Φ I (n) = n i=0 ( ) n θ i (1 θ) n i =[θ +(1 θ)] n =1 i Discrete distributies p 5/33

Karakteristieken µ I = n i=0 iϕ I (i) =nθ σ 2 I = n i=0 i 2 ϕ I (i) µ 2 = nθ(1 θ) σ I = nθ(1 θ) θ : parameter van de binomiale distributie Discrete distributies p 6/33

Kansverdeling ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 n =10,θ=01 ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 n =10,θ=05 ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 n =10,θ=09 Discrete distributies p 7/33

Voorbeeld Een familie heeft 6 zes kinderen De kansen bij een geboorte bedroegen 049 voor een jongen en 051 voor een meisje (i) Wat is de kans dat er tenminste 1 meisje is? (ii) Wat is de kans dat er hoogstens 2 jongens zijn? Oplossing : Zij I het aantal meisjes onder de zes kinderen ( ) 6 ϕ I (i) = θ i (1 θ) 6 i θ =051 i (i) P(I 1)= 1 P(I <1)= 1 P(I =0)=1 ϕ I (0) =1 (1 θ) 6 =09826 (ii) P(I 4) = ϕ I (4) + ϕ I (5) + ϕ I (6) ( ) ( ) 6 6 = θ 4 (1 θ) 2 + 4 5 θ 5 (1 θ)+θ 6 =03627 Discrete distributies p 8/33

Toepassing Zij x 1, x 2,,x 10 10 onafhankelijke waarden van de toevalsveranderlijke X met cumulatieve distributiefunctie Φ X (x) Bepaal de kans dat alle meetwaarden vallen in [α, β] Oplossing : P(α X β) =Φ X (β) Φ X (α) Zij I het aantal x-en in [α, β] n =10 Dan is I binomiaal verdeeld met θ I =Φ X (β) Φ X (α) P(I = 10) = θ 10 I =(Φ X (β) Φ X (α)) 10 Discrete distributies p 9/33

Teruglegging Voorbeeld : Een urne bevat n U = 100 (op kleur na identieke) ballen, waaronder k =20zwarte We voeren n =25 achtereenvolgende trekkingen van een bal uit Zij I het aantal getrokken zwarte ballen met teruglegging : de kans op een zwarte bal is voor elke trekking constant, nl k n U I : binomiaal verdeeld met θ I = k n U zonder teruglegging : de kans op een zwarte bal verschilt van trekking tot trekking I : hypergeometrisch verdeeld Discrete distributies p 10/33

Hypergeometrische distributie De hypergeometrisch verdeelde toevalsveranderlijke I is het aantal keer dat een eigenschap A wordt waargenomen in een reeks van n enkelvoudige waarnemingen van telkens verschillende elementen uit een verzameling van n U elementen waarvan k elementen deze eigenschap A bezitten Discrete distributies p 11/33

Distributie - n U : populatiegrootte - n : steekproefgrootte - k : aantal elementen in populatiemet gezochte eigenschap max(0, n+ k n U ) I min(n, k) want I k en als n n U k, dan is I n (n U k) ( )( ) k nu k ϕ I (i) = Ci k C n i n U k i n i Cn n = ( ) nu U n Discrete distributies p 12/33

Karakteristieken - n U : populatiegrootte - n : steekproefgrootte - k : aantal elementen in populatiemet gezochte eigenschap σ 2 I = n k n U n U k n U µ I = n k n U = nθ θ = k n U n = nθ(1 θ) n U 1 n U ( 1 n 1 n U 1 Als n 1 n U 1 n zeer klein is (dzw ongeveer 0), kan de n U hypergeometrische verdeling benaderd worden door een binomiale verdeling met parameter θ = k n U ) Discrete distributies p 13/33

Kansverdeling ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 n U = 100, k=10,n=10 ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 n U =20,k=10,n=10 Discrete distributies p 14/33

Vergelijking Hypergeometrisch Binomiaal ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 05 06 n U = 200, k=10,n=10 0591 0327 0073 0008 ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 05 06 n =10,θ=005 0599 0315 0075 0010 Discrete distributies p 15/33

Voorbeeld In een loterij worden, benevens heel wat troostprijzen, 10 hoofdprijzen uitgedeeld Als er 5000 deelnemende nummers zijn, wat is dan de kans dat een deelnemer met 10 loten minstens 1 hoofdprijs heeft gewonnen Oplossing : I : aantal gewonnen hoofdprijzen met de 10 loten I : hypergeom verdeeld met k =10, n =10en n U = 5000 P(I 1) = 1 P(I =0) ( 10 )( 4990 ) 0 10 = 1 ) = (4990!)2 4980! 5000! =0019839 ( 5000 10 n =0002 = binomiale benadering met θ = k =0002 n U n U P(I 1) = 1 P(I =0) 1 (1 θ) 10 =0019821 Discrete distributies p 16/33

De verdeling van Poisson De Poisson verdeelde veranderlijke I is het aantal keer dat een verschijnsel A optreedt in een totale tijdsduur t Hierbij moet de kans dat het verschijnsel optreedt in een klein tijdsinterval t evenredig zijn met de duur van dit interval : λ t Daarenboven moet het ene optreden van A onafhankelijk zijn van vorige optredens van A, hetgeen betekent dat λ een constante is die niet afhangt van wat voordien voorgevallen is klein betekent : het verschijnsel kan hoogstens 1 keer optreden Discrete distributies p 17/33

Distributie i =0 P i (t) =P(A treedt i keer op in tijdsduur t) P 0 ( t) =1 P 1 ( t) =1 λ t P 0 (t + t) =P 0 (t) P 0 ( t) =P 0 (t)(1 λ t) P 0 (t + t) P 0 (t)+λp 0 (t) t =0 P 0 (t + t) P 0 (t) lim + λp 0 (t) =0 t 0 t = dp 0(t) + λp 0 (t) =0 dt P 0 (0) = 1 P 0 (t) =e λt Discrete distributies p 18/33

Distributie i>0 P i (t) =P(A treedt i keer op in tijdsduur t) P 0 ( t) =1 P 1 ( t) =1 λ t P i (t + t) = P i (t) P 0 ( t)+p i 1 (t) P 1 ( t) i =1, 2, = P i (t)(1 λ t)+p i 1 (t) λ t P i (t + t) P i (t)+λp i (t) t = λp i 1 (t) t P i (t + t) P i (t) lim + λp i (t) =λp i 1 (t) t 0 t = dp i(t) + λp i (t) =λp i 1 (t) dt P i (0) = 0 P i (t) =e λt (λt)i i! Discrete distributies p 19/33

Distributie λt (λt)i ϕ I (i) =P i (t) =e i! i =0, 1, 2, Φ I (w) =P(I w) =e λt j w (λt) j j! e x = + j=0 x j j! Φ I (+ ) =e λt + j=0 (λt) j j! =1 Discrete distributies p 20/33

Karakteristieken µ I = i=0 iϕ I (i) =λt σ 2 I = i=0 i 2 ϕ I (i) µ 2 I = λt µ µi ϕ I (i) =e i! i =0, 1, 2, µ : parameter van de Poisson-distributie Discrete distributies p 21/33

Kansverdeling ϕ I (i) 0 1 2 3 4 5 00 01 02 03 04 05 06 µ =05 0 1 2 3 4 5 6 00 01 02 03 04 05 06 µ =1 ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 11 12 13 00 01 02 03 µ =5 Discrete distributies p 22/33

Momentenfunctie M I (t) = = e it ϕ I (i) i=0 i=0 = e µ e it µ µi e i! i=0 = e µ e µet = e µ (et 1) (e t µ) i i! Discrete distributies p 23/33

Momentenfunctie Som van onafhankelijke Poisson verdeelde toevalsveranderlijken De som K van n onafhankelijke Poisson verdeelde toevalsveranderlijken I j met parameter µ j is Poisson verdeeld n met parameter µ j j=1 M K (t) = n M j (t) = n e µ j (e t 1) = e (e t 1) n j=1 µ j j=1 j=1 Discrete distributies p 24/33

Vergelijking Binomiaal Poisson ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 05 06 n = 100, θ=0005 0606 0304 0076 0012 ϕ I (i) 0 1 2 3 4 5 6 7 8 9 10 00 01 02 03 04 05 06 µ =05 0607 0303 0076 0013 De Poisson-verdeling levert goede benaderingen voor de binomiale verdeling als n groot is en µ = nθklein Discrete distributies p 25/33

Voorbeeld Een radioactieve bron wordt geobserveerd gedurende vier verschillende tijdsintervallen van 6 seconden elk Per seconde wordt er gemiddeld 05 deeltjes uitgezonden Men neemt aan dat het aantal deeltjes dat uitgezonden wordt in het tijdsinterval [0, t] verdeeld is volgens de Poisson-distributie (i) P(in de vier intervallen 3 deeltjes uitgezonden) (ii) P(in minstens 1 interval 3 deeltjes uitgezonden) Oplossing : I : het aantal uitgezonden deeltjes in [0, t] λt (λt)i ϕ I (i) =e i! i =0, 1, t=6seconden = λt=3 P(I 3) = 1 P(I <3) = 1 e µ ( 1+µ + µ2 2! ) =0577 Discrete distributies p 26/33

Voorbeeld Een radioactieve bron wordt geobserveerd gedurende vier verschillende tijdsintervallen van 6 seconden elk Per seconde wordt er gemiddeld 05 deeltjes uitgezonden Men neemt aan dat het aantal deeltjes dat uitgezonden wordt in het tijdsinterval [0, t] verdeeld is volgens de Poisson-distributie (i) P(in de vier intervallen 3 deeltjes uitgezonden) (ii) P(in minstens 1 interval 3 deeltjes uitgezonden) Oplossing : I : het aantal uitgezonden deeltjes in 6 seconden P(I 3) = 0577 J : aantal intervallen met 3 uitgezonden deeltjes J : binomiaal met θ J =0577 (i) P(J =4)=θ 4 =0111 (ii) P(J 1)= 1 P(J =0)= 1 (1 θ) 4 =0968 Discrete distributies p 27/33

Veralgemeningen De distributie van Poisson kan veralgemeend worden door het constant zijn van λ te laten varen Als voorbeeld kunnen we het aantal slachtoffers van een besmettelijke ziekte gedurende een tijd t beschouwen De besmettingsparameter neemt toe als het aantal nieuwe zieken in eenzelfde tijdsduur toeneemt Daarentegen neemt af als de tijdsduur voor evenveel nieuwe zieken toeneemt Een van de veralgemeningen is de distributie van Polya Discrete distributies p 28/33

Poisson en binomiaal Bepaal ϕ J (j) als J telt hoeveel verschijnselen uit een Poisson proces (met parameter µ) ook voldoen aan een zekere eigenschap (met constante kans θ) µ µi een Poisson proces I : ϕ I (i) =e i =0, 1, i! binomiaal proces met parameter θ ϕ J (j) = P(J = j) =P((J = j) ( (I = i))) j =0, 1, i=0 = P((J = j) (I = i)) = P(I = i)p(j = j I = i) i=0 i=0 = P(I = i)p(j = j I = i) want P (J >I)=0 = i=j i=j µ µi e i! ( ) i θ j (1 θ) i j j Discrete distributies p 29/33

Poisson en binomiaal Bepaal ϕ J (j) als J telt hoeveel verschijnselen uit een Poisson proces (met parameter µ) ook voldoen aan een zekere eigenschap (met constante kans θ) ( ) µ µi i ϕ J (j) = e θ j (1 θ) i j i! j i=j = e µ i=j = e µ (θµ) j j! = e µ (θµ) j j! = e µ (θµ) j j! µ j+(i j) i! i j=0 k=0 1 k! i! (i j)! j! θj (1 θ) i j 1 (i j)! (µ (1 θ))k e µ (1 θ) = e µθ(θµ)j j! (µ (1 θ))i j J : Poisson µ J = µθ Discrete distributies p 30/33

De discrete uniforme verdeling Een uniform verdeelde discrete veranderlijke X is een veranderlijke waarbij de kans op het voorkomen van een enkelvoudige gebeurtenis uit de populatie voor elke enkelvoudige gebeurtenis dezelfde is Discrete distributies p 31/33

Distributie karakteristieken waarden X : x 1 <x 2 <<x m ϕ X (x i )=P(X = x i )= 1 m i =1, 2,, m Φ X (w) =P(X w) = x i w 1 m Φ X (x i )=P(X x i )= i m i =1, 2,, m m µ X = 1 m m i=1 x i σ 2 X = 1 m i=1 x 2 i µ 2 X Discrete distributies p 32/33

Bijzonder geval waarden I : 1 < 2 <<m µ I = m +1 2 σ 2 I = m2 1 12 Discrete distributies p 33/33