Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie

Maat: px
Weergave met pagina beginnen:

Download "Deze week: Schatten. Statistiek voor Informatica Hoofdstuk 6: Schatten. Voorbeeld Medicijnentest. Statistische inferentie"

Transcriptie

1 Deze week: Schatten Statistiek voor Informatica Hoofdstuk 6: Schatten Cursusjaar 2009 Peter de Waal Departement Informatica Statistische inferentie A Priori en posteriori verdelingen Geconjugeerde a priori verdelingen Bayes schatters Maximum likelihood schatters Hfdstk 6: 1 / 50 Hfdstk 6: 2 / 50 Statistische inferentie Voorbeeld Medicijnentest Het afleiden van gegevens voor een onbekende verdeling in een populatie op grond van waarnemingen van een gedeelte van die populatie. Toepassingen Parameter schatten Voorspellen Beslissingsproblemen. Beschouw het voorbeeld van de medicijnentest uit Hoofdstuk 5: Medicijn Imipramine heeft een onbekende kans P op succes. Medicijn wordt uitgeprobeerd op een aantal n patiënten. We willen een uitspraak doen over de onbekende P. Twee mogelijke aanpakken: Frequentistisch: De onbekende P heeft één, ons niet bekende, waarde. Probeer deze waarde zo goed mogelijk te bepalen. Bayesiaans: De onbekende P is een stochast met onbekende verdeling, die onze overtuiging ( belief ) in de parameterwaarde representeert. Probeer de verdeling zo goed mogelijk te bepalen. Hfdstk 6: Inleiding 3 / 50 Hfdstk 6: Inleiding 4 / 50

2 Bayesiaans vs. niet-bayesiaans Niet-Bayesiaans (Frequentistisch) Onbekende parameter heeft één onbekende waarde, Geen veronderstellingen vooraf, Uitkomsten van experiment leveren één schatting (waarde) voor de onbekende parameter. Bayesiaans Onbekende parameter is een stochast met een onbekende verdeling, Bij start van experiment: a-priori verdeling, Uitkomsten van experiment leveren informatie om de a-priori verdeling te verbeteren tot a-posteriori verdeling. A priori verdeling In de Bayesiaanse statistiek loopt schatten van een onbekende parameter θ als volgt: a priori verdeling ξ(θ) Waarnemingen x = (x 1,..., x n ) f (x θ) a posteriori verdeling ξ(θ x) Hfdstk 6: Inleiding 5 / 50 Hfdstk 6: A priori verdeling 6 / 50 Voorbeeld Medicijnentest (Vervolg) In het voorbeeld van de medicijnentest (in Hoofdstuk 5) zagen we al zo n aanpak: a priori verdeling: P Beta(1, 1) Waarnemingen x = (x 1,..., x n ) f (x p): 100 patiënten met 45 successen a posteriori verdeling: P Beta(46, 56) Waarnemingen Twee (equivalente) interpretaties van f (x θ): 1 Parameter X heeft kansverdeling met kansdichtheid- of kansmassafunctie f (x θ) die afhangt van een onbekende parameter θ, De X1,..., X n s vormen aselecte steekproef met verdeling gegeven door f (x θ); 2 Stochast X en θ hebben simultane verdeling f (x, θ), waarbij θ dus ook als een stochast beschouwd wordt. f (x θ) is een conditionele kansdichtheid- of kansmassafunctie, De X1,..., X n s zijn conditioneel onafhankelijk en identiek verdeeld gegeven θ met kansverdeling f (x θ). Hfdstk 6: A priori verdeling 7 / 50 Hfdstk 6: A priori verdeling 8 / 50

3 Voorbeeld (Levensduur TL-buizen) We weten dat de levensduur van een TL-buis een exponentiële verdeling heeft met parameter θ: f (x θ) = { θe θx, als x > 0, 0, anders. De parameter θ is niet bekend, maar we veronderstellen dat θ a priori een Gamma verdeling heeft met verwachting en standaard deviatie De parameter θ heeft dan een Gamma verdeling met parameters α =? en β =?, i.e. ξ(θ) = (β) α Γ(α) θα 1 e βθ, als θ > 0, 0, anders. A posteriori verdeling ξ(θ x) = conditionele verdeling van θ, gegeven de waargenomen data x = (x 1,..., x n ) uit de steekproef. Berekening: 1 Bepaal de a priori kansverdeling ξ(θ) van θ. 2 Doe aselecte steekproef X 1, X 2,..., X n met kansverdeling f (x θ) 3 Simultane verdeling van X 1,..., X n, gegeven θ: f n (x θ) = f n (x 1,..., x n θ) = f (x 1 θ) f (x 2 θ) f (x n θ) 4 Simultane verdeling van X 1,..., X n, en θ: h(x, θ) = f n (x θ)ξ(θ) 5 Marginale simultane verdeling van X 1,..., X n : g n (x) = θ h(x, θ) = θ f n(x θ)ξ(θ) 6 Conditionele kansmassa van θ gegeven X 1 = x 1,..., X n = x n : h(x, θ) ξ(θ x) = g n (x) = f n(x θ)ξ(θ) g n (x) Hfdstk 6: A priori verdeling 9 / 50 Hfdstk 6: A posteriori verdeling 10 / 50 Voorbeeld Medicijnenproef (Vervolg) Onbekende parameter θ = p. Realisatie steekproef n x i = ξ(p) = Γ(α+β) Γ(α)Γ(β) pα 1 (1 p) β 1, voor 0 < p < 1. 2 f (x p) = p x (1 p) 1 x, voor x = 0, 1. 3 f n (x p) = p x 1 (1 p) 1 x 1 p x 2 (1 p) 1 x 2... p xn (1 p) 1 xn. 4 h(x, p) = p Γ(α + β) (1 p) Γ(α)Γ(β) pα 1 (1 p) β 1. 5 g n (x) = Γ(α + β) Γ(α)Γ(β) Γ(α + 45)Γ(β + 55). Γ(α + β + 100) Aannemelijkheidsfunctie De functie f n (x 1,..., x n θ) is de kansmassafunctie van het steekproefresultaat x = (x 1,..., x n ) gegeven de onbekende parameter θ: f n (x 1,..., x n θ) = P(X 1 = x 1,..., X n = x n θ). Als de waarden x 1,..., x n, gegeven zijn, dan kunnen we dit ook beschouwen als een functie van θ. De functie noemen we dan de aannemelijkheidsfunctie van θ (Engels: likelihood function). 6 ξ(p x) = Γ(α + β + 100) Γ(α + 45)Γ(β + 55) pα+45 1 (1 p) β Hfdstk 6: A posteriori verdeling 11 / 50 Hfdstk 6: A posteriori verdeling 12 / 50

4 Berekening Stap 6: ξ(θ x) = h(x, θ) g n (x) = f n(x θ)ξ(θ) g n (x) g n (x) onafhankelijk van θ = f n(x θ)ξ(θ) h(x, θ) dient voor normering van ξ(θ x) tot kansmassafunctie, Alternatief: ξ(θ x) f n (x θ)ξ(θ), wat betekent: ofwel ξ(θ x) proportioneel met f n (x θ)ξ(θ). ξ(θ x) = C f n (x θ)ξ(θ), voor een of andere constante C die niet afhangt van θ. De juiste normering kan plaatsvinden door θ ξ(θ x) = 1 θ Voorbeeld Medicijnenproef ξ(p x) = f n(x p)ξ(p) g n (x) = p 45 (1 p) 55 Γ(α + β) Γ(α)Γ(β) pα 1 (1 p) β 1 Γ(α + β) Γ(α)Γ(β) p α+45 1 (1 p) β+55 1 Γ(α + 45)Γ(β + 55) Γ(α + β + 100) Hfdstk 6: A posteriori verdeling 13 / 50 Hfdstk 6: A posteriori verdeling 14 / 50 Voorbeeld Elektronische componenten Siemens produceert elektronische componenten, waarvan een fractie θ defect is. We nemen de a priori verdeling van θ uniform over [0, 1]: { 1, als 0 θ 1, ξ(θ) = 0, anders. We nemen een aselecte steekproef van 10 items, Noem X i = 1 als item i defect is, en 0 anders. De X i zijn conditioneel onafhankelijk, gegeven θ. Bovendien hebben ze elk een Bernoulli verdeling met parameter θ. De kansmassa voor elke X i is dus De uitslag van de steekproef is x = (1, 0, 0, 0, 0, 0, 1, 0, 0, 1). Dit levert f n (x θ) = θ (1 θ)(1 θ)(1 θ)(1 θ)(1 θ) θ (1 θ)(1 θ) θ Hieruit volgt ξ(θ x) θ 3 (1 θ) 7, 0 < θ < 1. We concluderen dat θ gegeven x een Beta(4, 8) verdeling heeft, ofwel ξ(θ x) = Γ(12) Γ(4)Γ(8) θ3 (1 θ) 7 f (x θ) = { θ x (1 θ) 1 x, als x = 0, 1, 0, anders. Hfdstk 6: A posteriori verdeling 15 / 50 Hfdstk 6: A posteriori verdeling 16 / 50

5 Voorbeeld Elektronische componenten (algemeen) Voorbeeld Levensduur TL-buizen (vervolg) De kansdichtheidsfunctie voor de levensduur van één TL-buis: f (x θ) = θe θx, als x 0, De steekproefuitslag is x = (x 1, x 2,..., x n ). Vraag: Als we definiëren y = n x i, wat is dan de a posteriori verdeling van θ gegeven x? In een aselecte steekproef bepalen we levensduren x i van n TL-buizen. Definieer y = n x i, dan is de aannemelijkheidsfunctie voor de steekproef: n ( ) f n (x θ) = θe θx i = θ n e θ(x 1+x x n). Met de a priori kansdichtheid ξ(θ) van eerder volgt dan ξ(θ x) f n (x θ)ξ(θ) θ n+3 e (y+20000)θ ofwel θ gegeven x heeft Gamma(n + 4, y)-verdeling: ξ(θ x) = (y )n+4 θ n+3 e (y+20000)θ (n + 3)! Hfdstk 6: A posteriori verdeling 17 / 50 Hfdstk 6: A posteriori verdeling 18 / 50 Geconjugeerde verdelingen Voorbeeld Elektronische componenten (vervolg) A priori verdeling van θ is een Beta(α, β) verdeling: Γ(α + β) ξ(θ) = Γ(α)Γ(β) θα 1 (1 θ) β 1, 0 < θ < 1. Steekproef uit een Bernoulli verdeling met parameter θ. Definiëer y = x x n, dan is f n (x θ) θ y (1 θ) n y. A posteriori verdeling voor θ gegeven x: ξ(θ x) f n (x θ)ξ(θ) θ α+y 1 (1 θ) β+n y 1 Hieruit volgt dat θ gegeven de waarnemingen x een???-verdeling heeft. Stelling Laat X 1,..., X n, een aselecte steekproef zijn uit een Bernoulli verdeling met een onbekende parameter θ (0 < θ < 1). Neem aan dat de a priori verdeling van θ een Beta-verdeling is met parameters α en β. De a posteriori verdeling van θ gegeven de steekproefresultaten X 1 = x 1,..., X n = x n, is een Beta-verdeling met parameters α = α + x i en β = β + n x i. We zeggen ook wel dat de Beta-verdelingen een geconjugeerde familie van verdelingen is voor een steekproef uit een Bernoulli verdeling. Hfdstk 6: Geconjugeerde verdelingen 19 / 50 Hfdstk 6: Geconjugeerde verdelingen 20 / 50

6 De a priori verdeling is Beta(α, β) verdeeld, dus de a priori verwachting en variantie zijn: E(θ) = α α + β en Var(θ) = αβ (α + β) 2 (α + β + 1) Vraag: Wat zijn de verwachting en variantie van θ gegeven het steekproefresultaat x en hoe verhouden die zich tot de a priori waarden? Steekproef uit een Poisson verdeling Aselecte steekproef uit een Poisson verdeling met gemiddelde θ: f (x θ) = e θ θ x x! Parameter θ heeft a priori een Gamma(α, β)-verdeling: ξ(θ) = 1 Γ(α) βα θ α 1 e βθ, θ > 0. De kansmassafunctie voor steekproefuitslag x = (x 1,..., x n ), is f n (x θ) e nθ θ y, (met y = x x n ) De a posteriori verdeling is dus proportioneel met ξ(θ x) θ α+y 1 e (n+β)θ en θ gegeven x heeft een Gamma(α + y, β + n)-verdeling. Hfdstk 6: Geconjugeerde verdelingen 21 / 50 Hfdstk 6: Geconjugeerde verdelingen 22 / 50 Steekproef uit een Normale verdeling De a priori verdeling had een Gamma(α, β) verdeling. De a priori variantie van θ was dus Var(θ) = α β 2 Vraag: Wat is de a posteriori variantie van θ gegeven het steekproefresultaat x? Aselecte steekproef uit een N(θ, σ 2 )-verdeling, waarvan variantie σ 2 bekend is, maar het gemiddelde θ is een onbekende parameter. A priori verdeling van θ is een N(µ, v 2 ) is met gemiddelde µ en variantie v 2 -verdeling: [ ξ(θ) exp 1 ] ( ) 2 θ µ 2v 2 De a posteriori verdeling van θ gegeven x is een N(µ, (v ) 2 )-verdeling met µ = σ2 µ + nv 2 x n σ 2 + nv 2 en (v ) 2 = σ2 v 2 σ 2 + nv 2. Hfdstk 6: Geconjugeerde verdelingen 23 / 50 Hfdstk 6: Geconjugeerde verdelingen 24 / 50

7 Opmerking 1 Het gemiddelde µ van de a posteriori verdeling is te schrijven als σ 2 µ = σ 2 + nv 2 µ + nv2 σ 2 + nv 2 x n = c µ + (1 c) x n i.e. als een gewogen som van het oorspronkelijke gemiddelde µ en het steekproefgemiddelde. Opmerking 2 We kunnen de grootte van de steekproef bepalen waarvoor de variantie van de a posteriori verdeling een vooraf bepaalde grens haalt. Neem bijvoorbeeld aan v 2 = 4 (horend bij de a priori normale verdeling van de parameter θ) en neem aan dat σ 2 = 1. De variantie van de a posteriori verdeling is dan: (v ) 2 = σ2 v 2 σ 2 + nv 2 = 4 4n + 1 Zo geldt (v ) dan en slechts dan als n Hfdstk 6: Geconjugeerde verdelingen 25 / 50 Hfdstk 6: Geconjugeerde verdelingen 26 / 50 Steekproef uit een Exponentiële verdeling Voorspellen Levensduur TL-buizen Aselecte steekproef uit een exponentiële verdeling met onbekende parameter θ. A priori verdeling van θ is Gamma(α, β)-verdeling: ξ(θ) θ α 1 e βθ, θ > 0. De kansdichtheidsfunctie voor steekproefuitslag x = (x 1,..., x n ) is f n (x θ) θ n e θy, met y = x x n. en de a posteriori verdeling van θ wordt dan: ξ(θ x) θ α+n 1 e (β+y)θ. Hieruit volgt dat θ gegeven de steekproefuitslag een Gamma(α + n, β + y)-verdeling heeft. Veronderstel dat we van 5 TL-buizen de volgende levensduren hebben geteld: 2911, 3403, 3237, 3509 en 3118 uur. De a posteriori verdeling van θ gegeven x = (x 1,..., x 5 ) is nu (met y = = 16178) ξ(θ x) = θ 8 e θ Vraag: Voorspel X 6, de levensduur van de 6-de TL-buis. Antwoord: De conditionele kansdichtheid van X 6 gegeven x is f (x 6 x). Deze kunnen we als volgt berekenen: f (x 6 x) = 0 f (x 6 θ, x) ξ(θ x) dθ = 0 f (x 6 θ) ξ(θ x) dθ Hfdstk 6: Geconjugeerde verdelingen 27 / 50 Hfdstk 6: Geconjugeerde verdelingen 28 / 50

8 Dit levert: f (x 6 x) = 0 θe θx θ 8 e 36178θ dθ = θ 9 e (x+36178)θ dθ = Γ(10) = (x ) 10 (x ) 10 We kunnen nu bijvoorbeeld uitrekenen: P(X 6 > 3000 x) = 3000 ( ) (x ) 10 dx 6 [ ] = 9(x ) 9 = = Schatters en schattingen Herinnering: (X 1,..., X n ): aselecte steekproef (x 1,..., x n ): realisatie van de steekproef. Definitie (Schatter en schatting) Een schatter van een parameter θ, gebaseerd op een aselecte steekproef X 1,..., X n, is een reëelwaardige functie δ(x 1,..., X n ). Een schatting is de waarde van de schatter voor een gegeven realisatie x 1,..., x n, van de steekproef, i.e. δ(x 1,..., x n ). Vaak noteren we ook X = (X 1,..., X n ), en x = (x 1,..., x n ). Een schatter noteren we dan als δ(x) en een schatting als δ(x). Hfdstk 6: Geconjugeerde verdelingen 29 / 50 Hfdstk 6: Bayesiaanse schatters 30 / 50 Voorbeeld Stel dat we willen schatten hoeveel klanten er gemiddeld tussen 12 uur en 1 uur bij de Spar komen. De steekproef zal genomen worden over 5 achtereenvolgende dagen. De steekproef bestaat dus uit 5 stochasten X 1,..., X 5, en we gebruiken de functie δ(x 1, x 2, x 3, x 4, x 5 ) = x x 2 + x x 4 + x 5 Volgens de definitie is nu δ(x 1, X 2, X 3, X 4, X 5 ) = X X 2 + X X 4 + X 5 een schatter (een stochast!). Als de steekproef (103, 143, 122, 99, 150) als resultaat op zou leveren, dan is δ(103, 143, 122, 99, 150) = een schatting. Wat is een goede schatter? Een schatter is een stochastische variabele. We willen de δ zo kiezen, dat met grote kans de fout δ(x) θ in de buurt van 0 ligt. Definitie (Verliesfunctie) Een verliesfunctie is een functie L(θ, a), die een maat is voor de strafboete, of de kosten, als a de schatting voor de parameter θ is. Als we geen waarnemingen zouden kunnen doen, dan is het verwachte verlies bij schatting a: E [ L(θ, a) ] = L(θ, a) ξ(θ ) dθ Als we wel waarnemingen x hebben, dan gebruiken we E [ L(θ, a) x ] = L(θ, a) ξ(θ x) dθ. Hfdstk 6: Bayesiaanse schatters 31 / 50 Hfdstk 6: Bayesiaanse schatters 32 / 50

9 Bayes schatter Voorbeeld SPAR (fictief) Voor elke mogelijke realisatie x zouden we het getal a uit kunnen rekenen dat E[L(θ, a) x] minimaliseert. De waarde van a zal afhangen van de waarde van x, i.e. het is een functie van x. Die functie noemen we δ (x). Definitie (Bayes schatter) Als er een functie δ bestaat, zodat voor elke mogelijke realisatie x de uitdrukking E[L(θ, a) x] minimaal is voor a = δ (x), ofwel, E [ L(θ, δ (x)) x ] = min a E [ L(θ, a) x ], dan heet δ (X) een Bayes schatter voor θ: Stel dat we een verliesfunctie L gekozen hebben, en uit de steekproeven blijkt: voor x = (110, 143, 153, 89, 97) zorgt a = dat E [ L(θ, a) x ] minimaal is. voor x = (132, 122, 98, 158, 101, 136) zorgt a = dat E [ L(θ, a) x ] minimaal is.... dan nemen we δ (x) = x 1 x 2 x n en is δ (X) = X 1 X 2 X n een Bayes schatter voor θ. Hfdstk 6: Bayesiaanse schatters 33 / 50 Hfdstk 6: Bayesiaanse schatters 34 / 50 Kwadratische verliesfunctie We kunnen voor L een kwadratische functie kiezen, bijvoorbeeld: L(θ, a) = (θ a) 2 Voor deze verliesfunctie heeft de Bayes schatter een eenvoudige vorm. Stelling Wanneer we een kwadratische verliesfunctie gebruiken, dan is de Bayes schatter δ voor θ: δ (X) = E(θ X), ofwel de verwachting van de a posteriori verdeling, geschreven als functie van de steekproef. Voorbeeld Elektronische componenten (vervolg) A priori verdeling van θ: Beta(α, β), Aselecte steekproef x uit Bernoulli verdeling met param θ. A posteriori verdeling van de parameter θ, gegeven de waarneming x, heeft Beta-verdeling heeft met parameters α = α + y en β = β + n y (waarbij y = x x n ). Dit levert E(θ x) = α α + β = α + y α + β + n = α + n x i α + β + n = δ (x) Hieruit volgt dat de Bayes schatter δ (X) voor θ is δ (X) = α + n X i α + β + n Hfdstk 6: Bayesiaanse schatters 35 / 50 Hfdstk 6: Bayesiaanse schatters 36 / 50

10 Voorbeeld Steekproef uit Normale verdeling (vervolg) Absolute verliesfunctie A priori verdeling van θ is N(µ, v 2 )-verdeling. Aselecte steekproef uit een normale verdeling met onbekende verwachting θ en bekende variantie σ 2. A posteriori verdeling van θ, gegeven de waarnemingen x, heeft een normale verdeling N(µ, (v ) 2 ) te hebben met verwachting µ = σ2 µ + nv 2 x n σ 2 + nv 2 = δ (x) Hieruit volgt dat de Bayes schatter δ (X) gegeven is door δ (X) = σ2 µ + nv 2 X n σ 2 + nv 2 In plaats van een kwadratische functie wordt soms ook de absolute verliesfunctie gebruikt: L(θ, a) = θ a. Bij een steekproefresultaat x is de Bayes schatting δ (x) dus die waarde a waarvoor E ( θ a x ) minimaal is. In Hoofdstuk 4 zagen we dat bij een stochast E( X d ) minimaal is als we d gelijk kiezen aan de mediaan m X van de verdeling van X. Dit betekent dat bij een absolute verliesfunctie de Bayes schatter δ (X) gelijk is aan de mediaan van de a posteriori verdeling van θ. Hfdstk 6: Bayesiaanse schatters 37 / 50 Hfdstk 6: Bayesiaanse schatters 38 / 50 Meest Aannemelijke Schatter Voorbeeld Elektronische Componenten (vervolg) In dit voorbeeld is er geen formule voor de Bayes schatter. We kunnen hem wel uitrekenen met behulp van tabellen van de Beta-verdeling. Voorbeeld Normale verdeling (vervolg) In dit voorbeeld is de Bayes schatter weer: Er bestaat een mogelijkheid om een parameter te schatten, als er geen a priori verdeling voor die parameter beschikbaar is. In dat geval is ξ(θ) onbekend, maar we weten wel de aannemelijkheidsfunctie f (x θ). Beschouw een aselecte steekproef van 1 uit een normale verdeling met onbekend gemiddelde θ en bekende variantie σ 2. De realisatie van de steekproef is x = 4.0. Welke situatie is aannemelijker? δ (X) = σ2 µ + nv 2 X n σ 2 + nv 2 f(x θ=10) f(x θ=5) x=4 10 x=4 5 Hfdstk 6: Bayesiaanse schatters 39 / 50 Hfdstk 6: Maximum Likelihood Schatter 40 / 50

11 De aannemelijkheidsfunctie van θ voor dit steekproefresultaat is f ( x = 4.0 θ ) = 1 2πσ 2 θ)2 e (4.02σ 2 Deze functie is maximaal (als functie van θ!) als θ = 4. Dit kunnen we ook voor een steekproef met grootte 2: Veronderstel dat de realisaties zijn x 1 = 4.0 en x 2 = 2.5. De aannemelijkheidsfunctie is f ( x 1 = 4.0, x 2 = 2.5 θ ) = 1 2πσ 2 e [ (4.0 θ) 2 + (2.5 θ) 2 ] 2σ 2 Dit is maximaal (meest aannemelijk) als (4.0 θ) 2 + (2.5 θ) 2 minimaal is. Vraag: Voor welke waarde van θ is dit het geval? M.L.-schatter Definitie Laat x = (x 1,..., x n ) een realisatie van een aselecte steekproef zijn, met aannemelijkheidsfunctie f n (x θ). Een waarde van ˆθ = δ(x) waarvoor f n (x ˆθ) = max θ f n (x θ) heet een meest aannemelijke schatting van θ. Als ˆθ voor iedere realisatie x eenduidig bepaald is, dan heet δ(x) de meest aannemelijke schatter (Engels: maximum likelihood estimator) van θ. Deze schatter wordt ook vaak afgekort als M.L.E. of M.L.-schatter. Hfdstk 6: Maximum Likelihood Schatter 41 / 50 Hfdstk 6: Maximum Likelihood Schatter 42 / 50 Voorbeeld: Parameter Bernoulli verdeling Experiment met Bernoulli verdeling met onbekende parameter θ (0 θ 1). Aselecte steekproef X 1,..., X n, waargenomen waarden zijn x = (x 1,..., x n ). n De aannemelijkheidsfunctie is f n (x θ) = θ x i (1 θ) 1 x i. Maximaliseer f n (x θ) door log ( f n (x θ) ) te maximaliseren: log ( f n (x θ) ) ( ) ( = x i log(θ) + n Deze uitdrukking is maximaal voor ˆθ(x) = x n. De M.L.E. voor θ is dus ˆθ(X) = X n. x i ) log(1 θ) Hfdstk 6: Maximum Likelihood Schatter 43 / 50 Voorbeeld: Normale verdeling Aselecte steekproef X 1,..., X n, uit een normale verdeling met onbekende verwachting θ en bekende variantie σ 2. Voor steekproefwaarnemingen x = (x 1,..., x n ), is de aannemelijkheidsfunctie f n (x θ) = 1 [ (2πσ 2 ) n/2 exp 1 2σ 2 f n (x θ) is maximaal is (als functie van θ) als (x i θ) 2 (x i θ) 2] minimaal is. Dit is het geval voor ˆθ(x) = x n. Hieruit volgt dat de M.L.E. voor θ is ˆθ(X) = X n Hfdstk 6: Maximum Likelihood Schatter 44 / 50

12 Voorbeeld: Normale verdeling µ én σ 2 Aselecte steekproef X 1,..., X n, uit een normale verdeling met onbekende verwachting µ en onbekende variantie σ 2. We noemen voor het gemak s = σ 2. De onbekende parameter is nu θ = (µ, s). De aannemelijkheidsfunctie voor een steekproefresultaat x = (x 1,..., x n ) is weer f n (x θ) = f n (x µ, s) = 1 (2πs) n/2 exp [ 1 2s (x i µ) 2] Oplossing in stappen: 1 Fixeer s en zoek ˆµ die L ( µ, s ) maximaliseert. Deze ˆµ hangt af van s, dus ˆµ = ˆµ(s). 2 Zoek ŝ die L (ˆµ(s), s ) maximaliseert. 3 Totale oplossing is ˆθ = (ˆµ(ŝ), ŝ ). Ook hier is het makkelijker om L(θ) = log ( f n (x µ, s) ) te maximaliseren: L(θ) = n 2 log(2π) n 2 log(s) 1 (x i µ) 2 2s Hfdstk 6: Maximum Likelihood Schatter 45 / 50 Hfdstk 6: Maximum Likelihood Schatter 46 / 50 Oplossing 1 Voor vaste s is L maximaal voor: 2 Maximaliseer ˆµ(s) = x n. (onafhankelijk van s!) L(ˆµ, s) = n 2 log(2π) n 2 log(s) 1 2s (x i x n ) 2 dl(ˆµ, s) Ofwel bepaal = n ds 2 s s 2 (x i x n ) 2 = 0. Dit levert: ŝ = 1 (x i x n ) 2 n ( 3 de M.L.E. is dus ˆθ = (ˆµ, ˆσ 2 ) = X n, 1 ) ( ) 2 Xi X n n Hfdstk 6: Maximum Likelihood Schatter 47 / 50 Voorbeeld: Uniforme verdeling Aselecte steekproef X 1,..., X n uit een uniforme verdeling op het interval [0, θ] met onbekende parameter θ. De kansdichtheidsfunctie is 1, als 0 x θ, f (x θ) = θ 0, anders. De aannemelijkheidsfunctie voor een steekproefresultaat x = (x 1,..., x n ) is dan 1 f n (x θ) = θ n, als 0 x i θ, i = 1,..., n. 0, anders De waarde van f n (x θ) is maximaal voor ˆθ(x) = max{x 1,..., x n }, dus de M.L.E. voor θ is ˆθ(X) = max{x 1,..., X n }. Hfdstk 6: Maximum Likelihood Schatter 48 / 50

13 Eigenschappen van schatters Na bestudering van Hoofdstuk 6 moet je: Invariantie: Als ˆθ een M.L.E. is voor een parameter θ, dan is g(ˆθ) een M.L.E. voor g(θ). Toepassing: Bij een Normale verdeling is 1 ) (ˆµ, ŝ) = (X n, (X i X n ) 2 is M.L.E. voor (µ, σ 2 ). n ˆσ2 is een M.L.E. voor σ. Uit een probleembeschrijving a priori en a posteriori verdelingen kunnen bepalen. De Bayes schatter en schatting uit kunnen rekenen. Uit een probleembeschrijving de ML-schatter kunnen bepalen. Weten hoe je de invariantie-eigenschap voor ML-schatters kunt gebruiken. ˆµ 2 + ˆσ 2 is een M.L.E. voor E(X 2 ). Hfdstk 6: Eigenschappen van Schatters 49 / 50 Hfdstk 6: Eigenschappen van Schatters 50 / 50

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten Deze week: Steekproefverdelingen Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen Cursusjaar 29 Peter de Waal Zuivere Schatters Betrouwbaarheidsintervallen Departement Informatica Hfdstk

Nadere informatie

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling.

Deze week: Verdelingsfuncties. Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties. Bernoulli verdeling. Bernoulli verdeling. Deze week: Verdelingsfuncties Statistiek voor Informatica Hoofdstuk 5: Verdelingsfuncties Cursusjaar 29 Peter de Waal Toepassingen Kansmassafuncties / kansdichtheidsfuncties Eigenschappen Departement Informatica

Nadere informatie

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Technische Universiteit Delft Mekelweg 4 Faculteit Elektrotechniek, Wiskunde en Informatica 2628 CD Delft Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Formulebladen, rekenmachines,

Nadere informatie

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1) Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie

Nadere informatie

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan. Afdeling Wiskunde Volledig tentamen Statistics Deeltentamen 2 Statistics Vrije Universiteit 28 mei 2015 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen: opgaven 1,2,3,4. Cijfer=

Nadere informatie

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Afdeling Wiskunde Volledig tentamen Algemene Statistiek Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013 Gebruik van een (niet-grafische) rekenmachine is toegestaan. Geheel tentamen:

Nadere informatie

SCHATTEN. A.W. van der Vaart en anderen

SCHATTEN. A.W. van der Vaart en anderen SCHATTEN A.W. van der Vaart en anderen VOORWOORD Dit diktaatje wordt gebruikt bij het vak Biostatistiek 2 voor MNW. Het is een uittreksel van het boek Algemene Statistiek geschreven door A.W. van der Vaart

Nadere informatie

4.2 Mean Square Error

4.2 Mean Square Error 4 Schatters 4.1 Introductie Een statistisch model bestaat uit alle kansverdelingen welke a priori mogelijk worden geacht voor de gegeven data. Gegeven een correct opgesteld model gaan we ervan uit dat

Nadere informatie

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur Kansrekening en statistiek WI22TI / WI25IN deel 2 2 februari 22, 4. 6. uur VOOR WI22TI: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad is niet toegestaan.

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur Kansrekening en statistiek wi205in deel 2 6 april 200, 4.00 6.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Betrouwbaarheidsgebieden 2 / 17 Idee Een schatter T voor een parameter θ geeft één punt in de parameterruimte Θ. I.h.a. zal T θ onder P θ,

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur.

Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (2WS05), dinsdag 3 november 2009, van 4.00 7.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 16 Donderdag 4 November 1 / 25 2 Statistiek Indeling: Schatten Correlatie 2 / 25 Schatten 3 / 25 Schatters: maximum likelihood schatters Def. Zij Ω de verzameling van

Nadere informatie

Kansrekening en stochastische processen 2S610

Kansrekening en stochastische processen 2S610 Kansrekening en stochastische processen 2S610 Docent : Jacques Resing E-mail: j.a.c.resing@tue.nl http://www.win.tue.nl/wsk/onderwijs/2s610 1/28 Schatten van de verwachting We hebben een stochast X en

Nadere informatie

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur Kansrekening en statistiek wi2105in deel 2 27 januari 2010, 14.00 16.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 8 Donderdag 13 Oktober 1 / 23 2 Statistiek Vandaag: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 23 Stochast en populatie

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2, Vrijdag 23 januari 25, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven dienen

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 18 t-toetsen 2 / 18 Steekproefgemiddelde en -variantie van normale observaties Stelling. Laat X 1,..., X n o.o. zijn en N(µ, σ 2 )-verdeeld. Dan:

Nadere informatie

Tentamen Voortgezette Kansrekening (WB006C)

Tentamen Voortgezette Kansrekening (WB006C) WB6C: Voortgezette Kansrekening Donderdag 26 januari 212 Tentamen Voortgezette Kansrekening (WB6C) Het is een open boek tentamen. Gebruik van een rekenmachine of andere hulpmiddelen is niet toegestaan.

Nadere informatie

Zo geldt voor o.o. continue s.v.-en en X en Y dat de kansdichtheid van X + Y gegeven wordt door

Zo geldt voor o.o. continue s.v.-en en X en Y dat de kansdichtheid van X + Y gegeven wordt door APP.1 Appendix A.1 Erlang verdeling verdeling met parameters n en λ Voor o.o. discrete s.v.-en X en Y geldt P (X + Y = z) =P (X = x 1 en Y = z x 1 )+P(X = x en Y = z x )+... = P (X = x 1 )P (Y = z x 1

Nadere informatie

Tentamen Inleiding Kansrekening 9 juni 2016, 10:00 13:00 Docent: Prof. dr. F. den Hollander

Tentamen Inleiding Kansrekening 9 juni 2016, 10:00 13:00 Docent: Prof. dr. F. den Hollander Tentamen Inleiding Kansrekening 9 juni 6, : 3: Docent: Prof. dr. F. den Hollander Bij dit tentamen is het gebruik van boek en aantekeningen niet toegestaan. Er zijn 8 vragen, elk met onderdelen. Elk onderdeel

Nadere informatie

Voorbeeld 1. Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen. Voorbeeld 2A. Voorbeeld 1 (vervolg)

Voorbeeld 1. Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen. Voorbeeld 2A. Voorbeeld 1 (vervolg) Voorbeeld Statistiek voor Informatica Hoofdstuk 3: Stochastische Variabelen en Verdelingen Cursusjaar 2009 Peter de Waal Departement Informatica In een eperiment gooien we 4 maal met een zuivere munt.

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2WS4, dinsdag 17 juni 28, van 9. 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Kansrekening en stochastische processen 2DE18

Kansrekening en stochastische processen 2DE18 Kansrekening en stochastische processen 2DE18 Docent : Jacques Resing E-mail: resing@win.tue.nl 1/23 Voor een verzameling stochastische variabelen X 1,..., X n, de verwachting van W n = X 1 + + X n is

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Vrijdag 16 Oktober 1 / 38 2 Statistiek Indeling vandaag: Normale verdeling Wet van de Grote Getallen Centrale Limietstelling Deductieve statistiek Hypothese toetsen

Nadere informatie

Uitwerking Tentamen Inleiding Kansrekening 11 juni 2015, uur Docent: Prof. dr. F. den Hollander

Uitwerking Tentamen Inleiding Kansrekening 11 juni 2015, uur Docent: Prof. dr. F. den Hollander Uitwerking Tentamen Inleiding Kansrekening juni 25,. 3. uur Docent: Prof. dr. F. den Hollander () [6] Zij F een gebeurtenissenruimte. Laat zien dat voor elke B F de verzameling G {A B : A F} opnieuw een

Nadere informatie

Samenvatting Statistiek

Samenvatting Statistiek Samenvatting Statistiek De hoofdstukken 1 t/m 3 gaan over kansrekening: het uitrekenen van kansen in een volledig gespecifeerd model, waarin de parameters bekend zijn en de kans op een gebeurtenis gevraagd

Nadere informatie

Mathematische Statistiek

Mathematische Statistiek Mathematische Statistiek Bert van Es Korteweg-de Vries Instituut Universiteit van Amsterdam Plantage Muidergracht 24 1018 TV Amsterdam 5 februari 2007 ii Inhoudsopgave 1 Introductie 1 2 Algemene begrippen

Nadere informatie

A.F. Schilperoort. Polya tree priors. Bachelorscriptie. Scriptiebegeleider: prof.dr. A.W. van der Vaart. Datum Bachelorexamen: 9 Juni 2015

A.F. Schilperoort. Polya tree priors. Bachelorscriptie. Scriptiebegeleider: prof.dr. A.W. van der Vaart. Datum Bachelorexamen: 9 Juni 2015 AF Schilperoort Polya tree priors Bachelorscriptie Scriptiebegeleider: profdr AW van der Vaart Datum Bachelorexamen: 9 Juni 2015 Mathematisch Instituut, Universiteit Leiden Inhoudsopgave 1 Inleiding 3

Nadere informatie

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Basistechnieken 6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling. x 0 2 4 6 p(x) ¼ ¼ ¼ ¼ a. Schrijf alle mogelijke verschillende steekproeven van n =

Nadere informatie

Zeldzame en extreme gebeurtenissen

Zeldzame en extreme gebeurtenissen 24 March 215 Outline 1 Inleiding 2 Extreme gebeurtenissen 3 4 Staarten 5 Het maximum 6 Kwantielen 23 maart 215 Het Financieele Dagblad Vijf grootste rampen (verzekerd kapitaal) 1 Orkaan Katrina (25, MU$

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17 Stochastiek 2 Inleiding in de Mathematische Statistiek 1 / 17 Statistische toetsen 2 / 17 Toetsen - algemeen - 1 Setting: observatie X in X, model {P θ : θ Θ}. Gegeven partitie Θ = Θ 0 Θ 1, met Θ 0 Θ 1

Nadere informatie

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014 Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal Toets Kansrekenen I 28 maart 2014 Naam : Richting : Lees volgende aanwijzingen alvorens aan het examen te beginnen Wie de

Nadere informatie

OefenDeeltentamen 2 Kansrekening 2011/ Beschouw een continue stochast X met kansdichtheidsfunctie cx 4, 0 x 1 f X (x) = f(x) = 0, anders.

OefenDeeltentamen 2 Kansrekening 2011/ Beschouw een continue stochast X met kansdichtheidsfunctie cx 4, 0 x 1 f X (x) = f(x) = 0, anders. Universiteit Utrecht *=Universiteit-Utrecht Boedapestlaan 6 Mathematisch Instituut 3584 CD Utrecht OefenDeeltentamen Kansrekening 11/1 1. Beschouw een continue stochast X met kansdichtheidsfunctie c 4,

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 12 Donderdag 21 Oktober 1 / 38 2 Statistiek Indeling: Stochast en populatie Experimenten herhalen Wet van de Grote Getallen Centrale Limietstelling 2 / 38 Deductieve

Nadere informatie

Meetkunde en Lineaire Algebra

Meetkunde en Lineaire Algebra Hoofdstuk 1 Meetkunde en Lineaire Algebra Vraag 1.1 Zij p en q twee veeltermfuncties met reële coëfficiënten en A een reële vierkante matrix. Dan is p(a) diagonaliseerbaar over R als en slechts dan als

Nadere informatie

Tentamen Kansrekening (NB004B)

Tentamen Kansrekening (NB004B) NB4B: Kansrekening Dinsdag november 2 Tentamen Kansrekening (NB4B) Het is een open boek tentamen. Gebruik van een rekenmachine of andere hulpmiddelen is niet toegestaan. Vermeld op ieder blad je naam en

Nadere informatie

Schatten en simuleren

Schatten en simuleren Les 5 Schatten en simuleren 5.1 Maximum likelihood schatting Tot nu toe hebben we meestal naar voorbeelden gekeken waar we van een kansverdeling zijn uitgegaan en dan voorspellingen hebben gemaakt. In

Nadere informatie

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Statistiek voor A.I. College 10. Dinsdag 16 Oktober Statistiek voor A.I. College 10 Dinsdag 16 Oktober 1 / 30 Jullie - onderzoek Geert-Jan, Joris, Brechje Horizontaal: lengte Verticaal: lengte tussen topjes middelvingers met gestrekte armen. DIII 170 175

Nadere informatie

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur.

Tentamen Kansrekening en Statistiek (2WS04), woensdag 30 juni 2010, van 9.00 12.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (WS4), woensdag 3 juni, van 9.. uur. Dit is een tentamen met gesloten boek. De uitwerkingen van de

Nadere informatie

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur

Kansrekening en statistiek wi2105in deel I 29 januari 2010, uur Kansrekening en statistiek wi20in deel I 29 januari 200, 400 700 uur Bij dit examen is het gebruik van een (evt grafische rekenmachine toegestaan Tevens krijgt u een formuleblad uitgereikt na afloop inleveren

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 7 Dinsdag 11 Oktober 1 / 33 2 Statistiek Vandaag: Populatie en steekproef Maten Standaardscores Normale verdeling Stochast en populatie Experimenten herhalen 2 / 33 3

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16 2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16 Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens:

Nadere informatie

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Examen Kansrekening en Wiskundige Statistiek: oplossingen Examen Kansrekening en Wiskundige Statistiek: oplossingen S. Vansteelandt Academiejaar 006-007 1. Een team van onderzoekers wil nagaan of een bepaald geneesmiddel Triptan meer effectief is dan aspirine

Nadere informatie

SOCIALE STATISTIEK (deel 2)

SOCIALE STATISTIEK (deel 2) SOCIALE STATISTIEK (deel 2) D. Vanpaemel KU Leuven D. Vanpaemel (KU Leuven) SOCIALE STATISTIEK (deel 2) 1 / 57 Hoofdstuk 5: Schatters en hun verdeling 5.1 Steekproefgemiddelde als toevalsvariabele D. Vanpaemel

Nadere informatie

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN. Continue Verdelingen 1 A. De uniforme (of rechthoekige) verdeling Kansdichtheid en cumulatieve frequentiefunctie Voor x < a f(x) = 0 F(x) = 0 Voor a x

Nadere informatie

Toetsen van hypothesen

Toetsen van hypothesen Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter

Nadere informatie

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek /k 1/35 OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een

Nadere informatie

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd

Nadere informatie

Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode

Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Het schatten van de Duitse oorlogsproductie: maximum likelihood versus de momentenmethode Rik Lopuhaä TU Delft 30 januari, 2015 Rik Lopuhaä (TU Delft) Schatten van de Duitse oorlogsproductie 30 januari,

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur

Kansrekening en statistiek WI2105IN deel I 4 november 2011, uur Kansrekening en statistiek WI05IN deel I 4 november 0, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Een formuleblad wordt uitgereikt. Meerkeuzevragen Toelichting:

Nadere informatie

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek Inleiding Applicatie Software - Statgraphics Beschrijvende Statistiek OPDRACHT OVER BESCHRIJVENDE STATISTIEK Beleggen Door een erfenis heeft een vriend van u onverwacht de beschikking over een klein kapitaaltje

Nadere informatie

b) Uit Bayes volgt, gebruik makend van onderdeel a) P (T V )P (V ) P (T ) = (0.09)(0.07)

b) Uit Bayes volgt, gebruik makend van onderdeel a) P (T V )P (V ) P (T ) = (0.09)(0.07) Uitwerkingen tentamen 6 juli 22. We stellen T de gebeurtenis test geeft positief resultaat, F de gebeurtenis, chauffeur heeft gefraudeerd, V de gebeurtenis, chauffeur heeft vergissing gemaakt C de gebeurtenis,

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

Antwoorden bij Inleiding in de Statistiek

Antwoorden bij Inleiding in de Statistiek Atwoorde bij Ileidig i de Statistiek Hoofdstuk. model: bi(, p), p [0, ], schattig: /.2 (i) i bloeddrukveraderig i e persoo i treatmet groep, Y j bloeddrukveraderig j e persoo i cotrolegroep, model:,...,,

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

Formules uit de cursus Waarschijnlijkheidsrekenen en statistiek

Formules uit de cursus Waarschijnlijkheidsrekenen en statistiek UNIVERSITY OF GHENT Samenvatting Formules uit de cursus Waarschijnlijkheidsrekenen en statistiek Auteur: Nicolas Vanden Bossche Lesgever: Prof. Hans De Meyer Hoofdstuk 1 Het kansbegrip en elementaire kansrekening

Nadere informatie

Tentamen Inleiding Kansrekening 25 juni 2009, uur Docent: F. den Hollander

Tentamen Inleiding Kansrekening 25 juni 2009, uur Docent: F. den Hollander Universiteit Leiden Niels Bohrweg Tentamen Inleiding Kansrekening 25 juni 2009, 0.00 3.00 uur Docent: F. den Hollander Mathematisch Instituut 2333 CA Leiden Bij dit tentamen is het gebruik van een (grafische)

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door

Nadere informatie

Vrije Universiteit Amsterdam Opleiding Wiskunde Vak Poisson Processen. Poisson Processen. Arno Weber.

Vrije Universiteit Amsterdam Opleiding Wiskunde Vak Poisson Processen. Poisson Processen. Arno Weber. Vrije Universiteit Amsterdam Opleiding Wiskunde Vak Poisson Processen Poisson Processen Arno Weber email: aeweber@cs.vu.nl Januari 2003 1 Inhoudsopgave 1. Computersimulaties 3 2. Wachttijd-paradox 6 3.

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

ALGEMENE STATISTIEK. A.W. van der Vaart en anderen

ALGEMENE STATISTIEK. A.W. van der Vaart en anderen ALGEMENE STATISTIEK A.W. van der Vaart en anderen VOORWOORD Dit diktaat wordt gebruikt bij het vak Statistiek voor Natuurkunde. Het is een uittreksel van het boek Algemene Statistiek geschreven door A.W.

Nadere informatie

Sterrenkunde Praktikum 1 Fouten en fitten

Sterrenkunde Praktikum 1 Fouten en fitten Sterrenkunde Praktikum 1 Fouten en fitten Paul van der Werf 12 februari 2008 1 Inleiding In de sterrenkunde werken we vaak met zwakke signalen, of met grote hoeveelheden metingen van verschillende nauwkeurigheid.

Nadere informatie

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter. STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.

Nadere informatie

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00 Tentamen Statistische methoden MST-STM 8 april 2, 9: 2: Bij dit examen is het gebruik van een (evt. grafische) rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop inleveren alstublieft.

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Kansrekening en stochastische processen 2DE18

Kansrekening en stochastische processen 2DE18 Kansrekening en stochastische processen 2DE18 Docent : Jacques Resing E-mail: resing@win.tue.nl 1/28 The delta functie Zij De eenheids impulsfunctie is: d ε (x) = { 1ε als ε 2 x ε 2 0 anders δ(x) = lim

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening en Statistiek (2S27), dinsdag 14 juni 25, 9. - 12. uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31 Tentamen Statistische methoden 45STAMEY april, 9: : Studienummers: Vult u alstublieft op het MC formulier uw Delftse studienummer in; en op het open vragen formulier graag beide, naar volgend voorbeeld:

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Kansrekening (2WS2), Vrijdag 24 januari 24, om 9:-2:. Dit is een tentamen met gesloten boek. De uitwerkingen van de opgaven

Nadere informatie

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten Stochastiek 2 Inleiding in the Mathematische Statistiek staff.fnwi.uva.nl/j.h.vanzanten 1 / 12 H.1 Introductie 2 / 12 Wat is statistiek? - 2 Statistiek is de kunst van het (wiskundig) modelleren van situaties

Nadere informatie

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling Moore, McCabe & Craig: 3.3 Toward Statistical Inference From Probability to Inference 5.1 Sampling Distributions for

Nadere informatie

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19

Stochastiek 2. Inleiding in de Mathematische Statistiek 1/19 Stochastiek 2 Inleiding in de Mathematische Statistiek 1/19 Herhaling H.1 2/19 Mathematische Statistiek We beschouwen de beschikbare data als realisatie(s) van een stochastische grootheid X.(Vaak een vector

Nadere informatie

Zeldzame en extreme gebeurtenissen

Zeldzame en extreme gebeurtenissen Zeldzame en extreme gebeurtenissen Ruud H. Koning 19 March 29 Outline 1 Extreme gebeurtenissen 2 3 Staarten 4 Het maximum 5 Kwantielen Ruud H. Koning Zeldzame en extreme gebeurtenissen 19 March 29 2 /

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Meetkunde en Lineaire Algebra

Meetkunde en Lineaire Algebra Hoofdstuk 1 Meetkunde en Lineaire Algebra Vraag 1.1 Zij p en q twee veeltermfuncties met reële coëfficiënten en A een reële vierkante matrix. Dan is p(a) diagonaliseerbaar over R als en slechts dan als

Nadere informatie

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen

Nadere informatie

Gezamenlijke kansverdeling van twee stochasten

Gezamenlijke kansverdeling van twee stochasten Gezamenlijke kansverdeling van twee stochasten Voorbeeld: V = de windsnelheid H = hoogte van het waterniveau in een rivier/zee De combinatie (V, H) is van belang voor een overstroming en niet zozeer V

Nadere informatie

Introductie tot traditionele herverzekering

Introductie tot traditionele herverzekering Introductie tot traditionele herverzekering Module AN17 Schadeverzekering 26 maart 2012 Nico de Boer nico.de.boer@aaa-riskfinance.nl Lesindeling onderdeel herverzekering Datum Te behandelen 19 maart Hoofdstuk

Nadere informatie

. Dan geldt P(B) = a. 1 4. d. 3 8

. Dan geldt P(B) = a. 1 4. d. 3 8 Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Moderne Bayesiaanse statistiek:

Moderne Bayesiaanse statistiek: Evolutionary Ecology Group Stefan Van Dongen /46 Mezelf even voorstellen Biologie UA: 988-99 Biostatistiek UHasselt: 99-993 Pre-post doc UA Lund-Zweden: 993 00 Janssen Farmaceutica 00-003 Moderne Bayesiaanse

Nadere informatie

VU University Amsterdam 2018, Maart 27

VU University Amsterdam 2018, Maart 27 Department of Mathematics Exam: Voortgezette biostatistiek VU University Amsterdam 2018, Maart 27 c Dept. of Mathematics, VU University Amsterdam NB. Geef een duidelijke toelichting bij de antwoorden.

Nadere informatie

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur Tentamen Kansrekening en statistiek wi205in 25 juni 2007, 4.00 7.00 uur Bij dit examen is het gebruik van een (evt. grafische rekenmachine toegestaan. Tevens krijgt u een formuleblad uitgereikt na afloop

Nadere informatie

Hoofdstuk 6 Discrete distributies

Hoofdstuk 6 Discrete distributies Hoofdstuk 6 Discrete distributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Discrete distributies p 1/33 Discrete distributies binomiale verdeling

Nadere informatie

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren

Overzicht. Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen. Voorwaardelijke kans. Voorbeeld: Probabilistisch redeneren Overzicht Statistiek voor Informatica Hoofdstuk 2: Voorwaardelijke kansen Cursusjaar 2009 Peter de Waal Departement Informatica Voorwaardelijke kans Rekenregels Onafhankelijkheid Voorwaardelijke Onafhankelijkheid

Nadere informatie

1. De wereld van de kansmodellen.

1. De wereld van de kansmodellen. STATISTIEK 3 DE GRAAD.. De wereld van de kansmodellen... Kansmodellen X kansmodel Discreet model Continu model Kansverdeling Vaas Staafdiagram Dichtheidsfunctie f(x) GraJiek van f Definitie: Een kansmodel

Nadere informatie

module SC 12 Inleiding Risicotheorie donderdag 7 november uur

module SC 12 Inleiding Risicotheorie donderdag 7 november uur module SC 1 Inleiding Risicotheorie donderdag 7 november 013 13.30-16.30 uur Examen module SC 1 Inleiding Risicotheorie donderdag 7 november 013 Voordat u met de beantwoording van de vragen van dit examen

Nadere informatie

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Statistiek voor A.I. College 10. Donderdag 18 Oktober Statistiek voor A.I. College 10 Donderdag 18 Oktober 1 / 28 Huffington Post poll verkiezingen VS - 12 Oktober 2012 2 / 28 Gallup poll verkiezingen VS - 15 Oktober 2012 3 / 28 Jullie - onderzoek Kimberly,

Nadere informatie

Statistiek voor A.I. College 6. Donderdag 27 September

Statistiek voor A.I. College 6. Donderdag 27 September Statistiek voor A.I. College 6 Donderdag 27 September 1 / 1 2 Deductieve statistiek Kansrekening 2 / 1 Vraag: Afghanistan In het leger wordt uit een groep van 6 vrouwelijke en 14 mannelijke soldaten een

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie