TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, 9.00-12.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek DD14) op vrijdag 17 maart 006, 9.00-1.00 uur. UITWERKINGEN 1. Methoden om schatters te vinden a) De aannemelijkheidsfunctie is gelijk aan Lλ) = 1 8 Voor de logaritme geldt λ) ) 3 x1 x x 3 )e λx 1 e λx e λx 3. ln Lλ) = ln 1 8 6 ln λ lnx 1x x 3 ) λx 1 x x 3 ). Differentiëren naar λ en gelijkstellen aan 0 levert 6 λ x 1 x x 3 ) = 0. Hieruit volgt λ = 6 x 1 x x 3 = x. De aannemelijkheidsfunctie neemt een maximum zie tekenverloop afgeleide) aan voor deze waarde. De meest aannemelijke schatter voor θ wordt λ = x. De meest aannemelijke schatting is 6/6. b) De verwachting van deze Erlang verdeelde grootheid is /λ. Oplossen van de vergelijking λ = X levert λ = /X. De momentenschatting wordt 6/6.. Eigenschappen schatters a) Voor de MSE geldt ) 4 MSE = bias) V M) = 5 θ θ 75 θ = 1 ) 5 θ 75 θ = 1 15 θ. 1

b) Er geldt V am) = a V M) en dus MSE = a 4 ) 5 θ θ a 75 θ [ = 1 4 ) ] 5 a a θ. 75 Minimaliseren van deze uitdrukking differentieer naar a) levert 1 4 5 a)4 5 4 75 a = 0 en dus a = 6/5. 3. Betrouwbaarheidsinterval voor fractie. a) Het betrouwbaarheidsinterval is gelijk aan ˆp ± 1.96 ˆp1 ˆp) n = 150 150 00 ± 1.96 50 /00 = 0.75 ± 0.06. 00 00 b) De normale verdeling. Deze mag gebruikt worden op grond van de centrale limietstelling. De som van een aantal onderling onafhankelijk en identiek verdeelde stochasten is bij benadering normaal verdeeld. Het aantal mensen dat ja antwoordt kan geschreven worden als X i, waarbij X i = 1 indien persoon i ja antwoordt en 0 anders. De kans dat een ASELECT gekozen persoon ja antwoordt is gelijk aan p, de onbekende fractie. De grootheid X i is dus Bernoulli verdeeld. Omdat ASELECT gekozen wordt uit een grote populatie mag aangenomen worden dat de X i onderling onafhankelijk en identiek verdeeld zijn. c) De breedte van het betrouwbaarheidsinterval is gelijk aan 4. Toetsen 1.96 ˆp1 ˆp)/n. Omdat de fractie minstens 0.70 is, is dit hoogstens gelijk aan 1.96 0.7 0.3/n = 1.96 0.1/ n. Omdat dit hoogstens gelijk mag zijn aan 0.1 volgt n > 17.96, en dus n 33. a) Men wil aantonen dat het kruispunt veiliger is geworden. Daarvoor is een sterke uitspraak nodig en moet dus in de alternatieve hypothese staan dat het verwachte aantal ongelukken kleiner is. Daarom is een geschikte toets H 0 : µ = H 1 : µ <. Opmerking: de nulhypothese mag ook H 0 : µ zijn. b) Laat X het aantal ongelukken in 5 maanden zijn. Dan is X Poisson-verdeeld met parameter 10 als de nulhypothese waar is. De p-waarde is gelijk aan de overschrijdingskans P X 6) = 0.1301.

c) Als het verwachte aantal ongelukken 1 per maand is, is X Poisson-verdeeld met parameter 5. De kans dat H 0 wordt verworpen is dus gelijk aan P X 5) = 0.6160. d) Met o.a) de Centrale Limiet Stelling volgt dat een 95%-betrouwbaarheidsinterval voor µ gelijk is aan 5. Kruistabel µ ± 1.645 σ bµ. De schatter µ is gelijk aan Y/36, waarbij Y het aantal ongelukken in 36 maanden is. De verwachting van Y is 36µ. De schatting is 40/36. De variantie van Y/36 is gelijk aan 36µ/36 ) = µ/36. Er geldt dus σ bµ = µ/36. De schatting hiervoor is 40/36 ). De bovengrens van het betrouwbaarheidsinterval wordt µ 1.645 σ bµ = 40 40 36 1.645 = 1.111 0.89. 36 Opmerking: het gaat sneller om een betrouwbaarheidsinterval te maken voor het verwachte aantal in 36 maanden. Dit is ogv CLS gelijk aan 40 1.645 40. Het betrouwbaarheidsinterval voor het verwachte aantal in een maand wordt nu gevonden door door 36 te delen. a) Als de fractie die herbewerkt moet worden niet gewijzigd is is een schatting voor de fractie gelijk 6 1)/400 = 0.095. De verwachte aantallen worden herbewerking ja nee som voor 19 181 00 na 19 181 00 De waarde 19 kan ook gevonden worden met de formule zoals die bij een kruistabel altijd gebruikt wordt e 11 = 38 00 400 = 19. b) Er zijn twee equivalente) methoden a) Een geschikte toetsingsgrootheid is χ = 6 19) 19 1 19) 19 174 181) 181 188 181) 181 = 5.70. Deze is χ -verdeeld met 1) 1) = 1 vrijheidsgraad. 3

6. Afvallen b) Ook kan de toetsingsgrootheid gebruikt worden om te toetsen of twee fracties van elkaar verschillen z = p 1 p p1 p) 1 00 1 ) = 0.13 0.06 00 0.095 0.905 1 00 1 ) =.39. 00 Merk op dat.39 = 5.70. a) Het gaat om gepaarde waarnemingen. Er zijn niet twee aselecte steeproeven dan zouden er 16 personen zijn). Daarom moet de analyse met methode gedaan worden. Het gegeven eenzijdig betrouwbaarheidsinterval bevat niet de waarde 3. Daarom moet de nulhypothese worden verworpen bij een eenzijdige toets en eenzijdig toetsen ligt hier het meest voor de hand). b) Het 95% eenzijdig betrouwbaarheidsinterval dat gegeven is in de uitvoer) is 4.15 t 0.05;7 s d, waarbij s d de geschatte standaardafwijking van het gemiddeld verschil is. Hieruit volgt s d = 0.8349 t 0.05;7 = 0.8349 1.895 = 0.4406. Het tweezijdig 99% betrouwbaarheidsinterval is 4.15 ± t 0.005;7 s d = 4.15 ± 3.499 0.4406 = 4.15 ± 1.54. Dit kan ook rechtstreeks uit de waarnemingen berekend worden. c) Het gaat om gepaarde waarnemingen en dus de verschillen. Omdat de nulhypothese is dat men 3 pond afvalt moet het verschil ten opzicht van 3 genomen worden. 7. Regressie Nummer persoon 1 3 4 5 6 7 8 Gewicht aan het begin 165 01 195 198 155 143 150 187 Gewicht na een maand 161 195 19 193 150 141 146 183 Verschil ten opzicht van 3 1 3 0 1 1 1 Rangnummers met teken.5 7 5.5 5.5.5.5.5 Er is een tie. Deze wordt weggelaten. Er zijn twee mogelijke toetsen. 1) Tekentoets: Het aantal getallen kleiner dan nul X) is onder de nulhypothese binomiaal verdeeld met p = 0.5. Er geldt P X 1) = 0.065. De nulhypothese wordt niet verworpen. ) Bij de rangtekentoets is de waarde van de toetsingsgrootheid gelijk aan de som van de rangnummers van de positieve verschillen. Deze som is 5.5. De linker kritieke waarde bij tweezijdig toetsen α = 0.05) is, bij eenzijdig toetsen is hij 3. De rechter kritieke waarde is dus 6, respectievelijk 5. Bij eenzijdig toetsen wordt de nulhypothese verworpen, bij tweezijdig toetsen niet. a) Het 95%-betrouwbaarheidsinterval voor β 0 is β 0 ± t α/;13 σ b β 0 = 16.49 ±.16.544 = 16.49 ± 4.8695. Het interval is 11.38, 131.1). 4

b) De schatting voor de variantie is gelijk aan SS T SS R n = 454.169 341.76 13 = 8.65. c) De toetsingsgrootheid is β 1 σ /S xx = 0.9176 8.65/405.836 = 6.85. De kritieke waarde is t α/;13 =.16. De nulhypothese wordt verworpen d) De schatting voor de response bij x = 10 is 16.49 0.9176 10 = 117.07. Het voorspellingsinterval is gelijk aan 117.07 ±.16 8.65 1 1 ) 10 14.54) = 117.07 ± 6.7 15 405.836 Het interval is 110.35, 13.79). 5