G0N34a Statistiek: Exame 7 jui 00 review Vraag Beoordeel de volgede uitsprake. Als ee uitspraak iet juist is of ovolledig, leg da uit waarom e verbeter de uitspraak.. Bij het teste va hypotheses is de kas op ee type-ii fout altijd groter da de kas op ee type-i fout. Fout! Kas op type-ii fout hagt af va het sigificatie iveau α kas op type-i fout. Kas op type-ii fout hagt af va het alteratief µ i.e. de echte waarde va µ. Hoe verder de vooropgestelde waarde µ 0 ligt va µ, hoe kleier de kas op ee type-ii fout.. Om te teste of de correlatie tusse cotiue variabele sigificat is, moete deze variabele ormaal verdeeld zij. Ovolledig! Lieair verbad: via de Pearso-correlatiecoëfficiët. Voorwaarde: variabele zij bivariaat ormaal verdeeld. Mootoo verbad: via de Spearma-ragcorrelatie. Voorwaarde: gee. Niet parametrische test! 3. Ee kwatielplot is ee krachtige grafische methode om ormaliteit va ee steekproef a te gaa. Ovolledig! Ee ormale kwatielplot... Vb. via ee expoetiële kwatielplot ka je ormaliteit atuurlijk iet agaa, maar wel of de steekproef uit ee expoetiële verdelig komt. Kwatielplots geve ekel ee idicatie. Moet og formeel getest worde via ee hypothesetest.
Vraag. Waarvoor diet ee Average Shifted Histogram? Schattig va de oderliggede dichtheidsfuctie va ee steekproef.. Leg bekopt e hoofdzakelijk i woorde uit hoe dit ASH wordt bekome voor ee willekeurige steekproef. Zie.pdf omtret ASH.
3 Vraag 3 Uit ee oderzoek door het Verbod der Vlaamse Tadartse is gebleke dat wie vaak soept 80% kas heeft op cariës. Bij mese die ooit soepe bedraagt deze kas 9%. Teves is gewete dat 5% va de bevolkig ooit soept e dat 65% va de mese die soepe, slechts af e toe soepe. Bij deze laatste categorie bedraagt de kas op cariës 55%. Idie ee tadarts bij ee patiët cariës vaststelt, wat is da de kas dat deze patiët soept? Oplossig: Bevolkig Kas op cariës C Soepe S 85% Af e toe A: 65% 55% Vaak V : 35% 80% Niet soepe S c 5% 9% Noteer: S : patiët soept S c : patiët soept iet. C : patiët heeft cariës. We zoeke: kas dat patiët soept, idie hij cariës heeft P [S C. Aagezie we P [C S P [C A P [A + P [C V P [V kue berekee uit het gegeve, is het uttig om via de regel va Bayes te werke. Dus P [S C Bayes W T K W T K P [C S P [S P [C P[C S P [S P [C S P [S + P [C S c P [S c P [C A P [A + P [C V P [V P [S P [C A P [A + P [C V P [V P [S + P [C S c P [S c 0.55 0.85 0.65 + 0.80 0.85 0.35 0.85 0.55 0.85 0.65 + 0.80 0.85 0.35 0.85 + 0.9 0.5 0.947. Ee kasboom had hier ook gekud. 3
4 Vraag 4 Gegeve is de gezamelijke dichtheidsfuctie f X,Y va de bivariate stochastische vector X, Y met Pearso correlatiecoëfficiët ρ: [ x f X,Y x, y 6π 3 exp y x y + + 3 3 6. Bepaal ρ.. Veroderstel dat X e Y Normaal verdeeld zij. Bereke vervolges de voorwaardelijke dichtheid va X i het put x, gegeve dat Y, i.e. f X Y. Oplossig: Zie slide Multivariate kasmodelle: de dichtheidsfuctie va de bivariate ormale verdelig heeft de vorm f X,Y x, y π det Σ e zt Σ z, met z x µ X, y µ Y t σ e Σ X σ XY σ σ XY σy X ρ XY σ X σ Y ρ XY σ X σ Y σy, vermits σ XY Cov [X, Y ρ XY σ X σ Y. Waeer we het rechterlid va volledig uitwerke, a substitutie va z e Σ, da vide we f X,Y x, y πσ X σ Y ρ XY e ρ XY [ x µx σ X + y µy ρ XY x µ X y µ Y σ Y σ X σ Y. 3 Waeer we formule 3 vergelijke met de opgave da zie we omiddellijk dat µ X σ X µ Y 0 σ Y 3 πσ X σ Y ρ XY 6π 3 ρ XY 4 ρ XY ±. E vermits moet gelde dat ρ XY x µ X y µ Y σ X σ Y + x y 6, volgt dat ρ. 4
Om de voorwaardelijke dichtheid f X Y te berekee, ka je gebruik make va de eigeschap: f X Y x y f X,Y x,y f Y. Bovedie, vermits de gezamelijke dichtheid uit de opgave overeekomt met de dichtheidsfuctie va de bivariate ormale verdelig met parameters y µ X, σ X, µ Y 0, σ Y 3 e ρ XY /, moge we aaeme dat de vector X, Y uit de opgave bivariaat ormaal verdeeld is e bijgevolg dat de variabele X e Y ormaal verdeeld zij. Dit impliceert dat f Y y e y µy σ Y. πσy Dus: f X Y 6π 3 exp 3 [ + 3 + 6 0.73 π3 e 0 3 5
5 Vraag 5 Oderstaade tabel toot os iformatie over het jaarlijks ikome i 000$ va Amerikaase statistici die zij tewerkgesteld i de private sector, volges hu diploma bachelor, master e doctoraat. Diploma Percetiel 0 5 50 75 90 bachelor 5 5 65 80 7 58 master 54 80 95 5 38 69 doctoraat 64 97 5 40 75 9. Wat ka je afleide over de verdelig va de variabele X Jaarlijks ikome per diploma? I elk va de 3 gevalle is de variabele Jaarlijks ikome rechtsscheef verdeeld. Dit ka je o.a. afleide uit het feit dat p 90 p 50 > p 50 p 0, i elk va de gevalle; hierbij is p x het x-percetiel. Hoe groter de afstad tusse het 0-percetiel e het 50-percetiel de mediaa, hoe zwaarder de liker staart. Hoe groter de afstad tusse de mediaa e het 90-percetiel, hoe zwaarder de rechter staart. I os geval is de rechter staart duidelijk systematisch zwaarder da de liker vb. 58 80 > 80 5, wat aageeft dat de verdelig rechtsscheef is.. Loot het de moeite om te doctorere? Test of de mediaa va het Jaarlijks ikome va mese met ee doctoraat PhD sigificat hoger is da 5, i.e. de mediaa va het Jaarlijks ikome va mese met ee master diploma. We teste H 0 : medx PhD 5; H : medx PhD > 5. Mediaatest: de hypothese H 0 is plausibel idie de steekproefmediaa iet teveel groter is da 5, of m.a.w. idie het aatal PhDs met ee Jaarlijks ikome 5 duized $ iet teveel kleier is da 64/ 3. zij A aatal PhDs met ee Jaarlijks ikome 5 duized $. Merk op dat i het geval va PhDs ee ikome va 5 duized $ overeekomt met het 5 percetiel. M.a.w. /4 va alle PhDs verdied mistes 5 duized $ A 64/4 60.5 60. 6
Oder H 0 geldt dat A Bi 64, p 0.5. De p-waarde, i.e. de kas -oder H 0 - dat de teststatistiek A og extremer is da de experimetele waarde 60 -i de richtig teveel kleier: va het alteratief- bedraagt da: p P [A 60 CLS P [Y 60 + 0.5, met Y N µ p 3, σ p p 60.5 0, dus we verwerpe H 0, i.e. het loot de moeite om te doctorere. 3. Veroderstel dat je beschikt over alle gegeves waarop de voorgaade tabel gebaseerd is dus de ikomes va alle mese die aa de studie deelame. Je wil teste of het mediaa ikome va Amerikaase statistici met ee doctoraat sigificat hoger is da het mediaa ikome va Amerikaase statistici met ee master diploma. Leg zo volledig mogelijk uit hoe je te werk zou gaa om deze hypothese te teste. We wille teste Mogelijkhede: a via trasformatie: H 0 : medx PhD medx Master ; H : medx PhD > medx Master. - trasformatie tot ormaliteit data zij rechtsscheef, dus mogelijks log-ormaal verdeeld; - test op verschil i gemiddeldes va de getrasformeerde data via t-test voor ogepaarde gegeves, dus test eerst op gelijkheid va de variaties; - formuleer ee besluit m.b.t. de mediae va de oorsprokelijke data idie de data log-ormaal zoude zij, da geldt dat de mediae va de getrasformeerde data gelijk zij aa de gemiddeldes va de getrasformeerde data + dat de mediae va de oorsprokelijke data gelijk zij aa de exp va de mediae va de getrasformeerde data. b via Wilcoxo: - merk op dat de gegeves iet uit ee ormale verdelig kome e je daarom ee iet-parametrische tet zal uitvoere; - let erop dat de oorsprokelijke H 0 e H moet worde aagepast aar die voor Wilcoxo; - formuleer ee besluit omtret gelijkheid of verschil i verdelige e leidt daaruit iformatie af omtret de verhoudig tusse de mediae va de oorsprokelijke data. 7
6 Vraag 6 Gegeve zij X, X,..., X oafhakelijke toevalsvariabele die Beroulli verdeeld zij met kas op succes p.. Too aa dat f Xi x p x p x, voor x 0,. maiere: a Ivulle: f Xi p f Xi 0. b Via de Biomiaal verdelig. Als X Beroullip, da geldt teves dat X Biomiaal, p. Bijgevolg is f X x x p x p x, voor x 0,. Teves geldt, voor elk willekeurig atuurlijk getal, dat 0, zodat fx x p x p x.. Too aa de de MLE va p wordt gegeve door X. De MLE vide we door de log-likelihood fuctie af te leide aar de parameters waarvoor we ee schatter zoeke. We moete dus allereerst de log-likelihood fuctie bepale. I dit geval hebbe we Lp; x, x,..., x f Xi p; x i p x i p x i, zodat loglp; x, x,..., x log [f Xi p; x i logp x i + log p x i, dus p loglp; x, x,..., x p x i p x i. de MLE ˆp MLE voor p voldoet aa ˆp MLE x i ˆp MLE x i 0, waaruit volgt dat ˆp MLE x i X. 8
3. Me wil ee schatter opstelle voor θ Var [X i e gebruikt hiervoor ˆθ X X. Is dit ee zuivere schatter voor Var [X i? We moete agaa of E [ˆθ θ Var [X i p p. E [ˆθ E [ X E [X µ X Var [ [ X + E X σ µ X X + µ X p p p + p [ p p p p p p p. De voorgestelde schatter is dus iet zuiver wel asymptotisch, i.e. voor. 4. Bepaal ee beaderig voor Var [ˆθ via de Delta methode. De Delta methode ka worde gebruikt om ee beaderig te bepale voor de verwachte waarde, de variatie,... va ee fuctie g va ee toevalsvariabele. De techiek bestaat eri om eerst de fuctie g te otwikkele i ee Taylorreeks rod ee goed gekoze put e vervolges de verwachte waarde, variatie,... te bepale va de reeksotwikkelig. Voor de verwachte waarde volstaat ee otwikkelig t.e.m. de tweede orde. Voor de variatie volstaat ee otwikkelig t.e.m. de eerste orde. I os geval geldt: ˆθ g X X X X X. De beschouwde fuctie is dus gx x x, zodat g x x. Merk op dat ˆθ ee fuctie is va de variabele X. Het is duidelijk dat X i de buurt zal ligge va E [ X E [X p, dus zulle we de fuctie g otwikkele rod het put p. Dit geeft tot de eerste orde: gx gp + x pg p. 9
Bijgevolg hebbe we Var [ˆθ Var [ g X Var [ gp + X p g p Var [gp + Var [ X p g p 0 + g p Var [ X p g p Var [ X p p p 0