G0N34a Statistiek: Examen 7 juni 2010 (review)

Vergelijkbare documenten
Examen G0N34 Statistiek

2de bach TEW. Statistiek 2. Van Driessen. uickprinter Koningstraat Antwerpen ,00

HOOFDSTUK III. SCHATTEN VAN PARAMETERS Schatters en Betrouwbaarheidsintervallen. Theorie Statistiek Les 6

FORMULARIUM: STATISTIEK

Eindexamen wiskunde A1-2 vwo 2008-II

Opgeloste Oefeningen Hoofdstuk 5: Wet van de grote aantallen en Centrale limietstelling

PROEFEXAMEN SOCIALE STATISTIEK November 2009 REEKS 1

VOOR HET SECUNDAIR ONDERWIJS. Verklarende statistiek. 6. Proporties. Werktekst voor de leerling. Prof. dr. Herman Callaert

Opgaven OPGAVE OPGAVE 2. = x ( 5 stappen ). a. Itereer met F( x ) = en als startwaarden 1 en

Les 7-8: Parameter- en Vergelijkingstoetsen

Oefeningen Analyse II

Uitwerkingen toets 11 juni 2011

TECHNISCHE UNIVERSITEIT EINDHOVEN. Tentamen Inleiding Experimentele Fysica (3NA10 of 3AA10) Tentamen OGO Fysisch Experimenteren voor minor AP (3MN10)

Antwoorden bij Inleiding in de Statistiek

VOOR HET SECUNDAIR ONDERWIJS

Set 3 Inleveropgaven Kansrekening (2WS20)

Statistiek Voor studenten Bouwkunde College 2

Statistiek = leuk + zinvol

DE ROL VAN GIS BIJ DE HEDONISCHE WAARDEBEPALING VAN VASTGOED

Examen VWO. wiskunde B1. tijdvak 1 woensdag 16 mei uur. Bij dit examen hoort een uitwerkbijlage.

Fourierreeksen. Calculus II voor S, F, MNW. 14 november 2005

1. Hebben de volgende rijen een limiet, en zo ja, bepaal die dan: (i) u n = sin(πn) (d) u n = cos(2πn) (l) u n = log n

Examen HAVO. wiskunde A. tijdvak 2 woensdag 19 juni uur. Bij dit examen hoort een uitwerkbijlage.

Examen VWO. wiskunde B1. tijdvak 1 woensdag 16 mei uur. Bij dit examen hoort een uitwerkbijlage.

Hoofdstuk 4: Aanvullende Begrippen (Extra Oefeningen)

Statistiek Voor studenten Bouwkunde College 5

Statistiek 2 voor TeMa. Statistiek 2 voor TeMa. Statistiek 2 voor TeMa. Statistiek 2 voor TeMa Inleiding. Studiemateriaal

Appendix A: De rij van Fibonacci

Statistiek. (relatieve) frequenties: histogram cumulatieve (relatieve) frequenties: cumulatief frequentiepolygoon of ogief

WenS eerste kans Permutatiecode 0

Betrouwbaarheid. Betrouwbaarheidsinterval

Eindexamen wiskunde B1 vwo 2007-I

Betrouwbaarheidsintervallen

Constructie van schatters bij het lokaliseren van QTL s

PARADOXEN 9 Dr. Luc Gheysens

Een toelichting op het belang en het berekenen van de steekproefomvang in marktonderzoek.

INLEIDING FYSISCH-EXPERIMENTELE VAARDIGHEDEN (3A560) , ANTWOORDEN. en y m.b.v. y = n

Periodiciteit bij breuken

1. Recursievergelijkingen van de 1 e orde

Toelichting bij Opbrengstgegevens VAVO

Steekproeftrekking Onderzoekspopulatie Steekproef

Ongelijkheden. IMO trainingsweekend 2013

2.6 De Fourierintegraal

Eindexamen wiskunde A vwo I

Schatters en betrouwbaarheidsintervallen

Convergentie, divergentie en limieten van rijen

χ 2 -toets voor homogeniteit χ 2 -toets voor goodness-of-fit ten slotte

x z vonden we dat de z-score aangeeft hoeveel standaardafwijkingen de waarde

Opgave 5 Onderzoek aan β -straling

Hoofdstuk 9 : Steekproefstatistieken. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

7.1 Recursieve formules [1]

WPP 5.2: Analyse. Oplossing onderzoeksopdrachten

De standaardafwijking die deze verdeling bepaalt is gegeven door

2.1 De normale verdeling

Steekproeven en schatters

opgave Opgave Bepaal de convergentiestralen van de volgende machtreeksen: (n + 1)! n! = lim n = lim (n + 1)!/(2n + 2)! n!/(2n)!

wiskunde A pilot vwo 2017-II

Julian gooit 20 keer met een dobbelsteen. Bereken de kans dat hij precies 5 keer een zes gooit.

Complexe getallen. c(a+ib)=ca+i(cb) id(a+ib)=i(ad)+i 2 (bd)=(-bd)+i(ad) (a+ib)(c+id)=ac+i(ad)+i(bc)+i 2 (bd)= ac-bd+i(ad+bc)

Statistiek Voor studenten Bouwkunde College 7

Praktische opdracht: Complexe getallen en de Julia-verzameling

WenS eerste kans Permutatiecode 0

WISKUNDE 5 PERIODEN DEEL B

Kanstheorie. 2de bachelor wiskunde Vrije Universiteit Brussel. U. Einmahl

Analyse wijze en stimuleren van invullen Nationale Studenten Enquête Pascal Brenders 19 juni 2013

9. Testen van meetresultaten.

Examen G0N34 Statistiek

Bass eenheden in ZG.

Buren en overlast. waar je thuis bent...

Statistiek Voor studenten Bouwkunde College 8

7. Betrouwbaarheidsintervallen voor proporties

Artikel. Regenboog. Uitgave Auteur.

Kanstheorie. 2de bachelor wiskunde Vrije Universiteit Brussel. U. Einmahl

Voorbehouden voor de correctoren Vraag 1 Vraag 2 Vraag 3 Vraag 4 Vraag 5 Totaal. Toets Kansrekenen I. 28 maart 2014

Hoe los ik het op, samen met Thuisvester? Ik heb een klacht

n n n bedoelen we uiteraard dat n N : 0 f x divergeert naar + of.

Elementaire speciale functies

1. Gegeven is het polynoom P (z) = z 4 + 4z 3 + 6z 2 + 4z + 5 met z C.

12 Kansrekening Kansruimten WIS12 1

Eindexamen wiskunde B vwo II

UITWERKINGEN TOETS TRAININGSKAMP. Valkenswaard, 10 juni 2006

Waarschijnlijkheidsrekening en Statistiek

RUDOLF STEINERCOLLEGE HAARLEM WISKUNDE HAVO CM/EM T212-HCMEM-H7911 Voor elk onderdeel is aangegeven hoeveel punten kunnen worden behaald.

Statistiek Voor studenten Bouwkunde College 6

Correctievoorschrift VWO. Wiskunde B1,2 (nieuwe stijl)

Klassieke en Kwantummechanica (EE1P11)

Rijen. 6N5p

Cursus Theoretische Biologie. Onderdeel Statistiek

Een meetkundige constructie van de som van een meetkundige rij

Waarschijnlijkheidsrekening en Statistiek

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

We kennen in de wiskunde de volgende getallenverzamelingen:

Werktekst 1: Een bos beheren

1ste bach TEW. Statistiek 1. Prof. Ellen Vandervieren. uickprinter Koningstraat Antwerpen ,00

Oplossingen extra oefeningen: rijen (leerstof RR, leerstof MR)

Videoles Discrete dynamische modellen

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Rijen met de TI-nspire vii

Uitwerkingen huiswerk week 7

Gemengde opgaven. 10 Mathematische statistiek. w 2,50 2,50 47,50 997, ,50. P(W = w) 0,95 0,049 0,0007 0,0002 0,0001

Transcriptie:

G0N34a Statistiek: Exame 7 jui 00 review Vraag Beoordeel de volgede uitsprake. Als ee uitspraak iet juist is of ovolledig, leg da uit waarom e verbeter de uitspraak.. Bij het teste va hypotheses is de kas op ee type-ii fout altijd groter da de kas op ee type-i fout. Fout! Kas op type-ii fout hagt af va het sigificatie iveau α kas op type-i fout. Kas op type-ii fout hagt af va het alteratief µ i.e. de echte waarde va µ. Hoe verder de vooropgestelde waarde µ 0 ligt va µ, hoe kleier de kas op ee type-ii fout.. Om te teste of de correlatie tusse cotiue variabele sigificat is, moete deze variabele ormaal verdeeld zij. Ovolledig! Lieair verbad: via de Pearso-correlatiecoëfficiët. Voorwaarde: variabele zij bivariaat ormaal verdeeld. Mootoo verbad: via de Spearma-ragcorrelatie. Voorwaarde: gee. Niet parametrische test! 3. Ee kwatielplot is ee krachtige grafische methode om ormaliteit va ee steekproef a te gaa. Ovolledig! Ee ormale kwatielplot... Vb. via ee expoetiële kwatielplot ka je ormaliteit atuurlijk iet agaa, maar wel of de steekproef uit ee expoetiële verdelig komt. Kwatielplots geve ekel ee idicatie. Moet og formeel getest worde via ee hypothesetest.

Vraag. Waarvoor diet ee Average Shifted Histogram? Schattig va de oderliggede dichtheidsfuctie va ee steekproef.. Leg bekopt e hoofdzakelijk i woorde uit hoe dit ASH wordt bekome voor ee willekeurige steekproef. Zie.pdf omtret ASH.

3 Vraag 3 Uit ee oderzoek door het Verbod der Vlaamse Tadartse is gebleke dat wie vaak soept 80% kas heeft op cariës. Bij mese die ooit soepe bedraagt deze kas 9%. Teves is gewete dat 5% va de bevolkig ooit soept e dat 65% va de mese die soepe, slechts af e toe soepe. Bij deze laatste categorie bedraagt de kas op cariës 55%. Idie ee tadarts bij ee patiët cariës vaststelt, wat is da de kas dat deze patiët soept? Oplossig: Bevolkig Kas op cariës C Soepe S 85% Af e toe A: 65% 55% Vaak V : 35% 80% Niet soepe S c 5% 9% Noteer: S : patiët soept S c : patiët soept iet. C : patiët heeft cariës. We zoeke: kas dat patiët soept, idie hij cariës heeft P [S C. Aagezie we P [C S P [C A P [A + P [C V P [V kue berekee uit het gegeve, is het uttig om via de regel va Bayes te werke. Dus P [S C Bayes W T K W T K P [C S P [S P [C P[C S P [S P [C S P [S + P [C S c P [S c P [C A P [A + P [C V P [V P [S P [C A P [A + P [C V P [V P [S + P [C S c P [S c 0.55 0.85 0.65 + 0.80 0.85 0.35 0.85 0.55 0.85 0.65 + 0.80 0.85 0.35 0.85 + 0.9 0.5 0.947. Ee kasboom had hier ook gekud. 3

4 Vraag 4 Gegeve is de gezamelijke dichtheidsfuctie f X,Y va de bivariate stochastische vector X, Y met Pearso correlatiecoëfficiët ρ: [ x f X,Y x, y 6π 3 exp y x y + + 3 3 6. Bepaal ρ.. Veroderstel dat X e Y Normaal verdeeld zij. Bereke vervolges de voorwaardelijke dichtheid va X i het put x, gegeve dat Y, i.e. f X Y. Oplossig: Zie slide Multivariate kasmodelle: de dichtheidsfuctie va de bivariate ormale verdelig heeft de vorm f X,Y x, y π det Σ e zt Σ z, met z x µ X, y µ Y t σ e Σ X σ XY σ σ XY σy X ρ XY σ X σ Y ρ XY σ X σ Y σy, vermits σ XY Cov [X, Y ρ XY σ X σ Y. Waeer we het rechterlid va volledig uitwerke, a substitutie va z e Σ, da vide we f X,Y x, y πσ X σ Y ρ XY e ρ XY [ x µx σ X + y µy ρ XY x µ X y µ Y σ Y σ X σ Y. 3 Waeer we formule 3 vergelijke met de opgave da zie we omiddellijk dat µ X σ X µ Y 0 σ Y 3 πσ X σ Y ρ XY 6π 3 ρ XY 4 ρ XY ±. E vermits moet gelde dat ρ XY x µ X y µ Y σ X σ Y + x y 6, volgt dat ρ. 4

Om de voorwaardelijke dichtheid f X Y te berekee, ka je gebruik make va de eigeschap: f X Y x y f X,Y x,y f Y. Bovedie, vermits de gezamelijke dichtheid uit de opgave overeekomt met de dichtheidsfuctie va de bivariate ormale verdelig met parameters y µ X, σ X, µ Y 0, σ Y 3 e ρ XY /, moge we aaeme dat de vector X, Y uit de opgave bivariaat ormaal verdeeld is e bijgevolg dat de variabele X e Y ormaal verdeeld zij. Dit impliceert dat f Y y e y µy σ Y. πσy Dus: f X Y 6π 3 exp 3 [ + 3 + 6 0.73 π3 e 0 3 5

5 Vraag 5 Oderstaade tabel toot os iformatie over het jaarlijks ikome i 000$ va Amerikaase statistici die zij tewerkgesteld i de private sector, volges hu diploma bachelor, master e doctoraat. Diploma Percetiel 0 5 50 75 90 bachelor 5 5 65 80 7 58 master 54 80 95 5 38 69 doctoraat 64 97 5 40 75 9. Wat ka je afleide over de verdelig va de variabele X Jaarlijks ikome per diploma? I elk va de 3 gevalle is de variabele Jaarlijks ikome rechtsscheef verdeeld. Dit ka je o.a. afleide uit het feit dat p 90 p 50 > p 50 p 0, i elk va de gevalle; hierbij is p x het x-percetiel. Hoe groter de afstad tusse het 0-percetiel e het 50-percetiel de mediaa, hoe zwaarder de liker staart. Hoe groter de afstad tusse de mediaa e het 90-percetiel, hoe zwaarder de rechter staart. I os geval is de rechter staart duidelijk systematisch zwaarder da de liker vb. 58 80 > 80 5, wat aageeft dat de verdelig rechtsscheef is.. Loot het de moeite om te doctorere? Test of de mediaa va het Jaarlijks ikome va mese met ee doctoraat PhD sigificat hoger is da 5, i.e. de mediaa va het Jaarlijks ikome va mese met ee master diploma. We teste H 0 : medx PhD 5; H : medx PhD > 5. Mediaatest: de hypothese H 0 is plausibel idie de steekproefmediaa iet teveel groter is da 5, of m.a.w. idie het aatal PhDs met ee Jaarlijks ikome 5 duized $ iet teveel kleier is da 64/ 3. zij A aatal PhDs met ee Jaarlijks ikome 5 duized $. Merk op dat i het geval va PhDs ee ikome va 5 duized $ overeekomt met het 5 percetiel. M.a.w. /4 va alle PhDs verdied mistes 5 duized $ A 64/4 60.5 60. 6

Oder H 0 geldt dat A Bi 64, p 0.5. De p-waarde, i.e. de kas -oder H 0 - dat de teststatistiek A og extremer is da de experimetele waarde 60 -i de richtig teveel kleier: va het alteratief- bedraagt da: p P [A 60 CLS P [Y 60 + 0.5, met Y N µ p 3, σ p p 60.5 0, dus we verwerpe H 0, i.e. het loot de moeite om te doctorere. 3. Veroderstel dat je beschikt over alle gegeves waarop de voorgaade tabel gebaseerd is dus de ikomes va alle mese die aa de studie deelame. Je wil teste of het mediaa ikome va Amerikaase statistici met ee doctoraat sigificat hoger is da het mediaa ikome va Amerikaase statistici met ee master diploma. Leg zo volledig mogelijk uit hoe je te werk zou gaa om deze hypothese te teste. We wille teste Mogelijkhede: a via trasformatie: H 0 : medx PhD medx Master ; H : medx PhD > medx Master. - trasformatie tot ormaliteit data zij rechtsscheef, dus mogelijks log-ormaal verdeeld; - test op verschil i gemiddeldes va de getrasformeerde data via t-test voor ogepaarde gegeves, dus test eerst op gelijkheid va de variaties; - formuleer ee besluit m.b.t. de mediae va de oorsprokelijke data idie de data log-ormaal zoude zij, da geldt dat de mediae va de getrasformeerde data gelijk zij aa de gemiddeldes va de getrasformeerde data + dat de mediae va de oorsprokelijke data gelijk zij aa de exp va de mediae va de getrasformeerde data. b via Wilcoxo: - merk op dat de gegeves iet uit ee ormale verdelig kome e je daarom ee iet-parametrische tet zal uitvoere; - let erop dat de oorsprokelijke H 0 e H moet worde aagepast aar die voor Wilcoxo; - formuleer ee besluit omtret gelijkheid of verschil i verdelige e leidt daaruit iformatie af omtret de verhoudig tusse de mediae va de oorsprokelijke data. 7

6 Vraag 6 Gegeve zij X, X,..., X oafhakelijke toevalsvariabele die Beroulli verdeeld zij met kas op succes p.. Too aa dat f Xi x p x p x, voor x 0,. maiere: a Ivulle: f Xi p f Xi 0. b Via de Biomiaal verdelig. Als X Beroullip, da geldt teves dat X Biomiaal, p. Bijgevolg is f X x x p x p x, voor x 0,. Teves geldt, voor elk willekeurig atuurlijk getal, dat 0, zodat fx x p x p x.. Too aa de de MLE va p wordt gegeve door X. De MLE vide we door de log-likelihood fuctie af te leide aar de parameters waarvoor we ee schatter zoeke. We moete dus allereerst de log-likelihood fuctie bepale. I dit geval hebbe we Lp; x, x,..., x f Xi p; x i p x i p x i, zodat loglp; x, x,..., x log [f Xi p; x i logp x i + log p x i, dus p loglp; x, x,..., x p x i p x i. de MLE ˆp MLE voor p voldoet aa ˆp MLE x i ˆp MLE x i 0, waaruit volgt dat ˆp MLE x i X. 8

3. Me wil ee schatter opstelle voor θ Var [X i e gebruikt hiervoor ˆθ X X. Is dit ee zuivere schatter voor Var [X i? We moete agaa of E [ˆθ θ Var [X i p p. E [ˆθ E [ X E [X µ X Var [ [ X + E X σ µ X X + µ X p p p + p [ p p p p p p p. De voorgestelde schatter is dus iet zuiver wel asymptotisch, i.e. voor. 4. Bepaal ee beaderig voor Var [ˆθ via de Delta methode. De Delta methode ka worde gebruikt om ee beaderig te bepale voor de verwachte waarde, de variatie,... va ee fuctie g va ee toevalsvariabele. De techiek bestaat eri om eerst de fuctie g te otwikkele i ee Taylorreeks rod ee goed gekoze put e vervolges de verwachte waarde, variatie,... te bepale va de reeksotwikkelig. Voor de verwachte waarde volstaat ee otwikkelig t.e.m. de tweede orde. Voor de variatie volstaat ee otwikkelig t.e.m. de eerste orde. I os geval geldt: ˆθ g X X X X X. De beschouwde fuctie is dus gx x x, zodat g x x. Merk op dat ˆθ ee fuctie is va de variabele X. Het is duidelijk dat X i de buurt zal ligge va E [ X E [X p, dus zulle we de fuctie g otwikkele rod het put p. Dit geeft tot de eerste orde: gx gp + x pg p. 9

Bijgevolg hebbe we Var [ˆθ Var [ g X Var [ gp + X p g p Var [gp + Var [ X p g p 0 + g p Var [ X p g p Var [ X p p p 0