3de bach HI Econometrie Volledige samenvatting Q www.quickprinter.be uickprinter Koningstraat 13 2000 Antwerpen 170 A 11,00
Practicum 0: Herhaling statistiek Hier vindt u een kort overzicht van enkele belangrijke begrippen uit de voorgaande cursussen statistiek die we zullen gebruiken bij KBM. 1
2
enkel gehele getallen ( 4,5 mensen antwoorden dit kan je niet zeggen) 3
4
5
6
7
8
Practicum 1: Inleiding Tijdens dit eerste werkcollege overlopen we de belangrijkste eigenschappen van schatters en frissen we de kennis over multivariate kansvariabelen op. Bovendien wordt het begrip hypothesetoets nog eens uitgebreid herhaald aan de hand van een nieuwe toets voor bivariate variabelen. Mogelijke examenvraag: Bewijs waarom het steekproefgemiddelde een goede schatter is voor het populatiegemiddeld. 9
10
Schatter met kleinste GGA is de beste. 2 y 1 var y i μ 3 E(y i ) GGA = var + vertekening² var(t 1 ) = var = 1 16 (vary 1 + vary 2 + vary 3 ) = efficiëntste (maar wat is de vertekening?) (Y 1, Y 2, Y 3 zijn onafhankelijk) var(t 2 ) = var = var(t 3 ) = var = vertekening V(T 1 ) = E(T 1 ) μ E μ = (E(Y 1 ) + E(Y 2 ) + E(Y 3 ) μ 3 = V(T 2 ) = analoog = 0 V(T 3 ) = analoog = 0 Je hebt nu de vertekening en de variantie dus nu kan je de GGA s gaan bepalen. GGA(T 1 ) = + = GGA(T 2 ) = +0² = GGA(T 3 ) = +0² = Conclusie: T 3 is de beste schatter want kleinste GGA. 11
Verwachte afstand μ m E(T 1 ) = 0,8m; var(t 1 ) = m² E(T 2 ) = m; var(t 2 ) = 1,5m² 0,8 = vertekening V(T 1 ) = E(T 1 ) m = 0,8m m = 0,2m V(T 2 ) = m m = 0 T 1 heeft vertekening maar kleine variantie T 2 heeft geen vertekening maar grotere variantie GGA(T 1 ) = m² + (0,2m)² = 1,04m² GGTA(T 2 ) = 1,5m² + 0 = 1,50m² beste Conclusie: T 1 is de beste schatter want kleinste GGA. 12
= steekproefcovariantie matrix = populatiecovariantie matrix 13
Extra informatie bij voorgaande uitleg ter verduidelijking: covariantie variantie correlatie 1 variabele X variantie 2 variabelen X,Y covariantie correlatie Opmerkingen: steekproef populatie X, Y onafhankelijk cov(x,y) = 0 maar niet omgekeerd Variantie van functies van variabelen Stel 2 variabelen X en Y. var(ax + by + c) a²var(x) + b²var(y) + 2abcov(X,Y) a² ² X + b² ² Y + 2ab XY = covariantiematrix Voor k variabelen: var(a 1 X 1 + a 2 X 2 + + a k X k ) = populatiecovariantiematrix De populatiecovariantiematrix is vierkant en heeft dus evenveel rijen als kolommen. Analoog is er de steekrpoefcovariantiematrix : s = transponeren rijen & kolommen van waarbij: X = datamatrix = plaats verwisselen hier n subjecten (rijen) in k variabelen (kolommen) 14
15
16
17
X 1 X 2 X 3 Shapiro-wilk moet je niet kunnen. sig significance p-waarde Ze zijn alle drie univariaat verdeeld maar men kan niet zeggen of ze multivariaat verdeeld zijn. gezamenlijk dichtheid is multivariaat normaal marginale dichtheden zijn univariaat normaal (geldt niet omgekeerd) a. OECD - kindersterfte: X 1 H 0 : X 1 is normaal verdeeld H a : X 1 is niet normaal verdeeld Toetsingsgrootheid: d 1 = 0,124 P-waarde: p = P(D > d 1 ) = 0,200 > α (α significantieniveau) X 1 is normaal verdeeld - aantal aids: X 2 P-waarde: p = 0,027 < α X 2 is niet normaal verdeeld - calorie-inname: X 3 P-waarde: p =0,200 > α X 3 is normaal verdeeld Conclusie: voor OECD is er geen multivariate normaalverdeling. (analoge bewerking en zelfde conclusie voor Asian/Pasific en Latin America) c. Africa analoog maar X 1, X 2, en X 3 zijn wel univariaat normaal, dus misschien multivariaat normaal. 18
Kritieke waarde (verwerpingsgebied): 1 rechterkritieke waarde namelijk: AG VG P-waarde: p = de kans dat u toetsingsgrootheid nog extremer is dan de berekende waarde met behulp van u steekproef = P( > x) 19
Onderzoeksvraag: Is het geslacht bepalend voor het correct herkennen van een merk? Kansvariabelen: 2 nominale variabelen (gepaard) Voorwaarden: ok Hypothesen: H 0 : merk en geslacht zijn onafhankelijk H a : merk en geslacht zijn afhankelijk Toetsingsgrootheid onder H 0 : merk ja neen geslacht man vrouw 95 41 11 12 136 55 109 21 22 164 150 150 300 = n Nu is e ij = 20
e 11 = = 68 e 21 = = 82 e 12 = = 68 e 22 = = 82 Dus x = + + = 39,22 Beslissingsregel: H 0 wordt verworpen t.v.v. H a x te groot bij Kritieke waarde (verwerpingsregel): 1 rechterkritieke waarde namelijk: : = : = 3,841 AG VG = 3,841 P-waarde: p = P( > x) = P( > 39,22) = kans < 0,001 dus < 0,05 Conclusie: H 0 wordt verworpen en dus zijn gender en merk niet onafhankelijk. Cramers V = met x = 39,22 V = 0,36 n = 300 L = min(2,2) = 2 21
Percent = 62/440 Row Pct = 62 = 178 (r-1)(k-1) = (4-1)(3-1) = 3 x 2 P( > x) > α H 0 (onafhankelijk) = niet verwerpen p-waarde = laag 22