DEEL 3 INDUCTIEVE STATISTIEK INHOUD H 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK H 11: PUNTSCHATTING 11.1 ALGEMEEN 11.1.1 Definities 11.1.2 Eigenschappen 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE 11.3 ENKELE (PUNT)SCHATTERS 11.3.1 De verwachting 11.3.2 De variantie 11.3.3 De proportie 11.3.4 De correlatiecoëfficiënt H 12: INTERVALSCHATTING 12.1 EEN BETROUWBAARHEIDSINTERVAL VOOR DE VERWACHTING 12.1.1 Inleiding 12.1.2 Twee gevallen - X is normaal verdeeld en σ is bekend - X is niet normaal verdeeld en σ is bekend - X is normaal verdeeld en σ is onbekend - X is niet normaal verdeeld en σ is onbekend 1BA PSYCH Statistiek 1: 2013-2014 57
HOOFDSTUK 10: INLEIDING TOT DE INDUCTIEVE STATISTIEK DEEL 1 BESCHRIJVENDE STATISTIEK - Empirie - Steekproeven beschrijven die we feitelijk trekken en observeren. DEEL 2 KANSREKENING - Theorie - Hypothesen en gevolgen - Steekproeven beschrijven die we zouden observeren als de werkelijkheid aan bepaalde hypothesen zou voldoen. DEEL 3 INDUCTIEVE STATISTIEK - Samenbrengen empirie en theorie - Methoden om: - te besluiten of een theorie weerlegd moet worden of niet, op basis van observaties en experimenten. - een theorie te verfijnen, op basis van observaties en experimenten. - Betrouwbaarheid: berekening van parameters o.b.v. een steekproef schatting " Puntschatting: een parameter door een waarde schatten (H11) " Intervalschatting: een interval waarin de parameter zich waarschijnlijk bevindt (H12) 1BA PSYCH Statistiek 1: 2013-2014 58
HOOFDSTUK 11: PUNTSCHATTING 11.1 ALGEMEEN 1. DEFINITIES DEF.: Een dichotome variabele is een variabele die slechts twee waarden kan aannemen. DEF.: - θ is de te schatten parameter. - Een schatter S is de steekproefgrootheid. Een schatter heeft dus een steekproevenverdeling. - De schatting θ is een getal dat bekomen wordt door de grootheid S in een steekproef te berekenen. EIGN.: - Een schatter S is een toevalsvariabele. Telkens we een steekproef trekken, weten we niet wat de waarde van de schatter S zal zijn. - Een schatting θ is geen toevalsvariabele, maar een getal. Een schatting is de waarde van de schatting in een bepaalde steekproef. 2. EIGENSCHAPPEN VAN EEN GOEDE SCHATTER S EIGN.: Een schatter S van een parameter θ is zuiver als zijn verwachting gelijk is aan de te schatten parameter θ. E S θ EIGN.: Een schatter S van een parameter θ is efficiënt als zijn variantie V S minimaal is. In het algemeen weten we dat een schatter zelden of nooit een perfecte schatting zal geven: soms zal de schatting te groot zijn, soms te klein. We willen dan ook dat de schatter in doorsnee gelijk is aan de parameter en dat de mogelijke afwijkingen zo klein mogelijk zijn. 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE DEF.: - Als men zich baseert op de grootste aannemelijkheidmethode, kiest men de schatter S die de kans maximaliseert dat de geobserveerde steekproef zich effectief realiseert. - De grootste aannemelijkheidschatter is een schatter die op de grootste aannemelijkheid methode gebaseerd is. EIGN.: De grootste aannemelijkheidmethode levert steeds efficiënte schatters, maar deze zijn niet altijd zuiver. 1BA PSYCH Statistiek 1: 2013-2014 59
Juno KOEKELKOREN 11.3 ENKELE (PUNT)SCHATTERS 1. DE VERWACHTING De grootste aannemelijkheidschatter van de verwachting van een variabele 𝑋 is de steekproefgrootheid 𝑋. EIGN.: De steekproefgrootheid 𝑋 is een zuivere schatter. BEWIJS: 𝐸(𝑆) 𝐸(𝑋) 𝐸 𝐸 𝐸 𝑋 𝑋 (𝑋 + 𝑋 + + 𝑋 ) 𝐸 𝑋 + 𝑋 + + 𝑋 (𝐸 𝑋 + 𝐸 𝑋 + + 𝐸 𝑋 ) (𝜇 + 𝜇 + + 𝜇 ) 𝑛𝜇 𝜇 EIGN.: De steekproefgrootheid 𝑋 is een efficiënte schatter. BEWIJS: 𝑉(𝑆) 𝑉(𝑋) 𝑉 𝑋 * Is 𝑉 (𝑆) minimaal? 𝑉 𝑆 𝑉(𝑋) 𝑉 (𝑆) is minimaal 𝑉 (𝑆) is een efficiënte schatter 2. DE VARIANTIE De grootste aannemelijkheidschatter van de variantie 𝜎 van een variabele 𝑋 is niet de steekproefgrootheid 𝑆, maar wel de steekproefgrootheid 𝑆. EIGN.: De steekproefgrootheid 𝑆 is geen zuivere schatter. BEWIJS: 𝐸 𝑆 𝐸 𝑆 𝜎 𝜎 EIGN.: De steekproefgrootheid BEWIJS: 𝐸(𝑆) 𝐸 1BA PSYCH EIGN.: 𝑆 is een zuivere schatter. 𝑆 𝐸(𝑆 ) 𝜎 𝜎 De steekproefgrootheid 𝑆 is een efficiënte schatter. Statistiek 1: 2013-2014 60
3. DE PROPORTIE De grootste aannemelijkheidschatter van de proportie π van elementen in een populatie die een bepaalde eigenschap bezitten, is de overeenkomende proportie in de steekproef. P is dus de grootste aannemelijkheidschatter van π. EIGN.: De steekproefgrootheid P is een zuivere schatter. BEWIJS: De steekproefgrootheid np is het aantal elementen met de bewuste eigenschap. Het is een binomiale variabele B(n, π). E(S) E P E, E(B n, π ) nπ π EIGN.: De steekproefgrootheid P is een efficiënte schatter. 4. DE CORRELATIECOËFFICIËNT De grootste aannemelijkheidschatter van de correlatiecoëfficiënt ρ " is de overeenkomende correlatiecoëfficiënt r ". Laat R " de toevalsvariabele zijn die in elke steekproef gelijk is aan de correlatiecoëfficiënt r ". R is de grootste aannemelijkheidschatter van ρ ". EIGN.: De steekproefgrootheid R is een zuivere schatter. EIGN.: De steekproefgrootheid R is een efficiënte schatter. 1BA PSYCH Statistiek 1: 2013-2014 61
HOOFDSTUK 12: INTERVALSCHATTING 12.1 EEN BETROUWBAARHEIDSINTERVAL VOOR DE VERWACHTING 1. INLEIDING DEF.: - Een betrouwbaarheidsinterval voor een bepaalde parameter is een numeriek interval waarin we aannemen dat de te schatten parameter zich bevindt. Een betrouwbaarheidsinterval is een realisatie van een toevalsinterval dat de te schatten parameter bevat met een bepaalde kans. - De betrouwbaarheid 1 α is gelijk aan de kans dat een betrouwbaarheids- interval de te schatten parameter bevat. - De onbetrouwbaarheidsdrempel is de kans α. 2. TWEE GEVALLEN " X IS NORMAAL VERDEELD EN σ IS BEKEND X normaal verdeeld X N μ, Laat z de waarde zijn v/d standaardnormale variabele waarvoor geldt dat: P N 0,1 z γ x z α/2 σ n, x + zα/2 σ n Een betrouwbaarheidsinterval voor de verwachting μ, met betrouwbaarheid 1 α. " X IS NIET NORMAAL VERDEELD EN σ IS BEKEND X niet normaal verdeeld, maar n > 30 (zie limietstelling) X N μ, Laat z de waarde zijn v/d variabele waarvoor geldt dat: P N 0,1 z γ x z α/2 σ n, x + zα/2 σ n Een betrouwbaarheidsinterval voor de verwachting μ, met betrouwbaarheid 1 α. 1BA PSYCH Statistiek 1: 2013-2014 62
Juno KOEKELKOREN " 𝑿 IS NORMAAL VERDEELD EN 𝝈 IS ONBEKEND 𝜎 onbekend onmogelijk grenzen berekenen Steekproefgrootheid 𝑇 / / heeft een 𝑡 - verdeling met 𝑛 1 vrijheidgraden Laat 𝑡 de waarde van 𝑇 zijn waarvoor geldt dat: 𝑃 𝑇 𝑡 𝛾 In de tabel van de verdelingsfunctie van de Student variabele kunnen we de waarde / 𝑡 vinden. Voor deze waarde geldt: 𝑃 / 𝑡 𝑃 𝑡 1 𝛼 𝒙 𝒕𝒏𝟏 𝜇 𝑋 + 𝑡 𝑺 𝜶/𝟐 𝝁 𝒙 + 𝒕𝒏𝟏 𝒏𝟏 / 𝑺 𝜶/𝟐 / 𝑋 𝑡 𝒏𝟏 1 𝛼 Een betrouwbaarheidsinterval voor de verwachting 𝜇, met betrouwbaarheid 1 𝛼. " 𝑿 IS NIET NORMAAL VERDEELD EN 𝝈 IS ONBEKEND 𝑋 niet normaal verdeeld, maar 𝑛 > 30 (zie limietstelling) 𝑇 / Laat 𝑡 de waarde van 𝑇 zijn waarvoor geldt dat: 𝑃 𝑇 𝑡 𝛾 In de tabel van de verdelingsfunctie van de Student variabele kunnen we de waarde / 𝑡 vinden. Voor deze waarde geldt: 𝑃 𝑡 𝑃 / / 𝑋 𝑡 𝑡 1 𝛼 𝜶/𝟐 𝒙 𝒕𝒏𝟏 𝑺 𝒏𝟏 / 𝜇 𝑋 + 𝑡 𝜶/𝟐 𝝁 𝒙 + 𝒕𝒏𝟏 𝑺 𝒏𝟏 1 𝛼 Een betrouwbaarheidsinterval voor de verwachting 𝜇, met betrouwbaarheid 1 𝛼. 3. ENKELE BELANGRIJKE WAARDEN VAN DE NORMALE VERDELINGSFUNCTIE Betrouwbaarheid 𝑥 𝑥 90% 95% - 1,65-1,96 1,65 1,96 99% - 2,58 2,58 99,9% - 3,29 3,29 1BA PSYCH Statistiek 1: 2013-2014 63
1BA PSYCH Statistiek 1: 2013-2014 64