Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16
2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16
Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens: 18 19 20 21 22 23 24 40 60 80 100 3 9 5 1 4 1 1 6 2 1 4 104 112 120 128 136 140 166 264 300 324 1 1 2 1 1 1 1 1 1 1 Waarom zijn gemiddelde X = 81 en standaardafwijking s X goede schatters van het gemiddelde en de standaardafwijking van de populatie CKI-studenten van de UU? 3 / 16
Filosofie: Frequentietheorie Richard Edler von Mises (1883-1953) 4 / 16
Filosofie: Frequentietheorie Waarschijnlijkheidsrekening is een empirische wetenschap, zoals de natuurkunde, en houdt zich bezig met problemen waarbij ofwel dezelfde gebeurtenis zich herhaalt en herhaalt, ofwel een groot aantal uniforme elementen betrokken zijn op hetzelfde moment. Axioma van Convergentie: #A Voor elk willekeurig atribuut A van een collectief C bestaat lim n, en dat getal n is P(A C). Merk op: Een kans is altijd relatief een collectief. Probleem: Er kunnen alleen kansen toegekend worden aan fenomenen die herhaald kunnen worden. Hoe moet het collectief gekozen worden? 5 / 16
Filosofie: Frequentietheorie versus subjectieve theorie Frequentietheorie Schatten, hypothese toetsen. Subjectieve theorie Bayesiaans leren. 6 / 16
Schatten 7 / 16
Schatten: betrouwbaarheidsinterval Def. Wanneer de standaardafwijking van de populatie σ bekend is, dan is het betrouwbaarheidsinterval met betrouwbaarheidsniveau (1 α) op grond van een statistiek X van een steekproef ter grootte n: CI = (X z kw σ X, X + z kw σ X ), waarbij z kw de standaard kritische waarde corresponderend met significantieniveau α (twee-zijdig) op grond van de standaard normale verdeling is. Wanneer de standaardafwijking van de populatie onbekend is dan is het betrouwbaarheidsinterval CI = ( X t kw s X, X + t kw s X ). waarbij t kw de standaard kritische waarde corresponderend met α (twee-zijdig) op grond van de t-verdeling bij (n 1) vrijheidsgraden is. CI wordt ook wel het 100(1 α)%-procent betrouwbaarheidsinterval genoemd. 8 / 16
Schatten: betrouwbaarheidsinterval en kritisch gebied Bij een toets met significantieniveau α is het kritische gebied bij een tweezijdige hypothese toets wanneer de standaardafwijking σ van de populatie bekend is: (, µ z kw σ X ] [µ + z kw σ X, ). Wanneer de standaardafwijking van de populatie onbekend is, is het kritische gebied (, µ t kw s X ] [µ + t kw s X, ). Merk op: In het geval X = µ is het betrouwbaarheidsinterval het complement van het kritische gebied. St. Als µ in the betrouwbaarheidsinterval rond X ligt wordt H 0 niet verworpen. Een manier om veel hypotheses tegelijk te testen: Construeer het betrouwbaarheidsinterval rond X. Alle nulhypotheses van de vorm µ = a, µ a of µ a, waarvoor a niet in het betrouwbaarheidsinterval ligt, worden op grond van X verworpen. 9 / 16
Schatten: betrouwbaarheidsinterval De interpretatie van een betrouwbaarheidsinterval: St. Voor alle steekproeven van een vaste grootte uit een populatie met gemiddelde µ waarvan het steekproefgemiddelde normaal verdeeld is, geldt dat 100(1 x)% van de 100(1 x)%-betrouwbaarheidsintervallen µ bevat en 100x% van de intervallen bevat µ niet. Bew. µ ligt in het 100(1 x)%-betrouwbaarheidsinterval rond X als geldt dat µ z kw σ X < X < µ + z kw σ X. (1) Voor z kw geldt dat P s(z z kw ) = x. Omdat X normaal verdeeld is met gemiddelde µ 2 en standaardafwijking σ X volgt daaruit dat de kans op (1) gelijk aan (1 x) is. Merk op: Voordat de steekproef heeft plaatsgehad is de kans dat het 100(1 x)%-betrouwbaarheidsinterval µ bevat (1 x). Nadat de steekproef heeft plaatsgehad, is die kans 0 of 1: het betrouwbaarheidsinterval bevat µ niet of wel. 10 / 16
Schatten Vb. Kan met betrouwbaarheidsniveau 90% beweerd worden dat iedere student die op minder dan 15 km van De Uithof woont per fiets (met snelheid tussen de 16 en 18 km/u) naar De Uithof reist? X 1 = 23.81 is de gemiddelde woonafstand in km tot De Uithof van de 21 mensen die op minder dan 15 km van de Uithof wonen. X 2 = 6.67 is hun gemiddelde reistijd in min naar De Uithof. De standaardafwijkingen zijn s 1 = 12.03 en s 2 = 2.89. De 90%-betrouwbaarheidsintervallen (20 vrijheidsgraden, t kw = 1.725): CI 1 = `23.81 (1.725)( 12.03 21 ), 23.81 + (1.725)( 12.03 21 ) = (19.28, 28.32). CI 2 = `6.67 (1.725)( 2.89 21 ), 6.67 + (1.725)( 2.89 21 ) = (5.58, 7.76). 16-18 km/u is 0.27-0.3 km/min. Dus voor de ware gemiddelde woonafstand µ 1 en reistijd µ 2 geldt dat µ 2 in (0.27µ 1, 0.3µ 1 ) ligt. Als µ 1 in CI 1 ligt, dan moet µ 2 in (0.27 19.28, 0.3 28.32) = (5.21, 8.5) liggen. Dat wordt door de steekproeven niet tegengesproken: het is mogelijk dat iedere student fietst en de intervallen de ware gemiddeldes bevatten. 11 / 16
Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens: 18 19 20 21 22 23 24 40 60 80 100 3 9 5 1 4 1 1 6 2 1 4 104 112 120 128 136 140 166 264 300 324 1 1 2 1 1 1 1 1 1 1 Waarom zijn gemiddelde X = 81 en standaardafwijking s X goede schatters van het gemiddelde en de standaardafwijking van de populatie CKI-studenten van de UU? 12 / 16
Schatten: zuivere schatters Def. Als een parameter θ van een populatie benaderd/geschat wordt door een statistiek t, dan is t een zuivere schatter als E(t) = θ. Hierbij is E(t) de verwachtingswaarde van t op grond van alle steekproeven van een vaste grootte uit de populatie. 13 / 16
Schatten: zuivere schatters St. Zij X een stochast met verwachtingswaarde/gemiddelde µ en variantie σ 2. Dan geldt wanneer het bijbehorende experiment n maal herhaald wordt dat een zuivere schatter van µ en P n i=1 X = X i n een zuivere schatter van σ 2 is. s 2 X = P n i=1 (X i X ) 2 n 1 Bew. Gebruik: voor alle stochasten X en Y en elke constante c geldt E(cX ) = ce(x ), Var(cX ) = c 2 Var(X ), E(X + Y ) = E(X ) + E(Y ) en Var(X + Y ) = Var(X ) + Var(Y ). Voor de variantie: nx (X i µ) 2 = i=1 nx (X i X ) 2 + n(x µ) 2. i=1 nx E(s 2 X ) = E( (X i X ) 2 nx (X i µ) 2 n(x µ)2 ) = E( ) E( ) = nσ2 n 1 n 1 n 1 n 1 σ2 n 1 = σ2. i=1 i=1 14 / 16
Schatten: zuivere schatters De Centrale Limietstelling en de eis van zuiverheid van een schatter ondersteunen de keuze om het gemiddelde en de variantie van een populatie te benaderen met het steekproefgemiddelde en de variantie van het steekproefgemiddelde, op verschillende wijze. 15 / 16
Finis 16 / 16