Kansrekening en Statistiek

Vergelijkbare documenten
Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I.

Statistiek voor A.I. College 10. Dinsdag 16 Oktober

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Kansrekening en Statistiek

Kansrekening en Statistiek

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Kansrekening en Statistiek

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

. Dan geldt P(B) = a d. 3 8

Samenvatting Statistiek

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Toetsen van hypothesen

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Tentamen Voortgezette Kansrekening (WB006C)

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Statistiek voor A.I. College 6. Donderdag 27 September

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Kansrekening en Statistiek

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Hoofdstuk 12: Eenweg ANOVA

Kansrekening en Statistiek. Overzicht Kansrekening

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Oefenvragen bij Statistics for Business and Economics van Newbold

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Meetkunde en Lineaire Algebra

Les 1: Waarschijnlijkheidrekening

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Data analyse Inleiding statistiek

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Les 2: Toetsen van één gemiddelde

Meetkunde en Lineaire Algebra

Kansrekening en Statistiek

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

= P(B) = 2P(C), P(A B) = 1 2 en P(A C) = 2 5. d. 31

Kansrekening en Statistiek

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Tentamen Kansrekening en Statistiek (2WS04), dinsdag 17 juni 2008, van uur.

Kansrekening en Statistiek

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Kansrekening en Statistiek

Statistiek voor A.I. College 9. Donderdag 11 Oktober

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

Kansrekening en Statistiek

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Hoofdstuk 5: Steekproevendistributies

Les 7-8: Parameter- en Vergelijkingstoetsen

SOCIALE STATISTIEK (deel 2)

HOOFDSTUK III. SCHATTEN VAN PARAMETERS Schatters en Betrouwbaarheidsintervallen. Theorie Statistiek Les 6

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Toetsen van Hypothesen. Het vaststellen van de hypothese

Sheets K&S voor INF HC 10: Hoofdstuk 12

Voorbeeldtentamen Statistiek voor Psychologie

Kansrekening en Statistiek

Les 1: Waarschijnlijkheidrekening

Kansrekening en stochastische processen 2S610

Inhoudsopgave. Deel I Schatters en toetsen 1

Statistiek voor A.I. College 1. Dinsdag 11 September 2012

Het tentamen heeft 25 onderdelen. Met ieder onderdeel kan maximaal 2 punten verdiend worden.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Tentamen Kansrekening (NB004B)

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Inleiding Applicatie Software - Statgraphics

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

werkcollege 6 - D&P9: Estimation Using a Single Sample

Tentamen Statistische methoden MST-STM 1 juli 2010, 9:00 12:00

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Transcriptie:

Kansrekening en Statistiek College 15 Dinsdag 2 November 1 / 16

2 Statistiek Indeling: Filosofie Schatten Centraal Bureau voor Statistiek 2 / 16

Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens: 18 19 20 21 22 23 24 40 60 80 100 3 9 5 1 4 1 1 6 2 1 4 104 112 120 128 136 140 166 264 300 324 1 1 2 1 1 1 1 1 1 1 Waarom zijn gemiddelde X = 81 en standaardafwijking s X goede schatters van het gemiddelde en de standaardafwijking van de populatie CKI-studenten van de UU? 3 / 16

Filosofie: Frequentietheorie Richard Edler von Mises (1883-1953) 4 / 16

Filosofie: Frequentietheorie Waarschijnlijkheidsrekening is een empirische wetenschap, zoals de natuurkunde, en houdt zich bezig met problemen waarbij ofwel dezelfde gebeurtenis zich herhaalt en herhaalt, ofwel een groot aantal uniforme elementen betrokken zijn op hetzelfde moment. Axioma van Convergentie: #A Voor elk willekeurig atribuut A van een collectief C bestaat lim n, en dat getal n is P(A C). Merk op: Een kans is altijd relatief een collectief. Probleem: Er kunnen alleen kansen toegekend worden aan fenomenen die herhaald kunnen worden. Hoe moet het collectief gekozen worden? 5 / 16

Filosofie: Frequentietheorie versus subjectieve theorie Frequentietheorie Schatten, hypothese toetsen. Subjectieve theorie Bayesiaans leren. 6 / 16

Schatten 7 / 16

Schatten: betrouwbaarheidsinterval Def. Wanneer de standaardafwijking van de populatie σ bekend is, dan is het betrouwbaarheidsinterval met betrouwbaarheidsniveau (1 α) op grond van een statistiek X van een steekproef ter grootte n: CI = (X z kw σ X, X + z kw σ X ), waarbij z kw de standaard kritische waarde corresponderend met significantieniveau α (twee-zijdig) op grond van de standaard normale verdeling is. Wanneer de standaardafwijking van de populatie onbekend is dan is het betrouwbaarheidsinterval CI = ( X t kw s X, X + t kw s X ). waarbij t kw de standaard kritische waarde corresponderend met α (twee-zijdig) op grond van de t-verdeling bij (n 1) vrijheidsgraden is. CI wordt ook wel het 100(1 α)%-procent betrouwbaarheidsinterval genoemd. 8 / 16

Schatten: betrouwbaarheidsinterval en kritisch gebied Bij een toets met significantieniveau α is het kritische gebied bij een tweezijdige hypothese toets wanneer de standaardafwijking σ van de populatie bekend is: (, µ z kw σ X ] [µ + z kw σ X, ). Wanneer de standaardafwijking van de populatie onbekend is, is het kritische gebied (, µ t kw s X ] [µ + t kw s X, ). Merk op: In het geval X = µ is het betrouwbaarheidsinterval het complement van het kritische gebied. St. Als µ in the betrouwbaarheidsinterval rond X ligt wordt H 0 niet verworpen. Een manier om veel hypotheses tegelijk te testen: Construeer het betrouwbaarheidsinterval rond X. Alle nulhypotheses van de vorm µ = a, µ a of µ a, waarvoor a niet in het betrouwbaarheidsinterval ligt, worden op grond van X verworpen. 9 / 16

Schatten: betrouwbaarheidsinterval De interpretatie van een betrouwbaarheidsinterval: St. Voor alle steekproeven van een vaste grootte uit een populatie met gemiddelde µ waarvan het steekproefgemiddelde normaal verdeeld is, geldt dat 100(1 x)% van de 100(1 x)%-betrouwbaarheidsintervallen µ bevat en 100x% van de intervallen bevat µ niet. Bew. µ ligt in het 100(1 x)%-betrouwbaarheidsinterval rond X als geldt dat µ z kw σ X < X < µ + z kw σ X. (1) Voor z kw geldt dat P s(z z kw ) = x. Omdat X normaal verdeeld is met gemiddelde µ 2 en standaardafwijking σ X volgt daaruit dat de kans op (1) gelijk aan (1 x) is. Merk op: Voordat de steekproef heeft plaatsgehad is de kans dat het 100(1 x)%-betrouwbaarheidsinterval µ bevat (1 x). Nadat de steekproef heeft plaatsgehad, is die kans 0 of 1: het betrouwbaarheidsinterval bevat µ niet of wel. 10 / 16

Schatten Vb. Kan met betrouwbaarheidsniveau 90% beweerd worden dat iedere student die op minder dan 15 km van De Uithof woont per fiets (met snelheid tussen de 16 en 18 km/u) naar De Uithof reist? X 1 = 23.81 is de gemiddelde woonafstand in km tot De Uithof van de 21 mensen die op minder dan 15 km van de Uithof wonen. X 2 = 6.67 is hun gemiddelde reistijd in min naar De Uithof. De standaardafwijkingen zijn s 1 = 12.03 en s 2 = 2.89. De 90%-betrouwbaarheidsintervallen (20 vrijheidsgraden, t kw = 1.725): CI 1 = `23.81 (1.725)( 12.03 21 ), 23.81 + (1.725)( 12.03 21 ) = (19.28, 28.32). CI 2 = `6.67 (1.725)( 2.89 21 ), 6.67 + (1.725)( 2.89 21 ) = (5.58, 7.76). 16-18 km/u is 0.27-0.3 km/min. Dus voor de ware gemiddelde woonafstand µ 1 en reistijd µ 2 geldt dat µ 2 in (0.27µ 1, 0.3µ 1 ) ligt. Als µ 1 in CI 1 ligt, dan moet µ 2 in (0.27 19.28, 0.3 28.32) = (5.21, 8.5) liggen. Dat wordt door de steekproeven niet tegengesproken: het is mogelijk dat iedere student fietst en de intervallen de ware gemiddeldes bevatten. 11 / 16

Schatten Vb. Het aantal tenen plus vingers in jullie huishoudens: 18 19 20 21 22 23 24 40 60 80 100 3 9 5 1 4 1 1 6 2 1 4 104 112 120 128 136 140 166 264 300 324 1 1 2 1 1 1 1 1 1 1 Waarom zijn gemiddelde X = 81 en standaardafwijking s X goede schatters van het gemiddelde en de standaardafwijking van de populatie CKI-studenten van de UU? 12 / 16

Schatten: zuivere schatters Def. Als een parameter θ van een populatie benaderd/geschat wordt door een statistiek t, dan is t een zuivere schatter als E(t) = θ. Hierbij is E(t) de verwachtingswaarde van t op grond van alle steekproeven van een vaste grootte uit de populatie. 13 / 16

Schatten: zuivere schatters St. Zij X een stochast met verwachtingswaarde/gemiddelde µ en variantie σ 2. Dan geldt wanneer het bijbehorende experiment n maal herhaald wordt dat een zuivere schatter van µ en P n i=1 X = X i n een zuivere schatter van σ 2 is. s 2 X = P n i=1 (X i X ) 2 n 1 Bew. Gebruik: voor alle stochasten X en Y en elke constante c geldt E(cX ) = ce(x ), Var(cX ) = c 2 Var(X ), E(X + Y ) = E(X ) + E(Y ) en Var(X + Y ) = Var(X ) + Var(Y ). Voor de variantie: nx (X i µ) 2 = i=1 nx (X i X ) 2 + n(x µ) 2. i=1 nx E(s 2 X ) = E( (X i X ) 2 nx (X i µ) 2 n(x µ)2 ) = E( ) E( ) = nσ2 n 1 n 1 n 1 n 1 σ2 n 1 = σ2. i=1 i=1 14 / 16

Schatten: zuivere schatters De Centrale Limietstelling en de eis van zuiverheid van een schatter ondersteunen de keuze om het gemiddelde en de variantie van een populatie te benaderen met het steekproefgemiddelde en de variantie van het steekproefgemiddelde, op verschillende wijze. 15 / 16

Finis 16 / 16