werkcollege 6 - D&P9: Estimation Using a Single Sample

Vergelijkbare documenten
werkcollege 5 - P&D7: Population distributions - P&D8: Sampling variability and Sampling distributions

werkcollege 6 - D&P10: Hypothesis testing using a single sample

werkcollege 7 - D&P10: Hypothesis testing using a single sample

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5: Steekproevendistributies

Data analyse Inleiding statistiek

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Hoofdstuk 3 Statistiek: het toetsen

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Voorbeeldtentamen Statistiek voor Psychologie

Data analyse Inleiding statistiek

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Examen Statistiek I Feedback

variantie: achtergronden en berekening

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Oefenvragen bij Statistics for Business and Economics van Newbold

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

Inleiding Applicatie Software - Statgraphics

Inhoudsopgave. Deel I Schatters en toetsen 1

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

SOCIALE STATISTIEK (deel 2)

Hoofdstuk 12: Eenweg ANOVA

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Statistiek voor A.I.

Formules Excel Bedrijfsstatistiek

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Hoofdstuk 10: Regressie

Deze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

4.1 Eigenschappen van de normale verdeling [1]

HOOFDSTUK II BIJZONDERE THEORETISCHE VERDELINGEN

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

. Dan geldt P(B) = a d. 3 8

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Kansrekening en Statistiek

Kansrekening en Statistiek

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Kansrekening en Statistiek

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Hoofdstuk 4 Kansen. 4.1 Randomheid

Meten en experimenteren

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Hoofdstuk 6 Twee populaties: parametrische toetsen

9. Lineaire Regressie en Correlatie

Toetsen van Hypothesen. Het vaststellen van de hypothese

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

Toetsen van hypothesen

Les 2: Toetsen van één gemiddelde

Statistiek I Samenvatting. Prof. dr. Carette

Feedback examen Statistiek II Juni 2011

Kansrekening en Statistiek

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Kansrekening en Statistiek

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

14.1 Kansberekeningen [1]

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

College 2 Enkelvoudige Lineaire Regressie

VOOR HET SECUNDAIR ONDERWIJS

Meten en experimenteren

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Statistiek ( ) eindtentamen

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

Examen Statistiek I Januari 2010 Feedback

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Klantonderzoek: statistiek!

Kansrekening en Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Cursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud

Tentamen Statistische methoden MST-STM 8 april 2010, 9:00 12:00

Toegepaste Statistiek, Week 3 1

Paragraaf 10.1 : Populatie en Steekproef

Kansrekenen en statistiek. Daniël Slenders Faculteit Ingenieurswetenschappen Katholieke Universiteit Leuven

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Niet de hoogte, wel de oppervlakte. Aandachtspunten bij. - statistische technieken voor een continue veranderlijke

Statistiek ( ) ANTWOORDEN eerste tentamen

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

13.1 Kansberekeningen [1]

Statistiek in HBO scripties

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Antwoorden bij 4 - De normale verdeling vwo A/C (aug 2012)

Algemeen overzicht inleiding kansrekening en statistiek

Een Bernoulli experiment is een experiment met slechts twee mogelijke uitkomsten, die we succes ( S ) en mislukking ( M ) noemen.

Betrouwbaarheid van een steekproefresultaat m.b.t. de hele populatie

Meten en experimenteren

Les 1: Waarschijnlijkheidrekening

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,


Transcriptie:

cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties (x100=percentages) plot in histogram som van waarden is 1 (100%) van discrete meetwaarden naar continue reeks de kans P op een waarde die kleiner is dan een bepaalde waarde, is gelijk aan de oppervlakte tot die waarde: kansdichtheidsfunctie standaard normale verdeling is een continue kansdichtheidsfunctie de oppervlakte tussen z 1 en z 2 geeft de kans op een observatie tussen z 1 en z 2 als z 1 = - dan kans op waarde < z 2 (dat is de tabelwaarde in de z-tabel) de kans op een exacte waarde is nul! daarom maakt < of geen verschil 1

gebruik van z-tabel waarden geven p(z<z*) dwz de kans op een waarde kleiner dan z* de kolommen geven honderdsten ook bruikbaar om bij gegeven p-waarde de bijbehorende z-waarde te vinden [indien alleen waarden voor z<0 gegeven] verdeling is symmetrisch dus p(z<1) = p(z> -1) = 1 p(z < -1) = 1 0.1587 = 0.8413 huiswerk opgaven Ch.7: 17, 30, 31 opgaven Ch.8: 1, 2, 7 (video), 16, 17 opgave 8.7 (zie ook video) 2

it s like magic! op grond van een enkele steekproef (N=1500) schatten we kenmerk van hele populatie (N=miljoenen) puntschatting schatting van kenmerk is zuiver (unbiased) als gemiddelde van herhaalde schattingen gelijk is aan waarde van kenmerk in populatie en anders onzuiver (biased) beste schatter heeft zelf kleinste sd gebruik wel n-1 bij berekening van sd van schatter! betrouwbaarheidsinterval hoe nauwkeurig is de schatting van het gemiddelde? het betrouwbaarheidsinterval met mate van betrouwbaarheid! 90%, 95%, 99% betrouwbaarheidsniveau in bv 99% van de gevallen zal een methode tot een betrouwbaarheidsinterval leiden waar het echte populatiegemiddelde werkelijk in ligt confidence interval, confidence level betrouwbaarheidsinterval plus/min 1 standaarddeviatie geeft betrouwbaarheidsniveau van 68% maar we willen naar bv 95% normale verdeling boven en onder 2.5% p(z)<0.025 > z = -1.96 (z kritiek ) kies interval 1.96 x standaarddeviatie 3

steekproefgemiddelde n > 30 (maar kleiner mag ook nog wel) dan heeft x ongeveer een normale verdeling distributie van populatiewaarden zijn normaal verdeeld met gemiddelde µ en standaard deviatie σ voor x geldt dat µ x = µ en σ x = σ / n we kunnen voor x een gestandaardiseerde variabele (z) afleiden: z = ( x - µ) / (σ / n) op 95% betrouwbaarheidsniveau geldt dan x - 1.96 (σ / n) < µ < x + 1.96 (σ / n) x populatiegemiddelde µ schatting van het populatiegemiddelde µ met bepaald betrouwbaarheidsinterval uit een enkele steekproef is x ± z kritiek σ / n (kies z kritiek op basis van betrouwbaarheidsniveau) 4

steekproefgrootte voor populatie gemiddelde B = 1.96 (σ / n) (95% betrouwbaarheidsniveau) dus n = (1.96 σ / B ) 2 als σ onbekend is dan mag die geschat worden met σ ~ range/4 = (max-min)/4 (neem aan dat tussen max en min 4 standaard deviaties zitten) alsσonbekend is (wat meestal het geval is) gebruik s (de standaard deviatie van de steekproef) in plaats van σ maar nu wordt de gestandaardiseerde variabele, die eerst z was, iets anders: t t = ( x- µ) / (s/ n) leidt tot t-distributie t-distributie als x het steekproefgemiddelde is van een random sample de populatie normaal is verdeeld, of n groot is (n 30) en σ, de sd van de populatie, onbekend is dan is het betrouwbaarheidsinterval x ± t kritiek (s/ n) t-waarden zijn afhankelijk van vrijheidsgraden: df = n-1 voor grote n is t-distributie gelijk aan z-distributie bestudeer de t-tabel in Appendix Table 3 en in de voorkaft van P&D! 5

resumé: 95% betrouwbaarheidsinterval x- t kritiek,95% (s / n) < µ < x + t kritiek,95% (s / n) let op, dat t kritiek (een beetje) van n afhangt (n-1 vrijheidsgraden) in de praktijk kennen we uit een steekproef alleen x, s en n, dus moeten we t gebruiken! dit alles ging over de schatting van een gemiddelde van een populatie nu de schatting van een populatieproportie proportie van successen p = aantal successen n (boek gebruikt p-dak) noemen we π (pi) voor de populatie (boek: p) Het gemiddelde en standaarddeviatie van p (populatie) zijn µ p = π (mu) σ p = π(1- π)/n (sigma) [dit volgt direct uit de formules voor de binomiale verdeling: µ= np en σ= npq en deze delen door n] 6

kritieke waarde de kritieke waarde is de waarde van z die behoort bij het gekozen betrouwbaarheidsniveau Als de steekproefproportie p van een random sample afkomstig is n groot is (np 10) maar n maximaal 10% van populatie dan π ~ p ± z kritiek p(1- p)/n omgekeerd: steekproefgrootte bepalen B = 1.96 π(1- π)/n daaruit volgt n = π(1- π) (1.96 / B) 2 dat is de grootte die de steekproef tenminste moet hebben om een 95% betrouwbaarheid te hebben dat het resultaat minder dan B van π afwijkt als π onbekend is, kies π = 0.5 meest conservatief > grootste n samenvattend prototype betrouwbaarheidsinterval is puntschatting met specifieke schatter ± krititieke waarde x geschatte standaarddeviatie van de schatter geschatte standaarddeviatie van de schatter = standaard fout (standard error) 7

steekproef ~normaal verdeeld 95% betrouwbaarheid, dan: grens van de schattingsfout B = 1.96 * standard error van de schatter huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 Activities 9.3 en 9.4 8