Samenvatting: Statistiek 1 by lekkernederlands The Marketplace t Buy and Sell yur Study Material Buy and sell all yur summaries, ntes, theses, essays, papers, cases, manuals, researches, and many mre.. www.stuvia.cm
Stuvia.cm - The Marketplace t Buy and Sell yur Study Material Cllege 1 Ppulatie = gehele grep elementen Steekpref = gedeelte van ppulatie dat nderzcht wrd Eenheden = elementen waarvan gegevens wrden verzameld Variabelen = element uit steekpref dat wrdt bepaald Kwantitatieve variabelen: getal met waarde, bijv. telling Cntinu: alle getallen Discreet: alleen hele getallen Weergeven: frequentie tabel (met klasses), histgram Kwalitatieve variabelen: geen getal Nminaal: geen vrkeur Ordinaal: wel gradatie aangegeven Weergeven: frequentie tabel, staafdiagram Steekpref heeft kans p vertekening -> dat de gehele ppulatie niet accuraat wrdt weergeven Vertekening vrkmen: Enkelvudige Aselecte Steekpref (ESA) Willekeurig aantal eenheden uit ppulatie genmen Alle mgelijke cmbinatie even grt m aanwezig te zijn Vrkmt vertekening dr teval gekzen wrden Vrbeelden vertekening: Onvlledige dekking: bepaalde grepen niet weergeven Nn-respns: mensen werken niet mee f zijn nbereikbaar Vrijwillige reactie: meestal uitgesprken negatieve reactie Vertekening van reactie: sciale wenselijkheid Bij bservatineel nderzek alleen maar waarneming Bij experimenteel nderzek pzettelijke behandeling tekennen m reactie waar te nemen Orzaak-gevlg reactie vaststellen alleen bij experimenteel nderzek Relatieve frequentie: fractie van iets gedeeld dr het ttaal -> kmt altijd uit p 1 Pieken in een histrgram: 1 piek= unimdal, 2 pieken = bimdal allemaal gelijk = unifrm Skewed t the left: heeft links staartje skewed t the right: rechts staartje Cllege 2 Vrselectie? Dan geen EAS Numerieke maten vr centrum: gemiddelde + mediaan Gemiddelde: yi y i= y 1 + y 2 + y 3 y n Mediaan: gemiddelde van alle waarnemingen als ze p grtte gerdend zijn niet gevelig vr uitbijters Standaard Deviatie = variantie Variantie = (yi y) Interkwartielafstand = IKA = Q3 Q1 Niet gevelig vr uitbijters Maximum/minimum waarde kan k uitbijter zijn Emperical rule = 68-95-99,7-regel
Stuvia.cm - The Marketplace t Buy and Sell yur Study Material 68 = y s, y + s 95 = y 2s, y + 2s 99,7 = y 3s, y + 3s Wet van grte getallen: relatieve frequentie stabiliseert bij grtere aantallen Schatter = p = k/n k/n = cnsistentie schatter des te grter steekpref, des te dichter bij nbekende waarde p als tevalsvariabele dan schatter, specifieke uitkmst dan schatting P (gebeurtenis A) = A = uitkmsten die niet in A vrkmen A B = alleen in A, alleen in B f in A en B Disjunct = A en B geen gemeenschappelijke gebeurtenis (n verlap ven diagram) A B = uitkmsten in zwel A als B Vr elke gebeurtenis = 0 P (A) 1 Cllege 3 Cmplementen regel: P(A ) = 1- P(A) Range = verschil tussen grtste en kleinste waarde van een set waarnemingen Percentile = heeft p% van waarnemingen ernder en 100-p% van waarnemingen erbven Prduct regel nafhankelijke prducten: P(A B) = P (A) * P (B) Algemene ptelregel: P (A B) = P (A) + P (B) - P(A B) Binminaal cëfficiënt Cllege 4 n = aantal steek pref elementen k = aantal successen!!(!) π (1 π) Mutually exclusive = disjunct = als disjunct dan kans dat A f B gebeurt = P(A) + P (B) Kansverdeling verschilt vr discrete en cntinue variabelen Bij discrete variabelen kunnen kansverdelingen bij elkaar wrden pgeteld Cntinue tevalsvariabelen Kan alle waardes aannemen Kan niet beschreven wrden dr lsse uitkmsten Exacte verdeling niet bekend Veel waarnemingen >> klassebreedte in histgram kleiner >> histgram wrdt een curve Bin size = staafjes breedte Kans is relatieve frequentie p lange termijn P(A) gegeven dr ppervlakte nder de curve en bven A Discreet: P ( y 5) P (y < 5) Cntinu: P (y 3/50) = P (y < 3/50) P(y=3/50) => 0 Nrmale verdeling: symmetrisch, 1-tppig, klkvrmig, ntatie: N( μ, σ ) Standaard nrmale verdeling: Z ~ N (0,1)
Stuvia.cm - The Marketplace t Buy and Sell yur Study Material P (Z 3,05) = 1 - P (Z 3,05) want tabel 1 geeft alleen kleiner dan waarden Transfrmatie naar standaard nrmaal verdeling Y ~ N (μ, σ ) -> Z ~ N (0,1) Y = μ + σ Z k wel Z = Discrete tevalsvariabele is gelijk aan de sm van de mgelijke uitkmsten vermenigvuldigd met de bijbehrende kansen Een steekprefgemiddelde is cnsistente schatter vr ppulatiegemiddelde = y Cllege 5 Rekenregels vr verwachtingen Regel 1: y tevals variabele, a en b vaste gevallen μ a+by = a + bμ y Regel 2: als x en y tevalsvariabele zijn μ x+y = μ x + μ y Als je alles hetzelfde det, blijft spreiding hetzelfde Rekenregels vr variantie Regel 1: σ a + by = b σy en dus σ 2 a + by = b 2 σ 2 y Regel 2: x en y nafhankelijke tevalsvariabelen σ 2 x+y = σ 2 x + σ 2 y σ 2 x-y = σ 2 x + σ 2 y varianties altijd bij elkaar ptellen Regels 1 en 2 gecmbineerd μ ax+by+c = aμ x + bμ y + c Onafhankelijk σ 2 ax+by+c = a 2 σ 2 x+b 2 σ 2 y Verwachting en standaardafwijking van sm van nafhankelijke trekkingen uit een zelfde verdeling: µμ = nμ y σ = n * σ y y = steekpref gemiddelde Standaard afwijking steekpref σy = Verdeling gemiddekde y~n (μ y * ) Tel je bij tevalsvariabele cnstante p, kmt ie er wel bij, bij verwachting, niet bij variantie Vermenigvuldig je met een tevalsvariabele een cnstante, dan kmt die in het kwadraat in de variantie terug
Stuvia.cm - The Marketplace t Buy and Sell yur Study Material Werkcllege 6 Binminale verdeling y~bin (n, π) Alternatieve hypthese: bewering waarvan men hpt dat die juist is In plaats dat nulhypthese juist is H 0 : π = 0.5 H a : > 0.5 Tetsingsgrtheid: aantal in de pref die vr de getetste situatie kiezen P-waarde -> verschrijdingskans Kans berekend nder aanname dat H 0 waar is He kleiner P-waarde, he sterker dr data tegen H geleverd bewijs Significantie niveau = α = nbetruwbaarheidsdrempel False psitive rate: in 5% H 0 verwerpen terwijl dit niet met P-waarde α : H 0 verwerpen, H a aangetnd P-waarde > α : H 0 niet verwerpen, H a is niet aangetnd Werkcllege 7 P-waarde gaat hand in hand met significantie niveau Als de alternatieve tweezijdig is kan die grter f kleiner zijn H 0 = x maar H a x Verwachtingswaarde = N*π Tweezijdige P-waarde = 2*eenzijdige P=waarde Alleen als het symmetrisch is Als significantie niveau niet aangegeven is, dan altijd 0,05 Verwachting en variantie Binminale verdeling Aantal successen y~bin(n,π) μ y = n*π σ 2 y= nπ (1-π) -> σ y = nπ(1 π) Steekpreffractie π = μπ = μ (1/n)y = 1/n μy = 1/n *n*π = π ftewel: schatting steekpreffractie is gewn π σ 2 (1/n)y = (1/n) 2 σ 2 y = (1/n) 2 * n*π*(1-π) = π(1-π)/n dus: σ = () Vuistregel benadering: nπ 5 en n(1-π) 5
Stuvia.cm - The Marketplace t Buy and Sell yur Study Material Cntinuïteitscrrectie Verbetert benadering van een discrete verdeling met cntinue verdeling Bin alleen hele getallen maar dan tel je niet alles van de rechtheken mee dus: benedenwaarde 0.5 (van bin size) bvenwaarde + 0.5 (van bin size) Cllege 7 Z-tets π π 0 σ π