Samenvatting: Statistiek 1

Vergelijkbare documenten
Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Inleiding Applicatie Software - Statgraphics

Inleiding Applicatie Software - Statgraphics. Beschrijvende Statistiek

Data analyse Inleiding statistiek

Medische Statistiek Kansrekening

Oefenvragen bij Statistics for Business and Economics van Newbold

Statistiek I Samenvatting. Prof. dr. Carette

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Domeinmodel voor hypothesetoetsen Sietske 23 oktober 2015

Onderzoeksmethoden II: het multivariaat lineair

Data analyse Inleiding statistiek

College 4 Inspecteren van Data: Verdelingen

Samenvatting Statistiek II (2017) Ella Mattan

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Examen Statistiek I Feedback

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 5 Een populatie: parametrische toetsen

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Verwachtingswaarde, Variantie en Standaarddeviatie

Theoretische elektriciteit 5TSO

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Toegepaste Statistiek, Week 6 1

Kansrekening en Statistiek

Formules Excel Bedrijfsstatistiek

Statistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Kansrekening en Statistiek

Data analyse Inleiding statistiek

Hoofdstuk 4 Kansen. 4.1 Randomheid

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

College Week 4 Inspecteren van Data: Verdelingen

VOOR HET SECUNDAIR ONDERWIJS. Kansmodellen. 4. Het steekproefgemiddelde. Werktekst voor de leerling. Prof. dr. Herman Callaert

Kansrekening en Statistiek

Hoofdstuk 6 Twee populaties: parametrische toetsen

Toetsen van hypothesen

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

introductie kansen pauze meer kansen random variabelen transformaties ten slotte

1. Shewartkaart. σ (sigma): de standaarddeviatie. In een shewartkaart komen de gemeten waarden en nog 5 extra lijnen :

Kansrekening en Statistiek

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Paragraaf 5.1 : Frequentieverdelingen

Hoofdstuk 5. Toevalsveranderlijken en waarschijnlijkheidsdistributies. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Sheets K&S voor INF HC 10: Hoofdstuk 12

Voorbeeldtentamen Statistiek voor Psychologie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Cursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)

Hoofdstuk 5: Steekproevendistributies

Feedback proefexamen Statistiek I

Samenvattingen 5HAVO Wiskunde A.

Onderzoeksmethoden II: overzicht en herhaling interpretatie output

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

Repetitie Wet van Snellius 3 HAVO

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Les 2 / 3: Meetschalen en Parameters

Opgeloste Oefeningen Hoofdstuk 6: Steekproeven en empirische distributies

9. Lineaire Regressie en Correlatie

Statistiek voor A.I. College 6. Donderdag 27 September

Les 1: Waarschijnlijkheidrekening

Antwoorden bij 4 - De normale verdeling vwo A/C (aug 2012)

Samenvatting Statistiek

Hoofdstuk 3 Statistiek: het toetsen

significantie van de co-occurentiescore bepalen. De vraag is echer of dit zinnig is

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Kansrekening en Statistiek

Toegepaste Statistiek, Week 3 1

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

8. Analyseren van samenhang tussen categorische variabelen

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Parameters Stap 1 Stap 2 Stap 3 Stap 4 Stap 5 Stap 6

Met M binaire attributen zijn er op deze manier 2 2M functioneel verschillende beslisbomen

werkcollege 6 - D&P9: Estimation Using a Single Sample

Onderzoeksmethodiek LE: 2

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Verbanden 3. Doelgroep Verbanden 3. Omschrijving Verbanden 3

Analyse bijdragen onder de drempelwaarde. (0.05 mol/ha/jaar) AERIUSA. 4 juli Datum. Status. Definitief. Auteurs

Statistiek: Spreiding en dispersie 6/12/2013. dr. Brenda Casteleyn

VOOR HET SECUNDAIR ONDERWIJS

B G M E B. Voorwaarden pakketprijs en gereduceerde tarief DCP kopie-aanvraag humane producten 16 januari van 5 pagina('s)

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN. Faculteit Wiskunde en Informatica

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Examenprogramma vwo C 2007 Examenprogramma vwo C onderzoeksontwerp E2 Visualisatie van data

Voorbeeldvragen Methodiek NEN 2767

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Statistiek, gegevens en een kritische houding

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Kansrekening en Statistiek

Statistiek: Vorm van de verdeling 1/4/2014. dr. Brenda Casteleyn

Factsheet STOP4-7 Schooljaar

Samenvatting Deelprojecten Ouderen Samen

Kansrekening en stochastische processen 2S610

Getallen 1 is een programma voor het aanleren van de basis rekenvaardigheden (getalbegrip).

Transcriptie:

Samenvatting: Statistiek 1 by lekkernederlands The Marketplace t Buy and Sell yur Study Material Buy and sell all yur summaries, ntes, theses, essays, papers, cases, manuals, researches, and many mre.. www.stuvia.cm

Stuvia.cm - The Marketplace t Buy and Sell yur Study Material Cllege 1 Ppulatie = gehele grep elementen Steekpref = gedeelte van ppulatie dat nderzcht wrd Eenheden = elementen waarvan gegevens wrden verzameld Variabelen = element uit steekpref dat wrdt bepaald Kwantitatieve variabelen: getal met waarde, bijv. telling Cntinu: alle getallen Discreet: alleen hele getallen Weergeven: frequentie tabel (met klasses), histgram Kwalitatieve variabelen: geen getal Nminaal: geen vrkeur Ordinaal: wel gradatie aangegeven Weergeven: frequentie tabel, staafdiagram Steekpref heeft kans p vertekening -> dat de gehele ppulatie niet accuraat wrdt weergeven Vertekening vrkmen: Enkelvudige Aselecte Steekpref (ESA) Willekeurig aantal eenheden uit ppulatie genmen Alle mgelijke cmbinatie even grt m aanwezig te zijn Vrkmt vertekening dr teval gekzen wrden Vrbeelden vertekening: Onvlledige dekking: bepaalde grepen niet weergeven Nn-respns: mensen werken niet mee f zijn nbereikbaar Vrijwillige reactie: meestal uitgesprken negatieve reactie Vertekening van reactie: sciale wenselijkheid Bij bservatineel nderzek alleen maar waarneming Bij experimenteel nderzek pzettelijke behandeling tekennen m reactie waar te nemen Orzaak-gevlg reactie vaststellen alleen bij experimenteel nderzek Relatieve frequentie: fractie van iets gedeeld dr het ttaal -> kmt altijd uit p 1 Pieken in een histrgram: 1 piek= unimdal, 2 pieken = bimdal allemaal gelijk = unifrm Skewed t the left: heeft links staartje skewed t the right: rechts staartje Cllege 2 Vrselectie? Dan geen EAS Numerieke maten vr centrum: gemiddelde + mediaan Gemiddelde: yi y i= y 1 + y 2 + y 3 y n Mediaan: gemiddelde van alle waarnemingen als ze p grtte gerdend zijn niet gevelig vr uitbijters Standaard Deviatie = variantie Variantie = (yi y) Interkwartielafstand = IKA = Q3 Q1 Niet gevelig vr uitbijters Maximum/minimum waarde kan k uitbijter zijn Emperical rule = 68-95-99,7-regel

Stuvia.cm - The Marketplace t Buy and Sell yur Study Material 68 = y s, y + s 95 = y 2s, y + 2s 99,7 = y 3s, y + 3s Wet van grte getallen: relatieve frequentie stabiliseert bij grtere aantallen Schatter = p = k/n k/n = cnsistentie schatter des te grter steekpref, des te dichter bij nbekende waarde p als tevalsvariabele dan schatter, specifieke uitkmst dan schatting P (gebeurtenis A) = A = uitkmsten die niet in A vrkmen A B = alleen in A, alleen in B f in A en B Disjunct = A en B geen gemeenschappelijke gebeurtenis (n verlap ven diagram) A B = uitkmsten in zwel A als B Vr elke gebeurtenis = 0 P (A) 1 Cllege 3 Cmplementen regel: P(A ) = 1- P(A) Range = verschil tussen grtste en kleinste waarde van een set waarnemingen Percentile = heeft p% van waarnemingen ernder en 100-p% van waarnemingen erbven Prduct regel nafhankelijke prducten: P(A B) = P (A) * P (B) Algemene ptelregel: P (A B) = P (A) + P (B) - P(A B) Binminaal cëfficiënt Cllege 4 n = aantal steek pref elementen k = aantal successen!!(!) π (1 π) Mutually exclusive = disjunct = als disjunct dan kans dat A f B gebeurt = P(A) + P (B) Kansverdeling verschilt vr discrete en cntinue variabelen Bij discrete variabelen kunnen kansverdelingen bij elkaar wrden pgeteld Cntinue tevalsvariabelen Kan alle waardes aannemen Kan niet beschreven wrden dr lsse uitkmsten Exacte verdeling niet bekend Veel waarnemingen >> klassebreedte in histgram kleiner >> histgram wrdt een curve Bin size = staafjes breedte Kans is relatieve frequentie p lange termijn P(A) gegeven dr ppervlakte nder de curve en bven A Discreet: P ( y 5) P (y < 5) Cntinu: P (y 3/50) = P (y < 3/50) P(y=3/50) => 0 Nrmale verdeling: symmetrisch, 1-tppig, klkvrmig, ntatie: N( μ, σ ) Standaard nrmale verdeling: Z ~ N (0,1)

Stuvia.cm - The Marketplace t Buy and Sell yur Study Material P (Z 3,05) = 1 - P (Z 3,05) want tabel 1 geeft alleen kleiner dan waarden Transfrmatie naar standaard nrmaal verdeling Y ~ N (μ, σ ) -> Z ~ N (0,1) Y = μ + σ Z k wel Z = Discrete tevalsvariabele is gelijk aan de sm van de mgelijke uitkmsten vermenigvuldigd met de bijbehrende kansen Een steekprefgemiddelde is cnsistente schatter vr ppulatiegemiddelde = y Cllege 5 Rekenregels vr verwachtingen Regel 1: y tevals variabele, a en b vaste gevallen μ a+by = a + bμ y Regel 2: als x en y tevalsvariabele zijn μ x+y = μ x + μ y Als je alles hetzelfde det, blijft spreiding hetzelfde Rekenregels vr variantie Regel 1: σ a + by = b σy en dus σ 2 a + by = b 2 σ 2 y Regel 2: x en y nafhankelijke tevalsvariabelen σ 2 x+y = σ 2 x + σ 2 y σ 2 x-y = σ 2 x + σ 2 y varianties altijd bij elkaar ptellen Regels 1 en 2 gecmbineerd μ ax+by+c = aμ x + bμ y + c Onafhankelijk σ 2 ax+by+c = a 2 σ 2 x+b 2 σ 2 y Verwachting en standaardafwijking van sm van nafhankelijke trekkingen uit een zelfde verdeling: µμ = nμ y σ = n * σ y y = steekpref gemiddelde Standaard afwijking steekpref σy = Verdeling gemiddekde y~n (μ y * ) Tel je bij tevalsvariabele cnstante p, kmt ie er wel bij, bij verwachting, niet bij variantie Vermenigvuldig je met een tevalsvariabele een cnstante, dan kmt die in het kwadraat in de variantie terug

Stuvia.cm - The Marketplace t Buy and Sell yur Study Material Werkcllege 6 Binminale verdeling y~bin (n, π) Alternatieve hypthese: bewering waarvan men hpt dat die juist is In plaats dat nulhypthese juist is H 0 : π = 0.5 H a : > 0.5 Tetsingsgrtheid: aantal in de pref die vr de getetste situatie kiezen P-waarde -> verschrijdingskans Kans berekend nder aanname dat H 0 waar is He kleiner P-waarde, he sterker dr data tegen H geleverd bewijs Significantie niveau = α = nbetruwbaarheidsdrempel False psitive rate: in 5% H 0 verwerpen terwijl dit niet met P-waarde α : H 0 verwerpen, H a aangetnd P-waarde > α : H 0 niet verwerpen, H a is niet aangetnd Werkcllege 7 P-waarde gaat hand in hand met significantie niveau Als de alternatieve tweezijdig is kan die grter f kleiner zijn H 0 = x maar H a x Verwachtingswaarde = N*π Tweezijdige P-waarde = 2*eenzijdige P=waarde Alleen als het symmetrisch is Als significantie niveau niet aangegeven is, dan altijd 0,05 Verwachting en variantie Binminale verdeling Aantal successen y~bin(n,π) μ y = n*π σ 2 y= nπ (1-π) -> σ y = nπ(1 π) Steekpreffractie π = μπ = μ (1/n)y = 1/n μy = 1/n *n*π = π ftewel: schatting steekpreffractie is gewn π σ 2 (1/n)y = (1/n) 2 σ 2 y = (1/n) 2 * n*π*(1-π) = π(1-π)/n dus: σ = () Vuistregel benadering: nπ 5 en n(1-π) 5

Stuvia.cm - The Marketplace t Buy and Sell yur Study Material Cntinuïteitscrrectie Verbetert benadering van een discrete verdeling met cntinue verdeling Bin alleen hele getallen maar dan tel je niet alles van de rechtheken mee dus: benedenwaarde 0.5 (van bin size) bvenwaarde + 0.5 (van bin size) Cllege 7 Z-tets π π 0 σ π