Data analyse Inleiding statistiek
|
|
- Hendrik Kuiper
- 6 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen Z- & t-toetstoets hypotheses; type I & II fout
2 Exploratieve statistiek Relatie tussen twee variabelen Interval of ratio meetschaal lineaire regressie 3 Lineaire regressie Kwantificeren van lineaire relatie tussen een onafhankelijke variabele X en een afhankelijke variabele Y Kwantificeren van de sterkte van deze lineaire relatie M.b.v. de relatie een voorspelling maken van Y zodra een nieuwe waarde van X beschikbaar komt 4
3 Voordat je begint Grafiek maken van Y tegen X spreidingsdiagram (scatterplot, scattergram) Controle: : is er wel een lineair verband? Beschrijving: positieve of negatieve relatie zwakke of sterke relatie 5 lineair, positief, zeer sterke relatie 6 3
4 lineair, positief, redelijk sterke relatie 7 lineair, positief, zwakke relatie 8 4
5 geen relatie 9 lineair, negatief, zwakke relatie 0 5
6 lineair, negatief, sterke relatie lineair, negatief, zeer sterke relatie 6
7 Locatie Voorbeeld Afstand (km) Neerslag (mm) X: afstand Y: neerslag 3 Kwantificeren best-fit lineaire lijn ( X, Yˆ ) ( X, Y ) d = Y Yˆ Yˆ = a+ bx cov r = s s X Y = = *
8 Ordinary Least Squares a en b kunnen worden bepaald door Σd i te minimaliseren Methode: : ordinary least squares Best-fit lineaire lijn = least-squares squares linear line Boek: : H 5 Ordinary Least Squares Uitkomst van Ordinary Least Squares (blz( 36 & 36 boek): ( X X)( Y Y) xy b = = ( X X) x a= Y bx x = X X y = Y Y 6 8
9 9 7 7 Voorbeeld Voorbeeld Neerslag Neerslag (mm) (mm) Afstand Afstand (km) (km) Locatie Locatie X: X: afstand afstand Y: Y: neerslag neerslag X = 8.5 = 8.5 Y = 39 = Y-Y Y X-X (X (X-X)(Y X)(Y-Y) Y) X Locatie Locatie
10 Yˆ = a+ bx Yˆ = X ( X X)( Y Y) xy 668 b = = = = 0.75 ( X X) x 3878 a= Y bx = 39 ( 0.75*8.5) = Geen lineaire relatie: Residuen zijn afhankelijk van X: 0 0
11 Wel lineaire relatie: Maar residuen zijn afhankelijk van X: Lineaire relatie? Erg afhankelijk van uitschieters. Zonder uitschieters geen relatie tussen X en Y
12 Voorwaarden voor regressie lineair verband tussen X en Y y is de afhankelijke variabele residuen moeten: een gemiddelde hebben van 0 normaal verdeeld zijn onafhankelijk zijn van X 3 Voorspellen Nieuwe waarneming X Schatting Ŷ d.m.v. regressie-lijn ˆ Y a bx = + Voorbeeld: : X = 35 km Ŷ = *35 = 9.6 mm 4
13 ˆ Y a bx = + Ŷ cov r = s s X Y = = *0.88 X 5 Kwantificeren sterkte relatie. Covariantie (cov). Correlatie coëffici fficiënt (r) 6 3
14 Bij variabele: Covariantie n s = ( Xi - X)( Xi - X) n -i= Bij variabelen: n cov = ( Xi - X)( Yi - Y) n -i= 7 Covariantie n n cov = ( - )( - ) - X i X Y i Y = n i n- xy = i= Covariantie beschrijft hoe twee variabelen tezamen variëren ren bij grotere X, ook grotere Y cov positief bij grotere X, kleinere Y cov negatief X en Y onafhankelijk 0 8 4
15 Voorbeeld Voorbeeld Neerslag Neerslag (mm) (mm) Afstand Afstand (km) (km) Locatie Locatie X: afstand afstand Y: neerslag neerslag X = 8.5 = 8.5 Y = 39 = 39 s x = 58.9 = 58.9 s y = 0.88 = Covariantie Covariantie Y-Y Y X-X (X (X-X)(Y X)(Y-Y) Y) X Locatie Locatie
16 Covariantie n cov = ( Xi - X)( Yi - Y) n -i= cov = - ( 4+ ( 50.5) ( 7.5) ) = * 668 = spreidingsdiagram: negatieve relatie covariantie: negatief getal 3 Correlatie-co coëfficiënt r cov sxsy = of xy r = of x y correlatie-co coëfficiënt is genormaliseerde covariantie r = : perfect positief lineair verband r = -: perfect negatief lineair verband r = 0 : X en Y lineair onafhankelijk 3 6
17 r = 33 r =
18 r = r =? Y X 36 8
19 cov r = = = sxsy 58.9* b en r b = x xy r = xy x y s b= r s Y X 38 9
20 Y Y Yˆ Y Yˆ = a+ bx ( ˆ ) ( ˆ) Y Y = Y Y + Y Y 39 Variatie ( Y Y) = ( Yˆ Y) + ( Y Yˆ) Σ(...) noemt men variatie (sum of squares) Σ(Y-Y) = totale variatie Σ(Ŷ-Y) = regressie-variatie ( verklaarde ) Σ(Y-Ŷ) = residu-variatie ( onverklaarde ) 40 0
21 Variatie ( Y Y) = ( Yˆ Y) + ( Y Yˆ) totaal = verklaard + onverklaard verklaarde variatie totale variatie ( Yˆ Y) = = r ( Y Y) 4 r (Boek:: 5.) r is coefficient of determination r * 00% = percentage variatie in Y verklaard door de lineaire relatie tussen Y en X (-r )*00% = percentage nog onverklaarde variatie in Y 4
22 r = r = 0.90 Huidig voorbeeld Oftewel,, 90% van de variatie in neerslag wordt verklaard door de lineaire relatie tussen neerslag en afstand 43 Steekproeven a, b, r en Ŷ zijn gebaseerd op steekproeven Net iets andere steekproeven, dus ook net iets andere waardes voor a, b, r en Ŷ Hoe nauwkeurig zijn a, b, r en Ŷ? Wat zeggen a, b, r en Ŷ over de populatie waardes α, β, ρ en μ? 44
23 Inductieve statistiek Wat zeggen a, b, r en Ŷ over de populatie waardes α, β, ρ en μ? Uitrekenen betrouwbaarheidsintervallen voor a, b, r en Ŷ!! 45 Residuele variantie Centraal bij uitrekenen betrouwbaarheids- intervallen staat de residuele variantie: s ˆ Y Y = ( ) n s wordt groter als de relatie tussen X en Y minder sterk wordt s wordt ook wel de schattingsfout genoemd 46 3
24 Residuen - voorbeeld Locatie X Y Ŷ Y- Ŷ ŷ= x ( ) s = = n 3.3 ˆ Y Y s = Betrouwbaarheidsinterval b Blz 380 boek s b t *... b+ t * x α/ α/ s x df = n 48 4
25 Betrouwbaarheidsinterval b Voorbeeld (α = 0.05) SE s b b t t **... b + t * x [ ] SEs x α/ α/ α / S xx S xx * * = Betrouwbaarheidsinterval b Belangrijkste gebruik van dit interval: Omvat het berekende interval 0? Ja?? Dan is de relatie tussen X en Y niet statistisch significant bij de gekozen α Waarom? 50 5
26 Betrouwbaarheidsinterval a α = 0.05 a t s + a+ t s + n x n x x α/ * *... α/ * * x *3.64* *3.64* + = [ ] 5 Betrouwbaarheidsinterval Ŷ 5 6
27 Betrouwbaarheidsinterval Ŷ Blz 385 boek ˆ /* * ( X Y t s X)... Yˆ t ( ) /* s* X X α + + α + n n x x df = n 53 Betrouwbaarheidsinterval Ŷ Voorbeeld: : X = 35, α = 0.05, ŷ = 9.6 ˆ /* * ( X Y t s X)... Yˆ t ( ) /* s* X X α + + α + n n x x (35 8.5) (35 8.5) 9.6.3*3.64* *3.64* + = [ ] 54 7
28 Betrouwbaarheidsinterval Ŷ ˆ /* * ( X Y t s X)... Yˆ t ( ) /* s* X X α + + α + n n x x Breedte van interval hangt af van X Hoe dichter bij het gemiddelde van X zit, hoe smaller het interval 55 bovengrens regressie-lijn ondergrens 56 8
29 Betrouwbaarheidsinterval Probleem: r ligt altijd tussen - en Betrouwbaarheidsinterval moet dat ook... Methode: Figuur 5.4 uit boek, blz Betrouwbaarheidsinterval r Belangrijkste gebruik van dit interval: Omvat het berekende interval 0? Ja?? Dan is de relatie tussen X en Y niet statistisch significant bij de gekozen α Waarom? 58 9
30 Boek: : r = 0.6; n = 0 Grens : 0.87 Grens : < ρ < 0.87 Asymmetrisch!! Interval omvat 0: niet significant 59 Betrouwbaarheidsinterval [ondergrens < ρ < bovengrens] Dus: als betrouwbaarheidsinterval 0 omvat,, is relatie statistisch niet significant bij α =
31 Grens : Grens : < ρ < interval omvat 0 niet, relatie statistisch significant bij α = Significant of niet? Er zijn dus manieren om uit te rekenen of relatie tussen X en Y statistisch significant is: betrouwbaarheidsinterval voor b betrouwbaarheidsinterval voor r Omvat interval 0, dan niet significant Uitkomst van beide methoden altijd hetzelfde! 6 3
b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte
Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte
Nadere informatiewerkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek
cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»
Nadere informatieHoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.
Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26 Regressielijn Vraag : vind het
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieFormuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i
Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de
Nadere informatieToegepaste Statistiek, Dag 7 1
Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek 1 Doel Beheersen van elementaire statistische technieken Toepassen van deze technieken op aardwetenschappelijke data 2 1 Leerstof Boek: : Introductory Statistics, door
Nadere informatieStatistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3
Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regreie - Leary: Hoofdtuk 8 t/m p. 65 - MM&C: Hoofdtuk 0 - Aanvullende tekt 3 (alinea ) Jolien Pa ECO 0-03 Correlatie: Hoe en Waarom? Een correlatie bechrijft niet HOE en
Nadere informatieStatistiek voor A.I. College 2. Donderdag 13 September 2012
Statistiek voor A.I. College 2 Donderdag 13 September 2012 1 / 42 1 Beschrijvende statistiek 2 / 42 Extrapolatie 3 / 42 Verkiezingen 2012 4 / 42 Verkiezingen 2012 5 / 42 1 Beschrijvende statistiek Vandaag:
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 9 Dinsdag 18 Oktober 1 / 1 2 Statistiek Vandaag: Centrale Limietstelling Correlatie Regressie 2 / 1 Centrale Limietstelling 3 / 1 Centrale Limietstelling St. (Centrale
Nadere informatieHoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1
Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch
Nadere informatiemlw stroom 2.1: Statistisch modelleren
mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 16 Donderdag 4 November 1 / 25 2 Statistiek Indeling: Schatten Correlatie 2 / 25 Schatten 3 / 25 Schatters: maximum likelihood schatters Def. Zij Ω de verzameling van
Nadere informatieCollege 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit
College 7 Regressie-analyse en Variantie verklaren Inleiding M&T 2012 2013 Hemmo Smit Neem mee naar tentamen Geslepen potlood + gum Collegekaart (alternatief: rijbewijs, ID-kaart, paspoort) (Grafische)
Nadere informatieHOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatieJe kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen
Lesbrief: Correlatie en Regressie Leerlingmateriaal Je leert nu: -een correlatiecoëfficient gebruiken als maat voor het statistische verband tussen beide variabelen -een regressielijn te tekenen die een
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatieTentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven
Nadere informatieExamen G0N34 Statistiek
Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatieb. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.
Opdracht 12a ------------ enkelvoudige lineaire regressie Kan de leeftijd waarop een kind begint te spreken voorspellen hoe zijn score zal zijn bij een latere test op verstandelijke vermogens? Een studie
Nadere informatieCollege 3 Meervoudige Lineaire Regressie
College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieHoofdstuk 8: Multipele regressie Vragen
Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted
Nadere informatieSpreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient
Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen
Nadere informatieG0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing
G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag
Nadere informatieFeedback examen Statistiek II Juni 2011
Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven
Nadere informatieMasterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA
Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable
Nadere informatieHoofdstuk 2: Verbanden
Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze
Nadere informatieInhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28
Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische
Nadere informatie1. Reductie van error variantie en dus verhogen van power op F-test
Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De
Nadere informatieOpgave 1: (zowel 2DM40 als 2S390)
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieExamen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008
Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatie(slope in het Engels) en het snijpunt met de y-as, b 0
8. Regressie Een introductie Al vaak is genoemd dat statistische modellen allemaal neerkomen op uitkomst = model + error. Dit model kun je ook gebruiken om de uitkomst te voorspellen, met een correlatie
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieHoofdstuk 19. Voorspellende analyse bij marktonderzoek
Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden
Nadere informatieStatistiek voor A.I.
Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het
Nadere informatieRobuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid
Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 6 mei 2010 1 1 Introductie De Energiekamer
Nadere informatieRobuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid
Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De
Nadere informatieOplossingen hoofdstuk XI
Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij
Nadere informatieTentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4) woensdag 27 oktober 2, 9.-2. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven
Nadere informatieOpgaven hoofdstuk 12 Enkelvoudige lineaire regressie
Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie 12.1 Teken voor elk van de volgende gevallen de lijn die door de gegeven punten gaat. a. (1,1) en (5,5). b. (0,3) en (3,0) c. ( 1,1) en (4,2) d. ( 6,
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatieSPSS. Statistiek : SPSS
SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik
Nadere informatieFaculteit der Wiskunde en Informatica
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4), op woensdag 7 januari 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven
Nadere informatie8. Analyseren van samenhang tussen categorische variabelen
8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen
Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen
Nadere informatieTentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd
Nadere informatieStatistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018
Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht
Nadere informatieHOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.
Nadere informatieSterrenkunde Praktikum 1 Fouten en fitten
Sterrenkunde Praktikum 1 Fouten en fitten Paul van der Werf 12 februari 2008 1 Inleiding In de sterrenkunde werken we vaak met zwakke signalen, of met grote hoeveelheden metingen van verschillende nauwkeurigheid.
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie
Nadere informatie(c) Bepaal de kans dat de linker bedelaar van 10 voorbijgangers in totaal exact 420 ct ontvangt.
Tentamen Statistiek van Proefopzetten wi244st 4 juni 2007, 4.00 7.00 uur Toelichting. Een antwoord alleen is niet voldoende: er dient een motivatie, toelichting of berekening aanwezig te zijn. Gebruik,
Nadere informatieStatistiek voor A.I. College 12. Dinsdag 23 Oktober
Statistiek voor A.I. College 12 Dinsdag 23 Oktober 1 / 20 2 Deductieve statistiek Orthodoxe statistiek 2 / 20 3 / 20 Jullie - onderzoek Wivine Tijd waarop je opstaat (uu:mm wordt weergeven als uumm). Histogram
Nadere informatieRegression Analysis for Interval-Valued Data
Regression Analysis for Interval-Valued Data Mousa Negash 431898 July 8, 2018 Abstract In dit paper worden verschillende regressiemethoden uitgevoerd op symbolische data om vervolgens te oordelen welke
Nadere informatieBij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:
13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke
Nadere informatieInleidende begrippen over foutentheorie
Hoofdstuk 1 Inleidende begrippen over foutentheorie Doelstellingen 1. leren omgaan met fouten op een meting 2. kennis van statistische basisbegrippen 3. meetgegevens verwerken en interpreteren (in Excell)
Nadere informatieMeetkunde en Lineaire Algebra
Hoofdstuk 1 Meetkunde en Lineaire Algebra Vraag 1.1 Zij p en q twee veeltermfuncties met reële coëfficiënten en A een reële vierkante matrix. Dan is p(a) diagonaliseerbaar over R als en slechts dan als
Nadere informatieStatistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef
Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en
Nadere informatieCollege 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit
College 6 Samenhang tussen variabelen Inleiding M&T 2012 2013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap 2. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek
Nadere informatieAanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling
Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl
Nadere informatieHoofdstuk 3 Statistiek: het toetsen
Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.
Nadere informatieMeetkunde en Lineaire Algebra
Hoofdstuk 1 Meetkunde en Lineaire Algebra Vraag 1.1 Zij p en q twee veeltermfuncties met reële coëfficiënten en A een reële vierkante matrix. Dan is p(a) diagonaliseerbaar over R als en slechts dan als
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4 en 2S39) op maandag 2--27, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieStatistiek II. Sessie 5. Feedback Deel 5
Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :
Nadere informatieBerekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt
A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:
Nadere informatieCursus Statistiek Hoofdstuk 4. Statistiek voor Informatica Hoofdstuk 4: Verwachtingen. Definitie (Verwachting van discrete stochast) Voorbeeld (1)
Cursus Statistiek Hoofdstuk 4 Statistiek voor Informatica Hoofdstuk 4: Verwachtingen Cursusjaar 29 Peter de Waal Departement Informatica Inhoud Verwachtingen Variantie Momenten en Momentengenererende functie
Nadere informatieKansverdelingen Inductieve statistiek met Geogebra 4.2
Kansverdelingen Inductieve statistiek met Geogebra 4.2 Brecht Dekeyser Pedic 20 november 2013 Gent 1 Inhoud Nieuw in Geogebra 4.2 Kansverdelingen: Berekeningen en grafische voorstellingen Manueel in rekenblad
Nadere informatieClassification - Prediction
Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training
Nadere informatieKlantonderzoek: statistiek!
Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van
Nadere informatieTentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.
Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.
Nadere informatieStatistiek. Beschrijvende Statistiek Hoofdstuk 1 1.1, 1.2, 1.5, 1.6 lezen 1.3, 1.4 Les 1 Hoofdstuk 2 2.1, 2.3, 2.5 Les 2
INHOUDSOPGAVE Leswijzer...3 Beschrijvende Statistiek...3 Kansberekening...3 Inductieve statistiek, inferentiele statistiek...3 Hoofdstuk...3. Drie deelgebieden...3. Frequentieverdeling....3. Frequentieverdeling....4.5
Nadere informatieDeze week: Steekproefverdelingen. Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen. Kwaliteit van schatter. Overzicht Schatten
Deze week: Steekproefverdelingen Statistiek voor Informatica Hoofdstuk 7: Steekproefverdelingen Cursusjaar 29 Peter de Waal Zuivere Schatters Betrouwbaarheidsintervallen Departement Informatica Hfdstk
Nadere informatieHoofdstuk 6 Twee populaties: parametrische toetsen
Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.
Nadere informatieParagraaf 10.1 : Populatie en Steekproef
Hoofdstuk 10 Statistische Variabelen (H5 Wis A) Pagina 1 van 8 Paragraaf 10.1 : Populatie en Steekproef Les 1 : Herhaling Definitie Betrouwbaarheidsinterval (BI) Betrouwbaarheidsinterval (BI) = { de waarden
Nadere informatieCursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015
Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%
Nadere informatieWiskunde B - Tentamen 2
Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2S390) op maandag 19-11-2001, 14.00-17.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieMethoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2
Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte
Nadere informatie4 Domein STATISTIEK - versie 1.2
USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum
Nadere informatieEnkelvoudige lineaire regressie
Enkelvoudige lineaire regressie Inleiding Dit hoofdstuk sluit aan op hoofdstuk I-9 van het statistiekboek. Er wordt hier steeds gesproken over het verband tussen één afhankelijke variabele Y en één onafhankelijke
Nadere informatieDEEL 1 Probleemstelling 1
DEEL 1 Probleemstelling 1 Hoofdstuk 1 Van Probleem naar Analyse 1.1 Notatie 4 1.1.1 Types variabelen 4 1.1.2 Types samenhang 5 1.2 Sociaalwetenschappelijke probleemstellingen en hun basisformat 6 1.2.1
Nadere informatieKengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607
1. Om na te gaan of de gemiddelde bijdrage dezelfde is voor ziekenkas A en voor ziekenkas B heeft men op een toevallige wijze 30 personen geselecteerd waarvan 15 aangesloten zijn bij ziekenkas A en 15
Nadere informatiec Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6
c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere
Nadere informatieToegepaste biostatistiek
Toegepaste biostatistiek 1 e master biomedische wetenschappen 1 Hoofdstuk 11: regressie en correlatie methoden Lineaire regressie: hier ga je willen onderzoeken hoe normaal verdeelde uitkomsten gerelateerd
Nadere informatieBETROUWBAARHEIDSINTERVALLEN VANUIT VERSCHILLENDE HOEKEN BELICHT. S.A.R. Bus
BETROUWBAARHEIDSINTERVALLEN VANUIT VERSCHILLENDE HOEKEN BELICHT S.A.R. Bus WAAR DENK JE AAN BIJ BETROUWBAARHEIDSINTERVALLEN? Wie van jullie gebruikt betrouwbaarheidsintervallen? WAAROM BETROUWBAARHEIDSINTERVALLEN???
Nadere informatieReconstructie Bedrijfsstatistiek 2016
Reconstructie Bedrijfsstatistiek 2016 Open vragen Vraag 1 1. Bewijs dat σ^² een onvertekende schatter is voor σ²=σi 1/n * Xi² 2. Bereken de variantie van o^² 3. Is de schatter consistent? 4. Teken chi-kwadraat
Nadere informatieLes 1: Waarschijnlijkheidrekening
Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het
Nadere informatieSheets K&S voor INF HC 10: Hoofdstuk 12
Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12) Betrouwbaarheidsintervallen (H11) en toetsen (H12)
Nadere informatieTentamen Kansrekening en Statistiek MST 14 januari 2016, uur
Tentamen Kansrekening en Statistiek MST 14 januari 2016, 14.00 17.00 uur Het tentamen bestaat uit 15 meerkeuzevragen 2 open vragen. Een formuleblad wordt uitgedeeld. Normering: 0.4 punt per MC antwoord
Nadere informatie