Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.
|
|
- Stefan Desmet
- 6 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26
2 Regressielijn Vraag : vind het verband Y = F (X) Werkwijze : steekproef waarbij X ingesteld en Y gemeten wordt Worden (x i,y i ), i =1,, nuitgezet in grafiek, dan zal dit een beeld geven over het functionele verband : lineair, kwadratisch, exponentieel, y = F (x) : regressielijn van Y op X Maar : Y is onderhevig aan meetfouten Y = F (X)+ɛ ɛ : N(0, σ) E[Y X = x] =F (x) Regressie en correlatie p 2/26
3 Regressie : lineair model Y = a + bx x 1 x x 3 x 4 x 2 y = a + bx y Regressie en correlatie p 3/26
4 De best passende kromme Eens de aard (lineair, kwadratisch, ) vanf (x) bepaald is, moet binnen deze klasse van functie de beste oplossing nog gezocht worden principe der kleinste kwadraten : de best passende kromme is de kromme die de som van de kwadraten van de afwijkingen van de waargenomen waarden tov de hypothetische kromme minimaal maakt minimaliseer (y i F (x i )) 2 Regressie en correlatie p 4/26
5 Lineaire regressie : Y = a + bx minimaliseer [y i F (x i )] 2 = [y i (a + bx i )] 2 = S y ŷ na+ b a x x i = x i + b S a =0 S b =0 = x 2 i = y i x i y i 2 2 [y i (a + bx i )] = 0 [y i (a + bx i )] x i =0 a + b x = y a x + b x 2 = xy Regressie en correlatie p 5/26
6 Lineaire regressie : Y = a + bx = minimaliseer [y i F (x i )] 2 = a x + b x 2 = y x a x + b x 2 = xy = a = y b x b = xy x y x 2 x 2 [y i (a + bx i )] 2 b (x 2 x 2 )=xy x y a + b x = y = s xy s xx y = a + bx: lineaire regressielijn b : regressiecoëfficiënt (van Y op X) Regressie en correlatie p 6/26
7 Voorbeeld : voorbeeldsteekproef lineair verband tussen X =gewicht en Y =gestalte voor mannen : regressielijn van Y op X : y = x GESTALTE GEWICHT Regressie en correlatie p 7/26
8 Voorbeeld : voorbeeldsteekproef lineair verband tussen X =gewicht en Y =gestalte voor mannen : regressielijn van Y op X : y = x Wat als de rollen van X en Y worden omgekeerd? Y : ingesteld en X gemeten regressielijn van Y op X : x = y Dit is een andere rechte! Regressie en correlatie p 8/26
9 Lineaire regressie y = a+bx met residu{ regressie{ y a = y b x b = xy x y x 2 x 2 (x, y) = s xy s xx (x i,y i ) (x i, ŷ i ) stel ŷ i = a + bx i y = a + bx x y i ȳ = (y i ŷ i )+(ŷ i ȳ) = residu + regressie Regressie en correlatie p 9/26
10 Lineaire regressie y = a+bx met 1 n (y i ŷ i ) 2 = 1 n = 1 n = 1 n a = y b x b = xy x y x 2 x 2 (y i a bx i ) 2 = 1 n = s xy s xx stel ŷ i = a + bx i (y i y + b x bx i ) 2 [(y i y) b (x i x)] 2 (y i y) 2 2b 1 n (x i x)(y i y)+b 2 1 n (x i x) 2 = s yy 2 bs xy + b 2 s xx = s yy s2 xy s xx s yy Regressie en correlatie p 10/26
11 Lineaire regressie y = a+bx met a = y b x b = xy x y x 2 x 2 (y i ŷ i ) 2 (y i ȳ) 2 = = s xy s xx (y i y) 2 (y i ŷ i ) 2 + (ŷ i ȳ) 2 stel ŷ i = a + bx i Regressie en correlatie p 11/26
12 Componenten van variabiliteit (y i ȳ) 2 = (y i ŷ i ) 2 + (ŷ i ȳ) 2 Som van kwadraten rond het gemiddelde = Som van kwadraten tov de regressielijn + Som van kwadraten te wijten aan regressie y ȳ x y ŷ x y ŷ ȳ x Regressie en correlatie p 12/26
13 Componenten van variabiliteit (y i ȳ) 2 = = = ((y i ŷ i )+(ŷ i ȳ)) 2 (y i ŷ i ) 2 +2 (y i ŷ i ) 2 + (y i ŷ i )(ŷ i ȳ)+ (ŷ i ȳ) 2 (ŷ i ȳ) 2 als (y i ŷ i )(ŷ i ȳ) =0 Regressie en correlatie p 13/26
14 Componenten van variabiliteit (y i ŷ i )(ŷ i ȳ) = (y i ŷ i )(a y + bx i ) =(a y) =(a y) (y i ŷ i )+b x i (y i ŷ i ) (y i a bx i )+b x i (y i a bx i ) =(a y) n (y a b x)+bn(xy a x b x 2 )=0 S want a =0 a + b x = y = S b =0 a x + b x 2 = xy Regressie en correlatie p 14/26
15 a en b De waarden a en b zijn steekproefafhankelijk, dus het zijn op hun beurt steekproefwaarden van veranderlijken A en B We noemen de gevonden waarden â en ˆb en ze stellen schattingen voor van de ware a en de ware b σ A = σ x 2 σ B = σ Y = F (X)+ɛ ɛ : N(0, σ) s x n s x n Betekenis σ : ongeveer 95 % van alle meetpunten liggen hoogstens 2 σ van de regressielijn af σ 2 1 (y i ŷ i ) 2 = n ( ) s 2 y s2 xy n 2 n 2 s 2 x 1 σ 2 (y i ŷ i ) 2 : χ 2 (n 2) Regressie en correlatie p 15/26
16 Toevalsveranderlijken Op A en B kunnen bvb testen uitgevoerd worden H 0 : b = b 0 H 1 : b b 0 Als H 0 waar is, is B b 0 : T (n 2) σ B Voorbeeldsteekproef : gestalte op gewicht voor mannen met b 0 =0: voor α =5%verwerpen we H 0 als t > 198 σ B = σ σ 2 1 (y i ŷ i ) 2 s x n n 2 σ = en s x =856 t = =1076 Dit is een zeer significant resultaat Regressie en correlatie p 16/26
17 Schatten en voorspellen De regressielijn kan gebruikt worden om een gemiddelde waarde E[Y X = x p ] te schatten om een toekomstige meetwaarde y p te voorspellen Regressie en correlatie p 17/26
18 Schatten van E[Y X = x p ] Ware verband y = a + bx y E[Y x = x p ] ŷ p { x p Geschatte verband ŷ =â + ˆbx ŷ p =â + ˆbx p ŷ =â + ˆbx y = a + bx x ŷ p : onvertekende schatter voor E[Y X = x p ] ŷ p :N(E[Y X = x p ],σŷp ) σŷp = σ 2 n [ 1+ (x p x) 2 s 2 x ] E[Y X = x p ] ŷ p σŷp T (n 2) Regressie en correlatie p 18/26
19 Voorspellen van toekomstige waarde y { ɛ { E[Y x = x p ] ŷ p ŷ =â + ˆbx y = a + bx x p x y ŷ =(y E[Y X = x]) + (E[Y X = x] ŷ) E[Y X = x] ŷ : fout in de regressie y E[Y X = x] : random fout ɛ σy ŷ 2 = σy 2 + σŷ 2 = σ 2 + [1+ σ2 (x ] p x) 2 n s 2 x ( = σ [1+ (x ]) p x) 2 n s 2 x Regressie en correlatie p 19/26
20 Schatten en voorspellen Zowel voor het schatten als voor het voorspellen kunnen betrouwbaarheidsintervallen opgesteld worden GESTALTE GEWICHT Regressie en correlatie p 20/26
21 Correlatie Dmv regressie : de best passende rechte Vraag : in hoeverre liggen die punten effectief rond een rechte? Dit wordt uitgedrukt door de correlatiecoëfficiënt r 1 n r = xy x y s x s y (y i ŷ i ) 2 = s yy s2 xy s xx = s yy = s xy s x s y ( ) 1 s2 xy s 2 x s 2 y = s yy (1 r 2 ) 1 r 2 = (y i ŷ i ) 2 (y i y) 2 Regressie en correlatie p 21/26
22 Correlatiecoëfficiënt 1 r 2 = (y i ŷ i ) 2 (y i y) 2 y y 1 r 2 bepaalt het percentage (van de som van de kwadraten van de afwijkingen tov het gemiddelde) dat niet kan verklaard worden door regressie ŷ ȳ x x Regressie en correlatie p 22/26
23 Correlatie r = xy x y s x s y = s xy s x s y 1 r 2 = (y i ŷ i ) 2 0= 1 r 1 (y i y) 2 Liggen alle punten exact op een rechte, dan is y i =ŷ i, zodat 1 r 2 =0 Regressie en correlatie p 23/26
24 Correlatie r drukt uit in hoeverre er een lineair verband is tussen X en Y x r 1 y y y y x r 1 r 0 x r 0 x Regressie en correlatie p 24/26
25 Voorbeeld : voorbeeldsteekproef X =gewicht en Y =gestalte voor mannen : regressielijn van Y op X : y = x GESTALTE GEWICHT r 2 =0323 : slechts 32 % van de deviaties verklaard worden door regressie Regressie en correlatie p 25/26
26 Correlatie r = s xy : correlatiecoëfficiënt (voor steekproeven) s x s y ρ = σ XY : correlatiecoëfficiënt (voor populaties) σ X σ Y r is de waarde van een veranderlijke R R n 2 1 R 2 : T(n 2) De test ρ =0is statistisch volledig equivalent met de test b =0 niet-parametrische test : op basis van Spearman rang coëfficiënt Regressie en correlatie p 26/26
Data analyse Inleiding statistiek
Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen
Nadere informatieHOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Nadere informatieb) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte
Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieWiskunde I - Wiskunde II
- Wiskunde II fundamentele methoden in wiskunde en statistiek Marnix Van Daele Marnix.VanDaele@UGent.be Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Introductiedag scheikunde 2003-2004
Nadere informatieFormuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i
Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de
Nadere informatieHoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent
Hoofdstuk 3 : Numerieke beschrijving van data Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Numerieke beschrijving van data p 1/31 Beschrijvende
Nadere informatieHoofdstuk 5. Toevalsveranderlijken en waarschijnlijkheidsdistributies. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent
Hoofdstuk 5 Toevalsveranderlijken en waarschijnlijkheidsdistributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Toevalsveranderlijken en waarschijnlijkheidsdistributies
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieOpgaven hoofdstuk 12 Enkelvoudige lineaire regressie
Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie 12.1 Teken voor elk van de volgende gevallen de lijn die door de gegeven punten gaat. a. (1,1) en (5,5). b. (0,3) en (3,0) c. ( 1,1) en (4,2) d. ( 6,
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatieExamen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008
Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer
Nadere informatieToegepaste Statistiek, Dag 7 1
Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieStatistiek voor A.I. College 2. Donderdag 13 September 2012
Statistiek voor A.I. College 2 Donderdag 13 September 2012 1 / 42 1 Beschrijvende statistiek 2 / 42 Extrapolatie 3 / 42 Verkiezingen 2012 4 / 42 Verkiezingen 2012 5 / 42 1 Beschrijvende statistiek Vandaag:
Nadere informatiemlw stroom 2.1: Statistisch modelleren
mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 9 Dinsdag 18 Oktober 1 / 1 2 Statistiek Vandaag: Centrale Limietstelling Correlatie Regressie 2 / 1 Centrale Limietstelling 3 / 1 Centrale Limietstelling St. (Centrale
Nadere informatiewerkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek
cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke
Nadere informatieRobuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid
Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De
Nadere informatieHoofdstuk 2 : Grafische beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent
Hoofdstuk 2 : Grafische beschrijving van data Marnix Van Daele Marnix.VanDaele@UGent.be Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Grafische beschrijving van data p. 1/35 Soorten meetwaarden
Nadere informatieInleidende begrippen over foutentheorie
Hoofdstuk 1 Inleidende begrippen over foutentheorie Doelstellingen 1. leren omgaan met fouten op een meting 2. kennis van statistische basisbegrippen 3. meetgegevens verwerken en interpreteren (in Excell)
Nadere informatieHerkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.
Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.
Nadere informatieFeedback examen Statistiek II Juni 2011
Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven
Nadere informatieToegepaste Statistiek, Week 4 1
Toegepaste Statistiek, Week 4 1 Onafhankelijkheid We beschouwen de volgende situatie, met TWEE variabelen: G een toevalsvariabele T een nominale variabele (al of niet toevallig), indeling/conditionering/behandeling/...
Nadere informatieHoofdstuk 2: Verbanden
Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze
Nadere informatieJe kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen
Lesbrief: Correlatie en Regressie Leerlingmateriaal Je leert nu: -een correlatiecoëfficient gebruiken als maat voor het statistische verband tussen beide variabelen -een regressielijn te tekenen die een
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatieDH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009
Naam:... Voornaam:... DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009 Slechts één van de vier alternatieven is juist. Kruis het bolletje aan vóór het juiste antwoord. Indien je een meerkeuzevraag verkeerd
Nadere informatieOriëntatie Econometrie Tijdreeksmodellen en Voorspellen. Marius Ooms. 23 April 2002, Amsterdam
Oriëntatie Econometrie Tijdreeksmodellen en Voorspellen Marius Ooms 23 April 2002, Amsterdam Carlson and Thorne (1997) Multiple Regression Key Ideas: 15.1, 15.2, 15.10, 15.14, 15.17, 15.19, 15.20 Ch. 16.1-16.4:
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 16 Donderdag 4 November 1 / 25 2 Statistiek Indeling: Schatten Correlatie 2 / 25 Schatten 3 / 25 Schatters: maximum likelihood schatters Def. Zij Ω de verzameling van
Nadere informatieRobuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid
Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 6 mei 2010 1 1 Introductie De Energiekamer
Nadere informatieZowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y
1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld
Nadere informatieStatistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3
Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatie1. Reductie van error variantie en dus verhogen van power op F-test
Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De
Nadere informatie1 Gegevens verzamelen 3 Statistische gegevens met één variabele ordenen 4 Opgaven 5
C 2004: Frits Spijkers Deze katern is bedoeld voor het keuzeonderwerp bij wiskunde voor de profielen EM en NG in het VWO. De tekst is gemaakt met Context, een typesetting-systeem van Pragma ADE in Hasselt
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 5 oktober 007 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt
Nadere informatieStatistiek voor A.I.
Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieInhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28
Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 3 oktober 006 Deel I Toevallige veranderlijken Steekproef Beschrijving van gegevens Histogram Gemiddelde en standaarddeviatie
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatieReflecties bij de invoering van TI-Nspire CAS op de Europese Scholen L.A.A. Blomme
Reflecties bij de invoering van TI-Nspire CAS op de Europese Scholen L.A.A. Blomme In 2010 is op de Europese Scholen het nieuwe wiskunde programma gestart. Een van de grote innovaties betreft het invoeren
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal
Nadere informatieInhoudsopgave. Deel I Schatters en toetsen 1
Inhoudsopgave Deel I Schatters en toetsen 1 1 Hetschattenvanpopulatieparameters.................. 3 1.1 Inleiding:schatterversusschatting................. 3 1.2 Hetschattenvaneengemiddelde..................
Nadere informatieToegepaste biostatistiek
Toegepaste biostatistiek 1 e master biomedische wetenschappen 1 Hoofdstuk 11: regressie en correlatie methoden Lineaire regressie: hier ga je willen onderzoeken hoe normaal verdeelde uitkomsten gerelateerd
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd
Nadere informatieFiguur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.
MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,
Nadere informatieKansverdelingen Inductieve statistiek met Geogebra 4.2
Kansverdelingen Inductieve statistiek met Geogebra 4.2 Brecht Dekeyser Pedic 20 november 2013 Gent 1 Inhoud Nieuw in Geogebra 4.2 Kansverdelingen: Berekeningen en grafische voorstellingen Manueel in rekenblad
Nadere informatieTentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven
Nadere informatie1. Statistiek gebruiken 1
Hoofdstuk 0 Inhoudsopgave 1. Statistiek gebruiken 1 2. Gegevens beschrijven 3 2.1 Verschillende soorten gegevens......................................... 3 2.2 Staafdiagrammen en histogrammen....................................
Nadere informatieHOOFDSTUK 2: VERBANDEN
HOOFDSTUK 2: VERBANDEN Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoodfstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze
Nadere informatieSpreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient
Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen
Nadere informatieReconstructie Bedrijfsstatistiek 2016
Reconstructie Bedrijfsstatistiek 2016 Open vragen Vraag 1 1. Bewijs dat σ^² een onvertekende schatter is voor σ²=σi 1/n * Xi² 2. Bereken de variantie van o^² 3. Is de schatter consistent? 4. Teken chi-kwadraat
Nadere informatieHOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.
Nadere informatieHoofdstuk 3 Statistiek: het toetsen
Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.
Nadere informatieHoofdstuk 19. Voorspellende analyse bij marktonderzoek
Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden
Nadere informatieOplossingen hoofdstuk XI
Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij
Nadere informatieMethoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2
Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte
Nadere informatie+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.
STATISTIEK OPLOSSINGEN OEFENZITTINGEN 5 en 6 c D. Keppens 2004 5 1 (a) Zij µ de verwachtingswaarde van X. We moeten aantonen dat E[M i ] = µ voor i = 1, 2, 3 om te kunnen spreken van zuivere schatters.
Nadere informatieSterrenkunde Praktikum 1 Fouten en fitten
Sterrenkunde Praktikum 1 Fouten en fitten Paul van der Werf 12 februari 2008 1 Inleiding In de sterrenkunde werken we vaak met zwakke signalen, of met grote hoeveelheden metingen van verschillende nauwkeurigheid.
Nadere informatieFORMULARIUM: STATISTIEK
FORMULARIUM: STATISTIEK VARIABELE STEEKPROEF x,x,...,x POPULATIE X Dichtheid relatieve frequetie: f j kas met kasregels P(G C ) = P(G) P(G G ) = P(G ) + P(G ) P(G G ) P(G \ G ) = P(G ) P(G ) als G G voorwaardelijke
Nadere informatieSPSS. Statistiek : SPSS
SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik
Nadere informatieDeel I : beschrijvende statistiek
HOOFDSTUK 1 TYPISCHE FOUTEN BIJ STATISTIEK Foute gegevens Fouten in berekening kans Foute interpretatie resultaten Statistiek : de wetenschap van het leren uit data & van het meten, controleren en communiceren
Nadere informatieintroductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter 5: Sampling Distributions 5.1: The
Nadere informatieGebruik van Correlatiecoëfficiënt in onderzoek
Gebruik van Correlatiecoëfficiënt in onderzoek Wim Krijnen Lector Analyse Technieken voor Praktijkonderzoek Lectoraat Healthy Ageing, Allied Health Care and Nursing Hanze University of Applied Sciences
Nadere informatie3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00
3de bach TEW KBM Theorie Q www.quickprinter.be uickprinter Koningstraat 13 2000 Antwerpen 168 6,00 Online samenvattingen kopen via www.quickprintershop.be BOEK 1: ENKELVOUDIGE EN MEERVOUDIGE REGRESSIE
Nadere informatiewerkcollege 6 - D&P9: Estimation Using a Single Sample
cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties
Nadere informatieVeel van weinig. Hoe vinden we diagnostische markers voor kanker op basis van een beperkt aantal genetische profielen?
Veel van weinig Hoe vinden we diagnostische markers voor kanker op basis van een beperkt aantal genetische profielen? Mark van de Wiel mark.vdwiel@vumc.nl Afdeling Epidemiologie & Biostatistiek Afdeling
Nadere informatieLes 1: Waarschijnlijkheidrekening
Les 1: Waarschijnlijkheidrekening A Men neemt een steekproef van 1000 appelen. Deze worden ingedeeld volgens gewicht en volgens symptomen van een bepaalde schimmel: geen, mild, gematigd of ernstig. Het
Nadere informatieHOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES
HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieHoofdstuk 8: Multipele regressie Vragen
Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted
Nadere informatieHoofdstuk 6 Twee populaties: parametrische toetsen
Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek (2S390) op maandag ,
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek (2S390) op maandag 20-11-2000, 14.00-17.00 uur ƒbij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieTentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.
Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.
Nadere informatieCursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015
Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%
Nadere informatieStatistiek. Statistiek in het laboratorium van de ziekenhuisapotheek; deel 1.
Statistiek Statistiek in het laboratorium van de ziekenhuisapotheek; deel 1. M.C. de Brouwer M.C.J. Langen Laboratorium van de ziekenhuisapotheek Midden-Brabant Maria ziekenhuis Dr. Deelenlaan 5 5042 AD
Nadere informatieToetsen van hypothesen
Les 4 Toetsen van hypothesen We hebben tot nu toe enigszins algemeen naar grootheden van populaties gekeken en bediscussieerd hoe we deze grootheden uit steekproeven kunnen schatten. Vaak hebben we echter
Nadere informatie. Dan geldt P(B) = a. 1 4. d. 3 8
Tentamen Statistische methoden 4052STAMEY juli 203, 9:00 2:00 Studienummers: Vult u alstublieft op het meerkeuzevragenformulier uw Delftse studienummer in (tbv automatische verwerking); en op het open
Nadere informatieHoofdstuk 6 Discrete distributies
Hoofdstuk 6 Discrete distributies Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Discrete distributies p 1/33 Discrete distributies binomiale verdeling
Nadere informatieGegevensverwerving en verwerking
Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie
Nadere informatieSheets K&S voor INF HC 10: Hoofdstuk 12
Sheets K&S voor INF HC 1: Hoofdstuk 12 Statistiek Deel 1: Schatten (hfdst. 1) Deel 2: Betrouwbaarheidsintervallen (11) Deel 3: Toetsen van hypothesen (12) Betrouwbaarheidsintervallen (H11) en toetsen (H12)
Nadere informatieStatistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018
Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding Zie syllabus voor details 16 februari 2011 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor
Nadere informatieHoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)
Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen) 8.16. Men wenst H 0 : p 0.2 te testen tegenover H 1 : p 0.4 voor een binomiale distributie met n 10. Bepaal α en β als de testfunctie gegeven
Nadere informatieHOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN
HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN 4. VERGELIJKINGSTOETSEN A. Vergelijken van varianties Men beschouwt twee steekproeven uit normaal verdeelde populaties: X, X,, X n ~ N(µ, σ ) Y, Y,, Y n
Nadere informatieMeten en experimenteren
Meten en experimenteren Statistische verwerking van gegevens Een korte inleiding 6 oktober 009 Catherine De Clercq Statistische verwerking van gegevens Kursus statistiek voor fysici door Jorgen D Hondt
Nadere informatieBETROUWBAARHEIDSINTERVAL REEKS 1
BETROUWBAARHEIDSINTERVAL REEKS 1 Versie 18/07/2019 Let op bij oefeningen 2 en 3! In sommige vakken moet je geen betrouwbaarheidsintervallen kunnen opstellen in situaties waar de populatievariantie (of
Nadere informatieHoofdstuk 7: Statistische gevolgtrekkingen voor distributies
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieStatistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef
Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,
Nadere informatie1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling
Bijlage II Aanvullende analyses 1 Inleiding In aanvulling op de kwantitatieve informatie over de diverse arbeid-en-zorg thema s, is een aantal analyses verricht Aan deze analyses lagen de volgende onderzoeksvragen
Nadere informatiestatviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4
statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................
Nadere informatieFormules uit de cursus Waarschijnlijkheidsrekenen en statistiek
UNIVERSITY OF GHENT Samenvatting Formules uit de cursus Waarschijnlijkheidsrekenen en statistiek Auteur: Nicolas Vanden Bossche Lesgever: Prof. Hans De Meyer Hoofdstuk 1 Het kansbegrip en elementaire kansrekening
Nadere informatieHoofdstuk 2. Aanduiding 1: Aanduiding 2: Formule 1: Formule 2: s2 x = Formule 3: s x = Formule 4: X nieuw = X oud ± a betekent ook
Hoofdstuk 2 Aanduiding 1: X ij Aanduiding 2: Formule 1: Formule 2: s2 x = Formule 3: s x = Formule 4: X nieuw = X oud ± a betekent ook ± a Formule 5: X nieuw = bx oud betekent t X nieuw = X oud/b betekent
Nadere informatie(100 T ) / 75 (1) T = (CZV- BZVoneindig) / CZV x 100 % (2)
Indien de CZV-waarde voor ten minste 25% afkomstig is van biologisch niet of nagenoeg niet afbreekbare stoffen in het afvalwater, wordt op die waarde een correctie toegepast door deze te vermenigvuldigen
Nadere informatieVoorspelling van Boodschappenlijstjes
Voorspelling van Boodschappenlijstjes Petra Tol Stageverslag Voorspelling van Boodschappenlijstjes Petra Tol Stageverslag Universiteit: Vrije Universiteit Amsterdam Faculteit der Exacte Wetenschappen
Nadere informatieTentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u
Technische Universiteit Delft Mekelweg 4 Faculteit Elektrotechniek, Wiskunde en Informatica 2628 CD Delft Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u Formulebladen, rekenmachines,
Nadere informatie