College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Vergelijkbare documenten
College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

College 4 Inspecteren van Data: Verdelingen

Hoofdstuk 2: Verbanden

Experimenteel en Correlationeel Onderzoek

Experimenteel en Correlationeel Onderzoek (ECO)

HOOFDSTUK 2: VERBANDEN

9. Lineaire Regressie en Correlatie

College 3 Interne consistentie; Beschrijvend onderzoek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

College 1 Grondprincipes van de Wetenschap

Data analyse Inleiding statistiek

College Week 4 Inspecteren van Data: Verdelingen

1. Reductie van error variantie en dus verhogen van power op F-test

Kansrekening en Statistiek

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

College Week 1 Grondprincipes van de Wetenschap

11. Multipele Regressie en Correlatie

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS

Statistiek voor A.I. College 2. Donderdag 13 September 2012

Experimenteel Onderzoek en Experimentele Controle

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Hoofdstuk 8: Multipele regressie Vragen

Kansrekening en Statistiek

DEEL 1 Probleemstelling 1

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

College 2 Enkelvoudige Lineaire Regressie

Hoofdstuk 10: Regressie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Examen Statistiek I Feedback

LES 2: Data-cleaning en -transformatie 1. Frequentietabel

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

College 3 Meervoudige Lineaire Regressie

Verband tussen twee variabelen

mlw stroom 2.1: Statistisch modelleren

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

SPSS. Statistiek : SPSS

Oplossingen hoofdstuk XI

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

G0N11C Statistiek & data-analyse Project tweede zittijd

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Toegepaste Statistiek, Dag 7 1

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

(slope in het Engels) en het snijpunt met de y-as, b 0

Statistiek Voor studenten Bouwkunde College 2

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

D) Alle drie de variabelen kunnen zowel afhankelijke als onafhankelijke variabelen zijn.

Tentamen Biostatistiek 3 / Biomedische wiskunde

Eerst wordt ingegaan op de verschillende soorten data die we kunnen verzamelen en hoe datasets georganiseerd zijn.

Classification - Prediction

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Meten en experimenteren

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

College 2 Observeren en Meten

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens

6 De relatie tussen de intentie tot exploratie, binding en delinquent gedrag

Meten en experimenteren

TECHNISCHE HANDLEIDING IQ TEST

Vaardigheden IV Delphine De smet 3 theorielessen 2 practica in groepen per 40, oefenen in SPSS

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Toegepaste data-analyse: oefensessie 2

College 1: Introductie van onderzoek

Hertentamen Biostatistiek 3 / Biomedische wiskunde

INHOUDS- OPGAVE. Voorwoord 19. Voorwoord bij de nieuwe druk 20. Inleiding 23

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Enkelvoudige lineaire regressie

toetskeuze schema verschillen in gemiddelden

1. Statistiek gebruiken 1

Statistiek II. Sessie 4. Feedback Deel 4

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

DATA-ANALYSEPLAN (20/6/2005)

Toegepaste data-analyse: sessie 3

20. Multilevel lineaire modellen

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

Voorbeeldtentamen Statistiek voor Psychologie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

PROEFEXAMEN SOCIALE STATISTIEK November 2009 REEKS 1

Statistische methoden en technieken tentamen

4a Sterke positieve correlatie. 4b Zwakke positieve correlatie. 4c Sterke negatieve correlatie.

Feedback proefexamen Statistiek I

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

HOVO statistiek November

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

Cursus Inleidende Statistiek

STATISTIEK I Samenvatting

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Statistiek II. Sessie 5. Feedback Deel 5

4 Domein STATISTIEK - versie 1.2

Hoofdstuk 5: Steekproevendistributies

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Transcriptie:

College 6 Samenhang tussen variabelen Inleiding M&T 2012 2013 Hemmo Smit

Overzicht van deze cursus 1. Grondprincipes van de wetenschap 2. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek 4. Inspecteren van data; Verdelingen 5. Normaalverdeling en z-scores 6. Samenhang tussen variabelen 7. Regressie-analyse en Variantie verklaren

Overzicht van dit college Wat is samenhang? Scatterplot: grafische weergave Covariantie: maat voor samenhang (1) Pearson Correlatie: maat voor samenhang (2) Stof: Leary: Hoofdstuk 7 Moore, McCabe & Craig: Hoofdstuk 2 ( 2.1 2.2) Werkboek: Aanvullende tekst 6

Verband tussen twee variabelen 1. Samenhang (associatie, interdependence). Beide variabelen hebben dezelfde rol en hangen wellicht van een (onbekende) derde af. 2. Afhankelijkheid (dependence) - Voorspelling - Causaliteit - Onafhankelijke (explanatory) variabele X bepaalt afhankelijke (response) variabele Y.

Wat is nodig voor vaststellen samenhang? Twee variabelen geobserveerd bij dezelfde n cases. Meetniveau variabelen: - kwantitatief + kwantitatief (bijv. lengte + gewicht) - categorisch + kwantitatief (bijv. sekse + depressiviteit) - categorisch + categorisch (bijv. oogkleur + haarkleur) Twee variabelen V1 en V2 zijn geassocieerd als bepaalde waarden van V1 vaker optreden met sommige waarden van V2 dan met andere waarden.

Overzicht van dit college Wat is samenhang? Scatterplot: grafische weergave Covariantie: maat voor samenhang (1) Pearson Correlatie: maat voor samenhang (2)

Scatterplot (puntenwolk)

Beoordelen scatterplot Algemeen patroon 1) Richting 2) Sterkte 3) Vorm - homogeen / heterogeen - lineair / niet-lineair Opvallende afwijkingen - uitbijters (outliers)

Scatterplot: Richting (1) Positief: hoge scores op variabele X gaan meestal samen met hoge scores op variabele Y. En lage met lage. (NB. Hoge scores: positieve afwijking van gemiddelde). Negatief: hoge scores op variabele X gaan meestal samen met lage scores op variabele Y. En lage met hoge.

Scatterplot: Richting (2) 160 140 120 (-)(+) (+)(+) 100 80 IQ, gem = 100 60 40 20 30 (-)(-) 40 50 60 (+)(-) 70 80 90 Verbaal Vermogen, gem = 50

Scatterplot: Richting (3)

Scatterplot: Sterkte Hoe meer de punten op één (rechte) lijn liggen, hoe sterker het verband.

Scatterplot: Vorm Lineair verband: De punten volgen ongeveer een rechte lijn. 100 Niet-linear verband: De punten volgen totaal geen rechte lijn. 90 80 70 60 50 40 30 20 Math 10 0 0 20 40 60 80 100 Anxiety

Scatterplot: Uitbijters (1) Uitbijters (outliers) zijn punten die duidelijk afwijken van het algemene patroon. - Uitbijters kunnen sterkte verband beïnvloeden. - Plot data ook zonder de uitbijter(s). - Probeer uitbijter(s) te verklaren. LET OP! Uitbijters niet zomaar uit de dataset verwijderen.

Scatterplot: Uitbijters (2) correlation coeff 0.890841 correlation coeff 0.348046 correlation coeff 0.348046 Data + uitbijter Data uitbijter (1) Data uitbijter (2)

Samenhang met categorische variabele (1)

Samenhang met categorische variabele (2)

Overzicht van dit college Wat is samenhang? Scatterplot: grafische weergave Covariantie: maat voor samenhang (1) Pearson Correlatie: maat voor samenhang (2)

Covariantie: maat voor sterkte samenhang Variëren de twee variabelen op een systematische manier samen? Bijv. laag/laag en hoog/hoog OF laag/hoog en hoog/laag

Variantie (week 1) 11 10 9 8 7 s 2 y ( = n y i 1 y) 2 mental age 6 5 0.0 1.0 2.0 3.0 4.0 KLAS

( y y) ) Van Variantie naar Covariantie Variantie niet geschikt voor bivariate data (2 variabelen). Covariantie voegt de variantie van beide variabelen: s 2 x 2 ( x ) i x 2 = en sy = n 1 ( y i n 1 Samen in één formule voor de covariantie: s xy ( )( = xi x y n 1 i y) y) 2 Kruisproduct

Covariantie in beeld

Rekenvoorbeeld covariantie (1) Onderzoeksvraag: Gewichtstoename Groeimiddel Leidt het gebruik van een groeimiddel tot gewichtstoename bij te vroeg geboren baby s? Verwachting: Meer groeimiddel meer gewichtstoename

Rekenvoorbeeld covariantie (3) xi y ( x i x) ( y i y) ( xi x)( yi y) i 0 1.0-3 -1.857 5.571 1 1.2-2 -1.657 3.314 2 2.0-1 -0.857 0.857 3 2.4 0-0.457 0.0 4 3.4 1 0.543 0.543 5 4.9 2 2.043 4.086 6 5.1 3 2.243 6.729 21.1 x y = = 3 2.857 s s x y = 2.16 = 1.67

( y y) ) Rekenvoorbeeld covariantie (4) s xy ( = x i x)( y n 1 i y) s xy = 21.1 (7 1) = 3.517 Tip :Vergelijk s xy met het product van s x en s y, want - (s x s y ) < s xy < s x s y

Overzicht van dit college Wat is samenhang? Scatterplot: grafische weergave Covariantie: maat voor samenhang (1) Pearson Correlatie: maat voor samenhang (2)

Pearon Product-Moment Correlatie (r): Maat voor lineaire samenhang Samenhang tussen twee variabelen Intervalniveau Correlatie ligt tussen -1.00 en +1.00 Geen onderscheid in afhankelijke en onafhankelijke variabele Gestandaardiseerd (verandert niet als meeteenheid verandert) Alleen voor lineaire verbanden Gevoelig voor uitbijters (niet robuust)

( y y) ) 2 Formules voor de Pearson r 1) r xy = 1 xi x yi y n s 1 x s y n 1 42431 4243 z x z y z x z 1 y 2) r xy = s s x xy s y

( y y) Pearson r schatten (1) r = 0.0 r = +1.0

( y y) Pearson r schatten (2) r = -0.3 r = +0.7 r = -0.9 r = +0.5 r = +0.7

Let op! Niet-lineair verband correlation coeff 0.482028 Aantal fouten Temperatuur

Let op! Uitbijters en heterogene groepen correlation coeff 0.425135 Gewicht hersenen Zoogdieren Dinosaurussen Lichaamsgewicht

Criteria voor Causaliteit 1) Variabelen moeten covariëren / correleren 2) Directionality: oorzaak gaat gevolg vooraf (in de tijd) 3) Alternatieve verklaringen zijn uitgesloten

Knoop in je oren Correlatie Causatie

Overzicht van dit college Scatterplots verduidelijken relatie tussen twee variabelen kijk naar: vorm, richting, sterkte, en uitbijters Correlatie meet/geeft richting en sterkte van een lineair verband Beschrijving is geen verklaring: Correlatie Causatie

Volgende week Regressieanalyse en Variantie Verklaren Stof: Moore, McCabe & Craig H.2 ( 3 4)