Hoofdstuk 8: Multipele regressie Vragen

Vergelijkbare documenten
11. Multipele Regressie en Correlatie

9. Lineaire Regressie en Correlatie

Oplossingen hoofdstuk XI

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

1. Reductie van error variantie en dus verhogen van power op F-test

College 3 Meervoudige Lineaire Regressie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

(slope in het Engels) en het snijpunt met de y-as, b 0

Voorbeeld regressie-analyse

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

mlw stroom 2.1: Statistisch modelleren

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

College 2 Enkelvoudige Lineaire Regressie

Data analyse Inleiding statistiek

Hoofdstuk 2: Verbanden

Strategie en resultaat

Hoofdstuk 12: Eenweg ANOVA

Bijlage 3: Multiple regressie analyse

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Verband tussen twee variabelen

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april uur

Classification - Prediction

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Statistiek II. Sessie 4. Feedback Deel 4

Wat gaan we doen? Help! Statistiek! Wat is een lineaire relatie? De rechte-lijn-vergelijking: Y = a + b X. Relatie tussen gewicht en lengte

Hoofdstuk 10: Regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

11. Meerdere gemiddelden vergelijken, ANOVA

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

4 Domein STATISTIEK - versie 1.2

Examen G0N34 Statistiek

Enkelvoudige lineaire regressie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 10 april uur

* de percentages goed per klas en volgorde van afnemen. sort cases by klas volgorde. split file by klas volgorde. des var=goedboekperc.

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

6 De relatie tussen de intentie tot exploratie, binding en delinquent gedrag

College 2 Enkelvoudige Lineaire Regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Bijlagen. Bijlagen Op hetzelfde spoor 1

2.9 Het adolescentieonderzoek Opgaven 72

TECHNISCHE UNIVERSITEIT EINDHOVEN

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen:

Vragen: 1 Is de relatie tussen X en Y significant (bij alpha = 0,05)?

HOOFDSTUK VII REGRESSIE ANALYSE

Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur

HOOFDSTUK 2: VERBANDEN

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

SPSS. Statistiek : SPSS

Meervoudige lineaire regressie

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Tentamen Biostatistiek 2 voor BMT (2DM50), op maandag 2 juli uur

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

De relatie tussen de groente- en fruitconsumptie en sociaal economische status bij zwangere vrouwen. Nanda Gost en Manon Ritico Referaat, 7 juni 2013

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Statistiek II. Sessie 6. Feedback Deel 6

Oriëntatie Econometrie Tijdreeksmodellen en Voorspellen. Marius Ooms. 23 April 2002, Amsterdam

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

Vragen oefententamen Psychometrie

Gezinsinkomen en kansenongelijkheid Cijfers bij beschouwend artikel Didactief mei 2018

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

20. Multilevel lineaire modellen

Aantrekkelijkheid van de Nederlandse binnensteden. Patty Roosen

Toegepaste data-analyse: sessie 3

Les 5: Analysis of variance

Toegepaste biostatistiek

Tentamen Biostatistiek 3 / Biomedische wiskunde

Disclosure Belangen Spreker

Toegepaste Statistiek, Dag 7 1

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Algemeen lineair model

LDL-Cholesterol: Gemeten versus Berekende waarde

Wiskunde B - Tentamen 2

Mediatie-analyse College 4+ Cursus PMC Statistiek Plus. Harry Ganzeboom 1 maart 2019

Hoofdstuk 5 Een populatie: parametrische toetsen

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Transcriptie:

Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted R2 van 0.788 en model 2 van 0.793. Welke model is het betere model op basis van deze waarden? 3. In een model zijn twee partiële correlaties gevonden tot de afhankelijke variabele: rx1y= 0.6, rx2y=0.4. De verklaarde variantie is 60%. Hoeveel variantie wordt verklaard door beide variabelen? 4. Gegeven is de volgende SPSS tabel: Unstandardized coefficients Standardized coefficients B Std. Error Beta (Constant) X1 X2-18.534 7.890-3.980 0.673-0.380 Wat is de gestandaardiseerde vergelijking? 5. Wat is de betekenis van B in de tabel bij de vorige vraag? 6. Welke uitspraak over het evalueren van individuele voorspellers is juist? A. Het evalueren van individuele voorspellers is handig wanneer het model niet beter dan kansniveau voorspelt. B. Om te evalueren kunnen zowel b-gewichten als bèta-gewichten worden gebruikt. C. Bèta-gewichten kunnen beïnvloed worden door de variabiliteit van een variabele, extra voorspellers en meetfouten. D. Het evalueren van bèta-gewichten en structuurcoëfficiënten kan vaak al voldoende zijn. 7. Wat zijn de assumpties voor multipele regressie?

8. In een regressie analyse bij data van 150 personen is het regressiegewicht van X2 niet significant, maar de correlatie is toch hoog: 0.6. Verdere gegevens: correlatie X1 en Y = 0.8, correlatie X1 en X2 = 0.8. Wat kan hiervoor de verklaring zijn? A. Er is sprake van een interactie-effect tussen X1 en X2 B. De data zal waarschijnlijk non-lineair zijn. C. X1 heeft geen unieke bijdrage. D. X2 heeft geen unieke bijdrage. 9. Welke uitspraak over (semi)-partiële correlaties is juist? A. De partiële correlaties geven percentages van de unieke verklaarde variantie van de variabele. B. De gekwadrateerde semi-partiële correlatie van X1 wordt berekend door de unieke verklaarde variantie te delen door de totale variantie van de afhankelijke variabele (zowel verklaard als onverklaard). C. De gekwadrateerde partiële correlatie van X1 geeft het percentage variantie dat voor een deel de afhankelijke variabele verklaart. D. De gekwadrateerde multipele correlatie (R2) is gelijk aan de unieke verklaarde varianties opgeteld. 10. Wat is multicollineariteit? 11.Multicollinariteit zorgt voor een hogere/lagere R 2 waarde en is wel/niet goed wanneer men de interactie tussen variabelen wil begrijpen. A. hogere, wel B. hogere, niet C. lagere, wel D. lagere, niet 12. Wanneer is er sprake van moderatie?

Hoofdstuk 8: Multipele regressie Antwoorden 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? de multipele correlatie heeft altijd een waarde tussen de 0 en 1 en kan dus niet negatief zijn. De pearson correlatie kan van -1 tot 1 lopen. 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted R2 van 0.788 en model 2 van 0.793. Welke model is het betere model op basis van deze waarden? Model 2, want die heeft een hogere R2, wat wijst om meer verklaarde variantie. Adjusted R2 is de multiple R2 plus een straf voor de complexiteit van het model. We zoeken modellen die het beste de data verklaren met het minst aantal verklarende variabele (simpleste model) en dat is wat de adjusted Rˆ2 doet; deze maat heeft een voorkeur voor eenvoudigere modellen. We kiezen hier dus voor model 2 omdat de grotere adjusted Rˆ2 een betere balance representeert tussen de grootte van de variantie van de rest-term en de complexiteit van het model. Extra: De adjusted Rˆ2 wordt gegeven door. AdjustedR2 =1 RSS/(n d 1) TSS/(n 1) Met RSS de residual sum of squares en TSS de total sum of squares (sum of squares van de response variabele) Als het aantal verklarende variabele d toeneemt wordt de breuk groter en de Adjusted R2 kleiner, d is dus de straf die wordt opgelegd voor meer complexe modellen. 3. In een model zijn twee partiële correlaties gevonden tot de afhankelijke variabele: rx1y= 0.6, rx2y=0.4. De verklaarde variantie is 60%. Hoeveel variantie wordt verklaard door beide variabelen? 8 procent 4. Gegeven is de volgende SPSS tabel: (Constant) X1 X2 Unstandardized coefficients Standardized coefficients B Std. Error Beta -18.534 7.890 0.673-3.980-0.380 Wat is de gestandaardiseerde vergelijking? Y= 0.673*X1 0.380*X2 5. Wat is de betekenis van B in de tabel bij de vorige vraag? Als X1 met 1 toeneemt, zal Y met 7.890 toenemen. 6. Welke uitspraak over het evalueren van individuele voorspellers is juist? A. Het evalueren van individuele voorspellers is handig wanneer het model niet beter dan kansniveau voorspelt. B. Om te evalueren kunnen zowel b-gewichten als bèta-gewichten worden gebruikt.

C. Bèta-gewichten kunnen beïnvloed worden door de variabiliteit van een variabele, extra voorspellers en meetfouten. D. Het evalueren van bèta-gewichten en structuurcoëfficiënten kan vaak al voldoende zijn. 7. Wat zijn de assumpties voor multipele regressie? 1. De afhankelijke variabele moet van interval niveau zijn 2. Er is een lineaire relatie tussen de voorspellers en de afhankelijke variabele. 3. De residuen hebben (a) een normale distributie, (b) dezelfde variantie voor alle waarden van de lineaire combinaties van voorspellers en (c) zijn onafhankelijk van elkaar. 8. In een regressie analyse bij data van 150 personen is het regressiegewicht van X2 niet significant, maar de correlatie is toch hoog: 0.6. Verdere gegevens: correlatie X1 en Y = 0.8, correlatie X1 en X2 = 0.8. Wat kan hiervoor de verklaring zijn? A. Er is sprake van een interactie-effect tussen X1 en X2 B. De data zal waarschijnlijk non-lineair zijn. C. X1 heeft geen unieke bijdrage. D. X2 heeft geen unieke bijdrage. 9. Welke uitspraak over (semi)-partiële correlaties is juist? A. De partiële correlaties geven percentages van de unieke verklaarde variantie van de variabele. B. De gekwadrateerde semi-partiële correlatie van X1 wordt berekend door de unieke verklaarde variantie te delen door de totale variantie van de afhankelijke variabele (zowel verklaard als onverklaard). C. De gekwadrateerde partiële correlatie van X1 geeft het percentage variantie dat voor een deel de afhankelijke variabele verklaart. D. De gekwadrateerde multipele correlatie (R2) is gelijk aan de unieke verklaarde varianties opgeteld.

10. Wat is multicollineariteit? Dat houdt in dat twee voorspellende variabelen sterk met elkaar correleren en dus grotendeels hetzelfde meten. 11.Multicollinariteit zorgt voor een hogere/lagere R 2 waarde en is wel/niet goed wanneer men de interactie tussen variabelen wil begrijpen. A. hogere, wel B. hogere, niet C. lagere, wel D. lagere, niet 12. Wanneer is er sprake van moderatie? Als een derde variabele de relatie tussen de afhankelijke en onafhankelijke variabele verandert.