Oplossingen hoofdstuk XI

Vergelijkbare documenten
1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Verband tussen twee variabelen

Voorbeeld regressie-analyse

Bijlage 3: Multiple regressie analyse

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

11. Multipele Regressie en Correlatie

9. Lineaire Regressie en Correlatie

Hoofdstuk 8: Multipele regressie Vragen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

mlw stroom 2.1: Statistisch modelleren

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

College 2 Enkelvoudige Lineaire Regressie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

Meervoudige lineaire regressie

* de percentages goed per klas en volgorde van afnemen. sort cases by klas volgorde. split file by klas volgorde. des var=goedboekperc.

Enkelvoudige lineaire regressie

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Deze opdracht lossen we eenvoudig op door in de vergelijking X1 en X2 te vervangen door de geobserveerde waarden van deze variabelen:

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

SPSS. Statistiek : SPSS

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011

Gezinsinkomen en kansenongelijkheid Cijfers bij beschouwend artikel Didactief mei 2018

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Strategie en resultaat

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

Classification - Prediction

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Oplossingen hoofdstuk 9

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

College 3 Meervoudige Lineaire Regressie

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Opgave 1: (zowel 2DM40 als 2S390)

Faculteit der Wiskunde en Informatica

(slope in het Engels) en het snijpunt met de y-as, b 0

1. Reductie van error variantie en dus verhogen van power op F-test

Data analyse Inleiding statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

Hoofdstuk 10: Regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

Antwoordvel Versie A

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Eindtoets Toegepaste Biostatistiek

STATISTIEK 2 VERSIE A MAT Tentamen Statistiek 2 (MAT-15403) Donderdag 13 maart 2014, uur

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Bijlage bij Meesterlijk gedrag. Leren van compareren., Rechtstreeks 2009/3

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag ,

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

STATISTIEK 2 VERSIE A MAT Tentamen Statistiek 2 (MAT-15403) Maandag 5 augustus 2013, uur

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Examen G0N34 Statistiek

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Hoofdstuk 5 Een populatie: parametrische toetsen

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

TECHNISCHE UNIVERSITEIT EINDHOVEN

Toegepaste data-analyse: oefensessie 2

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

S0A17D: Examen Sociale Statistiek (deel 2)

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

Voorbeeldtentamen Statistiek voor Psychologie

Kansrekening en Statistiek

Exitscore Ready for discharge? Chulja Pek Verpleegkundig Specialist Obstructie Icterus 18 november 2014

Vragen: 1 Is de relatie tussen X en Y significant (bij alpha = 0,05)?

Engelse taal bachelor psychologie UvT

Wat gaan we doen? Help! Statistiek! Wat is een lineaire relatie? De rechte-lijn-vergelijking: Y = a + b X. Relatie tussen gewicht en lengte

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Tabel 2: Stemgedrag van respondenten bij de TK verkiezingen in 2010 VVD xx % PvdA PVV CDA SP D66 CU PvdD SGP GL Te jong om te stemmen Niet gestemd

Minorproduct 2. SPSS en Atlas-Ti eindverslag

Statistiek II. Sessie 6. Feedback Deel 6

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november uur

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

Fasen in het onderzoeksproces

Statistiek voor A.I. College 2. Donderdag 13 September 2012

DE IMPACT VAN (CONSUMENTEN)RACISME OP DE EFFECTIVITEIT VAN BLANKE EN NIET- BLANKE (CELEBRITY) ENDORSERS IN RECLAME

Conclusies analyse op databestand van KEO Huidtherapie jaar 2016

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 1 februari 2008

Transcriptie:

Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij 2 leerlingen. Summary djusted Std. Error of R R Square R Square the Estimate,8 a,7,704 6,78 a. Predictors: (Constant), leestest Regression Residual Total NOV b Sum of Squares df Mean Square F Sig. 249,864 249,864 27,8,000 a 49,80 0 4,980 709,667 a. Predictors: (Constant), leestest b. Dependent Variable: schoolrapport (Constant) leestest Unstandardized a. Dependent Variable: schoolrapport a Standardized B Std. Error Beta t Sig. -,692,87 -,288,779,22,26,8,24,000 Tevens de SD van de beide variabelen : Statistics N Std. Deviation Valid Missing leestest schoolrapport 2 2 0 0 8,649 2,467 Stel de regressielijn op van het model : Y = a + bx. (Y is het schoolrapport en X de test) Y = -,69 +,2X Wat is de concrete betekenis van deze b-waarde?

Deze b-waarde betekent dat wanneer de variabele X met één eenheid toeneemt de variabele Y met een waarde b zal toenemen. Hoeveel bedraagt de Pearson correlatie tussen beide variabelen? Deze bedraagt.86 Welk is de determinatiecoëfficiënt? Deze bedraagt.7. Dat wil zeggen dat 7% van de verschillen in de afhankelijke variabele verklaard kunnen worden door dit model. Hoe groot is de standaardfout van estimatie? Deze bedraagt 6,78. Dit wil zeggen dat indien de uitslag voor het schoolrapport voorspeld zal worden op basis van deze regressielijn, we in tweederde van de gevallen een fout zullen maken die kleiner zal zijn dan 6,78. Kunnen deze resultaten iets zeggen over de betrouwbaarheid, validiteit of ijking van deze leestest? Ze hebben enkel betrekking op de validiteit. Indien we de criteriumuitslag met twee zouden vermenigvuldigen (aldus ontstaat Y2). Wat is daarvan de betekenis voor de nieuwe regressielijn, waarbij we deze Y2 trachten te voorspellen op grond van de testuitslag X? Ofschoon de correlatie tussen X en Y2 dezelfde is als tussen X en Y, zal er een nieuw regressiemodel geformuleerd dienen te worden. Met andere woorden de constante en de regressiecoëfficiënt zullen veranderen. Zal de determinatiecoëfficiënt veranderen? Neen, omdat de correlatie niet zal veranderen ten gevolge van deze lineaire transformatie. En bijgevolg de determinatiecoëfficiënt eveneens niet. Zal de standaardfout van estimatie veranderen? Deze zal wel veranderen. Omdat deze standaardfout recht evenredig is met de standaarddeviatie van de afhankelijke variabele, zal deze standaardfout van estimatie veranderen. De standaarddeviatie van de afhankelijke variabele zal met twee vermenigvuldigd worden. Dus Zal de Pearson correlatie veranderen? Neen. Deze lineaire transformatie heeft geen impact op de correlatie. Zal de bètacoëfficiënt veranderen? Neen, omdat deze bij een enkelvoudige regressie gelijk is aan de correlatie van Pearson.

leesniveautest 2. Een logopediste onderzoekt het verband tussen de scores van een leesvoorwaardentest (X) en het resultaat van een leesniveautest (Y). Van 6 leerlingen werden volgende gegevens verzameld. Leerling Score leesvoorwaarden Score leesniveautest 2 4 6 0 2 2 6 8 6 Kan men zeggen dat er een verband bestaat tussen beide variabelen? Maak hierbij gebruik van SPSS. Interpreteer dit resultaat. Kunnen we op grond van de score voor de leesvoorwaardentest iets voorspellen over de leesniveautest? Hoe goed is deze voorspelling? De scatterplot toont dat er een positief rechtlijnig verband bestaat tussen de beide variabelen. Zie hiervoor de output in de Viewer. 8 7 6 4 0 2 4 leesvoorwaarden De Pearson correlatie bedraagt.9, zoals onderstaande output aantoont.

leesvoorwaarden leesniveautest Correlations Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N **. Correlation is significant at the 0.0 level (2-tailed). leesvoor leesnivea waarden utest,926**,008 6 6,926**,008 6 6 Vanuit dergelijke hoge correlatie is het zinvol een regressielijn te tekenen. Summary djusted Std. Error of R R Square R Square the Estimate,926 a,87,822,694 a. Predictors: (Constant), leesvoorwaarden Regression Residual Total NOV b Sum of Squares df Mean Square F Sig.,74,74 24,08,008 a,926 4,48,00 a. Predictors: (Constant), leesvoorwaarden b. Dependent Variable: leesniveautest (Constant) leesvoorwaarden a. Dependent Variable: leesniveautest a Unstandardized Standardized B Std. Error Beta t Sig.,8,,78,004,926,89,926 4,90,008 We kunnen dus schrijven dat het Y =,8 + 0,9X, waarbij Y het leesniveau is en X het resultaat van de leesvoorwaardentest. Merk op dat deze oefening een louter didactische functie heeft, en dat voor het toepassen van een regressielijn het aantal respondenten in feite te weinig is.

. Een kinderpsycholoog wenst het IQ van kinderen te voorspellen bij een leeftijd van 0 jaar aan de hand van de leeftijd (in maanden) waarop het kind zijn eerste woordjes sprak. Voor een groepje van kinderen vond hij volgende waarden op deze variabelen: Leeftijd eerste woordjes IQ op latere leeftijd 9 26 7 0 8 9 9 02 Bereken de correlatie via SPSS. Eerder hebben we (hoofdstuk IX) aangetoond dat er een negatieve (en rechtlijnige) samenhang bestaat tussen de beide variabelen. De Pearson correlatie bedroeg -.6. We stellen de regressielijn op via PSW. Summary djusted Std. Error of R R Square R Square the Estimate,60 a,4,08,90 a. Predictors: (Constant), leeftijdwoordjes Regression Residual Total NOV b Sum of Squares df Mean Square F Sig. 78,022 78,022,72,26 a 89,78 29,726 67,200 4 a. Predictors: (Constant), leeftijdwoordjes b. Dependent Variable: IQ

a (Constant) leeftijdwoordjes a. Dependent Variable: IQ Unstandardized Standardized B Std. Error Beta t Sig. 0,2,60 7,6,00 -,989,844 -,60 -,7,26 Op grond van deze output kunnen we schrijven dat het IQ gelijk is aan 0,24 verminderd met 0,99 keer de leeftijd in maanden waarop het kind de eerste woordjes kon spreken. Y = 0,24 0,99*X. Let op in deze output staat dat de correlatie gelijk is aan.6, maar omdat de b waarde negatief is weten we dat deze correlatie negatief moet zijn. Dat bleek ook eerder bij de berekening van de Pearson correlatie. Indien we een regressielijn zouden maken hoe groot is dan de standaardfout van estimatie? De standaardfout van estimatie is gelijk aan,9. Dat wil zeggen dat indien we het IQ van een kind willen voorspellen op grond van de leeftijd dat het kind kan spreken we in tweederde van de gevallen een fout zullen maken die kleiner is dan,9. Hoe groot is de determinatiecoëfficiënt? Deze is.. Dat wil zeggen dat we % van de verschillen van de IQ s van kinderen kunnen verklaren op grond van de leeftijd in maanden waarop het kind de eerste woordjes kon zeggen. Ook kunnen we stellen dat 69% van deze verschillen in IQ niet verklaard worden door dit model. Indien een kind op 8 maand de eerste woordjes zou spreken, welk IQ verwacht je dan? We zouden hierbij de volgende regressielijn kunnen invullen. IQ = 0,24 0,99*8 = 9,2. Maar aangezien het model van deze regressieanalyse niet significant is, kunnen we in feite geen uitspraken doen over het IQ van een kind dat de eerste woordjes zegt op 8 maanden. 4. De fouten in het dictee. Ofschoon de correlatie tussen beide variabelen niet erg hoog is en het aantal respondenten eerder gering, kunnen we onderzoeken of we een regressielijn kunnen tekenen. We starten in SPSS met nalyze - Regression - Lineair. Let hierbij op in het volgende keuzemenu dat fouten in het dictee de dependent variabele vormt en het aantal boeken de independent. Na dit commando verschijnt volgende output in de Viewer.

In deze output lezen we dat de Pearson correlatie tussen de twee variabelen.6 bedraagt en dat de determinatiecoefficient slechts % is. Dat wil zeggen dat 87% van de verschillen in het aantal fouten in het dictee niet verklaard kan worden door de hoeveelheid boeken dat gelezen wordt. Dit is dus een pover resultaat. In de NOV tabel lezen we dat het model niet significant is. Dat wil zeggen dat de samenhang in de steekproef niet veralgemeend kan worden naar de populatie. Tot slot vinden we in de derde tabel de coefficienten van de regressie. Deze regressie zouden we kunnen schrijven als: Fouten in dictee =,60-0,0 * aantal boeken. Gezien echter de matige correlatie en het niet significant zijn van het model is het niet toegelaten om deze regressielijn te hanteren om toekomstige resultaten te voorspellen. Dus het is in dit geval niet zinvol om de uitkomst van de regressie te gebruiken.

. Lees het betreffende artikel en ga na of je tot dezelfde uitkomst kunt komen. 6. Bestudeer het artikel en controleer de uitkomsten via SPSS.