Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient



Vergelijkbare documenten
b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

Verband tussen twee variabelen

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen gewest, tetra en freq.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

Grafieken Cirkeldiagram

Data analyse Inleiding statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Enkelvoudige lineaire regressie

Oplossingen hoofdstuk XI

Bij het maken van deze opgave worden de volgende vragen beantwoord:

Opdracht 5a Kruistabellen

SPSS. Statistiek : SPSS

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

Statistiek voor A.I. College 2. Donderdag 13 September 2012

1 Inleiding spss; Aanwijzingen.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Opgave 1: (zowel 2DM40 als 2S390)

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Hoofdstuk 2: Verbanden

9. Lineaire Regressie en Correlatie

Meervoudige lineaire regressie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

11. Multipele Regressie en Correlatie

Hoofdstuk 8: Multipele regressie Vragen

Kansrekening en Statistiek

mlw stroom 2.1: Statistisch modelleren

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Technische uitwerkingen voor het SPSS practicum Inleiding M&T.

Kansrekening en Statistiek

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Akternatieve doorrekenen. 7.2 Tabellen

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 27 oktober 2010, uur

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

feb 2013 Instituut CMI SPSS les 2

Technische uitwerkingen voor het SPSS + R practicum Experimenteel en Correlationeel Onderzoek

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Handleiding Excel. bij. hoofdstuk 18 Cijfers in Orde Wageningse Methode

Faculteit der Wiskunde en Informatica

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

De grafiek van een lineair verband is altijd een rechte lijn.

HOOFDSTUK VII REGRESSIE ANALYSE

Computervaardigheden. Basisvaardigheden Statistiek. Hoofdstuk 3 Grafieken en Rapporten

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Biostatistiek voor BMT (2S390) op maandag ,

Voorbeeld regressie-analyse

HOOFDSTUK 2: VERBANDEN

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

College 2 Enkelvoudige Lineaire Regressie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

Fasen in het onderzoeksproces

Wat gaan we doen? Help! Statistiek! Wat is een lineaire relatie? De rechte-lijn-vergelijking: Y = a + b X. Relatie tussen gewicht en lengte

Informatica 1rste BAC Biologie. Hoofdstuk 3 Grafieken. Universiteit Antwerpen

Disclosure Belangen Spreker

3.0 Voorkennis. Voorbeeld 1: Los op: 6x + 28 = 30 10x.

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

TECHNISCHE UNIVERSITEIT EINDHOVEN

Introductie in R.

Beknopte handleiding SPSS versie van 28

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Formules grafieken en tabellen

De grafiek van een lineair verband is altijd een rechte lijn.

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

Statistiekcursus aan het Gymnasium

Toepassingen met de grafische rekenmachine TI-83/84 (plus)

Statistiek. Met het rekentoestel CASIO Collège fx-92b 2D+ kunnen statistische berekeningen in één of in twee variabelen uitgevoerd worden.

Korte inleiding Excel

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

(slope in het Engels) en het snijpunt met de y-as, b 0

P2 Exponentiële groei

Toegang tot HiSPARC gegevens jsparc bibliotheek Data retrieval 3.1 Downloaden van data

College 3 Meervoudige Lineaire Regressie

Toegepaste Statistiek, Dag 7 1

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Graphmatica. Afstandsmodule Wiskunde 2b Greet Verhelst

Tentamen Biostatistiek 1 voor BMT (2DM40), op woensdag 12 november uur

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

1 vorig = omzet voorgaande jaar. Forward (Criterion: Probability-of-F-to-enter <=,050) 2 bezoek = aantal bezoeken vertegenwoordiger

Data retrieval D.B.R.A. Fokkema. Werkbladen. HiSPARC. 1 Inleiding. 2 Datasets downloaden en bekijken

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

3 Enkelvoudige lineaire regressie

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Transcriptie:

Opdracht 4a ----------- Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen het gebied als herkomst hadden, en hoeveel schepen het gebied als bestemming hadden. Dit leverde de onderstaande gegevens op (Bron:J. Th. Lindblad, Sweden s trade with the Dutch Republic, 1738-1795 (Assen 1982) Hfst. III.1.)). gebied aangekomen schepen vertrokken schepen Denemarken 41 22 Duitsland 7 9 Engeland 67 107 Frankrijk 29 33 Portugal 24 19 Nederland 23 30 Rusland 103 90 Spanje 3 1 a. Maak een spreidingsdiagram van de gegevens. Zorg dat in de grafiek ook de kleinste-kwadraten regressielijn wordt getekend. b. Bepaal de vergelijking van de kleinste-kwadraten regressielijn. c. Stel het aantal aangekomen schepen is gelijk aan 23. Wat is dan volgens de tabel het aantal vertrokken schepen? En wat is volgens de kleinstekwadraten regressielijn het aantal vertrokken schepen? d. Bereken de correlatiecoefficient r tussen de aangekomen schepen en de vertrokken schepen. e. Hoeveel procent van de variantie van het aantal vertrokken schepen wordt verklaard door het aantal aangekomen schepen? Opdracht 4a - berekening ------------------------ a. Het aantal aangekomen schepen is uiteindelijk afhankelijk van het aantal vertrokken schepen, en het aantal vertrokken schepen is uiteindelijk afhankelijk van het aantal aangekomen schepen. De x-as kan het aantal aangekomen schepen aangeven en de y-as het aantal vertrokken schepen, maar net andersom mag ook.

Voor b. en d. gebruiken en berekenen we eerst de volgende gegevens: x sqr(x) y sqr(y) xy 41 1681 22 484 902 7 49 9 81 63 67 4489 107 11450 7169 29 841 33 1089 957 24 576 19 361 456 23 529 30 900 690 103 10610 90 8100 9270 3 9 1 1 3 --------------------------------------------------- 297 18784 311 22465 19510 sum_x : 297 sum_sqr(x) : 18783 sum_y : 311 sum_sqr(y) : 22465 sum_xy : 19510 x_mean = 297 / 8 = 37.125 y_mean = 311 / 8 = 38.875 b. sum_xy - ((sum_x * sumy) / n) b = -------------------------------- sum_sqr(x) - (sqr(sum_x) / n) 19510 - ((297 * 311) / 8) = -------------------------------- 18783 - (sqr(297) / 8) = 1.0267182338 a = y_mean - (b * x_mean)

= 38.875 - (1.0267182338 * 37.125) = 0.75808556925 y_dakje = 0.75808556925 + (1.0267182338 * x) c. Als het aantal aangekomen schepen gelijk is aan 23, is het aantal vertrokken schepen volgens de tabel gelijk aan 30, en volgens de kleinstekwadraten regressie lijn gelijk aan 0.75808556925 + (1.0267182338 * 23) = 24.372604947 d. sum_xy - (n * x_mean * y_mean) r = --------------------------------------------------------------- sqrt((sum_sqr(x)-(n*sqr(x_mean)))*(sum_sqr(y)-(n*sqr(y_mean)))) 19510 - (8 * 37.125 * 38.875) = --------------------------------------------------------------- sqrt((18783-(8 * sqr(37.125))) * (22465 - (8 * sqr(38.875)))) = 0.88777566211 e. Het percentage van de variantie van het aantal vertrokken schepen dat verklaard wordt door het aantal aangekomen schepen is gelijk aan het kwadraat van de correlatie tussen het aantal aangekomen schepen en het aantal vertrokken schepen. sqr(r) = sqr(0.88777566211) = 0.78814562623 = 78.814562623% Opdracht 4a - S-PLUS -------------------- Plaats de gegevens in de tabel. Noem de kolom van aangekomen schepen binnen en de kolom van de vertrokken schepen buiten. a. Kies >Graph >2D Plot. Kies onder Axes Type voor Linear, en onder Plot Type voor Fit - Linear Least Squares (x, y1, y2,...). Klik op >OK. Selecteer onder Data Columns en achter x Columns de variabele binnen, en achter y Columns de variabele buiten. Klik op >OK. In de grafiek wordt de lineaire regressielijn weergegeven door de lineaire lijn. b. Kies >Statistics >Regression >Linear. Selecteer achter Dependent de variabele buiten, en achter Independent de variabele binnen. Klik op >OK. c. In het Report-venster vinden we onder Coefficients een tabel. In deze tabel vinden we in rij binnen kolom Value de waarde voor b, en in rij (Intercept) kolom Value vinden we de waarde voor a. Deze waarden moeten ingevuld worden in de vergelijking y = a + bx. d. Kies >Statistics >Data Summaries >Correlations. Selecteer achter Variables < ALL >. Klik op >OK. In het Report-venster vinden we een tabel met de correlatie tussen binnen en buiten in rij binnen en kolom buiten, of rij buiten en kolom binnen.

e. Opdracht 4a - SPSS ------------------ Plaats de gegevens in de tabel. Noem de kolom van aangekomen schepen binnen en de kolom van de vertrokken schepen buiten. a. Kies nu >Graphs >Scatter. Kies in het window Scatterplot voor Simple. Klik vervolgens op Define. Nu kom je in het window Simple Scatterplot. Verplaats binnen naar XAxis en buiten naar YAxis. Klik nu op >OK. In het output-window verschijnt nu het spreidingsdiagram. Selecteer het diagram door er met de linkermuisknop op te klikken. Kies nu >Edit >SPSS Chart Object >Open. Je komt nu in de SPSS Chart Editor. Kies daar >Chart >Options. Zet onder Fit Line Total aan. Klik op >Fit Options. Klik op >Linear Regression en daarna op >Continue. Klik tenslotte op >OK. Sluit de SPSS Chart Editor af. b. Kies >Statistics >Regression >Linear. Je komt nu in het window Linear Regression. Breng binnen naar independent en buiten naar dependent. Klik op >OK. Kijk nu in het output-window in de tabel Coefficient. In rij BINNEN kolom B vinden we b. In rij (constant) kolom B vinden we a. Deze waarden moeten ingevuld worden in de vergelijking y = a + bx. c. d. Kies >Statistics >Correlate >Bivariate. Je komt dan in het window Bivariate Correlations. Breng binnen en buiten naar rechts onder Variables. Onder Correlation Coefficients moet gekozen zijn voor Pearson. Klik op >OK. In het output-window vind je in de tabel Correlations de correlatie tussen binnen en buiten in rij BINNEN kolom BUITEN, of rij BUITEN kolom BINNEN. e. Opdracht 4a - verslag --------------------- In 1738 werd in de haven van Stockholm voor een aantal landen voor elk land geregistreerd hoeveel schepen het gebied als herkomst hadden, en hoeveel schepen het gebied als bestemming hadden. a. Maak een spreidingsdiagram van de gegevens. Zorg dat in de grafiek ook de kleinste-kwadraten regressielijn wordt getekend.

b. Bepaal de vergelijking van de kleinste-kwadraten regressielijn. y_dakje = 0.75808556925 + (1.0267182338 * x) c. Stel het aantal aangekomen schepen is gelijk aan 23. Wat is dan volgens de tabel het aantal vertrokken schepen? En wat is volgens de kleinstekwadraten regressielijn het aantal vertrokken schepen? Als het aantal aangekomen schepen gelijk is aan 23, is het aantal vertrokken schepen volgens de tabel gelijk aan 30, en volgens de kleinstekwadraten regressie lijn gelijk aan 0.75808556925 + (1.0267182338 * 23) = 24.372604947 d. Bereken de correlatiecoefficient r tussen de aangekomen schepen en de vertrokken schepen. r = 0.88777566211 e. Hoeveel procent van de variantie van het aantal vertrokken schepen wordt verklaard door het aantal aangekomen schepen? Het percentage van de variantie van het aantal vertrokken schepen dat verklaard wordt door het aantal aangekomen schepen is gelijk aan het kwadraat van de correlatie tussen het aantal aangekomen schepen en het aantal vertrokken schepen. sqr(r) = sqr(0.88777566211) = 0.78814562623 = 78.814562623%