Technische uitwerkingen voor het SPSS practicum Inleiding M&T.

Vergelijkbare documenten

Verband tussen twee variabelen

feb 2013 Instituut CMI SPSS les 2

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Opdracht 5a Kruistabellen

Bij het maken van deze opgave worden de volgende vragen beantwoord:

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

Grafieken Cirkeldiagram

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Gemiddelde, mediaan, kwartielen, interkwartielafstand, minimum, maximum, variantie, standaardafwijking, boxdiagrammen

Oplossingen hoofdstuk Het milieubesef

Beschrijvende statistieken

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

Menu aansturing van SPSS voorbeeld in hoofdstuk 7 over Kaplan-Meier en Cox regressie survival analyses van recidive bij meisjes

Hoofdstuk 4. Beschrijvende statistiek. 4.1 Beschrijvende statistiek voor één variabele

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

Technische uitwerkingen voor het SPSS + R practicum Experimenteel en Correlationeel Onderzoek

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

Appendix B Computeranalyse van kwantitatieve data

Enkelvoudige lineaire regressie

Basishandleiding SPSS

1. Introductie tot SPSS

Handleiding SPSS. 1) Maak je bestand

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

Wat zijn de verschillen tussen SPSS 9 en SPSS 10?

Betrouwbaarheid, validiteit en overeenstemming

Oplossingen hoofdstuk 4

College Week 4 Inspecteren van Data: Verdelingen

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Onderzoek. B-cluster BBB-OND2B.2

Tools voor itemanalyse

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Fasen in het onderzoeksproces

Beknopte handleiding SPSS versie van 28

Analyse van kruistabellen

SPSS. Statistiek : SPSS

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

College 4 Inspecteren van Data: Verdelingen

SPSS in praktische stappen voor AGW-bachelors. auteurs: Miranda Winkelhuijzen Mickey Chenault Monique Reusken Pauline Vilters Robbie Martens

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum]

1 Inleiding spss; Aanwijzingen.

ALGEMENE STATISTIEK VOOR BWI COMPUTEROPGAVEN 2009/2010. A.W. van der Vaart en F. Bijma

Moleculaire LevensWetenschappen stroom 1.2

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Handleiding Excel. bij. hoofdstuk 18 Cijfers in Orde Wageningse Methode

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

6.8 Lijsten: oefeningen

Meten, weten & beleid. 'Kennisopbouw en kennisuitwisseling databeheer' Workshop 4 2. En in Gent? Stadsmonitorresultaten in vogelvlucht.

Handleiding voor het maken van tabellen en figuren

8.8 Records selecteren

gemiddelde politieke interesse van hoger opgeleide mensen)

INHOUD. KHLim dep IWT MeRa 1/22

Computervaardigheden. Basisvaardigheden Statistiek. Hoofdstuk 3 Grafieken en Rapporten

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Sorteren, groeperen en totaliseren

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Inhoud syntax opschonen BVH incidenten bestand.sps

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

Grafiek van de temperatuur in de loop van de tijd

Informatie Voor algemene vragen/opmerkingen omtrent de inhoud van deze site kunt u bellen of en met: Cargo Data Systems BV

Handleiding gebruik dashboard ProMISe

Wat te doen met die lange variabele- labels in SPSS?

Hoofdstuk 5. Dobbelen, echt en virtueel. > Maak in SPSS een nieuwe data-verzameling (File > New > Data). We gaan hier de

Hoofdstuk 14 : Layout

Handleiding Gebruik Dashboard. ProMISe 3

A. Week 1: Introductie in de statistiek.

Sioges Rapporten [1] Pag Kasopmaak 1.1 Het uitvoeren van kasopmaak Pag Rapporten 2.1 Programmering Lijst Slepen & sorteren

Informatica 1rste BAC Biologie. Hoofdstuk 3 Grafieken. Universiteit Antwerpen

3 Taken. 3.1 Inleiding. 3.2 Taken invoeren

Technologie: TI-Nspire CX CAS Niveau: beginner

Subrapporten. 5.1 Inleiding

Akternatieve doorrekenen. 7.2 Tabellen

10: Statistieken en rapportages met Excel

* de percentages goed per klas en volgorde van afnemen. sort cases by klas volgorde. split file by klas volgorde. des var=goedboekperc.

waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum

Handleiding Gebruik Dashboard. ProMISe 3

Introductie SPSS. Hogeschool Gent. Mei Inhoudsopgave. 1 Introductie 2. 2 One-sample T-test Two-sample T-test Paired T-test 18

Handleiding voor het maken van een online enquête formulier. Google Drive toepassing

2 Data en datasets verwerken

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Handleiding Grade Center

Handleiding voor het maken van een online enquête formulier. Google Drive toepassing

Welk programma gebruiken we? Om onze foto s te verkleinen gebruiken we het programma IrfanView. Het icoontje van IrfanView ziet er als volgt uit:

Weebly: Stappenplan voor docenten

U ziet de progressie van de download aan de groene blokjes in het balkje helemaal onder aan de pagina.

TI 84-plus Software. TI Connect. Downloaden, installeren en gebruiken. Wouter Bailleul

8.9 Draaitabellen [Pivot tables]

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

ANDI-tool handleiding

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

14 Opmaak Opmaak van taken Opsommingstekens [Outline symbols]

Transcriptie:

Technische uitwerkingen voor het SPSS practicum Inleiding M&T. NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin October 19, 2012

WEEK 1 Introductie en SPSS: data 1. Opgave 1 gaat niet over SPSS 2. Opgave 2 gaat niet over SPSS 3. Opgave 3 gaat niet over SPSS 4. Start SPSS via Start, Programs, IBM SPSS Statistics, IBM SPSS Statistics 19. Even wachten en dan toont SPSS een keuzevenster. Klik dat weg via cancel. Als het Data View venster zichtbaar is (zie tabblad onderaan het scherm) kun je beginnen. 5. a. Ga nu naar het Variables View venster (klik op tabblad onderaan het scherm) en specificeer daar in de kolommen Name, Type, Width en Decimals de namen, soort, breedte en aantal decimalen voor de variabelen Respnum t/m V4, zoals die in het codeboek beschreven zijn. b. Doen. c. Specificeer Variabele Labels, Value Labels en Missing Values. NB: De variabele Respnum heeft nooit missing values. Specificeer een missing value waarde zowel bij Missing Values (noodzakelijk) als ook bij Value Labels (informatief). d. Doen e. Doen f. Doe dit via File, Save... of het diskette icoon op de toolbar. Standaard locaties om te bewaren zijn: My Documents (een netwerkfolder, gekoppeld aan het inlog account) USB stick (G:), netwerkschijf P: (waar ook My Documents zich bevindt, gekoppeld aan het inlog account) 1

WEEK 1. INTRODUCTIE EN SPSS: DATA 6. Doe dit via File, Open, Data of via het open icoon op de toolbar. 7. Doe dit via Utilities, File Info, of Utilities, Variables, of kijk naar de Variables View. 8. Doe dit via Data, Sort Cases en zet dan variabele V8 (gewicht) of V9 (lengte) in het Sort By venster om de data in een nieuwe volgorde te zetten. Via Edit, Find kan men in de geselecteerde variabele naar een ingevulde waarde zoeken. 9. Bewaren via File, Save. NB afhankelijk van het scherm (Data, Output) dat zichtbaar is zal het programma aannemen dat dat bewaard moet worden en past ook de bewaaropties aan. Printen via File, Print en verander de printernaam naar PDF Creator. Druk op Ok, even later zal worden gevraagd om een naam (INL-MT1). Afsluiten via File, Exit of een ander standaard manier om een programma te verlaten. 2

WEEK 2 Het bewerken van gegevens 1. Copieer student.sav 2. Doe dit via Transform, Compute. Specificeer een naam voor de Target Variable die het resultaat van de berekening gaat bevatten: bijv. WERK- TIJD. Maak de SPSS variabelenaam niet te lang en begin met een letter. Gebruik alleen letters, cijfers en (underscore). Specificeer in het Numeric expression venster de berekening. In dit geval V11+V12. 3. Doe dit weer via Transform, Compute. Specificeer de naam QINDEX voor de Target Variable. Specificeer in het Numeric expression venster de berekening. In dit geval V8/(V7*V7) of V8/V7**2. NB de haakjes in de eerste versie zorgen ervoor dat het resultaat niet gelijk wordt aan V8. De ** in de tweede versie staan voor machtsverheffen. 4. Doe dit via Transform, Recode, Into Same variables. Volg nu de stappen in de Vocht in 16.1 waarmee je specificeert hoe de System missing waarden van QINDEX worden vertaald naar de waarde 99. Specificeer daarna via Variabele View in de kolom Missing dat 99 een missing value is 5. Doe dit via Analyze, Reports, Case Summaries. Zet de variabelen V7, V8 en QINDEX in het Variables venster. Specificeer 25 voor de optie Limit cases tot first. 6. Doe dit via Transform, Recode, Into Different variables. Zet QINDEX in het Numeric Variable Output Variable venster en Specificeer QINDEX2 als naam van de Output Variable Klik op change, zodat de naam QINDEX2 het? vervangt en in het Numeric Variable Output Variable venster zichtbaar wordt. 3

WEEK 2. HET BEWERKEN VAN GEGEVENS Volg nu de stappen in de Vocht in 16.2 waarmee je specificeert hoe de waarden van QINDEX worden vertaald naar waarden van QINDEX2. Voor categorie 1 kies je bij Old Value de optie Range, Lowest through en vult voor de bovengrens 18 in. Specificeer bij New Value de waarde 1 en druk op Add. De regel lowest thru 20 > 1 verschijnt in het venster. Voor categorie 2-4 kies je per waarde voor Range en vult de onder- en bovengrenzen in en specificeert de New Value etc. Voor categorie 5 kies je Range, through highest en vult voor de ondergrens 30 in en specificeert de New Value etc. Voor categorie 9 kies je bij Old Value de optie Value en vult 99 in. Specificeer bij New Value de waarde 9 en druk op Add. De regel 99 > 9 verschijnt in het venster. Druk nu op OK om de hercodering uit te laten voeren. 7. Doe dit via Analyze, Reports, Case Summaries. Zet de variabelen QINDEX en QINDEX2 in het Variables venster. Specificeer voor Limit cases tot first een beperkt aantal aantal (10-25) en zet de optie Show only valid cases uit. Merk op dat (system) missing values op QINDEX leiden tot (system) missing values op QINDEX2. 8. Doe dit via het Variables View venster. 9. Doe dit via Graphs, Legacy Dialogs, Bar (de Vocht 24.1). Kies voor Simple en druk op Define. Zet dan QINDEX2 in het Category Axis veld. 1 10. Realiseer je vooraf dat er een complicatie is en we niet simpelweg 2012 - V1 (=geboortejaar) kunnen gebruiken als antwoord op deze vraag. Sommige geboortemaanden liggen voor september en deze mensen zijn op 1 september 2012 dat jaar al jarig zijn geweest. Anderen, met een zelfde geboortejaar maar een latere geboortemaand, zijn in 2012 nog niet jarig geweest en dat scheelt dan net een jaar in leeftijd. We hebben dus twee groepen mensen a. geboren voor september leeftijd = 2012 - V1 en b. geboren in september of later leeftijd = 2012 - V1-1. We moeten dus ook apart voor deze 2 groepen de berekening van de leeftijd uitvoeren. Doe dit weer via Transform, Compute. 1 Standaard worden in de SPSS cursus grafieken gemaakt via de Legacy Dialogs. Andere aanpakken kunnen tot afwijkende oplossingen leiden en zijn niet aanpasbaar. U bent gewaarschuwd. 4

WEEK 2. HET BEWERKEN VAN GEGEVENS Specificeer de naam leeftijd voor de Target Variable. Specificeer in het Numeric expression venster de berekening zelf. In dit geval 2012 - V1. Duk nu op If... en kies in het Compute Variable: If Cases venster voor Include if cases satisfies condition. specificeer als conditiev2 < 9 of V2 <= 8 en druk op continue druk op OK Nu zal de variabele LEEFTIJD voor de eerste groep mensen worden berekend. Voer de bovenstaande stappen opnieuw uit maar bereken dan 2012 - V1-1 voor de conditiev2 > 8 ofv2 >= 9. NB omdat de tweede berekening de inhoud van de al bestaande variabele leeftijd gaat veranderen waarschuwt SPSS hiervoor. Geef aan dat dit in orde is. Maak het Histogram van de variabele LEEFTIJD via Graphs, Legacy Dialogs, Histogram (de Vocht 24.2). Bewaren via File, Save. NB afhankelijk van het scherm (Data, Output) dat zichtbaar is zal het programma aannemen dat dat bewaard moet worden en past ook de bewaaropties aan. Printen via File, Print en verander de printernaam naar PDF Creator. Druk op Ok, even later zal worden gevraagd om een naam (INL-MT2). 5

WEEK 2. HET BEWERKEN VAN GEGEVENS 6

WEEK 3 Selecteren en sorteren + missing values Copieer zonodig eerst STUDENTA2.SAV, dat de nieuw berekende variabelen van week 2 bevat 1. Doe dit via Graphs, Legacy Dialogs, Bar (de Vocht 24.1). Kies voor Simple en druk op Define. Zet dan Sterrenbeeld (=V3) in het Category Axis veld. Zoek naar het sterenbeeld met de hoogste staaf. Dat is het meestvoorkomende sterrenbeeld. 2. Doe dit via Data, Select Cases... en kies dan voor de optie If condition is satisfied. Specificeer dan de conditie waar de gewenste groep moet voldoen. Dat zijn de mensen die op de variabele Sexe (=V6) de waarde man (=2) hebben, dus de conditie wordt: V6=2. NB dit is dezelfde manier van een conditie specificeren als bij opgave 9 van vorige week. Kies voor de optie Unselected Cases are Filtered. Kijk naar het data venster en constateer dat alle vrouwen zijn doorgestreept. Op de status balk onderaan staat nu Filter On. Volg de stappen van opgave 1 voor het maken van het staafdiagram etc. 3. Doe dit via Data, Select Cases en a) kies dan voor de optie All Cases + OK of b) druk op Reset. In beide gevallen is de selectie ongedaan gemaakt. 4. Doe dit via Data, Sort Cases en zet eerst de variabele QINDEX2 en daarna de variabele Sexe (=V6) in het Sort by venster. NB de volgorde van de twee variabelen in het Sort by venster is bepalend voor resultaat. Eerst Sexe en dan QINDEX2 in het Sort by venster zou het bestand zo sorteren dat in het begin eerst de vrouwen geordend naar de waarde van QINDEX2 zouden staan en daarna pas de mannen zouden komen, ook weer gesorteerd naar QINDEX2. Merk op dat missing values bij sortering als kleiner worden 7

WEEK 3. SELECTEREN EN SORTEREN + MISSING VALUES beschouwd dan geldige waarden en dus bij oplopend sorteren bovenin het data venster komen. 5. Doe dit via Analyze, Reports, Case Summaries. Zet de variabelen QINDEX en QINDEX2, Sexe en gewicht (=V8) in het Variables venster. Specificeer bij Limit cases tot first dat je alles wilt zien: dus haal het vinkje weg. 6. Zie opgave 2. Het gaat zijn de mensen die op de variabele Sexe (=V6) de waarde vrouw (=1) hebben en waarvan de waarde van QINDEX2 in orde (=2) of te laag (=1) is. Dit laatste stukje van de conditie heeft verschillende oplossingen die hetzelfde betekenen. QINDEX2 = 1 QINDEX2 = 2 QINDEX2 < 3 QINDEX2 <= 2 We kiezen hier voor de eenvoudigste QINDEX2 < 3. NB er zijn nog meer mogelijkheden dan de drie die hierboven genoemd zijn. De volledige conditie wordt: V6=1 & QINDEX2 < 3. Merk op dat mensen met missing values op V6 en/of QINDEX2 niet in de selectie terecht komen. 7. Volg de stappen van opgave 1 voor het maken van het staafdiagram etc. 8. Zie opgave 3 9. Doe dit via Data, Split File, kies voor Organize output by groups en zet de variabele Sexe (=V6) in het Groups based on venster. Op de status balk onderaan staat nu Split On. 10. Volg de stappen van opgave 1 voor het maken van het staafdiagram en gebruik nu V9 (burgerlijke staat). Dit resulteert in aparte staafdiagrammen van V9 voor mannen, vrouwen en voor mensen waarvan het geslacht niet bekend is. 11. Doe dit via Data, Split File 12. Doe dit via Graphs, Legacy Dialogs, Histogram (zie week 2). Opvallend is hier de aanwezigheid van studenten met een gewicht van ongeveer 1000 kilo. Of is er wat anders aan de hand? 13. Het ontbreken van een specificatie van missing values, wordt gecorrigeerd via het Variables View venster (zie week 1) 14. Zie opgave 12. 8

WEEK 4 Inspecteren van data: verdelingen 1. Copieer STUDENT.SAV, MM01 028.SAV en WBA 4.SAV zoals dat al eerder gedaan is 2. Doe dit door de data beschrijving in MM&C te bekijken en in het Variable View en Data View venster de variabelen en de datawaarden te bekijken. Doe het onderzoek van de verdeling van GPA (het gemiddelde cijfer) via Graphs, Legacy Dialogs, Histogram, of Graphs, Legacy Dialogs, Boxplot. NB De Boxplot identificeert uitbijters door het regelnummer in het databestand te vermelden. 3. Doe de verificatie via Analyze, Descriptive Statistics, Frequencies. Maak alleen grafieken (dus ontvink de Display frequency tables optie) en kies via de optie Charts voor Histogrammen vanwege het meetniveau (ratio) van de drie variabelen. 4. Doe dit door op het Histogram te dubbelklikken (double click to activate) en het Histogram in de Chart Editor aan te passen. Het aanpassen van de klassen gaat via het selecteren van de staven en dan bij Bin Sizes het Number of Intervals aanpassen in het property venster (tabblad Histogram Options) 5. Doe dit via Analyze, Descriptive Statistics, Descriptives en specificeer de 10 variabelen. 6. Doe dit via Graphs, Legacy Dialogs, Boxplot en kies voor Simple en Summaries of separate variables. 9

WEEK 4. INSPECTEREN VAN DATA: VERDELINGEN 7. Doe dit via Graphs, Legacy Dialogs, Histogram. Zet de variabele Geslacht in Panel by achtereenvolgens in Rows en in Columns. NB je kunt weliswaar via Analyze, Descriptive Statistics, Frequencies een histogram maken, maar geen opsplitsing instellen, zoals hier gevraagd wordt. 8. a. Open het Histogram in de Chart Editor (zie de Vocht, 21.2). Pas voor de X-as (selecteren) in het properties venster (tabblad Scale) Mimimum en Maximum aan ( 15.5-42.5) of ( 17-41) als ook Maior Increment naar 3. Pas voor de staven (selecteren!) in het properties venster (tabblad Binning) de Interval Width aan ( 3) en Custom value for anchor (15.5). Zo kunnen de tick marks op de horizontale as samenvallen met de ware klassegrenzen of de middens. NB Alleen de Interval Width aanpassen is al een goed begin. X as met ware klassegrenzen X as met klassemiddens Frequency 0 5 10 15 20 Frequency 0 5 10 15 20 15.5 18.5 21.5 24.5 27.5 30.5 33.5 36.5 39.5 42.5 17 20 23 26 29 32 35 38 41 score score b. Doe dit via Graphs, Legacy Dialogs, Boxplot en kies voor Simple en Summaries of separate variables. 10

WEEK 5 Normaalverdeling en Z scores 1. Copieer LEEG.SAV en zonodig STUDENT.SAV en MM01 028.SAV zoals dat al eerder gedaan is. 2. a. Doe dit via Analyze, Descriptive Statistics, Descriptives en vink de optie Save standardized values as variables aan. b. Sorteer de gegevens via Data, Sort Cases (zie ook week 3) c. EXTRA Maak histogrammen van v8 en zv8 via Graphs, Legacy Dialogs, Histogram. Constateer dat de verdeling qua vorm niet verschilt. 3. geen SPSS opdracht 4. a. Doe dit via Data, Split File (zie week 3, opgave 9) en daarna opnieuw Analyze, Descriptive Statistics, Descriptives zoals in opgave 2. b. Sorteer, indien nodig, de gegevens via Data, Sort Cases 5. a. Doe de beschrijving op basis van statistieken en grafieken via a) Frequencies of Explore en b) Histogram en/of Boxplot (voor de uitbijters). b. Doe het onderzoek naar normaliteit via Analyze, Descriptive Statistics, Q-Q plot. c. Geen SPSS opdracht 6. a. Doe dit via Transform, Compute. Specificeer de naam SCORE voor de Target Variable. Specificeer in het Numeric expression venster de berekening RV.NORMAL(0,1). Dit creëert een nieuwe variabele SCORE met voor iedere case in het bestand een waarde die uit een verdeling N(0,1) afkomstig is. b. Doe de gevraagde verificatie via Analyze, Descriptive Statistics, Q-Q plot. 11

WEEK 5. NORMAALVERDELING EN Z SCORES 7. Open via Start, Programs, Accessories het programma Notepad om de R instructies aan te maken en op te slaan. Start dan R. a. Bewaren met x<- c(18,15,19,27,13,30,24,11,5,16,17,9,17) b. Doe dit via hist(x) c. Doe dit via de drie instructies: Zie ook pagina 32 i. m<- mean(x) ii. s<- sd(x) iii. z <- (x-m)/s d. Geen SPSS opdracht e. Doe dit via boxplot(x) f. Doe de gevraagde verificatie via qqnorm(x). 12

WEEK 6 Samenhang tussen variabelen In de laatste opgaven wordt weer een klein datasetje ingevoerd uit de werkgroepopgaven van deze week. 1. Copieer zonodig STUDENT.SAV zoals dat al eerder gedaan is. 2. Doe dit via Graphs, Legacy Dialogs, Scatter. Kies voor Simple en specificeer Lengte (V7) voor de X axis, Gewicht (V8) voor de Y axis en Geslacht (V6) voor Set Markers by. Om de verschillen duidelijker te kunnen weergeven per groep kan GESLACHT (V6) ook in Panel by in Rows worden gespecificeerd. 3. Doe dit via Analyze, Correlate, Bivariate. Kies via Options voor Exclude case pairewise of Exclude case listwise. Herhaal daarna de berekening met de andere Exclude optie 4. Doe dit via Graphs, Legacy Dialogs, Scatter. 5. Doe dit via Analyze, Correlate, Bivariate. 6. Doe dit via a. x<- c(6,8.5,7,5.5,10,8,7,7.5,8,7.5) b. y<- c(5.5,7,7.5,6,8,7.5,6.5,8,7,7) c. plot(x,y) 7. Doe dit via cor(x,y) 13

WEEK 6. SAMENHANG TUSSEN VARIABELEN 14

WEEK 7 Verklaren van variantie In de laatste opgaven wordt weer met data uit de werkgroepopgaven van deze week gewerkt. 1. Copieer MM02 060.SAV en zonodig STUDENT.SAVzoals dat al eerder gedaan is. 2. Doe dit via Graphs, Legacy Dialogs, Scatter. Kies voor Simple en specificeer LENGTE (V7) voor de X axis, GEWICHT (V8) voor de Y axis en GESLACHT (V6) voor Set Markers by. 3. a. Doe dit via Analyze, Regression, Linear. Zet GEWICHT (V8) bij Dependent en LENGTE (V7) bij Independent(s). b. Noteren. c. Invullen d. Laat in de grafiek van opgave 2 de regressielijnen zien door in de Chart Editor via het menu-item Elements de optie Add Fit Line at Total en Add Fit Line at Subgroups te kiezen. e. EXTRA Zie de Vocht 40.1. Doe opnieuw Analyze, Regression, Linear en vraag via Plots voor i. normaliteit residuen: het histogram en de Normal PP plot van de residuen. ii. gelijkmatige verdeling residuen (homoscedastisch): plot van *ZPRED op de X-as en *ZRESID op de Y-as (zie voorbeeld pagina 204 De Vocht) iii. lineariteit: loopt in de vorige plot de puntenwolk horizontaal rond Y=0 of is er een patroon waarneembaar? 4. a. Bepaal de gemiddelden en standaarddeviaties via Analyze, Descriptive Statistics, Descriptives. 15

WEEK 7. VERKLAREN VAN VARIANTIE b. Doe dit via Analyze, Correlate, Bivariate. en via Analyze, Regression, Linear. c. Doe dit 4 maal via Graphs, Legacy Dialogs, Scatter. Kies voor Simple en specificeer X1 voor de X axis, Y1 voor de Y axis en herhaal dit tot en met het paar X4, Y4. Laat per grafiek de regressielijn zien door in de Chart Editor via het menu-item Elements de optie Add Fit Line at Total te kiezen. 5. Doe in R a. de scatterplot via plot(x,y). b. de regressielijn via coef <- lm(y x) voor de lijn informatie en dan abline(coef) om de lijn in de scatterplot toe te voegen. 6. Doe in R a. de regressie-analyse met lm(y x) of met alleen lm(coef) uit de vorige opgave dat het regressieresultaat bevat. b. de proportie verklaarde variantie (=r 2 ) via cor(x,y)ˆ2. 7. EXTRA residuen in R. de variabele coef bevat de residuen al. Met res <- coef$residuals kun je de residuen in res zetten en met hist(res) of boxplot(res) kun je de verdeling bekijken. 16

WEEK 8 Toets: herhaling van week 1-7 1. Copieer MM02 121.SAV zoals dat al eerder gedaan is. 2. Doe het labelen via Variables View window (zie ook week 1) 3. Doe dit via Graphs, Legacy Dialogs, Boxplot of via Analyze, Descriptive Statistics, Explore. Kies in Explore via Statistics de optie Percentiles, zodat je alle ingrediënten voor de Five Number Summary hebt. Alleen de Five Number Summary kan ook worden verkregen via Analyze, Descriptive Statistics, Frequencies. Kies via Statistics voor Quartiles, Minimum en Maximum en zet daarna de optie Display frequency tables uit. 4. Doe dit via Transform, Compute. Specificeer de naam PROP voor de Target Variable. Specificeer in het Numeric expression venster de berekening SPEND/PAY. a. Doe dit via een Boxplot of Histogram b. Dit kan op een aantal manieren, maar de meest directe is via Data, Sort Cases (zie ook week 3) voor PROP. De laagste waarde staat nu op de eerste regel van het databestand. 5. Doe dit via Transform, Recode, Into Different variables (week 2) op basis van de informatie uit opgave 3. Doe de controle via Analyze, Descriptive Statistics, Frequencies. Voor het labelen zie opgave 2. 6. a.-c. Doe dit via Graphs, Legacy Dialogs, Scatter d.-e. Doe dit via Analyze, Regression, Linear. Zet PAY bij Dependent en SPEND bij Independent(s). NB beide variabelen zijn uitgedrukt in eenheden van 1000 dollars. 7. Doe dit via een Boxplot voor verschillende groepen (=uitgesplitst naar RE- GION) en gelabeld naar STATE. 17

WEEK 8. TOETS: HERHALING VAN WEEK 1-7 18