Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek NB Voor de SPSS opgaven wordt alleen aangegeven hoe het door de opgave gevraagde resultaat kan worden bereikt. C. J. Verduin 11 december 2012
Hoofdstuk 1 Rekenen: functies en random variabelen 1. Copieer MISSING.SAV zoals dat al eerder gedaan is. 2. a. Doe dit met Analyze, Missing Value Analysis. b. Doe het tellen met Transform, Count. Specificeer de naam MIS1735A voor de Target Variable die het resultaat van de telling bevat. Specificeer de variabelen die geteld moeten worden en laat via Define Values de System-or user-missing tellen. c. Doe het tellen met Transform, Compute. Specificeer de naam MIS1735B voor de Target Variable die het resultaat van de telling bevat. Specificeer in het Numeric expression venster de functie NMISS. Zet tussen de haakje de namen van de variabelen gescheiden door komma s: dus v17, v18,..., v35. In het geval van een groot aantal namen van variabelen die naast elkaar in het bestand staan kan men ook het steekwoord TO gebruiken om een serie variabelen aan te geven: dus V17 TO V35. d. Doe dit via Analyze, Descriptive Statistics, Frequencies of bij voorkeur via Graphs, Legacy Dialogs, Histogram. 3. a. Doe dit via Transform, Compute. Specificeer SOMPLUS voor de Target Variable. Specificeer in het Numeric expression venster de berekening:. Vx+Vy+Vz+ etc en vervang x, y en z door de juiste variabelenummers. b. Doe dit via Analyze, Descriptive Statistics, Frequencies of via Graphs, Legacy Dialogs, Histogram. 4. a. Doe dit via Transform, Compute. Specificeer SOMSUM voor de Target Variable. Specificeer in het Numeric expression venster de berekening: SUM(Vx,Vy etc) 1
HOOFDSTUK 1. REKENEN: FUNCTIES EN RANDOM VARIABELEN b. Doe dit via Analyze, Descriptive Statistics, Frequencies of bij voorkeur via Graphs, Legacy Dialogs, Histogram. 5. a. Doe dit via Transform, Compute. Specificeer MEAN3 voor de Target Variable. Specificeer in het Numeric expression venster de berekening: MEAN.3(Vx,Vy etc) b. Doe dit via Analyze, Descriptive Statistics, Frequencies of bij voorkeur via Graphs, Legacy Dialogs, Histogram. Merk op dat men bij opgaven 4 en 5 de variabelenamen expliciet moet noemen (en dus niet met behulp van het steekwoord TO kan aangeven) omdat de variabelen niet naast elkaar in het bestand staan. 6. a. Doe dit 2 maal via Transform, Compute. Specificeer eerst RAN1 als Target Variable en in het Numeric expression venster de berekening RV.NORMAL(3,3). Specificeer daarna RAN2 als Target Variable en in het Numeric expression venster de berekening RV.NORMAL(4,4). b. Doe het optellen via Transform, Compute. Specificeer RAN12 voor de Target Variable. Specificeer in het Numeric expression venster de berekening: RAN1 + RAN2. c. Doe dit met Analyze, Descriptive Statistics, Descriptives. d. Doen 7. a. Doen. b. Doe dit via Analyze, Correlate, Bivariate Correlation. c. Doen. 2
Hoofdstuk 2 De steekproevenverdeling (van het gemiddelde) 1. Copieer zonodig LEEG.SAV. 2. a. Het bepalen van µ en σ voor een steekproevenverdeling van x. µ x = µ en σ x = σ/ n b. i. Berekening van de negen observatievariabelen: doe dit 9 maal via Transform, Compute. Specificeer de namen voor de Target Variable die het resultaat van de berekening gaan bevatten: OBS1 t/m OBS9. Specificeer in het Numeric expression venster de berekening: RND(RV.NORMAL(100, 15)). ii. Berekening van het sample gemiddelde variabele voor 4 cases: doe dit via Transform, Compute. Specificeer de Target Variable die het resultaat gaat bevatten: MEAN4. Specificeer in het Numeric expression venster de berekening: MEAN(OBS1 to OBS4). iii. Berekening van het sample gemiddelde variabele voor 9 cases: doe dit via Transform, Compute. Specificeer de Target Variable die het resultaat gaat bevatten: MEAN9. Specificeer in het Numeric expression venster de berekening: MEAN(OBS1 to OBS9). c. Bekijk de verdelingen via Graphs, Legacy Dialogs, Histogram. Verifieer het gemiddelde en de standaarddeviaties via Analyze, Descriptive Statistics, Descriptives. 3. Is geen SPSS opgave 4. Is geen SPSS opgave 5. R voor 4 samples. NB let op hoofdletters en kleine letters. 3
HOOFDSTUK 2. DE STEEKPROEVENVERDELING (VAN HET GEMIDDELDE) a. data <- rnorm(2000, mean=100, sd=15) 1 b. datar <- round(data, digits=0) 2 c. datarm <- matrix(datar, ncol=4, byrow=false) 3 d. mean4 <- rowmeans(datarm) 4 e. mean(mean4) f. sd(mean4) g. hist(mean4) 6. R voor 9 samples a. data <- rnorm(4500, mean=100, sd=15) b. datar <- round(data, digits=0) c. datarm <- matrix(datar, ncol=9, byrow=false) d. mean9 <- rowmeans(datarm) e. mean(mean9) f. sd(mean9) g. hist(mean9) 1 NB mag ook als rnorm(2000,100,15). Zie B.4.3 2 NB mag ook als round(data,0) of zelfs round(data). Zie B.2 3 NB het byrow stukje mag ook weggelaten worden. Het is in dit voorbeeld niet van belang of de matrix per rij of per kolom gevuld wordt. Zie B.3 p. 88 4 Zie B.4.1. p. 89 4
Hoofdstuk 3 Statistische betrouwbaarheid en significantietoetsing 1. Is geen SPSS opgave. 2. Is geen SPSS opgave. 3. Is geen SPSS opgave. 4. Doe dit via Analyze, Descriptive Statistics, Explore. 5. Doe dit via Data, Select Cases, Random sample of cases. 6. Doe dit via Graphs, Legacy Dialogs, Errorbar. Het toevoegen van rasterlijnen aan een grafiek Open grafiek in chart editor Selecteer een as en open properties window. Selecteer het tab window Lables & Ticks. Stel Number of minor ticks per Major tick in op 4 en druk op Apply (laat het properties window open) Kies in chart editor menu Options, Show Grid Lines (Let op verandering van het properties window) Selecteer het tab window Grid Lines Stel Place grid lines in op Both minor and major en druk op Apply Selecteer de minor grid lines in grafiek Selecteer in het properties window het tab window Lines Stel Lines, Style in op - - - - - 5
HOOFDSTUK 3. STATISTISCHE BETROUWBAARHEID EN SIGNIFICANTIETOETSING 6
Hoofdstuk 4 Toetsen van gemiddelden: de t-toets 1. Is geen SPSS opgave. 2. a. Tellen b. Doe dit via Data, Select Cases, Random sample of cases. 3. Doe dit via Analyze, Compare Means, One-Sample T Test met Test Value = 5.5. 4. a. Doe de inspectie voor de 2 groepen via Graphs, Legacy Dialogs, Boxplot en kies voor Simple en Summaries for groups of cases b. Doe dit via Analyze, Compare Means, Independent-Samples T- Test. 5. Doe dit via Analyze, Compare Means, Paired-Samples T-Test. Het nadeel van deze manier is dat men de verdeling van V21-V24 niet kan inspecteren. De volgende opgave laat een betere manier zien. 6. In deze opgave wordt eerst een verschil bepaald. Dit maakt het mogelijk om de verdeling te inspecteren a. Doe dit via Transform, Compute. Specificeer een naam (bijv VER- SCHIL) voor de Target Variable. Specificeer in het Numeric expression venster V21-V24. b. Maak via Graphs, Legacy Dialogs, Boxplot een Boxplot van VER- SCHIL en kies voor Simple en Summaries for separate variables c. Toets het verschil via Analyze, Compare Means, One-Sample T-Test met Test Value = 0. d. Maak via Graphs, Legacy Dialogs, Errorbar een CI van VERSCHIL. 7. NB in de R uitleg in appendix B iets ontbreekt over de optie alternative =. De mogelijkheden zijn two.sided (default), less of greater. 7
HOOFDSTUK 4. TOETSEN VAN GEMIDDELDEN: DE T-TOETS a. eekhoorns <- c(8.4, 9.8, 9.4, 10.2, 9.4, 9.5, 8.8, 9.0) b. t.test(eekhoorns,mu=9, alternative = greater ) 8. a. babies <- c(37.4, 37.3, 37.2, 37.1, 36.9) b. t.test(babies,mu=37). 8
Hoofdstuk 5 Power en F-toets geen SPSS, dus geen uitwerkingen. 9
HOOFDSTUK 5. POWER EN F-TOETS 10
Hoofdstuk 6 Het vergelijken van frequentieverdelingen: de Pearson Chi-kwadraattoets 1. Copieer HAYS18 3.SAV zoals dat al eerder gedaan is. 2. Doe het wegen via Data, Weight Cases met de variabele AANTAL 3. Doe dit via Analyze, Nonparametric Tests, Chi-Square. 4. Doe dit via Analyze, Descriptive Statistics, Crosstabs 5. Zie opgave 4 + optie Cells, Expected 6. Zie opgave 5 + optie Cells, Residuals, Unstandardized 7. Zie opgave 6 + optie Statistics, Chi-Square 8. Zie opgave 5 + optie Cells, Residuals, Standardized 9. Toets of de verdeling uniform is voorkeur<-c(18,14,9,5,4) chisq.test(voorkeur) 10. Toets of de verdeling afwijkt van de verdeling van vorig jaar (prop). De R-opmerking Chi-squared approximation may be incorrect mag worden genegeerd. prop<-c(.34,.21,.24,.12,.09) chisq.test(voorkeur,p=prop) 11
HOOFDSTUK 6. DE PEARSON CHI-KWADRAATTOETS 11. Toets of de verdeling afwijkt tussen mannen en vrouwen. De R-opmerking Chi-squared approximation may be incorrect mag worden genegeerd. voorkeur2<-c(10,12,3,17,2,6) voorkeur2b<-matrix(voorkeur2,ncol=2,byrow=false) chisq.test(voorkeur2b) 12
Hoofdstuk 7 Non-parametrische toetsen voor 2 afhankelijke en onafhankelijke steekproeven: de Wilcoxon toetsen Net als het boek gebruiken ook wij (en dus ook de studenten) deze week de Legacy Dialogs voor de Nonparametric Tests. 1. Copieer STORIES.SAV zoals dat al eerder gedaan is. Dit bestand bevat 10 observaties NB we werken dus in deze opgaven in SPSS standaard met Exact. 2. Doe dit via Graphs, Legacy Dialogs, Boxplot voor eerst VERHAAL1 en Simple en Summaries for groups of cases per NIVEAU. Dan daarna hetzelfde voor VERHAAL2. Alternatief: Doe dit via Graphs, Legacy Dialogs, Boxplot en kies dan Clustered en Summaries for separate variables, om het in één plaatje te krijgen. Alleen Summaries for separate variables gebruiken en dan via by met NIVEAU goede en slechte lezers onderscheiden kan ook. 3. Doe dit via Analyze, Nonparametric Tests, Legacy Dialogs, 2 Independent Samples. 4. Doe dit via Analyze, Nonparametric Tests, Legacy Dialogs, 2 Independent Samples. 5. Doe dit via Analyze, Nonparametric Tests, Legacy Dialogs, 2 Related Samples. 6. Doe dit via Data, Split File met leesniveau als split-variabele een dan opnieuw Analyze, Nonparametric Tests, Legacy Dialogs, 2 Related Samples. Daarna weer Split File uitzetten. 13
HOOFDSTUK 7. DE WILCOXON TOETSEN 7. Alles opnieuw doen met als aanname dat de scores interval niveau zijn en de populatiesverdelingen van de scores en de verschilscores normaal zijn. a. Doe dit via Analyze, Compare Means, Independent-Samples T- Test. b. Idem c. Doe dit via Analyze, Compare Means, Paired-Samples T-Test + split file. 8. Doen NB met opgave 7.2. groep1<-c(40, 32, 18, 30, 38, 37, 33) groep2<-c(59, 44, 35, 42, 48, 41, 36) wilcox.test(groep1,groep2) 9. Doen NB met opgave 7.3. vrouw<-c(73, 80, 68, 66, 93, 70, 76, 64, 92) man<-c(70, 96, 82, 74, 84, 90, 88, 74, 94) wilcox.test(man,vrouw,paired=true) 14
Hoofdstuk 8 Herhaling week 1 7 1. Copieer MM01 028.SAV en MM02 010.SAV en zonodig STUDENT.SAV zoals dat al eerder gedaan is 2. Geen commentaar 3. Doe dit via Transform, Compute. Eerst het gemiddelde. Specificeer een naam (bijv MEAN) voor de Target Variable. Specificeer in het Numeric expression venster MEAN.19(V17 TO V35). Daarna de standaarddeviatie. Specificeer een naam (bijv STD) voor de Target Variable. Specificeer in het Numeric expression venster SD.19(V17 TO V35). a. Doe de labels in het Variables View venster b. Maak de verdelingsplaatjes met Boxplot of Histogram via Graphs, Legacy Dialogs, Histogram, of Graphs, Legacy Dialogs, Boxplot c. Maak het spreidingsdiagram via Graphs, Legacy Dialogs, Scatter 4. Doe dit via Data, Select Cases, Random sample of cases. 5. Doe dit via Analyze, Compare Means, Independent-Samples T-Test. 6. Doe dit via Analyze, Compare Means, Paired-Samples T-Test. c Doe dit via Transform, Compute. Specificeer een naam (bijv VER- SCHIL) voor de Target Variable. Specificeer in het Numeric expression venster V30-V35. Maak een Boxplot van VERSCHIL -NB wanneer gevraagd wordt om met VERSCHIL de toetsing uit te voeren dan zou je dit doen als in opgave 6 van week 4. 7. Doe dit via Analyze, Descriptive Statistics, Crosstabs met via Statistics de optie Chi-Square 15
HOOFDSTUK 8. HERHALING WEEK 1 7 8. Doe dit via Analyze, Compare Means, Independent-Samples T-Test. 9. Doe dit via Analyze, Nonparametric Tests, Legacy Dialogs, 2 Independent Samples. 10. Doe dit opnieuw via Analyze, Compare Means, Independent-Samples T-Test. 16