SPSS-oefening 2: Hypothesetoetsen Opgave Oefening 1 a) Het zijn onafhankelijke steekproeven. De scores voor politieke interesse zijn afkomstig van verschillende mensen aangezien elke persoon slechts in 1 categorie van opleiding zit. b) Analyze > Compare Means > Independent-Samples T Test Test variable: politieke_interesse Grouping variable: opleiding Define groups : Group 1: 1; Group 2: 2 Continue Options: 95% Continue OK OUTPUT: De Levene s test is significant ( p 0.001 0.05 ) De nulhypothese dat de populatievarianties aan elkaar gelijk zijn kan verworpen worden. We werken dus verder met Equal variances not assumed. Nulhypothese H 0 : laag hoog of nog laag hoog 0 Alternatieve hypothese Ha : laag hoog of nog laag hoog 0 (tweezijdige test) (met laag de gemiddelde politieke interesse van lager opgeleide mensen en hoog de gemiddelde politieke interesse van hoger opgeleide mensen) se s²laag s²hoog 0.72360² 0.88114² 0.08937 nlaag nhoog 161 164 0.05703² 0.06881² xlaag xhoog 0 2.8199 2.3354 0 0.48451 t 5.422 se 0.08937 0.08937 t-verdeling met als aantal vrijheidsgraden: software: df = 313.265
handmatig: df = 161 1 = 160 p 0.001 0.05 95%-betrouwbaarheidsinterval: Ondergrens: Software: xlaag xhoog tdf, * se 0.48451 t313.265; 0,025*0.08937 0.484511.9676*0.08937 0.31 Handmatig: 2 xlaag xhoog tdf, * se 0.48451 t160; 0,025*0.08937 0.484511.9749*0.08937 0.31 Bovengrens: Software: 2 xlaag xhoog tdf, * se 0.48451 t313.265; 0,025*0.08937 0.484511.9676*0.08937 0.66 Handmatig: 2 xlaag xhoog tdf, * se 0.48451 t160; 0,025*0.08937 0.484511.9749*0.08937 0.66 2 Besluit: De nulhypothese kan verworpen worden. Er is evidentie voor een verschil in interesse in politiek wanneer men mensen met een verschillende scholingsgraad (geen vs wel hoger onderwijs) vergelijkt. ( xlaag 2.8199 ; xhoog 2.3354 ; slaag 0.72360 ; shoog 0.88114 ; nlaag 161; nhoog 164 ; t 5.412 ; p 0, 001 0, 05). Een schatting voor het gemiddelde verschil is 0.48 met een 95%-betrouwbaarheidsinterval van 0.31 tot 0.66. Dit betekent dat de groep laaggeschoolden gemiddeld gezien meer interesse in politiek heeft dan de groep hooggeschoolden. (Merk op: 0 bevindt zich niet in het betrouwbaarheidsinterval) c) Define groups : Group 1: 2 ; Group 2: 1 OUTPUT: Nulhypothese H 0 : hoog laag of nog hoog laag 0 Alternatieve hypothese Ha : hoog laag of nog hoog laag 0 (tweezijdige test)
s²hoog se s²laag 0.88114² 0.72360² 0.08937 nhoog nlaag 164 161 0.06881² 0.05703² xhoog xlaag 0 2.3354 2.8199 0 0.48451 t 5.422 se 0.08937 0.08937 t-verdeling met als aantal vrijheidsgraden: software: df = 313.265 handmatig: df = 161 1 = 160 p 0.001 0.05 95%-betrouwbaarheidsinterval: Ondergrens: Software: xhoog xlaag tdf, * se 0.48451 t313.265; 0,025*0.08937 0.484511.9674*0.08937 0.66 Handmatig: 2 xhoog xlaag tdf, * se 0.48451 t160; 0,025*0.08937 0.484511.9749*0.08937 0.66 Bovengrens: Software: 2 xhoog xlaag tdf, * se 0.48451 t313.265; 0,025*0.08937 0.484511.9674*0.08937 0.31 Handmatig: 2 xhoog xlaag tdf, * se 0.48451 t160; 0,025*0.08937 0.484511.9749*0.08937 0.31 2 Besluit: De nulhypothese kan verworpen worden. Er is evidentie voor een verschil in interesse in politiek wanneer men mensen met een verschillende scholingsgraad (wel vs geen hoger onderwijs) vergelijkt. ( xhoog 2.3354 ; xlaag 2.8199 ; shoog 0.88114 ; slaag 0.72360 ; nhoog 164 ; nlaag 161; t 5.412 ; p 0, 001 0, 05). Een schatting voor het gemiddelde verschil is -0.48 met een 95%-betrouwbaarheidsinterval van -0.66 tot -0.31. Dit betekent dat de groep hooggeschoolden gemiddeld gezien minder interesse in politiek heeft dan de groep laaggeschoolden. (Merk op: 0 bevindt zich niet in het betrouwbaarheidsinterval) Besluit: Aangezien de groepen omgewisseld werden, krijgen de testwaarde, het gemiddelde verschil en het betrouwbaarheidsinterval van het verschil het omgekeerde teken. d) Bij het uitvoeren van een vergelijkingstoets voor gemiddeldes worden de volgende veronderstellingen gemaakt: *De steekproef is willekeurig. *De steekproeven zijn onafhankelijk van groep tot groep. *De responsvariabele is kwantitatief en is benaderd normaal verdeeld voor elk van de twee groepen. (De normaliteit is vooral belangrijk bij kleine steekproeven en eenzijdige hypothesetoetsen.) -> Enkel deze laatste onderstelling kunnen we nagaan aan de hand van figuren. Graphs > Legacy Dialogs > Histogram Variable: politieke_interesse
Columns: opleiding Display normal curve aanvinken OK Aangezien er slechts 4 antwoordmogelijkheden zijn, geeft dit ons beperkte houvast om een uitspraak te doen over de verdelingen van politieke interesse. In beide groepen lijkt de variabele normaal verdeeld. Er wordt met een tweezijdige test gewerkt, dus de invloed van eventuele schendingen van deze veronderstelling blijft beperkt. Oefening 2 a) Het gaat om afhankelijke steekproeven aangezien het een prijsvergelijking is van dezelfde boeken. b) Analyze > Compare Means > Paired-Samples T Test Paired variables: Pair: 1: variable1 = website1 en variable2 = website2 Options: 99% Continue OK
OUTPUT Nulhypothese H 0 : d 0 Alternatieve hypothese Ha : d 0 (tweezijdige test) met d het gemiddelde prijsverschil tussen website1 en website2. t xd d 4.3 0 4.3 2.884 sd 4.71522 1.49108 n 10 df n 1 10 1 9 p 0, 018 0, 01 => nulhypothese niet verwerpen. 99%-betrouwbaarheidsinterval: Ondergrens: xd tdf, * se 4.3 t9; 0,005*1.491 4.3 3.250*1.491 0.5458 2 Bovengrens: xd tdf, * se 4.3 t9; 0,005*1.491 4.3 3.250*1.491 9.1458 2 Besluit: Het gemiddelde prijsverschil (website1 website2) is niet significant verschillend van 0. ( xd 4.3 ; sd 4.71522 ; n 10 ; t 2.884; p 0, 018 0, 01 (tweezijdig)). Een schatting voor het gemiddelde verschil bedraagt 4.3 met een 99%-betrouwbaarheidsinterval van -0.55 tot 9.15. Merk op: 0 is een element van het betrouwbaarheidsinterval. c) Nulhypothese H 0 : (1 2) d 0 Alternatieve hyp. Ha : 1 2 (eenzijdige test) De p-waarde die in de output gegeven wordt, is de p-waarde die bij de tweezijdige alternatieve hypothese hoort. De p-waarde is de som van de twee rode stukjes in de linkertekening. Voor de eenzijdige alternatieve hypothese kijken we slechts naar 1 staart van de verdeling in plaats van naar de twee staarten. p-waarde tweezijdige H a : p-waarde eenzijdige H a :
De p-waarde van de eenzijdige test is hier dus de helft van de p-waarde van de tweezijdige test. p 0.018 0.009 0.01 2 Het gemiddelde prijsverschil (website1 website2) is significant groter dan 0. ( xd 4.3 ; sd 4.71522 ; n 10 ; t 2.884; p 0, 009 0, 01 (eenzijdig)). Website 1 is gemiddeld gezien duurder dan website 2. Oefening 3 a) Het zijn onafhankelijke steekproeven. De prijzen behoren toe aan verschillende computers. b) Analyze > Compare Means > Independent-Samples T Test Test variable: prijs Grouping variable: methode Define groups : Group 1: a; Group 2: b Continue Options: 95% Continue OK OUTPUT De Levene s test is niet significant ( p 0.337 0.05) De nulhypothese dat de populatievarianties aan elkaar gelijk zijn kan niet verworpen worden. We werken dus verder met Equal variances assumed. Nulhypothese H 0 : a b 0 of a b Alternatieve hypothese Ha : a b 0 (tweezijdige test) of Ha : a b
met a de gemiddelde verkoopprijs bij methode A en b de gemiddelde verkoopprijs bij methode B. se 1 7 1*14.63850² 18 1* 21.18121² * * na nb 2 na nb 8.76848 xa xb 0 233.5714 229.9444 0 3.627 t 0.41364 se 8.76848 8.76848 t-verdeling met df 7 18 2 23 p 0.683 0.05 95%-betrouwbaarheidsinterval: Ondergrens: xa xb tdf, * se 3.627 t23; 0,025*8.76848 3.627 2.0687*8.76848 14.51200 Bovengrens: 2 xa xb tdf, * se 3.627 t23; 0,025*8.76848 3.627 2.0687*8.76848 21.766 2 Besluit: De nulhypothese kan niet verworpen worden. Er is geen evidentie voor een verschil in verkoopsprijs wat betreft de 2 methodes. ( xa 233.5714; xb 229.9444; sa 14.63850 ; sb 21.18121; na 7 ; nb 18 ; t 0.41364; p 0, 683 0, 05 ). Een schatting voor het gemiddelde verschil is 3.627 met een 95%-betrouwbaarheidsinterval van -14.512 tot 21.766. (Merk op: 0 bevindt zich in het betrouwbaarheidsinterval) Oefening 4 a) Categorisch: ordinaal b) Analyze < Descriptive statistics < Crosstabs Sleep 1 variabele naar de rijen en 1 variabele naar de kolommen. Statistics: Vink Chi-Square aan; Continue Cells : Vink observed en expected aan; Continue; OK
c) 57 d) 52 e) 24.3 => 24 f) 130 h) ² 85.025 i) Nulhypothese: de variabelen vertrouwen in de Belgische politie en vertrouwen in de Belgische politiek zijn onafhankelijk van elkaar. Alternatieve hypothese: de variabelen vertrouwen in de Belgische politie en vertrouwen in de Belgische politiek zijn afhankelijk van elkaar. j) 4 k) De p-waarde is bij benadering gelijk aan 0. De nulhypothese dat er geen samenhang is tussen de twee variabelen kan dus verworpen worden.