SPSS. Statistiek : SPSS

Vergelijkbare documenten

Onderzoek. B-cluster BBB-OND2B.2

Oplossingen hoofdstuk Het milieubesef

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

9. Lineaire Regressie en Correlatie

11. Multipele Regressie en Correlatie

Oplossingen hoofdstuk XI

Verband tussen twee variabelen

Oefenvragen bij Statistics for Business and Economics van Newbold

Fasen in het onderzoeksproces

feb 2013 Instituut CMI SPSS les 2

Grafieken Cirkeldiagram

Oplossingen hoofdstuk 9

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

College Week 4 Inspecteren van Data: Verdelingen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Oplossingen hoofdstuk 4

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Data analyse Inleiding statistiek

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

mlw stroom 2.1: Statistisch modelleren

College 2 Enkelvoudige Lineaire Regressie

Statistiek voor A.I. College 2. Donderdag 13 September 2012

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

HOOFDSTUK VII REGRESSIE ANALYSE

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

b. Bepaal b1 en b0 en geef de vergelijking van de kleinste-kwadratenlijn.

Feedback proefexamen Statistiek I

Basishandleiding SPSS

Examen Statistiek I Feedback

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

College 4 Inspecteren van Data: Verdelingen

Hoofdstuk 8: Multipele regressie Vragen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

Kansrekening en Statistiek

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Samenvattingen 5HAVO Wiskunde A.

4 Domein STATISTIEK - versie 1.2

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

Hoofdstuk 5 Een populatie: parametrische toetsen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

A. Week 1: Introductie in de statistiek.

Statistiek. Statistiek. 1 Wat is statistiek en opstart PASW

Betrouwbaarheid, validiteit en overeenstemming

Analyse van kruistabellen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen....

Workshop Qualtrics & SPSS

TIP 10: ANALYSE VAN DE CIJFERS

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Statistische variabelen. formuleblad

Opgave 1: (zowel 2DM40 als 2S390)

Hoofdstuk 3 : Numerieke beschrijving van data. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Hoofdstuk I De statistiek in het onderzoek Doelstellingen: Statistiek Beschrijvende statistiek Inductieve statistiek

SPSS Opstarten & gegevens inlezen Gegevens verkennen Beschrijvende statistiek

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Opdracht 5a Kruistabellen

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

Voorbeeldtentamen Statistiek voor Psychologie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

DEEL 1 Probleemstelling 1

In de praktijk gaat men eerder werken met numerieke codes. Aan de hand van een codeboek wordt per variabele een nummer aan een waarde toegekend.

8. Analyseren van samenhang tussen categorische variabelen

Hoofdstuk 4. Beschrijvende statistiek. 4.1 Beschrijvende statistiek voor één variabele

Voorbeeld regressie-analyse

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Wat zijn de verschillen tussen SPSS 9 en SPSS 10?

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Kansrekening en Statistiek

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Enkelvoudige lineaire regressie

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

Data analyse Inleiding statistiek

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

LES 2: Data-cleaning en -transformatie 1. Frequentietabel

Hoofdstuk 2: Verbanden

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Technische uitwerkingen voor het SPSS practicum Inleiding M&T.

Transcriptie:

SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik van Excel: zeer beperkte mogelijkheden voor inductieve statistiek Gebruik van SPSS: zeer handig. Meest gebruikte sofware voor statistische analyse. SPSS: Statistical Package for the Social Science (SPSS) Twee tabs: - variable view - data view Twee windows: - input - output 1

Type : numeric = getallen --> kan dus een gemiddelde worden berekent string = letters --> kan dus geen gemiddelde worden berekent Values : moet worden ingevuld als de variabele een categorie is 2

Missing: wat niet in gevuld is uit de enquête, daar wordt een getal voor geplaatst dat geen waarde kan zijn Scale : meetbaar, metingen ordinaal : volgorde vb.: niet akkoord, beetje akkoord, grotendeels akkoord, helemaal akkoord nominaal : groepen, categorieën : studenten psychologie, studenten logopedie 3

4

SPSS : output viewer Via Analyze kunnen we een opdracht geven aan SPSS Analyse 5

Output viewer HOOFDSTUK 2 : 2.3. betekenis van dit meetniveau THEORIE : ZIE SAMENVATTING In de psychologie vooral nominale, ordinale en interval variabelen, weinig ratio schalen. Onderscheid tussen interval en niet interval is het belangrijkste onderscheid, met oog op de analyse van de gegevens. SPSS maakt geen onderscheid tussen interval en ratio: nominal, ordinal en scale -> dit is in te vullen bij valiable view -> meassure = niveau van variabelen 6

Soms berekent spss zinloze waarden : --> zie theorie nu van 2.3 Hoort bij hoofdstuk 2 : SPSS TRANSFORM U kunt variabelen bewerken via het menu transform - compute maakt berekeningen op variabelen, bv. optellen, keer, etc - via recode kunt u variabelen hercoderen - via count u bepaalde scores tellen per persoon. SPSS transform RECODE 7

Op deze wijze ontstaat een nieuwe variabele met als titel recodegezond. Deze variabele is precies het omgekeerde van item 19L. Tip: maak gebruik van recode into a different var ; Voor de totaalscore van gezondheidsbesef moeten we gebruik maken van recodegezond en niet van het item 19L Recode IF kan ook gebruikt worden. U definieert een conditie waaraan voldaan moet worden om de recode uit te voeren. 8

SPSS transform COMPUTE We zouden ook gebruik kunnen maken van de som van de items.??? Op deze wijze ontstaat een nieuwe variabele gezondheidsbesef, waarmee we zullen verder werken, en niet meer met de afzonderlijke items. U kunt ook gebruik maken van de mogelijkheid om een conditie aan te geven (compute IF) om deze compute uit te voeren SPSS transform -> COUNT tel het aantal missing values per persoon 9

Op deze wijze ontstaat een nieuwe variabele waarin het aantal missing values per persoon samengeteld wordt. U kunt hierbij ook gebruik maken van de optie Count IF. HOOFDSTUK 3 : Frequentietabel en histogram met SPSS!! Frequentietabel en histogram met SPSS SPSS zal voor een frequentietabel niet automatisch een gegroepeerde tabel maken. Dit is wel mogelijk via recode van de gegevens. Eventueel een stem and leaf plot. Als histogram zal SPSS bij een grote diversiteit van waarden automatisch de waarden in klassen indelen 10

AANMAKEN VAN TABEL Spss output van een tabel 11

Spss aanmaken van een staafdiagram Spss output van een staafdiagram 12

SPSS en een taartdiagram grafiek van nominale waarden : 13

SPSS tabel en grafiek maken van interval waarden SPSS maakt niet automatisch een gegroepeerde frequentietabel dus een gegroepeerde frequentietabel maken --> SPSS aanmaken van een histogram 14

SPSS output van een histogram 15

SPSS : boxplot maken OF!!!! (hoofdstuk 4 : na de mediaan) 16

BOXPLOT : SPSS werken interactieve grafiek Hoe zou de verdeling zijn van de diploma s bij dames en heren in deze steekproef? 17

GECLUSTERD STAAFDIAGRAM 18

HOOFDSTUK 4 : centrummaten SPSS en centrummaten 19

20

Spss output spss en het rekenkundig gemiddelde Om subgroepen te vergelijken maken we vaak gebruik van het rekenkundig gemiddelde. Maak uitgaande van het bestand busters.sav een vergelijking tussen de beide leeftijdsgroepen voor wat betreft de levensstijl variabelen (op grond van de gemiddelden) Spss maak een vergelijking tussen de subgroepen spss output 21

BESLUIT centrummaten : Bij centrummaten gaat het om het centrum van de geobserveerde scores. We onderscheiden modus, mediaan en gemiddelde. De mediaan is niet gevoelig voor extreme waarden, het gemiddelde wel. Het gemiddelde varieert minder (in vergelijking met de mediaan) wanneer men uit een populatie meerdere steekproeven trekt. HOOFDSTUK 5 : spreidingsmaten standaardafwijking,.. Analoog voor de variantie; SPSS maakt altijd gebruik van N-1 (schatting van de sigma) SPSS EN STANDAARD DEVIATIE 22

SPSS en standaardscores 23

Hoofdstuk 8 : kruistabellen en spss crosstabs snelle invoer van een kruistabel 24

25

Opvragen van een kruistabel output van de kruistabel 26

Opvragen van de Chi-kwadraat Opvragen van de Chi-kwadraat en associatiematen output van de Chi-kwadraat via spss 27

Opvragen van de Fe Opvragen van de geobserveerde en verwachte aantallen 28

output van een kruistabel via SPSS Relatie tussen roken en hart- en vaatziekten 29

HOOFDSTUK 8 : (2 de keer : Mc Nemar toets) Input data via weight cases Mc Nemar toets via SPSS Analyze descriptive stat crosstabs - statistics output Mc Nemar (terug naar samenvatting- voor goodness of fit) hoofdstuk 8 deel 3 : goodness of fit SPSS Chi-kwadraat goodness-of-fit Invoeren van de data, via data weight cases 30

SPSS output data SPSS Chi-kwadraat goodness-of-fit SPSS output Chi-kwadraat goodness-of-fit 31

(terug naar samenvatting) na uitleg van cramer s V, C, en phi-coëfficiënt staat : Output van associatiematen in SPSS politieke voorkeur t.o.v. attitude milieutaks ( terug naar samenvatting) hoofdstuk 8 : deel 4 Input in SPSS via weight cases spss en Kappa Analyze descriptive stat crosstabs statistics - 32

spss en Kappa output Toepassingen : toepassing 1 Bestaat er een verband tussen geslacht en dyslexie? Bereken de samenhang handmatig en controleer het resultaat aan de hand van SPSS. Geslacht en dyslexie: twee vragen Bestaat er een significant verband? Hoe sterk is dit verband? De kruistabel: SPSS output: de Chi-kwadraat 33

SPSS output: de associatiematen Toepassing 2 : zie samenvatting Hoofdstuk 9 : correlatie en regressie na Correlatie en causaliteit. spss input : 34

SPSS scatterplot Kies voor simple scatter Afhankelijke variabele op de Y-as Onafhankelijke variabele op de X-as 35

het spreidingsdiagram spss analyse 36

spss output : (,914 =,91 / 0,91 ) de 0-hypothese zegt : geen samenhang ( = een veronderstelling) de alternatieve hypothese zegt : wel samenhang ( = feitelijk) dus -> de 0-hypothese = FOUT sig.(2-tailed) : - kleiner dan 0,05 : significantie de 0-hypothese wordt verworpen - groter dan 0.05 : geen significantie de 0-hypotese blijft De 0-hypothese veronderstelt altijd : geen samenhang. ( terug naar samenvatting : lineaire regressie) Hoofdstuk 9 : lineaire regressie De regressielijn een eenvoudig voorbeeld: het salaris 37

spss input : spss output de correlatie : 38

Teken een scatterplot via SPSS SPSS aanmaken van een scatterplot Afhankelijke variabele op Y-as Onafhankelijke variabele op X-as SPSS output: de scatterplot 39

B = +/- (+12,00) A = 0 R square = determinatie coëfficiënt = de maat hoe goed uw regressie lijn is : hier perfect = 1 Fouten bij de voorspelling? nee determinatie coëfficiënt = 100% 40

Spss regessietechniek SPSS regressie analyse Dependent =afhankelijke variabelen 41

Independent =onafhankelijke variabelen De regressielijn: een voorbeeld, nu met eindejaarspremie 1000 y = 1000 + 12,00 X a = 1000 b = 12,00 X = maandloon 2 vragen : Hoe vinden we de parameters van de regressielijn (Y = a + bx)? Hoe goed kunnen we de Y waarden voorspellen op basis van dit model? hoe dichter de punten bij regressie lijn : hoe meer juist het zal zijn. Hoe vinden we deze a en b coëfficiënten? b: dit is de richtingscoëfficiënt; deze is functie van de r en de verhouding tussen de twee SD. b = ryx. SDY/SDX (slope) a: dit is de uitslag van Y indien X nul bedraagt; a = Y bx (intercept) b = de verandering in y wanneer x met 1 eenheid toeneemt Op grond van deze vergelijking kunnen we voor elke score van X een verwachting voor Y formuleren. Y = a + bx Y = 2,4 + 1,31X bv. X = 3, Y =? Y = 2,4 + 1,31*3 Y = 6,31 De regressielijn voldoet aan het criterium van het kleinste kwadraat. D.w.z. dat de gekwadrateerde afwijking van de verwachte uitslag t.o.v. de 42

feitelijke uitslag minimaal is. Algemene werkformule van de regressielijn: Y = Y + r XY (Xi X)*SDY/SDX Vergelijking van de best passende lijn, waarbij de Y waarden zo goed mogelijk geschat kunnen worden op grond van de X waarden. De regressielijn is niet symmetrisch. Hoe goed voldoet dit model om de werkelijkheid te voorspellen? Waarde van de regressielijn I Het verschil tussen de verwachte en de feitelijke score van Y is de schattingsfout. De SD van deze fout is de standaardschattingsfout. Dit komt overeen met de SD van de verschillen tussen de verwachte en feitelijke uitslag. SD Y.X = SD Y *V1-r2 ; Standaardschattingsfout In SPSS wordt deze standaardfout aangeduid middels std. error of the estimate. Deze schattingsfout geeft een indicatie van de (on)nauwkeurigheid van de voorspelling. (omgekeerde) relatie met rxy de standaardschattingsfout : standaard fout of estimate geeft aan hoe onnauwkeurig uw voorspelling van y is op grond van de regressielijn. ( berekening : standaarddeviatie ( SD ) SD y. x = SD y * vierkantswortel van ( 1-r²) = de standaard deviatie van uw verdeling van fouten (wat u verwacht <-> feiten) in 2/3de van de gevallen zal de fout kleiner zijn dan standaard schattingsfout. Waarde van de regressielijn II Hoe goed verklaart het model de werkelijke gegevens? Proportie niet-verklaarde variantie: (1- r2 XY ) Proportie verklaarde variantie: r2 XY Deze determinatiecoëfficiënt geeft de gemeenschappelijk variantie weer. Kan berekend worden via het kwadraat van de r. Voorstelling: R2 Mijn correlatie coëfficiënt zou al.70 moeten zijn, dan kan ik 50% verklaren want :.70² =.50 = 50 procent bv.: correlatiecoëfficiënt =.40 (.40² = 0,16 ) dit betekent dat ik 16% zou kunnen verklaren, en dus 84 % niet. je zou al de helft, of meer van de verschillen moeten kunnen verklaren. 43

terug naar het voorbeeld van de IQ schoolvorderingen R Square : determinantiecoëfficiënt = 0,914² = 0,835 Adjusted R Square : niet belangrijk bij 1 regressielijn, wel bij meerdere! 16,46 = constante 0,52 = B --> zie uitgaven restaurant en inkomen de samenvatting! Hoofdstuk 10 : De rangcorrelatiecoëfficiënt spss input : 44

SPSS analyse correlatie bivariate SPSS. De rangcorrelatie: output : 9,05 = significant --> terug naar samenvatting : probleem :knopen 45

Hoofdstuk 10 : De Puntbiseriële coëfficiënt hoe doet ge itemanalyse: analyse scale betrouwbaarheid chromer alfa en dan bekomt ge dit: -> terug naar samenvatting : 10.3 10.3 verband tussen meer dan 2 (interval) variabelen. 46

spss : en de partiële correlatie: Spss : en de multiple correlatie een voorbeeld : 47

--> terug naar samenvatting ( samenhang tussen meerdere interval variabelen) 48