Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1
Bestand opmaken Variabelen definiëren: kies variable view (links onderaan scherm): 2
Bestand opmaken Data invoeren: kies Data view : 3
4 Soorten variabelen Nominale variabelen: kengetallen toekennen; een one-to-one relationship vb: de eigenschap geslacht Ordinale variabelen: ranggetallen toekennen; een orderelatie vb: onderwijsniveau Interval variabelen intervallen vergelijken vaste afstanden tussen opeenvolgende meetwaarden geen natuurlijk nulpunt temperatuur (Celsius & Fahrenheit) Ratio variabelen vaste afstanden tussen opeenvolgende meetwaarden wel een natuurlijk nulpunt vb.: leeftijd (jaren)
5 Bestand opmaken Nieuwe variabele invoegen data insert variable Nieuwe waarneming invoegen data insert case Opzoeken van een waarneming data Go to case Opzoeken van een variabele Utilities variables Go to
Bestand controleren Enkele beschrijvende statistieken Analyze Descriptive statistics Frequencies geeft frequenties, percentielen, gemiddelde, mediaan,.. geeft plots mogelijk om foutieve waarden op te sporen Descriptives Explore mogelijk om extreme waarden op te sporen 6
Variabelen berekenen en indelen in klassen (1) Transform menu berekenen van variabelen: compute 7
Variabelen berekenen en indelen in klassen (2) Voor indelen in klassen: recode Voor herdefiniëren van variabelen Transform Recode into same variable into different variables Voorbeeld: leeftijdscategorieën opmaken 8
Selecteren van waarnemingen Data Split file voorbeeld: analyses voor mannen en vrouwen Data select cases voorbeeld: analyse voor mensen die de laatste drie jaar niet gepromoveerd zijn 9
Kruistabellen (1) Crosstabs inzicht in verband tussen twee variabelen nominale of ordinale variabelen continue variabelen voorafgaand in klassen indelen (hercoderen) eenvoudig (iedereen begrijpt ze) en krachtig (veel info zonder noodzaak van geavanceerde statistiek) Werkwijze Analyze Descriptive Statistics Crosstabs Onafhankelijke variabele als rijvariabele, afhankelijke als kolomvariabele (laat toe getallen onder elkaar te vergelijken) Cells: meer info opnemen in tabel (b.v. kolompercentage) Statistics: b.v. berekenen van Chi-kwadraattoets Format: uitzicht tabel veranderen Layer: voor elke waarde van een variabele afzonderlijke kruistabel 10
Kruistabellen (2) Crosstabs: Cell display Expected: verwachte of theoretische frequentie die voor chikwadraattoets wordt gebruikt Row - Column - Total Residuals: unstandardized residual geeft waargenomen frequentie minus verwachte frequentie Chi-kwadraattoets Nagaan of twee nominale variabelen onafhankelijk zijn Nulhypothese: er is geen verband tussen variabelen Geeft weinig info over richting of sterkte van verband 11
Kruistabellen (3): Kengetallen Correlations Pearson: Lineair verband dat bij interval en ratio geschaalde variabelen wordt gebruikt Spearman: correlatiecoëfficiënt voor ordinale variabelen Overige Contingency coëfficiënt, Phi and Cramer s V: mate van verband tussen twee nominale variabelen Gamma: mate van verband tussen twee ordinale variabelen Kendall s Tau-b: alleen voor vierkante tabellen Eta: afhankelijke variabele interval, onafhankelijke nominaal of ordinaal 12
Beschrijven van groepen: Means (1) Termen onafhankelijke variabele: variabele die de groepsindeling bepaalt (nominale of ordinale variabele) afhankelijke variabele: variabele waarvoor kengetallen worden opgevraagd (ratio of interval variabele) Bewerking Analyze Compare means Means Dependent list, independent list Output Standaard (entire population) means, standaarddeviatie, aantal obs. Via options: ook andere kengetallen Multiple layers Om subgroepen verder op te splitsen 13
14 Beschrijven van groepen: Means (2) One sample t-test informatie over representativiteit van een steekproef vaststellen of het steekproefgemiddelde overeenkomt met een andere waarde (een norm, een nationaal gemiddelde, ) nulhypothese: steekproefgemiddelde is gelijk aan ander gemiddelde T-test nagaan of de gemiddelden van twee groepen gelijk zijn, en dit bij onafhankelijke groepen (Analyze Compare means Independent samples t-test) nulhypothese: gemiddelden zijn gelijk bij afhankelijke groepen (b.v. echtparen - vergelijken scores van man en vrouw; longitudinaal onderzoek): paired samples t- test
Beschrijven van groepen: Means (3) T-test output Levene s test voor gelijkheid van varianties nulhypothese stelt dat variantie in beide groepen gelijk is; bij zeer lage p- waarde wordt deze hypothese verworpen 2-tail sig geeft overschrijdingskans weer (two tailed significance) nulhypothese stelt dat gemiddelden niet verschillen; bij lage overschrijdingskans wordt nulhypothese verworpen 15
Variantie-analyse (1) Gemiddelden van verschillende groepen worden vergeleken verschil met t-toets: > 2 groepen verschil met regressie: er wordt geen veronderstelling gemaakt over het functioneel verband H 0 : de gemiddelden van de verschillende groepen zijn gelijk H 1 : de gemiddelden van de verschillende groepen zijn ongelijk Analyze - Compare Means - One Way Anova Voorbeeld 16 We gaan na of mensen die aan meer personen leiding geven gemiddeld verschillen in leeftijd van mensen die aan minder personen leiding geven H0: de gemiddelde leeftijd verschilt niet per leidingsgroep H1: de gemiddelde leeftijden per leidingsgroep zijn ongelijk afhankelijke variabele: leeftijd factor: leiding
Variantie-analyse (2) Post Hoc LSD: vergelijkt gemiddelde van elke groep met elke andere groep m.b.v. een t- toets (kans dat significante verschillen gevonden worden neemt toe met aantal vergelijkingen) Bonferroni corrigeert voor nadeel van LSD (strenger) 17
Regressie-analyse Lineair verband schatten tussen een afhankelijke variabele en één of meer onafhankelijke variabelen: Y=β 0 +β 1 X+e interval of ratio variabelen een uitzondering hierop is als gebruik gemaakt wordt van dummy variabelen (waarde 0 en 1) Analyze Regression Linear voorbeeld: invloed van anciënniteit en voltijds/deeltijds contract op binding 18
Oefeningen Vergelijk de gemiddelde leeftijd van mannen en vrouwen maak 4 anciënniteitscategorieën (anciënniteit in het bedrijf) aan: 0-5 jaar 5-15 jaar 15-25 jaar > 25 jaar maak dummyvariabelen aan voor de verschillende functieniveaus Ga na of de anciënniteit in de functie verschilt tussen mensen die al dan niet bedrijfsopleiding hebben gekregen doe een regressie-analyse met als afhankelijke variabele jobanciënniteit en als onafhankelijke anciënniteit in bedrijf, voltijds/deeltijds contract en functieniveau bereken de gemiddelde anciënniteit in de job voor mensen die geen leiding geven 19
20 Hulp en praktische achtergrondinfo Hand-out introductiesessie Help functie SPSS Huizingh, E. (2002). Inleiding SPSS 11.0 voor Windows en data entry. Academic Service: Schoonhoven (beschikbaar in RBIB) Howitt, D. & Cramer, D. (2004). Statistiek met SPSS 11.0 voor Windows. Pearson Education. ((te) eenvoudig; nuttig als inleiding op loglineaire analyse en factoranalyse) (beschikbaar in bib ETEW) Kerr, A., Hall, H. & Kozub, S. (2003). Doing statistics with SPSS. Sage: London. (beschikbaar in bib ETEW) SPSS thuis of op kot: studentenversie (beperkt tot 100 var./2500 cases!!): beschikbaar bij LUDIT (35 euro) Full version: 300 euro http://ludit.kuleuven.be/software/campuslicenties/cspss.html