Analyse van kruistabellen



Vergelijkbare documenten
Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Oplossingen hoofdstuk 9

Verband tussen twee variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Basishandleiding SPSS

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

Meerderheid Zeeland voor snelle bouw brede school i.p.v. bouw MFC Grote bereidheid om de enquête van Progressief Landerd in te vullen.

Statistiek Hoorcollege 5. Χ 2 toets 10/7/2009. De Collegereeks Statistiek. Deze week. Vandaag. Keuze voor een toets

APPENDIX B: Statistische analyses

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Betrouwbaarheid, validiteit en overeenstemming

Fasen in het onderzoeksproces

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Opdracht 5a Kruistabellen

Onderzoek. B-cluster BBB-OND2B.2

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen gewest, tetra en freq.

Verdelingsvrije statistiek

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

TECHNISCHE UNIVERSITEIT EINDHOVEN

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum]

feb 2013 Instituut CMI SPSS les 2

χ 2 -toets voor homogeniteit χ 2 -toets voor goodness-of-fit ten slotte

8. Analyseren van samenhang tussen categorische variabelen

Tabel 2: Stemgedrag van respondenten bij de TK verkiezingen in 2010 VVD xx % PvdA PVV CDA SP D66 CU PvdD SGP GL Te jong om te stemmen Niet gestemd

De primaire link op gemeentelijke websites, Bijlagen. over efficiëntie, effectiviteit en gebruiksvriendelijkheid

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Enkelvoudige lineaire regressie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek II voor TeMa (2S195) op maandag ,

gemiddelde politieke interesse van hoger opgeleide mensen)

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

b. Maak een histogram van de verdeling van het groeiseizoen. Kies eerst klassen en maak een geschikte frequentietabel.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op maandag ,

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Vergelijken van twee groepen (SPSS)

Hoofdstuk 5 Een populatie: parametrische toetsen

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op donderdag ,

Menu aansturing van SPSS voorbeeld in paragraaf 6.5 van hoofdstuk 6 over multipele regressie analyses van recidive bij jongens

SPSS. Statistiek : SPSS

SPSS VOOR DUMMIES+ Werken met de NSE: enkele handige basisbeginselen. Gebaseerd op SPSS21.0 & Benchmarkbestand NSE 2014

Beknopte handleiding SPSS versie van 28

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Beschrijvende statistieken

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

Oplossingen hoofdstuk Het milieubesef

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

Workshop Qualtrics & SPSS

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

Akternatieve doorrekenen. 7.2 Tabellen

Beschrijvende statistiek

Wat zijn de verschillen tussen SPSS 9 en SPSS 10?

Tabellen, grafieken en indexcijfers

** VOORBEELD VAN CAUSALE ANALYSE MET CONFOUNDER EN MEDIATOR **.. GET FILE='u:\)Research\ISSP-NL\ISSP \Data\issp_2013_2014_NL_def.sav'.

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

d. Maak een spreidingsdiagram van de gegevens. Plaats de x-waarden op de x-as en de z-waarden op de y-as.

7.1 SPSS, Een summier overzicht van een aantal faciliteiten

Handleiding SPSS. 1) Maak je bestand

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Meervoudige lineaire regressie

SPSS in praktische stappen voor AGW-bachelors. auteurs: Miranda Winkelhuijzen Mickey Chenault Monique Reusken Pauline Vilters Robbie Martens

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

Praktijkgericht onderzoek in de (para)medische zorg

Antwoordvel Versie A

Hoofdstuk 6 Twee populaties: parametrische toetsen

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Voorbeeld regressie-analyse

1. Introductie tot SPSS

Oplossingen hoofdstuk 4

Bij het maken van deze opgave worden de volgende vragen beantwoord:

mlw stroom 2.1: Statistisch modelleren

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Examen G0N34 Statistiek

Beschrijvende statistiek

Onderzoeksrapport Een statistische en demografische analyse van de Tammenga Pet in Net enquete. (versie 2, 10 november 2013)

Appendix B Computeranalyse van kwantitatieve data

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

1 OEFENING GEGEVENSBEHEER 1

U ziet de progressie van de download aan de groene blokjes in het balkje helemaal onder aan de pagina.

waarin u gegevens in verschillende het wel goed doen Internet Opleidingscentrum

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Toegepaste Statistiek, Week 3 1

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Nominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht

1. Inleiding Constructie van nieuwe variabelen Bereken nieuwe variabelen: Compute Maak nieuwe categorieën: recode...

1. Inleiding Constructie van nieuwe variabelen Bereken nieuwe variabelen: Compute Maak nieuwe categorieën: recode...

Moleculaire LevensWetenschappen stroom 1.2

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Transcriptie:

Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel kan de relatie tussen twee nominale of ordinale variabelen onderzocht worden. Continue variabelen met veel verschillende waarden worden eerst ingedeeld in klassen, voordat ze in een kruistabel gebruikt kunnen worden. Zoals uit de theorie bekend is worden de toets op onafhankelijkheid, de homogeniteitstoets, en de toets voor aanpassing (Goodness of Fit) uitgevoerd met een chi-kwadraat toets, welke in dit practicum uitgebreid aan de orde komt. Tevens zal het opvragen van kritieke waarden en overschrijdingskansen uit een chi-kwadraat verdeling behandeld worden. Tenslotte zal aandacht worden besteed aan het d.m.v. SPSS berekenen van verschillende associatiematen, het relatieve risico, en de odds ratio. De onafhankelijkheid- en homogeniteitstoets middels SPSS: De procedure Crosstabs Zoals we al gezien hebben in I-3 kan middels de procedure Crosstabs een kruistabel worden gemaakt waarin de waarden van de ene variabele afgezet worden tegen de waarden van de andere variabele. De inhoud van de cellen geeft de geobserveerde frequenties weer. Voorbeeld: stel dat je wilt onderzoeken of er een verband bestaat tussen roken (SMOKE) en geslacht (SEX) in het Pulse1.SAV bestand (voor beschrijving zie bijlage 3 deel 1 van het statistiekboek). Het dialoogvenster Crosstabs maak je actief met de menuoptie Analyze Descriptive Statistics Crosstabs. In het kader onder Row(s) geef je de variabele op die de rijen vormt, bijv. SEX en in het kader onder Column(s) de kolomvariabele, bijv. SMOKE: Met behulp van de drukknop Statistics in dit dialoogvenster kun je een chikwadraat toets laten uitvoeren. Klik hiervoor op Chi-Square. Standaard vermeldt SPSS in elke cel van de kruistabel de geobserveerde frequenties (). Onder de drukknop Cells staat standaard onder s Observed II13-1

aangeklikt, maar en/of Expected counts is ook mogelijk. Zie I3-1 van dit Werkboek. Onder Percentages kunnen kolom-, rij- en totaalpercentages worden opgevraagd. Tenslotte kunnen onder de drukknop Exact de resultaten van de exacte toetsen als volgt opgevraagd worden: SPSS uitvoer Crosstabs: Case Processing Summary SEX * SMOKE Cases Valid Missing Total N Percent N Percent N Percent 92 100.0% 0.0% 92 100.0% SEX * SMOKE Crosstabulation SEX Total male female % within SEX % within SEX % within SEX SMOKE no yes Total 37 20 57 64.9% 35.1% 100.0% 57.8% 71.4% 62.0% 40.2% 21.7% 62.0% 27 8 35 77.1% 22.9% 100.0% 42.2% 28.6% 38.0% 29.3% 8.7% 38.0% 64 28 92 69.6% 30.4% 100.0% 100.0% 100.0% 100.0% 69.6% 30.4% 100.0% II13-2

Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Chi-Square Tests Asymp. Sig. Exact Sig. Exact Sig. Value df (2-sided) (2-sided) (1-sided) 1.532 b 1.216.250.158 1.009 1.315 1.570 1.210.250.158.250.158 Point Probability Linear-by-Linear Association 1.515 c 1.218.250.158.089 N of Valid Cases 92 a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.65. c. The standardized statistic is -1.231. Het eerste gedeelte van de uitvoer bestaat uit een tabel met samenvattende datagegevens (aantallen en ontbrekende waarden) en vervolgens een afdruk van de kruistabel. In het voorbeeld worden de geobserveerde frequenties (), de rij-percentages (% within SEX), de kolompercentages () en de totaalpercentages () afgedrukt. Hieruit blijkt bijvoorbeeld dat 35.1% van de mannen en 22.9% van de vrouwen rookt. De laatste tabel (Chi-Square Tests) bevat de chi-kwadraat toetsen. De nulhypothese bij ieder van deze toetsen is telkens: Er is geen samenhang tussen de rij- en kolom variabele (er is onafhankelijkheid). Wij behandelen 2 van deze toetsen: De Pearson Chi-Square. Dit is de Pearson chi-kwadraat toets met als waarde van de toetsingsgrootheid 1.532 (Value) en 1 vrijheidsgraad (df = (het aantal rijen - 1) * (het aantal kolommen -1)). De kolom Asymp. Sig., geeft de overschrijdingskans (p-waarde) weer (.216). Aangezien de p-waarde groter is dan alpha (=.05) wordt de nulhypothese dat SEX en SMOKE onafhankelijk zijn, niet verworpen. Hoewel uit de tabel blijkt dat er meer mannen dan vrouwen zijn die roken, is het verschil niet groot genoeg om als significant beschouwd te worden. De Likelihood Ratio toets is vergelijkbaar met de Pearson chi-square toets wanneer de steekproef groot genoeg is. In ons voorbeeld verschillen de p-waarden van beide toetsen niet veel (.216 versus.210) omdat we te maken hebben met een relatief grote steekproef (N=92). Bij kleinere aantallen heeft deze toets echter wel de voorkeur boven de Pearson chi-kwadraat toets. Eén van de aannames van van de chi-kwadraat toets is dat de verwachte frequentie in elke cel groter dan 5 is, (E) > 5. Onderaan de Chi-Square Tests tabel staat een subscript b waarin een melding wordt gemaakt van het aantal cellen met een verwachte waarde minder dan 5. In ons voorbeeld staat er: 0 cells (.0%) have expected count less than 5. The minimum expected count is 10.65. Er wordt dus aan de aanname voldaan. Indien er niet aan deze aanname wordt voldaan en er dus cellen zijn met een verwacht aantal kleiner dan 5 is het beter om een exacte toets te doen. De p-waarde van de exacte toetsen is in de tabel vermeld in de kolom Exact Sig. II13-3

Meerdere kruistabellen Als in het dialoogvenster Crosstabs meerdere variabelen onder Row(s) en onder Column(s) worden opgegeven, wordt voor elke rijvariabele met elke kolomvariabele een kruistabel gemaakt. Kruistabellen per groep Het is ook mogelijk om kruistabellen te produceren voor verschillende groepen. Bijvoorbeeld een kruistabel van Conditie (ACTIVITY) versus Roken (SMOKE) voor mannen en vrouwen (SEX) afzonderlijk (Pulse bestand). In het dialoogvenster Crosstabs geef je onder Row(s) de variabele ACTIVITY op en onder Column(s) de variabele SMOKE. Klik in het kader onder Layer en plaats hierin de variabele SEX: Het resultaat is dat voor elke waarde van de variabele SEX een kruistabel van ACTIVITY versus SMOKE gemaakt wordt: II13-4

SPSS uitvoer Crosstabs: ACTIVITY * SMOKE * SEX Crosstabulation SEX male female ACTIVITY Total ACTIVITY Total slight moderate a lot slight moderate a lot no SMOKE yes Total 3 3 6 50.0% 50.0% 100.0% 8.1% 15.0% 10.5% 5.3% 5.3% 10.5% 22 13 35 62.9% 37.1% 100.0% 59.5% 65.0% 61.4% 38.6% 22.8% 61.4% 12 4 16 75.0% 25.0% 100.0% 32.4% 20.0% 28.1% 21.1% 7.0% 28.1% 37 20 57 64.9% 35.1% 100.0% 100.0% 100.0% 100.0% 64.9% 35.1% 100.0% 3 1 4 75.0% 25.0% 100.0% 11.1% 12.5% 11.4% 8.6% 2.9% 11.4% 20 6 26 76.9% 23.1% 100.0% 74.1% 75.0% 74.3% 57.1% 17.1% 74.3% 4 1 5 80.0% 20.0% 100.0% 14.8% 12.5% 14.3% 11.4% 2.9% 14.3% 27 8 35 77.1% 22.9% 100.0% 100.0% 100.0% 100.0% 77.1% 22.9% 100.0% Inlezen van kruistabellen: de procedure Weight Cases Het kan voorkomen dat je alleen de beschikking hebt over een kruistabel en niet over de oorspronkelijke waarnemingen. Vergelijk onderstaande kruistabel van geslacht versus links/rechtshandigen: Man Vrouw Rechtshandig 2780 3281 Linkshandig 311 300 Onderzocht wordt of er een verband bestaat tussen geslacht en rechts/linkshandigen. Als je de gegevens op de gebruikelijke wijze in het SPSS datavenster zou invoeren, worden er 2 variabelen gedefineerd, bijv. GESLACHTen HAND. GESLACHT heeft bijv. code 0 voor Man en code 1 voor Vrouw en de variabele HAND heeft bijv. code 0 voor Rechtshandig en II13-5

code 1 voor Linkshandig. Voor de variabele GESLACHT zou dan 3091 keer een 0 (Man) en 3581 keer een 1 (Vrouw) ingetikt moeten worden en voor de variabele HAND 6061 keer een 0 (Rechtshandig) en 611 keer een 1 (Linkshandig). Dit is onbegonnen werk! Gelukkig biedt SPSS de mogelijkheid om dit aanzienlijk sneller te doen (zie ook hoofdstuk I-7 van dit werkboek). Maak in het datavenster een gegevensbestand met drie variabelen, Geslacht, Hand en Aantal op de volgende wijze: De variabele AANTAL geeft de geobserveerde frequenties weer. De betekenis van de eerste regel is dat er 2780 rechtshandige mannen zijn. Ga dit na! Zaak is om SPSS duidelijk te maken dat de waarden in de variabele AANTAL als frequenties beschouwd moeten worden. Daarom gaan we de variabelen wegen op basis van AANTAL. Gebruik hiervoor de menu-optie Data Weight Cases. In het dialoogvenster dat nu verschijnt klik je op Weight Cases by. Selecteer de variabele AANTAL en klik op OK. In de statusbalk rechtsonder in het SPSS scherm verschijnt de melding Weight on: Dus de eerste waarneming Man en Rechtshandig telt nu 2780 keer. Stel het als volgt voor: met behulp van Weight Cases zijn als het ware 2780 regels (=cases) gemaakt met Geslacht = 0 en Hand = 0. Vervolgens kan de chi-kwadraat toets uitgevoerd worden met behulp van de procedure Crosstabs. Selecteer HAND als rijvariabele en GESLACHT als kolomvariabele. Klik op de drukknop Statistics en vink Chi-Square aan. Dit geeft het volgende resultaat. II13-6

SPSS uitvoer Crosstabs: Case Processing Summary HAND * GESLACHT Cases Valid Missing Total N Percent N Percent N Percent 6672 100.0% 0.0% 6672 100.0% HAND * GESLACHT Crosstabulation HAND Total 0 1 % within HAND % within GESLACHT % within HAND % within GESLACHT % within HAND % within GESLACHT GESLACHT 0 1 Total 2780 3281 6061 45.9% 54.1% 100.0% 89.9% 91.6% 90.8% 41.7% 49.2% 90.8% 311 300 611 50.9% 49.1% 100.0% 10.1% 8.4% 9.2% 4.7% 4.5% 9.2% 3091 3581 6672 46.3% 53.7% 100.0% 100.0% 100.0% 100.0% 46.3% 53.7% 100.0% Pearson Chi-Square Continuity Correction a Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association Chi-Square Tests Asymp. Sig. Value df (2-sided) 5.655 b 1.017 5.454 1.020 5.639 1.018 5.654 1.017 Exact Sig. (2-sided) Exact Sig. (1-sided).019.010 N of Valid Cases 6672 a. Computed only for a 2x2 table b. 0 cells (.0%) have expected count less than 5. The minimum expected count is 283.06. Uit de uitvoer (Pearson Chi-Square) blijkt dat geslacht en links/rechtshandigheid afhankelijk zijn (Asymp. Sig. (=p-waarde) =.017). II13-7

Chi-kwadraat toets voor goodness of fit Met de chi-kwadraat toets voor goodness of fit kan bepaald worden of de waargenomen aantallen in verschillende klassen van een variabele overeenkomen met de verwachte frequenties in deze klassen. De chi-kwadraat toets is ook al besproken bij de procedure Crosstabs. Daar werd deze toets echter gebruikt om na te gaan of er een verband tussen twee variabelen bestond. Uitgaande van een dobbelsteenvoorbeeld wordt besproken hoe een goodness of fit toets met SPSS kan worden uitgevoerd. Goodness of Fit met SPSS 60 keer gooien met een dobbelsteen levert de volgende uitkomsten op: Uitkomst Aantal 1 4 2 6 3 17 4 17 5 8 6 9 Voer de gegevens van de variabelen UITKOMST en AANTAL in het datavenster in. Omdat de variabele AANTAL niet uit op zich staande waarden bestaat maar uit frequenties, moet deze variabele eerst gewogen worden met Data Weight Cases. De chi-kwadraat toets voor één variabele wordt uitgevoerd met de procedure Analyze Nonparametric Tests Chi- Square. Het dialoogvenster Chi-Square test wordt nu geopend. Geef onder Test Variable List de variabele UITKOMST op en selecteer onder Expected values de optie All categories equal. Bevestig met OK: SPSS uitvoer Chi-Square toets voor Goodness of Fit: UITKOMST 1 2 3 4 5 6 Total Observed N Expected N Residual 4 10.2-6.2 6 10.2-4.2 17 10.2 6.8 17 10.2 6.8 8 10.2-2.2 9 10.2-1.2 61 Voor elke categorie wordt eerst de waargenomen frequentie afgedrukt (Observed N) en daarna de verwachte frequentie (Expected N). In de kolom Residual staat het verschil tussen de waargenomen en de verwachte frequentie. II13-8

Test Statistics Chi-Square a df Asymp. Sig. UITKOMST 15.230 5.009 a. 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 10.2. Het laatste stukje van de uitvoer geeft de resultaten van de chi-kwadraat toets: de berekende chi-kwadraat toetsingsgrootheid (Chi-Square 15.230), daarnaast het aantal vrijheidsgraden (df =5 = het aantal klassen - 1) en de bijbehorende overschrijdingskans (Asymp. Sig.=.009). Dit betekent dat de nulhypothese: 'de dobbelsteen is eerlijk' verworpen wordt zelfs bij een α van 1%. Standaard wordt bij het uitvoeren van de chi-kwadraat toets voor goodness of fit ervan uitgegaan dat de verwachte frequenties voor alle klassen gelijk zijn (zie Expected values: all categories equal in het Chi-Square test dialoogvenster). Er kunnen zich ook situaties voordoen waar de verwachte frequenties verschillend zijn. Je kunt de waarden van de verwachte frequenties in het kader onder Expected Values opgeven. Klik daartoe op Values, tik de verwachte frequentie van de eerste uitkomst in en klik vervolgens op Add. Geef op deze wijze alle verwachte aantallen op. De functie CDF.CHISQ en IDF.CHISQ De cumulatieve- en inverse verdelingsfunctie zijn eerder uitvoerig aan de orde geweest met betrekking tot de normale verdeling, t- en f-verdeling. Deze verdelingsfuncties kunnen op dezelfde wijze gebruikt worden voor de chikwadraat verdeling. Met de cumulatieve verdelingsfunctie CDF.CHISQ kunnen overschrijdingskansen uit een chi-kwadraat verdeling worden opgevraagd en met de inverse verdelingsfunctie IDF.CHISQ kunnen kritieke waarden uit een chi-kwadraat verdeling worden opgevraagd. Beide functies zijn beschikbaar met Compute Variable (via de menu-optie Transform). Gebruik voor het berekenen van overschrijdingskansen de functie CDF.CHISQ(quant,df) waarbij: quant de waarde van de toetsingsgrootheid is en df het aantal vrijheidsgraden. N.B: SPSS berekent standaard de linkeroverschrijdingskans. Een voorbeeld: Gevraagd: de rechteroverschrijdingskans van 4.24 uit een chi-kwadraat verdeling met 3 vrijheidsgraden. De expressie luidt: p1 = 1 - CDF.CHISQ(4.24,3): II13-9

Voor p1 (de resultaatvariabele) kan men een willekeurige variabele naam invullen. De uitkomst bedraagt.24. Gebruik voor het berekenen van kritieke waarden de functie IDF.CHISQ(prob,df) waarbij: prob de linkeroverschrijdingskans is en df het aantal vrijheidsgraden. Bijvoorbeeld: Wat is de kritieke waarde bij een linkeroverschrijdingskans van 0.90 met 5 vrijheidsgraden (ofwel een rechteroverschrijdingskans van 0.10)?. De expressie luidt: k1 = IDF.CHISQ (.90, 5): II13-10

Dit levert een kritieke waarde op van 9.24. Associatiematen Met behulp van de drukknop Statistics van de procedure Crosstabs kunnen verschillende associatiematen opgevraagd worden: Cramer s V wordt berekend door te klikken op Phi and Cramer s V in het kader onder Nominal. Goodman & Kruskal s Tau worden berekend door te klikken op Lambda in het kader onder Nominal Data. Klik op Risk (rechtsonder in het venster Statistics) om de odds ratio en de relatieve risico s te laten berekenen. II13-11

Beknopte aanwijzingen met betrekking tot de oefeningen van hoofdstuk II-13 Lees dit hoofdstuk eerst goed door!! De meeste oefeningen kunnen met behulp van SPSS gemaakt worden. De gegevens worden bij elke oefening in het datavenster ingevoerd. Telkens als een variabele ingevoerd wordt waarvan de waarden als frequenties beschouwd moeten worden, maak gebruik gemaakt van de menu-optie Data Weight Cases. Oefening 13.1 13.1.a: Voer de waarden 1.61, 11.07, 1 en 10 in het datavenster in. Noem deze variabele bijv. K. Bereken de overschrijdingskansen met Transform Compute Variable. Geef onder target variable (resultaatvariabele) de naam van de variabele die de overschrijdingskansen gaat bevatten, bijv. P. Gebruik de numerieke expressie 1-CDF.CHISQ(K,5). Voor elke waarde van K wordt op deze wijze de rechteroverschrijdingskans berekend. 13.1.b: Bereken de kritieke waarde met behulp van de functie IDF.CHISQ. 13.1.c: Ga te werk zoals bij oefening 13.1.a en 13.1.b, maar nu met df = 10. Oefening 13.2 13.2.a: Maak 2 variabelen, Uitkomst (=dag van de week, 1 t/m 5) en Frequentie (=aantal ongelukken op die dag) en voer de gegevens in. Weeg de variabele Frequentie. De chi-kwadraat toets voer je uit met Analyze Nonparametric Tests Chi-Square. De verwachte frequentie is gelijk per werkdag. Oefening 13.3 Deze oefening kan op twee manieren: 1 Maak 2 variabelen in het datavenster: LEEFTIJD en AANTAL. Weeg de variabele AANTAL. Voer vervolgens de chi-kwadraat toets uit met de procedure Analyze Nonparametric Tests Chi-Square. Bereken de verwachte frequenties door het aantal waargenomen juryleden per leeftijdscategorie te vermenigvuldigen met de gegeven procentuele leeftijdsverdeling. Vb: Leeftijd 21-40: 66*0.42 = 27.72. Vul deze verwachte frequenties in het kader onder Expected values Values in. Telkens als je een waarde hebt ingetikt klik je op Add. Laat de toets uitvoeren als alle verwachte waarden zijn ingetikt. 2 Maak 2 variabelen met geobserveerde (OBS) en verwachte frequenties (VERWACHT, berekening als bij 1). Bereken de toetsingsgrootheid als volgt: - Geef met het Compute Variable commando (via Transform) de expressie: II13-12

Chi=(OBS-VERWACHT)**2/VERWACHT - Bereken vervolgens de som van de variabele Chi, bijv. met de procedure Descriptives en de drukknop Options. Noteer deze waarde. - Tenslotte bereken je de overschrijdingkans van deze waarde met de functie CDF.CHISQ. Oefening 13.4, 13.5 en 13.6 Als oefening 13.3 Oefening 13.8 Maak 3 variabelen: GESLACHT, STEM, en AANTAL. Weeg de variabele AANTAL met Weight Cases. Voer de chi-kwadraat toets uit met de procedure Crosstabs. Verschil van de 2 proporties en het 95%-BI met de hand uitrekenen. Oefening 13.9 Als bij oefening 13.8. Oefening 13.10 Bereken de aantallen voor degenen die wel resp. geen hulp nodig hebben per groep. Bijvoorbeeld bachelors-wel hulp nodig: 513*76.4=392 en bachelorsgeen hulp nodig: 513*23.6=121. Rond de aantallen af op gehele getallen. Voer de variabelen HULP, GROEP en AANTAL in het datavenster in. Weeg de variabele AANTAL. Voer de chi-kwadraat toets uit met de procedure Crosstabs Oefening 13.11 Ga te werk zoals bij oefening 13.8. en bereken tevens de gevraagde associatiematen (klik op de drukknop Statistics en vink het volgende aan: Chi- Square, Phi and Cramer s V en Lambda en bevestig met OK. Oefening 13.12 13.12.a: Als oefening 13.8 13.12.b, 13.12.c, 13.12f, en 13.12g: Met de hand. (eventueel relatief risico door SPSS laten berekenen m.b.v. Risk onder de drukknop Statistics van de procedure Crosstabs. Oefening 13.13 Als bij oefening 13.8 ter uitvoering chi-kwadraat test (niet expliciet gevraagd). Rest met de hand! (ter controle eventueel SPSS de relatieve risico met bijbehorend BI laten berekenen) Oefening 13.14 Als bij oefening 13.8 ter uitvoering van chi-kwadraat test (niet expliciet gevraagd). Rest met de hand! (ter controle eventueel de odds ratio met bijbehorend BI berekenen met SPSS). II13-13