DEEL 1 Probleemstelling 1 Hoofdstuk 1 Van Probleem naar Analyse 1.1 Notatie 4 1.1.1 Types variabelen 4 1.1.2 Types samenhang 5 1.2 Sociaalwetenschappelijke probleemstellingen en hun basisformat 6 1.2.1 Werkzaamheid en overgewicht: 6 de schijnbare causaliteit 1.2.2 Regionale verschillen in bestaansonzekerheid: 7 de indirecte causaliteit 1.2.3 Leeftijd en subjectieve bestaansonzekerheid: 8 suppressie van een samenhang 1.2.4 Beroepsstatus en subjectieve gezondheid: 9 de interactieve structuur 1.2.5 Politiek vertrouwen: 11 1.2.6 Etnische identiteit bij minderheden: 14 1.2.7 Schoolloopbanen van allochtone jongeren: 17 1.2.8 Arbeidsregime in België: 21 1.2.9 Attitudes van Turkse en Marokkaanse mannen in België: de latente structuur 23 1.3 Kernbegrippen 25 1.4 Geraadpleegde Literatuur 25 3
viii DEEL 2 Basis 27 Hoofdstuk 2 Meten en Meetniveaus 2.1 Wat is meten? 29 2.2 Eigenschappen van meetschalen 33 2.2.1 Ordenbaarheid 33 2.2.2 Het bestaan van een meeteenheid 33 2.2.3 Het bestaan van een absoluut nulpunt 33 2.3 Meetniveaus 33 2.4 Hiërarchie van meetniveaus 37 2.5 Kernbegrippen 38 2.6 Geraadpleegde Literatuur 38 Hoofdstuk 3 Frequentieverdelingen & Grafische Voorstellingen 3.1 Nominale variabelen 39 3.1.1 Frequentietabel: absolute en relatieve frequenties 40 3.1.2 Grafische voorstelling: histogram, cirkeldiagram 41 3.2 Ordinale variabelen 42 3.2.1 Frequentietabel: 42 absolute en relatieve cumulatieve frequenties 3.2.2 Grafische voorstelling van ordinale variabelen 43 3.3 Interval- en ratiovariabelen 44 3.3.1 Niet in klassen gegroepeerde gegevens 45 3.3.2 In klassen gegroepeerde gegevens 46 3.4 Kernbegrippen 50 Hoofdstuk 4 Univariate Statistische Parameters 4.1 Inleiding 51 4.2 Maatstaven voor ligging en centrale tendens 51 4.2.1 Modus en modale klasse 52 4.2.2 Kwantielen en mediaan 53 4.2.3 Rekenkundig gemiddelde 55 4.2.4 Meetkundig gemiddelde 55 4.2.5 Harmonisch gemiddelde 57 4.3 Maatstaven voor spreiding 58 4.3.1 Variatiebreedte of range 59 4.3.2 Kwantielafstanden 59 4.3.3 Centraal moment van rang 1 61 4.3.4 Gemiddelde absolute afwijking e 62 4.3.5 Variatie en variantie 62 29 39 51
ix 4.3.6 Standaardafwijking 65 4.3.7 Variatiecoëfficiënt 66 4.3.8 Even centrale momenten 66 4.4 Maatstaven voor symmetrie 66 4.4.1 Empirische coëfficiënt van Pearson 67 4.4.2 Coëfficiënt van Yule en Kendall 68 4.4.3 Oneven centrale momenten 68 4.4.4 Coëfficiënt van Fisher 69 4.4.5 Coëfficiënt van Pearson 69 4.5 Maatstaven voor kurtosis 70 4.5.1 Coëfficiënt van Pearson 70 4.5.2 Coëfficiënt van Fisher 71 4.6 Kernbegrippen 71 4.7 Geraadpleegde Literatuur 72 Hoofdstuk 5 Inductieve Statistiek 5.1 De centrale limietstelling 74 5.2 Toepassingen van de Centrale Limietstelling 78 5.2.1 Test voor het populatiegemiddelde 78 5.2.2 Berekenen van een betrouwbaarheidsinterval 81 5.3 De Student s t-verdeling 83 5.3.1 Hypothesetoets 85 5.3.2 Berekenen van een betrouwbaarheidsinterval 85 5.4 Kernbegrippen 86 5.5 Geraadpleegde literatuur 86 DEEL 3 Analyse 87 Hoofdstuk 6 Samenhang en Statistische Controle 6.1 Analyse van nominale en/of ordinale variabelen 89 6.1.1 Gegevens en probleemstelling 90 6.1.2 Analyse van kruistabellen: doelstellingen 90 6.1.3 Anatomie van een kruistabel 91 6.1.4 Statistische onafhankelijkheid en samenhang 92 6.1.5 Aard van de samenhang: rij- en kolompercentages 93 6.1.6 Significantietoetsing bij kruistabellen: chi-kwadraat 95 6.1.7 Sterkte van het verband: associatiematen 99 6.1.8 Tabelsplitsing 102 6.1.9 Tabelsplitsing: een voorbeeld 102 6.1.10 Mogelijke uitkomsten bij tabelsplitsing 104 6.2 Samenhang tussen variabelen van interval- en/of rationiveau 113 73 89
x 6.2.1 Scatterplots 114 6.2.2 Covariatie en covariantie 115 6.2.3 Pearson product-moment correlatiecoëfficiënt 119 6.2.4 Partiële correlatie 121 6.3 Kernbegrippen 124 6.4 Geraadpleegde Literatuur 124 Hoofdstuk 7 Bivariate Regressie 7.1 Probleemstelling en causaal diagram 125 7.2 Gegevens en Operationalisering 126 7.3 Grafische voorstelling 128 7.4 Het model van bivariate regressie 129 7.5 Doelstellingen van bivariate regressie 132 7.6 Schatting van de regressieparameter 132 7.6.1 Kleinste kwadratencriterium (Ordinary Least Squares) 133 7.6.2 Eigenschappen van de OLS-schatters 136 7.7 Interpretatie van de regressieparameters 136 7.8 Sterkte van het verband en verklaarde variantie 140 7.8.1 De correlatiecoëfficiënt 140 7.8.2 De determinatiecoëfficiënt 141 7.9 Regressie met gestandaardiseerde variabelen 145 7.10 Significantietesten 147 7.10.1 T-test en betrouwbaarheidsinterval voor en 147 7.10.2 Modelvergelijkingsprocedure en F-test 154 7.11 Kernbegrippen 156 7.12 Geraadpleegde Literatuur 156 Hoofdstuk 8 Meervoudige Regressie 8.1 Probleemstelling en causaal diagram 159 8.2 Gegevens en operationalisering 161 8.3 Voorbereidende bivariate analyses 162 8.3.1 Bivariate regressie in functie van 162 8.3.2 Bivariate regressie in functie van 164 8.4 Grafische voorstelling van meervoudige regressie 166 8.5 Het model van meervoudige regressie 168 8.6 Doelstellingen van meervoudige regressie 170 8.7 Schatting van de regressieparameters 171 8.8 Interpretatie van de regressieparameters 173 8.9 Sterkte van het verband en verklaarde variantie 175 8.9.1 Meervoudige correlatiecoëfficiënt 175 8.9.2 Meervoudige determinatiecoëfficiënt 176 125 159
xi 8.9.3 Adjusted 179 8.10 Meervoudige regressie met gestandaardiseerde variabelen 179 8.11 Significantietesten 183 8.11.1 Modelvergelijkingsprocedure en F-test 183 8.11.2 T-test partiële regressiecoëfficiënten 184 8.11.3 F-test voor partiële regressiecoëfficiënten 188 8.11.4 T-test regressiecoëfficiënt 190 8.12 Regressiediagnostiek 191 8.12.1 Lineariteitsassumptie 191 8.12.2 Additiviteitsassumptie 196 8.12.3 Multicollineariteit 199 8.12.4 Afwezigheid van autocorrelatie 201 8.12.5 Homoscedasticiteitsassumptie 202 8.12.6 Normaliteitsassumptie residuen 203 8.12.7 Outliers of uitbijters 205 8.12.8 Hefboompunten 206 8.13 Kernbegrippen 208 8.14 Geraadpleegde Literatuur 208 Hoofdstuk 9 Dummy-regressie & Variantie-analyse 9.1 Probleemstelling en causaal diagram 210 9.2 Gegevens en operationalisering 210 9.3 Het model van regressie met dummyvariabelen 212 9.4 Doelstellingen van meervoudige regressie met dummyvariabelen 214 9.5 Schatting van de regressieparameters 215 9.6 Meervoudige regressie met dummyvariabelen 216 9.6.1 Regressie met een dichotome onafhankelijke variabele 216 9.6.2 Regressie met een polytome onafhankelijke variabele 222 9.6.3 Regressie met kwantitatieve en dummy onafhankelijke 229 variabelen 9.6.4 Interacties tussen dummyvariabelen 236 9.6.5 Niet-lineaire relaties 245 9.6.6 Alternatieve codeerschema s 250 9.7 Variantieanalyse 252 9.7.1 T-test voor verschil tussen gemiddelden 253 9.7.2 One-way analysis of variance 258 9.7.3 N-way analysis of variance & analysis of covariance 263 9.8 Kernbegrippen 265 9.9 Geraadpleegde literatuur 266 209
xii Hoofdstuk 10 Logistische Regressie 10.1 Het linear probability model 268 10.2 Het model van Logistische Regressie 271 10.2.1 Odds 271 10.2.2 Odds-ratio 272 10.2.3 Logit 273 10.2.4 Regressievergelijking 274 10.3 Schatting van de regressieparameters 277 10.3.1 Het principe van de likelihoodfunctie 278 10.3.2 Kenmerken van maximum likelihood schatters 279 10.4 Logistische regressie in de praktijk 280 10.4.1 Model chi-square en model summary 282 10.4.2 Pseudo R² 284 10.4.3 Classificatie 284 10.4.4 Wald-statistic 285 10.4.5 Interpretatie van de coëfficiënten 286 10.4.6 Alternatieve codeerschema s 290 10.4.7 Hosmer-Lemeshow test 295 10.4.8 Additiviteitsassumptie 295 10.4.9 Lineariteitsassumptie 296 10.5 Multinomial logit modellen 296 10.5.1 Het model van multinimiale logistische regressie 297 10.5.2 Significantietesten 300 10.5.3 Interpretatie regressiecoëfficiënten 301 10.6 Kernbegrippen 304 10.7 Geraadpleegde literatuur 304 Hoofdstuk 11 Modelspecificatie in Regressie 11.1 Inleiding 305 11.2 Causale diagrammen 307 11.3 Padanalyse met variabelen van interval- of ratiomeetniveau 309 11.4 Analyse van probleemrelaties door modelvergelijking 314 11.4.1 Bivariate causale structuur 315 11.4.2 Schijnbare causaliteit 318 11.4.3 Indirecte relaties of mediatie 320 11.4.4 Suppressie 322 11.4.5 Interactie of moderatie 323 11.4.6 Replicatie 326 11.5 Kernbegrippen 327 11.6 Geraadpleegde literatuur 327 267 305
xiii Hoofdstuk 12 Principale Componenten & Factoranalyse 12.1 Principes van schaalconstructie 331 12.2 Constructie van somschalen 333 12.2.1 Cumulatief categorische indexschaal 333 12.2.2 Likertschaal 334 12.2.3 Betrouwbaarheid van scomschalen 338 12.3 Principale Componentenanalyse 341 12.3.1 PCA: een intuïtieve benadering 341 12.3.2 PCA als geometrie: eigenwaarden en eigenvectoren 344 12.3.3 PCA: een bivariaat voorbeeld 346 12.3.4 PCA: tweedimensionale oplossing en rotaties 352 12.4 Van principale componenten naar principale factoranalyse 362 12.5 Kernbegrippen 365 12.6 Geraadpleegde literatuur 365 Appendix A Elementaire Algebra A.1 Machten 367 A.2 Merkwaardige producten 367 A.3 Sommatieteken 368 A.4 Productteken 369 A.5 Logaritmen 370 A.6 Geraadpleegde literatuur 370 Appendix B Tabellen B.1 Standaardnormale verdeling 371 B.2 T-verdeling 372 B.3 F-verdeling 373 B.4 F-verdeling 374 B.5 F-verdeling 375 B.6 Chi-kwadraatverdeling 376 331 367 371