Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens



Vergelijkbare documenten
Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom

3.1 Itemanalyse De resultaten worden eerst op itemniveau bekeken. De volgende drie aspecten dienen bekeken te worden:

11. Multipele Regressie en Correlatie

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS

9. Lineaire Regressie en Correlatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Overzicht van tabellen 13. Overzicht van figuren 15. Voorwoord 17. Inleiding 19

College 3 Meervoudige Lineaire Regressie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

INHOUDS- OPGAVE. Voorwoord 19. Voorwoord bij de nieuwe druk 20. Inleiding 23

Bachelorproject II College 1: Validiteit en betrouwbaarheid: factor- en betrouwbaarheidsanalyse. Harry BG Ganzeboom 5 januari 2016 Bijgewerkt in rood

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Samenvatting Nederlands

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011

Experimenteel en Correlationeel Onderzoek

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek.

Onderzoek Module 10.3 Het empirisch onderzoek ontwerpen. Master Innovation & Leadership in Education

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Experimenteel en Correlationeel Onderzoek (ECO)

DATA-ANALYSEPLAN (20/6/2005)

Voorwoord... iii Verantwoording... v

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 1 Het soort onderzoek waar dit boek op gericht is 15

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

3 Werkwijze Voordat een CQI meetinstrument mag worden ingezet voor reguliere metingen moet het meetinstrument in twee fases getest worden.

Toegepaste data-analyse: sessie 3

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus

A. Business en Management Onderzoek

Hoofdstuk 7: De analyse en rapportering van jouw empirisch onderzoek

Valid N Missing N

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden

College 3 Interne consistentie; Beschrijvend onderzoek

Hoofdstuk 5 Een populatie: parametrische toetsen

Item-responstheorie (IRT)

8. Analyseren van samenhang tussen categorische variabelen

WOT statistiek. Betrouwbaarheidsanalyse. CLIN Centre for Linguistics. Els Schoonjans

Methodologie voor onderzoek in zorg, welzijn en hulpverlening. Foeke van der Zee

tudievragen voor het vak TCO-2B

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 8: Multipele regressie Vragen

Oplossingen hoofdstuk XI

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Strategie en resultaat

Random en systematische meetfouten. Harry B.G. Ganzeboom ADEK UvS College 3 5 maart 2011

Mediatie-analyse College 4+ Cursus PMC Statistiek Plus. Harry Ganzeboom 1 maart 2019

Zelfstudiefiches M&T: Deel 2 (H6-7)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

1 Basisbegrippen, W / O voor waar/onwaar

Methodologie voor sociaalwetenschappelijk onderzoek. Foeke van der Zee

Methodologie voor onderzoek in marketing en management. Foeke van der Zee

Theorie en Empirisch Onderzoek. Werkcollege 4.1 Kwalitatief onderzoek: Yazilitas et al.

Theorie en Empirisch Onderzoek. Werkcollege 4.3 Experimenteel onderzoek Rijken & Merz. 2014

SPSS. Statistiek : SPSS

1. Reductie van error variantie en dus verhogen van power op F-test

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Klantonderzoek: statistiek!

20/04/2013: Kwalitatief vs. Kwantitatief

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

LES 2: Data-cleaning en -transformatie 1. Frequentietabel

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

Hoofdstuk 2: Verbanden

Workshop. Dataverzameling. Van onderzoeksvraag naar data

HOOFDSTUK VII REGRESSIE ANALYSE

Hoofdstuk 7: Selectie van steekproeven

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

MASTERCLASS De datateam methode Examenresultaten Nederlands

Classification - Prediction

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Workshop. Dataverzameling. Van onderzoeksvraag naar data

Statistiek is zo saai nog niet! Een integratie van theorie en praktijk Manfred te Grotenhuis

Zelfstudiefiches M&T: Deel 2 (H6-7)

Ik wil de opdracht van VORIG ACADEMISCH JAAR laten meetellen bij de bepaling van het eindcijfer:

Project Kwantitatief onderzoek Module 12 HDT H830-11

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

Data analyse Inleiding statistiek

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00

Operationaliseren van variabelen (abstracte begrippen)

WORKSHOP ONDERZOEKSMETHODEN

Oefenvragen bij Statistics for Business and Economics van Newbold

Hoofdstuk 10: Regressie

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

De Bladenbox in 2012 en verder.. Onderzoeksrapport

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Zelfstandig wonen binnen het huidige zorgklimaat

Sociologie Vrije Universiteit Amsterdam - Faculteit der Sociale Wetenschappen - P Sociologie

Zelf aan de slag met vragenlijsten

Transcriptie:

Waar waren we? BCO ANALYSEPLAN Harry Ganzeboom 14 april 2005 Probleemstelling, deelvragen, theorie Definities, conceptueel model Hypothesen Onderzoekzoeksopzet, operationalisatie Dataverzameling Data-analyse Rapportage 1 2 Soorten gegevens Documentatie Documentatie, jaarverslagen, beleids-plannen, voorlichtingsmateriaal, reeds bewerkte (secundaire gegevens) Kwalitatieve primaire gegevens, bv. Verslagen topical interviews Observatieverslagen Kwantitatieve primaire gegevens, bv. (Numerieke) gegevens voorgestructureerde interviews Gecodeerde inhouden van documenten Gestructureerde observaties 3 Maak een zeer nauwkeurige lijst van verwijzingen. Dit is (nog) veel moeilijker dan een lijst van artikelen / boeken. Maak uitgetypte uittreksels van elke bron (kort). Neem daarin over saillante passages (maak informatie elektronisch beschikbaar). Houdt deze documenten bij de hand als je je onderzoeksverslag maakt. 4 Kwalitatieve gegevens Bij uitwerking van open interviews twee opties: Bewerk tot documentair materiaal. Hierin laat je de geinterviewde niet zelf aan het woord, je doet verslag en analyseert tegelijkertijd. Schrijf het gezegde volledig uit. Je neemt letterlijke passages op. Dit maakt het mogelijk om iets te vertellen door de mond van de onderzochten. In beide gevallen is het cruciaal dat je je materiaal elektronisch beschikbaar hebt. Dit is ook zo, als je je materiaal met kleurstiften op papier bewerkt. Coderen kwalitatieve gegevens Er bestaan hiervoor gespecialiseerde computerprogramma s: Kwalitan, Nudist, N5/N6, Atlas/TI etc. Je komt ook een eind met pen en papier, en met een word processor. Gebruik cut/paste en Word-tabellen om materiaal te herordenen en van keywords (coderingen, rubriceringen) te voorzien. 5 6

Spoorboekje analyse kwantitatieve gegevens Datadocumentatie en -cleaning Van conceptueel model (hypothesen) naar causaal model (relatie tussen variabelen). Valide en betrouwbare meting van variabelen: Selectie van valide en betrouwbare indicatoren Constructie het meetinstrument Enkelvoudige (bivariate) relaties: Conditionele gemiddelden (Pearson) correlatie. Meervoudige (multipele) relaties: Multiple regressie Kwantitatieve gegevens: invoer en documentatie Kwantitatieve gegevens invoeren in data-sheet. Dat kan in Excel, maar het is handiger het gelijk in SPSS te doen. Keuze variabelennamen: correspondentie met vragenlijst. Label variabelen en values volledig (mag in het Engels). Voer alle open informatie ook in (strings) en maak er kwantitatieve codes van. Documentatie: Vragenlijst & frequentieverdelingen van de uiteindelijke data & verslag van het veldwerk. 7 8 Cleaning Causale modellen Bekijk alle frequentieverdelingen en herstel onmogelijke scores. Bestudeer missing values: waar komen die vandaan? Zijn ze te repareren? Missing values zijn een groot probleem voor analyses binnen de kortste keren ben je je data kwijt. Hou altijd in de gaten over hoeveel eenheden je analyse doet. In een causaal model worden variabelen met elkaar verband gebracht via veronderstelde oorzaak- gevolg relaties. De relatie wordt weergegeven met een causale pijl: X Y ( X leidt tot Y, verschillen in Y komen voort uit verschillen in X ). Causale relatie zijn veronderstellingen die doorgaans te maken hebben met tijdsvolgorde. Ze berusten op kennis van de onderzochte situatie. Causale analyse gaat om het kwantificeren van de sterkte van de veronderstelde relaties. Een uitkomst kan zijn dat deze relatie 0 is, niet bestaat. 9 10 Statistische significantie (terminologie) SPSS vermeldt bij correlatie- en regressie-coëfficiënten de geschatte overschrijdingskans. De overschrijdingskans is de kans dat het resultaat (of extremer) in een enkelvoudig aselecte steekproef naar boven zou komen, terwijl in de populatie de nul-hypothese geldt. We spreken van een statistisch significant resultaat als deze kans kleiner is dan het gekozen significantieniveau (.05 of.10). Significantie is een kwestie van al dan niet, het is niet de sterkte van het verband. Bivariate analyse De meeste eenvoudige causale relatie is die met één X en één Y: X Y In dit geval veronderstellen we dat variaties in X variaties in Y veroorzaken en dat die relatie niet verstoord wordt door andere De meest voor de hand liggende meting van een X Y relatie zijn (verschillen tussen) conditionele gemiddelden. We kunnen de sterkte van de relatie ook bepalen uit elke bivariate associatiecoëfficiënt. Het meest bruikbaar daarvoor is de pearson correlatie (r). Dit is equivalent aan lineair gemodelleerde conditionele gemiddelden. 11 12

Correlatie (en regressie) Kan strikt genomen alleen worden toegepast op gegevens van intervalniveau. Wordt oogluikend ook wel toegepast op ordinale (meer.. minder) gegevens. Ook goed interpreteerbaar voor dichotome gegevens (0/1 variabelen). Dit kan met alle Voorbeeld van een correlatieberekening. Multipele regressie Vaak bestuderen we de situatie met een Y (de afhankelijke of gevolg-variabele) en meerdere X-variabelen (de onafhankelijke of oorzaak-variabelen). Dit is met name noodzakelijk in het (zeer veel voorkomende geval) dat de X-variabelen onderling gecorreleerd zijn. De standaard statistische techniek is multipele regressie: in dit model bepaal je de sterkte van de relatie tussen elke X en de Y, terwijl de invloed van de andere X-variabelen constant wordt gehouden ( controlled ). 13 14 Verwarrende statistische terminologie Multipele regressievergelijking LET OP: In de statistiek wordt hetzelfde woord onafhankelijkheid ( independence ) voor twee verschillende dingen gebruikt: Onafhankelijke == oorzaak- Onafhankelijke == ongecorreleerde Let achtereenvolgens op de volgende dingen: Multipele correlatie / verklaarde variantie Statistische significantie van de vergelijking Ongestandaardiseerde B-coëfficiënten Gestandaardiseerde B-coëfficiënten. Statistisch significantie van de afzonderlijke coëfficiënten. 15 16 Stapsgewijze regressie Complexe causale modellen (1) Een populaire wijze van analyse is stapsgewijze regressie: kijken hoe een regressievergelijking verandert als je geleidelijk aan meer X-variabelen ( controle-variabelen ) toevoegt. Door modellen naast elkaar te zetten kun je zien hoe de onderlinge correlaties tussen X-variabelen doorwerkt. Stapsgewijze procedures zijn vaak dubieus, omdat er geen expliciet model aan ten grondslag ligt. 17 We kunnen spreken van complexe causale modellen wanneer we meerdere Y-variabelen hebben. Twee belangrijke situaties: Confounding: een derde variabele (Z) is van invloed op zowel X als Y. De relatie tussen X en Y is niet causaal, maar een schijnverband (spurious correlation). Intervening: een derde variabele (Z) intervenieert tussen X en Y: X is van invloed op Y doordat (voorzover) X op Z van invloed is, en Z weer Y beïnvloedt. 18

Complexe causale modellen (2) Betrouwbaarheid Merk op dat het confounding en intervening tot radicaal verschillende interpretaties van dezelfde uitkomst leiden! Je kunt over de verschillende interpretaties geen beslissing nemen aan de hand van de statistische analyses, ze moeten berusten op je kennis van de onderzochte situatie en het onderzoeksdesign. 19 Betrouwbaarheid == stabiliteit van resultaten. Als je iets (op dezelfde manier) opnieuw onderzoekt, moet er hetzelfde uitkomen. Onbetrouwbaarheid ontstaat door toevallige (random) invloeden op je onderzoeksresultaten. Bronnen van zulke invloeden zijn bv.: Steekproeffluctuaties (vandaar statistische significantie). Fouten gemaakt bij beantwoording van vragen door vergissing van interviewers, respondenten, datainvoerders (meetbetrouwbaarheid). 20 Meetbetrouwbaarheid Multiple indicatoren Analyse van meetbetrouwbaarheid kun he beschouwen als een causaal model, waarbij een (latente, ongemeten) variabele F van invloed is op meerdere (geobserveerde, gemeten) indicatoren f. Elke f is een (lineaire) functie van F en een random storingsterm e: f = b.f +e. We spreken van een betrouwbare meting als de relatie tussen F en f sterk is en de omvang (variantie) van de storingsterm e klein. 21 Als f 1 = b 2.F + e 1 en f 2 = b 2.F + e 2 (etc.), dan: Dat f 1 en f 2 moeten samenhangen De samenhang is sterker naarmate de omvang van e1 en e 2 geringer is (en daardoor b 1 en b 2 dichter bij 1). De som (gemiddelde) van f 1 en f 2 zal een betrouwbaarder meting van F zijn dan elk van f 1 en f 2 afzonderlijk. Het doel van een betrouwbaarheidsanalyse is een zodanig deelverzameling van je indicatoren te vinden dat hun gemiddelde de meest betrouwbare meting van F is. 22 Hoeveel indicatoren? Cronbach s alfa (1) Hoeveel indicatoren hebben we nodig om iemands geslacht nauwkeurig te bepalen? Drie! Hoeveel indicatoren hebben we nodig om de meetbetrouwbaarheid van afzonderlijke indicatoren te bepalen? Drie! 23 De formule van Cronbach s alfa geeft een schatting van de betrouwbaarheid van een somscore F en de onderlinge correlatie tussen de F i -indicatoren: Alfa = N.R/[1+R(N-1)] Waarin N het aantal indicatoren en r de gemiddelde correlatie tussen die indicatoren is. Alfa wordt groter naarmate: R groter is N groter is. Meetbetrouwbaarheid kun je dus vergroten door vaker te meten en door betere metingen te gebruiken. Meestal hebben deze twee een omgekeerde relatie met elkaar! 24

Cronbach s alfa (2) Een waarde van 0.70 wordt doorgaans als voldoende beschouwd. Enige karakteristieke waarden van alfa: 2 items, R =.60, alfa = 0.75 2 items, R =.40, alfa = 0.57 4 items, R =.30, alfa = 0.65 4 items, R =.40, alfa = 0.73 6 items, R =.20, alfa = 0.60 6 items, R =.30, alfa = 0.70 Kwalitatieve gegevens: betrouwbaarheid Onbetrouwbaarheid van uitkomsten is niet iets dat zich beperkt tot kwantitatieve metingen. Ook bij kwalitatieve analyse doet zich de vraag van betrouwbaarheid voor (misschien nog wel sterker): Krijg je dezelfde conclusies als je na een tijdje de analyses opnieuw doet? Krijg je dezelfde conclusies als twee onderzoekers afzonderlijk de analyses doen? 25 26 Beoordelaarsbetrouwbaarheid (1) Een vorm van betrouwbaarheidsonderzoek die toegepast kan worden in kwalitatief onderzoek, is onderzoek naar consistentie tussen beoordelaars: zijn de uitkomsten voor iedereen (ongeveer) hetzelfde? Bijv. rangorden ondervraagde sleutelpersonen naar een vooraf afgesproken kenmerk. Of: laat meerdere beoordelaars passages uit vraaggesprekken volgens een conceptueel schema classificeren Beoordelaarsbetrouwbaarheid (2) Doe beoordelingen (A) geheel onafhankelijk van elkaar; (B) nadat je eerst hebt voorgesproken. Je kunt op deze manier een bepaald aspect van je kwalitatieve gegevens kwantitatief maken en er correlatie op berekenen. Denk aan jureringsystemen in sport e.d. (kunstrijden, turnen, Idols). 27 28