Constructie van tests en vragenlijsten. Kernbegrippen, voetangels en klemmen, en mogelijkheden voor beter meten

Maat: px
Weergave met pagina beginnen:

Download "Constructie van tests en vragenlijsten. Kernbegrippen, voetangels en klemmen, en mogelijkheden voor beter meten"

Transcriptie

1 1 Constructie van tests en vragenlijsten Kernbegrippen, voetangels en klemmen, en mogelijkheden voor beter meten Klaas Sijtsma Universiteit van Tilburg Lezing in het kader van de Sociaal Wetenschappelijk Sectie van de VVS Utrecht, 6 november 009

2 Ik ga in op kernbegrippen voor constructie tests & vragenlijsten voor de meting van attributen in diverse wetenschapsgebieden methodologie van het opzetten van een goede test & vragenlijst misverstanden over testtheorie en nieuwe mogelijkheden voor test- en vragenlijstconstructie onderschatte rol van goede inhoudelijke theorieën voor succesvolle test- en vragenlijstconstructie, en de dubieuze validiteit die volgt bij onderschatting hiervan

3 3 Tests en vragenlijsten zijn instrumenten voor de meting van psychologische attributen: kennis, vaardigheden ( skills ); verkeersregels (k), autorijden (v), vaderlandse geschiedenis (k), geheugen (v) cognitieve capaciteiten ( abilities ); transitief redeneren, inductief redeneren, conservering, ruimtelijk inzicht geschiktheden ( aptitudes ); concentratievermogen, precisie, snelheid persoonlijkheidstrekken ( traits ); introversie, neuroticisme, depressiviteit, rigiditeit, angst attituden, opinies; abortus (a), positieve discriminatie van vrouwen (a), milieubeleid lokale overheid (o), Balkenende weg, nieuwe verkiezingen (o)

4 4 Toepassingen Wetenschappelijk: vergelijking groepen, relaties variabelen Maatschappelijk: diagnose stoornissen, leer- en ontwikkelingsproblemen, schoolvorderingen (CITO), selectie ( jobs ) en plaatsing (o wijs) Dus, relevant onderscheid: Groepskenmerken versus Individuele scores Heeft grote gevolgen voor constructie test- of vragenlijst

5 5 Hoe maak je een meetinstrument? Definieer attribuut (= hypothetisch construct), bij voorkeur gebaseerd op inhoudelijke theorie Voorbeeld o Bestudeer theorie / theorieën over intelligentie, tevredenheid, neuroticisme, mening over abortus o Definieer het attribuut zo precies mogelijk

6 6 Definieer operationalizering: meetvoorschrift, hoe moet ik in concrete stappen het attribuut meten? Van abstracte theorie naar observeerbaar gedrag Welk gedrag is typisch / karakteristiek voor het bedoelde attribuut? o Wanneer laten mensen intelligent, tevreden, neurotisch, enzovoort, gedrag zien? En in welke situaties gebeurt dat vooral? En in reactie op welke stimuli? o Definieer domein van gedrag typisch voor intelligentie, tevredenheid, neuroticisme, en sluit andere gedragingen uit

7 7 Definieer itemdomein: o Dit zijn alle mogelijke items (= stimuli) die relevant zijn voor het oproepen van gedrag dat typisch / informatief is voor het attribuut o Attributen verschillen sterk wat betreft stimuli; vergelijk kennis, intelligentie met neuroticisme, mening over abortus; leiderschap, coöperatief gedrag o Itemdomeinen verschillen vooral mbt aantallen relevante items, waarbij het in herhaling vallen niet schadelijk is voor de meting Selecteer uit het itemdomein de beste deelverzameling van items: TEST, VRAGENLIJST

8 8 Leg test / vragenlijst voor aan representatieve steekproef van respondenten Analyseer data mbv van klassieke testtheorie & factoranalyse of PCA (meerderheid) of item-responstheorie; levert informatie over o betrouwbaarheid (nauwkeurigheid, herhaalbaarheid) o validiteit (betekenis, voorspelling) o normen (interpretatie) Construeer schaal en ken meetwaarden toe aan individuen; gebruik deze voor wetenschappelijke of maatschappelijke toepassingen

9 9 Zwakke theorie Attribuut Theorie Operationalizering Data Analyse Attribuut Theorie Sterke theorie

10 10 Onderwerpen Validiteit: Wat meet de test? Meet de test het attribuut zoals bedoeld? Betrouwbaarheid: Kan ik bij herhaling dezelfde testscore verwachten? Standaardmeetfout: Wanneer zijn scoreverschillen significant? Vragenlijstconstructie volgens PCA en IRT: Wat levert moderne testtheorie extra?

11 11 VALIDITEIT Meet de test of vragenlijst het bedoelde attribuut? Zwaar verwaarloosd onderwerp, maar veruit belangrijkste kenmerk van een test of vragenlijst Vaak neemt men genoegen met Enkele correlaties met andere variabelen; covariaten, testscores, toevallig beschikbare variabelen De ad hoc structuur van de items op basis van een PCA De passing ( fit ) van een confirmatorisch factormodel of een itemresponsmodel

12 1 Echter, het enige wat werkt, is dat de test of vragenlijst gebaseerd is op een goeddoordachte en onderzochte theorie van het attribuut Van slechts enkele attributen zijn goede theorieën beschikbaar, zodat de operationalizering hier een logische uitwerking van is Veel tests en vragenlijsten gebaseerd op gewoonte (hoe doen anderen dit?), traditie (hoe deed me dit vroeger?) en intuïtie (wat lijkt me plausibel?) Hieruit resulterende items worden voorgelegd aan steekproef, en data worden statistisch geanalyseerd Omdat data nooit random zijn, komt er altijd iets uit een statistische analyse, maar bij ontbreken theorie ondersteunt dit niet de validiteit anders dan incidenteel

13 13 Dus, meting dient vooraf te worden gegaan door theorievorming en toetsing Bijv. onderzoek Samantha Bouwmeester naar transitief redeneren Monnikkenwerk; vergelijk Felix Vening Meinesz (UU) Zonder theorie en daarop gebaseerde operationalizering levert data-analyse alleen beschrijving van de data, geen feedback over theorie die er immers niet is Aanhangen bepaalde school op gebied validiteitsonderzoek niet van belang; begin bij theorie

14 14 KLASSIEKE TESTTHEORIE Ontstaan begin 0 e eeuw (Spearman, Binet) Basis idee: X = T + E + ij i ij Waarin: X + ij : Observeerbare score persoon i testafname j T i : True score, gedefinieerd als: T i = 1 q q X j= 1 + ij ; q onafhankelijke replicaties van test E ij : Meetfout, gedefinieerd als: E ij = X + ij T i

15 15 Propensity Distributions voor twee personen 0.0 propensity Kees Marijke T Kees T Marijke True Score Testscore

16 16 BETROUWBAARHEID Welk deel van variantie van testscore X + in een groep is systematisch? ' = = X E X T XX S S S S r In hoeverre kan meting worden herhaald onder dezelfde omstandigheden? Dit is de pm-correlatie tussen parallelle testscores, + X en ' + X : ), ( ' X + X + r Definities zijn wiskundig identiek: = = = ' ' ' ' ), ( X T X T XX S S S S r X X r

17 17 Praktijk: True scores onbekend, dus ook variantie parallelle tests; dus betrouwbaarheid onbekend S T, en ook beschikt men zelden over Meest populaire oplossing: Schat ondergrens r XX ' dmv Cronbach s alfa coefficient: Waarin: k : aantal items g, h : item indices k g alfa = k 1 S C gh : covariantie item g en item h h X+ C gh

18 18 Voor berekening alfa nodig: Variantie-covariantie matrix k = 4: C 1 S 1 C 1 C 13 C 14 S C 3 C 4 3 C 31 C 3 S 3 C 34 4 C 41 C 4 C 43 S 4 Merk op: Hoofddiagonaal: varianties van items Andere cellen: covarianties tussen items Matrix symmetrisch in hoofddiagonaal

19 19 Regel: Variantie testscore X + ( = S X + ) = som van termen in variantie-covariantie matrix Formule: Als X + = k X g g = 1 X+, dan S = S + k g= 1 g g h C gh Opdracht: k = 4: Wat is waarde alfa?

20 0 Opdracht: k = 4: k = 4: Bereken alfa s Verklaar resultaat waarvan alfa afhankelijk?

21 1 Wetenswaardigheden over alfa: 1. Alfa wordt vaak aangeduid als coëfficiënt voor interne consistentie homogeniteit Suggereert dat hoge alfawaarde betekent dat items hetzelfde attribuut meten V: Is dit correct? A: Nee; zie de voorbeelden; een alfa van.8 kan naar elke factoriële samenstelling verwijzen, en alfa s van.3 of.56 kunnen dat ook

22 Algemene verklaring: Teller alfa bestaat uit som van k ( k 1) covarianties; De som is gelijk aan het aantal k ( k 1) maal de gemiddelde covariantie C ; Dus, k ( k 1) C Schrijf alfa als: alfa = k k( k 1) C k = k 1 S C X S + X + Dus, alfa hangt af van gemiddelde covariantie terwijl alle informatie over de factoriële samenstelling in de contrasten van de covarianties zit; ben je dus kwijt

23 3. Alfa is ondergrens voor betrouwbaarheid (in populatie): alfa r XX ' Is wiskundige stelling, zoals stelling van Pythagoras; is dus altijd waar Consequentie: Alfa is vertekende schatter van r XX' ; Wel nuttig omdat conservatief Praktijk: Grote steekproeven: Kleine steekproeven:? alfa < r XX '

24 4 3. Iedereen kent alfa, maar er zijn grotere ondergrenzen, zoals Guttmans lambda (lijkt op alfa, maar gebruikt meer informatie uit variantie-covariantiematrix) Probleem van het vinden van de grootste ondergrens ( GLB ) opgelost Bewezen kan worden dat alfa lambda GLB r XX ' Dus, lambda en GLB dichter bij doel; waarom dan alfa gebruikt? Alfa en lambda beide in SPSS; GLB in andere software (EQS, CITO)

25 5 Voorbeeld: 8 rating scale items, gescoord 0, 1,, 3, meten coping (aanpassen aan situatie) steekproefgrootte N = 88 factoranalyse suggereert deeltests van elk 4 items # items 8 4 (set 1) 4 (set ) alfa lambda GLB verschillen alfa en lambda klein GLB veel groter; moeite waard om GLB te schatten (grote N, kleine k)

26 6 Conclusies Alfa is geen maat voor interne consistentie, ondanks hardnekkige behandeling als zodanig is de literatuur Interne consistentie ( items meten hetzelfde attribuut ) onderzoeken mbv factoranalyse en item-responstheorie Alfa is bijna de kleinste bekende ondergrens voor de betrouwbaarheid (Guttman s lambda 1 is nog kleiner) Voor grote steekproeven (N > 1,000) en korte tests ( k 10), schat de GLB Voor andere data, schat Guttman s lambda Om strategische redenen rapporteer zowel alfa als een grotere ondergrens (Guttman s lambda of de GLB)

27 7 STANDAARDMEETFOUT en KORTE TESTS & VRAGENLIJSTEN Wat wil het nu eigenlijk zeggen dat r XX ' =.6,.7,.8,.9,. 95? Je leest vaak: alfa =.8, dus de test is voldoende betrouwbaar! Waarvoor? Hierover lees je weinig tot niets, en gerapporteerde normtabellen (verdelingen van testscores) worden niet vaak gerelateerd aan de vraag of scores wel significant verschillen (van een aftestgrens of van elkaar)

28 8 Niet betrouwbaarheid is belangrijk maar standaardmeetfout: S E = S X+ 1 rxx ' Hoort bij schatting true score ˆ T i = X + i (kan allemaal veel mooier, doen we hier niet terwille van de eenvoud) Nemen aan dat standaarmeetfout voor iedereen gelijk is (in IRT verschillend) Gaan ons nu concentreren op korte tests en vragenlijsten

29 9 Bekend: Korte tests hebben lagere betrouwbaarheid dan lange tests Tendens: onder externe druk concentratie problemen van jonge kinderen en patiënten, ongeduld klanten en managers lijken tests steeds korter te worden: k < 10 Vraag: Kan een korte test die uit items van hoge kwaliteit bestaat, nauwkeurige metingen opleveren? Voorbeelden: Medisch, gezondheidsonderzoek: k 10 Organisatie, marktonderzoek: k 5, soms k = 1 Psychologisch onderzoek: RAKIT (k > 350), NEO ( k = 40)

30 30 Relatie betrouwbaarheid en testlengte (= # items) Stel, alle items / testdelen zijn parallel, dan neemt bij verlenging test met factor K De true-score variantie De meetfoutvariantie S T kwadratisch toe in K, dus met factor S E lineair toe, dus met factor K K Omdat X+ T S = S + S E, bestaat de testscorevariantie dus naar verhouding steeds meer uit true-score variantie en steeds minder uit meetfoutvariantie Betrouwbaarheid neemt toe volgens Spearman-Brown formule (r = betr. item / testdeel): r Kr = KK 1+ ( K 1 ) r

31 31 Probleem: Verkorten test leidt tot snellere afname true-score variantie dan meetfoutvariantie, resulterend in korte schaal waarop verschillen testscores vooral gevolg van meetfouten Gebruik standaardmeetfout om betrouwbaarheidsinterval voor T te schatten: T ˆ i ± z1/ α S ; dus voor 95 E 1 α =. : X + i 1.96SE ; X + i SE Bij lange tests (lange schalen) bestrijkt dit interval een relatief klein deel van de schaal, bij korte tests is dat deel absoluut kleiner maar relatief groter Hoe zit dat precies?

32 3 Wiskundig onderzoek naar relatie testlengte, betrouwbaarheid, standaardmeetfout en schaallengte Data gesimuleerd mbv Rasch model voor dichotome items (bijv. 0 = fout, 1 = goed), P( X g = 1 θ ) exp[ a( θ δ g )] = 1+ exp[ a( θ δ )] g Waarin: θ : Latente variabele, ipv true score δ g : Moeilijkheid van item g op schaal van latente variabele (geen P-waarde) a: Discriminatie van willekeurig item; representeert kwaliteit = mate waarin item personen met lage en hoge kansen betrouwbaar onderscheid

33 33 Design met: 0 datamatrices voor elk 500 respondenten Latente variabele standaardnormaal: θ ~ N(0,1) Alle combinaties van 5 testlengten en 4 itemdiscriminatieniveaus: o k = 6, 8, 10, 1, 0 o a = 1,, 3, 4 Realistisch 1: bescheiden : goed Onrealistisch 3: erg hoog 4: extreem hoog Itemmoeilijkheden uniform verdeeld tussen 1 en 1

34 34 Lambda, Standaardmeetfout, Half Betr. Int. True Score, en Half Betr. Int. Verschil Twee True Scores. Realistisch k a Lambda S E 1.96S E 1.96 S E Yes No Yes No Yes No Yes No Yes No

35 35 Wat valt op? Voor constante k en toenemende a, neemt - Betrouwbaarheid toe, en - Standaardmeetfout af Voor k = 6 en a = 1 (bescheiden) laat zien dat 95% betr. int. gelijk is aan T ±.10, dus voor X = 4 hebben we (1.90; 6.10) (maximum = 6) i Stel, aftestscore +i X c =, 3, 4, 5, 6, dan geen significant verschil Alleen X = 0, 1 laat significant verschil toe c Voor grotere a-waarden wordt situatie gunstiger, maar niet heel veel

36 36 Voor grotere k-waarden (bijv. k = 0) nemen tov k =6 o de betrouwbaarheid toe o maar ook de standaarmeetfout en de betrouwbaarheidsintervallen Echter, de lengte van de intervallen tov van de schaallengte (0 eenheden) is kleiner dan bij k = 6: =.39 (k = 0) versus =. 70 (k = 6) 0 6 Bedenk verder dat personen op een lange schaal verder van de aftestgrens komen te liggen (of van elkaar), en dat gaat sneller dan de groei van de intervallen Hier zit de winst

37 37 PRINCIPALE COMPONENTENANALYSE of ITEM-RESPONSTHEOIE? PCA gebruikt wanneer weinig bekend over dimensionaliteit van data PCA vat zoveel mogelijk variantie uit de itemscores samen in een zo klein mogelijk aantal principale componenten (maximaal k). Scree plot of eigenwaarde-groter-dan-1 criterium om de beste M samenvatters te selecteren Loodrechte of scheve rotatie M principale componenten om betere interpretatie te verkrijgen Typische methode om data te beschrijven / samen te vatten, wordt gebruikt bij gebrek aan goede theorie over attribuut; weinig vooronderstellingen

38 38 IRT als alternatief voor klassieke testtheorie Klassieke testtheorie leidt tot tellingen van punten behaald op items, strikt genomen geen meting; betrouwbaarheid refereert aan herhaalbaarheid telling IRT bestaat uit modellen gedefineerd op basis van vooronderstellingen, die o Meeteigenschapen beschrijven (bijv., aantal dimensies in de data, relatie items en wiskundige representatie eigenschap); o Mogelijkheid bieden om in de data na te gaan of die vooronderstellingen opgaan voor de test en de populatie in kwestie; en o Bij passing model op data schaaleigenschappen impliceren, zoals ordening personen en / of items IRT kan exploratief en toetsend worden gebruikt (maar PCA eigenlijk ook)

39 39 Mokkenschaalanalyse (MSA) gebaseerd op model van monotone homogeniteit (MHM); impliceert ordinale meting van personen Test / vragenlijst meet één eigenschap itt een complexe mengsel van invloeden op itemscores die leiden tot slecht interpreteerbare testscore Eendimensionaliteit, gerepresenteerd door latente variabele θ Hoger niveau van de eigenschap θ verhoogt kans op hogere itemscores Monotonie, gerepresenteerd door stijgende kans P( X g x θ ) Respondenten benaderen ieder item alsof het geheel op zich staat, dus onafhankelijk van eerder gegeven antwoorden (bijv. sociale wenselijkheid) Lokale onafhankelijkheid, antwoordkansen alleen afhankelijkheid van niveau respondent i op θ, zodat P X x θ, y ) = P( X x θ ) ( g i i g i

40 Latent Trait Cumulative Response Probability Restscore Groups X = 1 X = X = 3 X = 4 Proportion Positive Responses per Item Step X = 1 X = X = 3 X = Restscore Groups Proportion Positive Responses per Item Step

41 41 Vooronderstellingen lijken plausibel, maar Data kunnen multidimensioneel zijn indien er diverse invloeden werkzaam zijn op de itemscores Relaties kunnen non-monotoon zijn, zeker in geval van multidimensionaliteit, en Respondenten kunnen zich laten leiden door vele andere eigenschappen en omstandigheden, zodat lokale afhankelijkheid geldt Ook hiervoor weer IRT modellen beschikbaar, maar duidelijk is dat Het geen modellen zijn van de werkelijkheid Maar gereedschappen uit een gereedschapskist waarmee je data spaarzaam kunt beschrijven (zoals elke statistische methode) Terwijl de echte modellen van de werkelijkheid de inhoudelijke theoriën van de attributen zijn; overeenkomst met structuur IRT niet dwingend

42 4 Verschillen PCA en IRT: Beide geschikt om dimensionaliteit data te onderzoeken, alleen IRT gebaseerd op meetmodel PCA pure rekentechniek waar altijd hetzelfde uitkomt (k hoofdcomponenten); het model kan niet worden verworpen; IRT modellen wel, helpt de wetenschap duidelijker vooruit

43 43 Voorbeeld: Self-Concealment Scale (SCS; geheimhoudingsschaal; k = 10, 5-punt rating scales, N = 1503 uit Nederlandse bevolking) Weinig tot geen theorie over geheimhouding als persoonlijkheidstrek 1. I have an important secret that I haven t shared with anyone.. If I shared all my secrets with my friends, they d like me less. 3. There are lots of things about me that I keep to myself. 4. Some of my secrets have really tormented me. 5. When something bad happens to me, I tend to keep it to myself. 6. I m often afraid I ll reveal something I don t want to. 7. Telling a secret often backfires and I wish I hadn t told it. 8. I have a secret that is so private I would lie if anybody asked me about it. 9. My secrets are too embarrassing to share with others. 10. I have negative thoughts about myself that I never share with anyone.

44 44 Vragenlijst laat zien dat items gebaseerd zijn op common sense Strijd in literatuur over aantal factoren in SCS-data, maar weinig besef dat Dit afhangt van de gekozen items en niet van een theorie, die er immers niet is En van de groep waarin je de data verzamelt Natuurlijk kun je uit de data wel iets leren over geheimhouding, maar uitgangspunt is gammel, dus leerproces uiterst moeizaam Men klampt zich vast aan statistiek en data-analyse Dus, meer aandacht voor theorievorming en onderzoek gewenst (is nu ook gaande)

45 45 PCA + scheve rotatie (oblimin; r =.54): corrected F1 F Item no. item-total correlations 8 (secret so private I d lie when asked) (secrets too embarrassing to share) (important secret not shared with anyone) (secrets tormented me) (friends like me less) (telling secret backfires, regret) (tend to keep bad things for myself) (afraid to reveal without wanting) (negative thoughts about myself not shared) (many things about me I keep to myself)

46 46 MSA, automatische itemselectie met verschillende ondergrenzen (c-waarden) voor kwaliteit schalen: Geselecteerde Schalen (Itemnummers gegeven) voor c-waarden die in gelijke stappen toenemen, schaal H-waarden, en niet-schaalbare items c Schaal 1 Schaal Onschaalbaar (.44) ,8,9 (.5) 6,7,10 (.44) ,8,9 (.5) 6,10 (.45) 5,7.50 1,4,8,9 (.57) 3,5 (.5),6,7, ,8,9 (.6) -7, ,9 (.74) 1-7,10

47 47 Conclusies: PCA: 1-factor oplossing (hoge item-restcorrelaties, correlatie scheve factoren =.54) MSA suggereert 1 matige tot sterke schaal (dus geschikt voor ordenen personen) Verschillen PCA en MSA betreffen o de selectie van items in de eendimensionele schaal; MSA levert hiervoor betere argumenten o MSA: items hebben sterke monotone relatie met latente variabele; dus, testscore X + kan personen nauwkeurig ordenen op latente variabele θ, en SCS kan low en high-concealers goed onderscheiden Auteurs SCS dachten dat ze drie factoren onderscheidden; lijkt onjuist Echter, auteurs van dit onderzoek vinden dat 1 dimensie de theorie geen recht doet!?

48 48 TOT SLOT Test- en vragenlijstconstructie is erg onderschat onderwerp; onderzoekers maken zich er niet druk om Goede metingen haal je niet bij de supermarkt en je plukt ze niet uit de boom DANK VOOR UW AANDACHT

49 49 LITERATUUR Emons, W. H. M., Sijtsma, K., & Meijer, R. R. (007). On the consistency of individual classification using short scales. Psychological Methods, 1, Sijtsma, K. (009). On the use, the misuse, and the very limited usefulness of Cronbach's alpha. Psychometrika, 74, Sijtsma, K. (009). Correcting fallacies in validity, reliability, and classification. International Journal of Testing, 9, Wismeijer, A. A. J., Sijtsma, K., Van Assen, M. A. L. M., & Vingerhoets, A. J. J. M. (008). A comparative study of the dimensionality of the self-concealment scale using principal components analysis and Mokken scale analysis. Journal of Personality Assessment, 90, Sijtsma, K. (009). Over misverstanden rond Cronbachs alfa en de wenselijkheid van alternatieven. De Psycholoog, 44, Sijtsma, K., & Emons, W. H. M. (007). Korte tests: Kostbare tijdwinst en onbetrouwbare beslissingen. De Psycholoog, 4,

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items 1. Gegeven zijn de itemsores van 8 personen op een test van 3 items item Persoon 1 2 3 1 1 0 0 2 1 1 0 3 1 0 0 4 0 1 1 5 1 0 1 6 1 1 1 7 0 0 0 8 1 1 0 Er geldt: (a) de p-waarden van item 1 en item 2 zijn

Nadere informatie

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit Kwantitatieve modellen voor BCO PMC Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit Drie colleges Validiteits- en betrouwbaarheidsanalyse Causale analyse met confounding en mediatie Causale

Nadere informatie

Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K.

Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K. Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K. Sijtsma Opmerking vooraf: Enkele docenten hebben ons laten weten dat zij

Nadere informatie

Item-responstheorie (IRT)

Item-responstheorie (IRT) Item-responstheorie (IRT) niet direct voor een dubbeltje, maar wel erg cool op het podium Ruth van Nispen 1 Caroline Terwee 2 1 Afdeling Oogheelkunde 2 Afdeling Epidemiologie en Biostatistiek VU medisch

Nadere informatie

Vragen oefententamen Psychometrie

Vragen oefententamen Psychometrie Vragen oefententamen Psychometrie 1. Hoe wordt betrouwbaarheid in de klassieke testtheorie gedefinieerd? a) De variantie van de error scores gedeeld door die van de geobserveerde scores. b) De variantie

Nadere informatie

WOT statistiek. Betrouwbaarheidsanalyse. CLIN Centre for Linguistics. Els Schoonjans

WOT statistiek. Betrouwbaarheidsanalyse. CLIN Centre for Linguistics. Els Schoonjans WOT statistiek Betrouwbaarheidsanalyse Els Schoonjans CLIN Centre for Linguistics 1 Betrouwbaarheid Betrouwbaarheid van een meetinstrument: consistentie; instrument geeft vergelijkbare resultaten in vergelijkbare

Nadere informatie

College 3 Interne consistentie; Beschrijvend onderzoek

College 3 Interne consistentie; Beschrijvend onderzoek College 3 Interne consistentie; Beschrijvend onderzoek Inleiding M&T 2012 2013 Hemmo Smit Overzicht van dit college Kwaliteit van een meetinstrument (herhaling) Interne consistentie: Cronbach s alpha Voorbeeld:

Nadere informatie

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS Inleiding in de Methoden & Technieken 2013 2014 Hemmo Smit Overzicht van dit college Kwaliteit van een meetinstrument Inleiding SPSS Hiervoor lezen:

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011 Meten: algemene Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011 OPZET College 1: Algemene College 2: Meting van attitudes (ISSP) College 3: Meting van achtergrondvariabelen via MTMM College 4:

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Citation for published version (APA): Egberink, I. J-A. L. (2010). Applications of item response theory to non-cognitive data Groningen: s.n.

Citation for published version (APA): Egberink, I. J-A. L. (2010). Applications of item response theory to non-cognitive data Groningen: s.n. University of Groningen Applications of item response theory to non-cognitive data Egberink, Iris IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite

Nadere informatie

Bachelorproject II College 1: Validiteit en betrouwbaarheid: factor- en betrouwbaarheidsanalyse. Harry BG Ganzeboom 5 januari 2016 Bijgewerkt in rood

Bachelorproject II College 1: Validiteit en betrouwbaarheid: factor- en betrouwbaarheidsanalyse. Harry BG Ganzeboom 5 januari 2016 Bijgewerkt in rood Bachelorproject II College 1: Validiteit en betrouwbaarheid: factor- en betrouwbaarheidsanalyse Harry BG Ganzeboom 5 januari 2016 Bijgewerkt in rood App.gosoapbox.com en gebruik telkens de volgende inlogcode:

Nadere informatie

Summary in Dutch 179

Summary in Dutch 179 Samenvatting Een belangrijke reden voor het uitvoeren van marktonderzoek is het proberen te achterhalen wat de wensen en ideeën van consumenten zijn met betrekking tot een produkt. De conjuncte analyse

Nadere informatie

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten Hoofdstuk 8 Betrouwbaarheidsintervallen In het vorige hoofdstuk lieten we zien hoe het mogelijk is om over een ongekende karakteristiek van een populatie hypothesen te formuleren. Een andere manier van

Nadere informatie

Psychometrie werkgroep: De antwoorden

Psychometrie werkgroep: De antwoorden Psychometrie werkgroep: De antwoorden Week 1: Schaling en Normering Opdracht 1. a) Psychometrie is de studie naar procedures die gebruikt worden om items van testen te schatten en te evalueren. Gedrag

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

3.1 Itemanalyse De resultaten worden eerst op itemniveau bekeken. De volgende drie aspecten dienen bekeken te worden:

3.1 Itemanalyse De resultaten worden eerst op itemniveau bekeken. De volgende drie aspecten dienen bekeken te worden: Werkinstructie Psychometrische analyse Versie: 1.0 Datum: 01-04-2014 Code: WIS 04.02 Eigenaar: Eekholt 4 1112 XH Diemen Postbus 320 1110 AH Diemen www.zorginstituutnederland.nl T +31 (0)20 797 89 59 1

Nadere informatie

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011

Het samenstellen van een multipele indicator index. Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011 Het samenstellen van een multipele indicator index Harry B.G. Ganzeboom ADEK UvS College 2 28 februari 2011 Indices voor attituden Attittuden (opvattingen) zijn complexe kenmerken Moeilijk te meten met

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

HTS Report DESIGMA - A. Design a Matrix. Tom Billiet ID Datum Advanced 1. Editie. Hogrefe Uitgevers BV, Amsterdam

HTS Report DESIGMA - A. Design a Matrix. Tom Billiet ID Datum Advanced 1. Editie. Hogrefe Uitgevers BV, Amsterdam HTS Report DESIGMA - A Design a Matrix ID 5107-4177 Datum 31.01.2017 Advanced 1. Editie DESIGMA - A Inleiding 2 / 10 INLEIDING Structuur van dit rapport Interpretatie Profielformulier Schaalscores Schaalinformatie

Nadere informatie

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek.

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek. Bijeenkomst 3 1 Programma Mini-presentaties Vragenlijst maken Kwaliteit van de vragenlijst: betrouwbaarheid en validiteit Vooruitblik: analyse van je resultaten Aan de slag: - Construct-> dimensies ->

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

werkcollege 6 - D&P10: Hypothesis testing using a single sample

werkcollege 6 - D&P10: Hypothesis testing using a single sample cursus huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 werkcollege 6 - D&P10: Hypothesis testing using a single sample Activities 9.3 en 9.4 van schatting naar toetsing vorige bijeenkomst: populatie-kenmerk

Nadere informatie

DOELGROEP De test richt zich tot zwangere vrouwen of vrouwen die recent bevallen zijn.

DOELGROEP De test richt zich tot zwangere vrouwen of vrouwen die recent bevallen zijn. BREASTFEEDING PERSONAL EFFICACY BELIEFS INVENTORY (BPEBI) Cleveland A.P., McCrone S. (2005) Development of the Breastfeeding Personal Efficacy Beliefs Inventory: A measure of women s confidence about breastfeeding.

Nadere informatie

Samenvatting (in Dutch)

Samenvatting (in Dutch) Samenvatting (in Dutch) Geordende latente klassen modellen voor nonparametrische itemresponstheorie Een geordend latente klassen model kan als een nonparametrisch itemresponstheorie model beschouwd worden.

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Dysphagia Risk Assessment for the Community-dwelling Elderly

Dysphagia Risk Assessment for the Community-dwelling Elderly DYSPHAGIA RISK ASSESSMENT FOR THE COMMUNITY-DWELLING ELDERLY (DRACE) Miura, H., Kariyasu, M., Yamasaki, K., & Arai, Y. (2007). Evaluation of chewing and swallowing disorders among frail community-dwelling

Nadere informatie

INhOud Voorwoord Inleiding Vooronderzoek en constructieonderzoek Beschrijving van de SON-R 6-40 Normering van de testscores

INhOud Voorwoord Inleiding Vooronderzoek en constructieonderzoek Beschrijving van de SON-R 6-40 Normering van de testscores Inhoud Voorwoord 9 1 Inleiding 13 1.1 Kenmerken van de SON-R 6-40 13 1.2 Geschiedenis van de SON-tests 14 1.3 Aanleiding voor de revisie van de SON-R 5V-17 17 1.4 De onderzoeksfasen 18 1.5 Indeling van

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Over misverstanden rond Cronbachs alfa en de wenselijkheid van alternatieven Sijtsma, Klaas

Over misverstanden rond Cronbachs alfa en de wenselijkheid van alternatieven Sijtsma, Klaas Tilburg University Over misverstanden rond Cronbachs alfa en de wenselijkheid van alternatieven Sijtsma, Klaas Published in: Publication date: 2009 Link to publication Citation for published version (APA):

Nadere informatie

Onderbouwing. AMN Eindtoets: adaptief met terugbladerfunctie. Hoe zit dat?

Onderbouwing. AMN Eindtoets: adaptief met terugbladerfunctie. Hoe zit dat? Onderbouwing AMN Eindtoets: adaptief met terugbladerfunctie. Hoe zit dat? In 2017 liet het ministerie van Onderwijs, Cultuur en Wetenschap de AMN Eindtoets officieel toe als eindtoets in het basisonderwijs.

Nadere informatie

Aantekeningenbundel te gebruiken bij het onderdeel testtheorie van Grondslagen psychologische diagnostiek en testtheorie.

Aantekeningenbundel te gebruiken bij het onderdeel testtheorie van Grondslagen psychologische diagnostiek en testtheorie. Aantekeningenbundel te gebruiken bij het onderdeel testtheorie van Grondslagen psychologische diagnostiek en testtheorie. College: Betrouwbaarheid Betrouwbaarheid kan je op verschillende manieren schatten:

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Aantekeningenbundel te gebruiken bij het onderdeel testtheorie van Grondslagen psychologische diagnostiek en testtheorie.

Aantekeningenbundel te gebruiken bij het onderdeel testtheorie van Grondslagen psychologische diagnostiek en testtheorie. Aantekeningenbundel te gebruiken bij het onderdeel testtheorie van Grondslagen psychologische diagnostiek en testtheorie. College: Transformaties, normering en (item)analyse Tentamentip: voor het tentamen

Nadere informatie

Spitzer quality of life index

Spitzer quality of life index Spitzer Quality of life index Spitzer, W. O., Dobson, A. J., Hall, J., Chesterman, E., Levi, J., Shepherd, R. et al. (1981). Measuring the quality of life of cancer patients: a concise QL index for use

Nadere informatie

Psychologische diagnostiek : Proces, Betrouwbaarheid, validiteit (h 5 en 6)

Psychologische diagnostiek : Proces, Betrouwbaarheid, validiteit (h 5 en 6) Psychologische diagnostiek 28-9-2005: Proces, Betrouwbaarheid, validiteit (h 5 en 6) Video PO (persoonlijkheidsonderzoek) Theorie/construct? Onder water: model (meten indiv. verschillen; observatie; teamoverleg)?

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Klantonderzoek: statistiek!

Klantonderzoek: statistiek! Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van

Nadere informatie

Het nagaan van het verloop van borstvoeding bij de pasgeborene

Het nagaan van het verloop van borstvoeding bij de pasgeborene INFANT BREASTFEEDING ASSESSMENT TOOL (IBFAT) Matthews M.K. (1988) Developing an instrument to assess infant breastfeeding behavior in early neonatal period. Midwifery, 4, 154-165. Meetinstrument Afkorting

Nadere informatie

Operationaliseren van variabelen (abstracte begrippen)

Operationaliseren van variabelen (abstracte begrippen) Operationaliseren van variabelen (abstracte begrippen) Tabel 1, schematisch overzicht van abstracte begrippen, variabelen, dimensies, indicatoren en items. (Voorbeeld is ontleend aan de masterscriptie

Nadere informatie

Programma. Schaalconstructie. IRT: moeilijkheidsparameter. Intro: Het model achter het LOVS Mogelijkheden die het model biedt voor interpretatie

Programma. Schaalconstructie. IRT: moeilijkheidsparameter. Intro: Het model achter het LOVS Mogelijkheden die het model biedt voor interpretatie Programma LOVS Rekenen-Wiskunde Inhoud, rapportage en invloed van en Intro: Het model achter het LOVS Mogelijkheden die het model biedt voor interpretatie Marian Hickendorff Universiteit Leiden / Cito

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen

Vandaag. Onderzoeksmethoden: Statistiek 2. Basisbegrippen. Theoretische kansverdelingen Vandaag Onderzoeksmethoden: Statistiek 2 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Theoretische kansverdelingen

Nadere informatie

Experimenteel en Correlationeel Onderzoek

Experimenteel en Correlationeel Onderzoek Experimenteel en Correlationeel Onderzoek In veel onderzoek is het doel: Het vaststellen van oorzaak-gevolg (causale) relaties Criteria voor causaliteit 1. Samenhang (correlatie, covariantie) 2. Opeenvolging

Nadere informatie

Met testscores bepalen we de kwaliteit van bepaalde items. De eisen voor kwaliteit zijn van groot belang voor psychologische testen.

Met testscores bepalen we de kwaliteit van bepaalde items. De eisen voor kwaliteit zijn van groot belang voor psychologische testen. Psychometrie: College 1: Schaling en Normering 04-09-2012 Kees van Putten Psychometrie: In de psychometrie bestudeert met de testscore. Hierbij gaat men van kwalitatief materiaal (antwoorden op testitems)

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

Welke vragenlijst voor mijn onderzoek?

Welke vragenlijst voor mijn onderzoek? Welke vragenlijst voor mijn onderzoek? NHG wetenschapsdag 2010 Caroline Terwee Kenniscentrum Meetinstrumenten VUmc Afdeling Epidemiologie en Biostatistiek VU medisch centrum Inhoud 1. Presentatie 2. Kritisch

Nadere informatie

1 Constructie van tests, schalen en vragenlijsten

1 Constructie van tests, schalen en vragenlijsten 1 Constructie van tests, schalen en vragenlijsten 1.1 Gebruik van de termen test en schaal Laten we eerst proberen de termen te stipuleren. Een meetinstrument is elke methode die leidt tot kwantitatieve

Nadere informatie

Samenvatting Nederlands

Samenvatting Nederlands Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.

Nadere informatie

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.

Hoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent. Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26 Regressielijn Vraag : vind het

Nadere informatie

WISKUNDE D HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0

WISKUNDE D HAVO VAKINFORMATIE STAATSEXAMEN 2016 V15.7.0 WISKUNDE D HAVO VAKINFORMATIE STAATSEAMEN 2016 V15.7.0 De vakinformatie in dit document is vastgesteld door het College voor Toetsen en Examens (CvTE). Het CvTE is verantwoordelijk voor de afname van de

Nadere informatie

Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak

Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak 1 Achtergrond van het onderzoek Bedrijven vertrouwen meer en meer op social media om klanten te betrekken

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

TECHNISCHE HANDLEIDING IQ TEST

TECHNISCHE HANDLEIDING IQ TEST TECHNISCHE HANDLEIDING IQ TEST 12 December 2011 INHOUDSOPGAVE TESTOVERZICHT Meetpretentie Theoretische achtergrond Kenmerken Samenstelling Toepassingsgebied Voorbeelditems TESTKENMERKEN Vraag die voor

Nadere informatie

SAMENVATTING HET ONDERZOEK. Ankeronderzoek Muiswerk Testsuite 7 Nederlands 1F-2F-3F-4F

SAMENVATTING HET ONDERZOEK. Ankeronderzoek Muiswerk Testsuite 7 Nederlands 1F-2F-3F-4F SAMENVATTING De testen uit Muiswerk Testsuite 7 Nederlands 1F-2F-3F-4F zijn genormeerd met behulp van de ankertesten van het Ministerie van Onderwijs, Cultuur en Wetenschap. Een groot aantal leerlingen

Nadere informatie

3 De betrouwbaarheid van toetsscores. 3 De betrouwbaarheid van toetsscores

3 De betrouwbaarheid van toetsscores. 3 De betrouwbaarheid van toetsscores 3 De betrouwbaarheid van toetsscores 3 De betrouwbaarheid van toetsscores 3 De betrouwbaarheid van toetsscores Piet Sanders De betrouwbaarheid van toetsscores is het onderwerp van dit hoofdstuk. Wat in

Nadere informatie

Zelfstudiefiches M&T: Deel 2 (H6-7)

Zelfstudiefiches M&T: Deel 2 (H6-7) Zelfstudiefiches M&T: Deel 2 (H6-7) Hoofdstuk 6 1. Bekijk figuur 6.2. Het meetproces (p. 133 cursus). Dit schema en bijhorende tekst moet je heel goed begrijpen, heel vaak komen tijdens de colleges termen

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur.

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van 14.00 17.00 uur. Technische Universiteit Eindhoven Faculteit Wiskunde en Informatica Tentamen Mathematische Statistiek (WS05), vrijdag 9 oktober 010, van 14.00 17.00 uur. Dit is een tentamen met gesloten boek. De uitwerkingen

Nadere informatie

Auteur Bech, Rasmussen, Olsen, Noerholm, & Abildgaard. Meten van de ernst van depressie

Auteur Bech, Rasmussen, Olsen, Noerholm, & Abildgaard. Meten van de ernst van depressie MAJOR DEPRESSION INVENTORY (MDI) Bech, P., Rasmussen, N.A., Olsen, R., Noerholm, V., & Abildgaard, W. (2001). The sensitivity and specificity of the Major Depression Inventory, using the Present State

Nadere informatie

Over het gebruik van continue normering Timo Bechger Bas Hemker Gunter Maris

Over het gebruik van continue normering Timo Bechger Bas Hemker Gunter Maris POK Memorandum 2009-1 Over het gebruik van continue normering Timo Bechger Bas Hemker Gunter Maris POK Memorandum 2009-1 Over het gebruik van continue normering Timo Bechger Bas Hemker Gunter Maris Cito

Nadere informatie

Schatting voor het aantal tanks: is statistiek beter dan de geheime dienst?

Schatting voor het aantal tanks: is statistiek beter dan de geheime dienst? Schatting voor het aantal tanks: is statistiek beter dan de geheime dienst? dr. H.P. Lopuhaä UHD Statistiek Opleiding Technische Wiskunde Faculteit Informatietechnologie & Systemen Technische Universiteit

Nadere informatie

Hill P.D., Humenick S.S. (1996). Development of the H&H Lactation Scale. Nursing Research, 45(3), 136-140.

Hill P.D., Humenick S.S. (1996). Development of the H&H Lactation Scale. Nursing Research, 45(3), 136-140. H & H LACTATION SCALE (HHLS) Hill P.D., Humenick S.S. (1996). Development of the H&H Lactation Scale. Nursing Research, 45(3), 136-140. Meetinstrument H&H Lactation Scale Afkorting HHLS Auteur(s) Hill

Nadere informatie

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee Methodologie voor onderzoek in de verpleegkunde Foeke van der Zee Inhoudsopgave 1. Onderzoek, wat is dat eigenlijk... 1 1.1 Hoe is onderzoek te omschrijven... 1 1.2 Is de onderzoeker een probleemoplosser

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Jensen D., Wallace S., Kelsay P. (1994). LATCH: a breastfeeding charting system and documentation tool. JOGGN, 23,

Jensen D., Wallace S., Kelsay P. (1994). LATCH: a breastfeeding charting system and documentation tool. JOGGN, 23, LATCH ASSESSMENT TOOL Jensen D., Wallace S., Kelsay P. (1994). LATCH: a breastfeeding charting system and documentation tool. JOGGN, 23, 27-32. Meetinstrument Afkorting LATCH Assessment Tool LATCH Auteur(s)

Nadere informatie

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen. Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi Inhoudsopgave Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi INTRODUCTIE... 1 1. Wat is onderzoek... 2 1.1 Een definitie van onderzoek... 2 1.2 De onderzoeker

Nadere informatie

Feedback proefexamen Statistiek I 2009 2010

Feedback proefexamen Statistiek I 2009 2010 Feedback proefexamen Statistiek I 2009 2010 Het correcte antwoord wordt aangeduid door een sterretje. 1 Een steekproef van 400 personen bestaat uit 270 mannen en 130 vrouwen. Een derde van de mannen is

Nadere informatie

Kansrekening en Statistiek

Kansrekening en Statistiek Kansrekening en Statistiek College 11 Dinsdag 25 Oktober 1 / 27 2 Statistiek Vandaag: Hypothese toetsen Schatten 2 / 27 Schatten 3 / 27 Vragen: liegen 61 Amerikanen werd gevraagd hoeveel % van de tijd

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Development of the diabetes problem solving measure for adolescents. Diabetes Educ 27:865 874, 2001

Development of the diabetes problem solving measure for adolescents. Diabetes Educ 27:865 874, 2001 Diabete Problem Solving Measure for Adolescents (DPSMA) Cook S, Alkens JE, Berry CA, McNabb WL (2001) Development of the diabetes problem solving measure for adolescents. Diabetes Educ 27:865 874, 2001

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening Inleveren: 12 januari 2011, VOOR het college Afspraken Serie 1 mag gemaakt en ingeleverd worden in tweetallen. Schrijf duidelijk je naam, e-mail

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

Voorwoord... iii Verantwoording... v

Voorwoord... iii Verantwoording... v Inhoudsopgave Voorwoord... iii Verantwoording... v INTRODUCTIE... 1 1. Wat is onderzoek... 2 1.1 Een definitie van onderzoek... 2 1.2 De onderzoeker als probleemoplosser of de onderzoeker als adviseur...

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie Inleveren: Uiterlijk 15 februari voor 16.00 in mijn postvakje Afspraken Overleg is toegestaan, maar iedereen levert zijn eigen werk in. Overschrijven

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

PSYCHOMETRIE FEEDBACKBUNDEL ACADEMIEJAAR 2009 2010

PSYCHOMETRIE FEEDBACKBUNDEL ACADEMIEJAAR 2009 2010 PSYCHOMETRIE FEEDBACKBUNDEL ACADEMIEJAAR 009 010 1 Algemeen Rekenmachines Indien mogelijk, gebruik een standaard model, dit betekent geen grafische rekenmachine. Indien u echt geen andere mogelijkheid

Nadere informatie

Gezinskenmerken: De constructie van de Vragenlijst Gezinskenmerken (VGK) Klijn, W.J.L.

Gezinskenmerken: De constructie van de Vragenlijst Gezinskenmerken (VGK) Klijn, W.J.L. UvA-DARE (Digital Academic Repository) Gezinskenmerken: De constructie van de Vragenlijst Gezinskenmerken (VGK) Klijn, W.J.L. Link to publication Citation for published version (APA): Klijn, W. J. L. (2013).

Nadere informatie

23-1-2014. Classificeren en meten. Overzicht van de officiële definities van de meter sinds 1795. Raymond Ostelo, PhD. Klinimetrie

23-1-2014. Classificeren en meten. Overzicht van de officiële definities van de meter sinds 1795. Raymond Ostelo, PhD. Klinimetrie Raymond Ostelo, PhD Professor of Evidence-Based Physiotherapy Dept. Health Sciences EMGO+ Institute for Health and Care Research VU University Amsterdam, the Netherlands r.ostelo@vumc.nl 1 Classificeren

Nadere informatie

Hoofdstuk 4 Uitvoeren en verslag leggen van een betrouwbaarheidsanalyse

Hoofdstuk 4 Uitvoeren en verslag leggen van een betrouwbaarheidsanalyse Inhoud Voorwoord 9 Hoofdstuk 1 Constructie van tests, schalen en vragenlijsten 11 1.1 Gebruik van de termen test en schaal 11 1.2 Fasen in een valideringsonderzoek 11 1.3 Unidimensionaliteit 15 Hoofdstuk

Nadere informatie

Statistische variabelen. formuleblad

Statistische variabelen. formuleblad Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Van de Schoot, et al. (2013) A black bear story. European Journal of Developmental Psychology

Van de Schoot, et al. (2013) A black bear story. European Journal of Developmental Psychology Van de Schoot, et al. (2013) A black bear story. European Journal of Developmental Psychology Weet u het nog? Stel, Julia behaalt een (T)IQ-score van 97 met betrouwbaarheidsinterval 90-104. Hoe zou u dit

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

Onderzoek Module 10.3 Het empirisch onderzoek ontwerpen. Master Innovation & Leadership in Education

Onderzoek Module 10.3 Het empirisch onderzoek ontwerpen. Master Innovation & Leadership in Education Onderzoek Module 10.3 Het empirisch onderzoek ontwerpen Master Innovation & Leadership in Education Leerdoelen Aan het eind van deze lesdag heb je: Kennis van de dataverzamelingsmethodes vragenlijstonderzoek,

Nadere informatie

Overige (Overig, ongespecificeerd)

Overige (Overig, ongespecificeerd) Uitgebreide toelichting van het meetinstrument Voice Related Quality of Life Measure (V-RQOL) 21 oktober 2011 Review 1: T. Dassen, K. v Nes, N. v Wersch Review 2: M. Jungen Invoer: E. Van Engelen 1 Algemene

Nadere informatie

INHOUD. Woord vooraf. P.F. Sanders en T.J.H.M. Eggen 1 Inleiding 1. N.H. Veldhuijzen en F.G.M. Kleintjes 2 Dataverzameling 17

INHOUD. Woord vooraf. P.F. Sanders en T.J.H.M. Eggen 1 Inleiding 1. N.H. Veldhuijzen en F.G.M. Kleintjes 2 Dataverzameling 17 INHOUD Woord vooraf P.F. Sanders en T.J.H.M. Eggen 1 Inleiding 1 1.1 Testindelingen 1 1.2 Toetsconstructie 3 1.3 Het valideren van meetinstrumenten 9 1.4 Psychometrie in de praktijk 12 N.H. Veldhuijzen

Nadere informatie

DATA-ANALYSEPLAN (20/6/2005)

DATA-ANALYSEPLAN (20/6/2005) DATA-ANALYSEPLAN (20/6/2005) Inleiding De manier waarop data georganiseerd, gecodeerd en gescoord (getallen toekennen aan observaties) worden en welke technieken daarvoor nodig zijn, dient in het ideale

Nadere informatie

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. Opgaven hoofdstuk 6 I Learning the Mechanics 6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling. De random variabele x wordt tweemaal waargenomen. Ga na dat, indien de waarnemingen

Nadere informatie

FinQ Monitor van financieel bewustzijn en financiële vaardigheden van Nederlanders. Auteurs Jorn Lingsma Lisa Jager

FinQ Monitor van financieel bewustzijn en financiële vaardigheden van Nederlanders. Auteurs Jorn Lingsma Lisa Jager FinQ 2018 Monitor van financieel bewustzijn en financiële vaardigheden van Nederlanders Auteurs Jorn Lingsma Lisa Jager 14-1-2019 Projectnummer B3433 Achtergrond van de FinQ monitor Nederlanders in staat

Nadere informatie