Item-responstheorie (IRT)



Vergelijkbare documenten
Samenvatting Nederlands

Kwaliteit van meetinstrumenten

MISSING DATA van gatenkaas naar valide uitkomsten

PROMIS. De nieuwe gouden standaard voor PROMs. Kenniscentrum Meetinstrumenten Afdeling Epidemiologie en Biostatistiek VU Medisch Centrum

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS

Welke vragenlijst voor mijn onderzoek?

Vitamine B12 deficiëntie

College 3 Interne consistentie; Beschrijvend onderzoek

9. Lineaire Regressie en Correlatie

11. Multipele Regressie en Correlatie

Samenvatting (in Dutch)

Classificeren en meten. Overzicht van de officiële definities van de meter sinds Raymond Ostelo, PhD. Klinimetrie

Cover Page. The handle holds various files of this Leiden University dissertation.

College 2 Enkelvoudige Lineaire Regressie

Analyse van Vragenlijsten met behulp van Item Respons Theorie

Het meten van ziektespecifieke kwaliteit van leven

PROMIS Een integraal systeem voor het meten van patientgeraporteerde

3.1 Itemanalyse De resultaten worden eerst op itemniveau bekeken. De volgende drie aspecten dienen bekeken te worden:

Psychometrie werkgroep: De antwoorden

Handleiding vragenlijst Ervaren Regie in de Zorg

ANALYSE PATIËNTERVARINGEN ELZ HAAKSBERGEN

Onderbouwing. AMN Eindtoets: adaptief met terugbladerfunctie. Hoe zit dat?

Handleiding vragenlijst Ervaren Regie in de Zorg

Met het oog op participatie

1 Constructie van tests, schalen en vragenlijsten

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Gebruik van PROMs individueel versus groepsniveau. Riekie de Vet

Samenvatting (Summary in Dutch)

PROMIS. De nieuwe gouden standaard voor vragenlijsten. Caroline Terwee

Projectplan overzicht (deel 1)

College 3 Meervoudige Lineaire Regressie

Bachelorproject II College 1: Validiteit en betrouwbaarheid: factor- en betrouwbaarheidsanalyse. Harry BG Ganzeboom 5 januari 2016 Bijgewerkt in rood

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens

Development of the diabetes problem solving measure for adolescents. Diabetes Educ 27: , 2001

Spitzer quality of life index

Taal peilingen door de jaren heen

PROMs en PROMIS. Colloqium NIVEL 27 jan 2014

Taalherstel na intensieve revalidatie is beter te voorspellen: Wie wordt er beter van?

INHOUD. Woord vooraf. P.F. Sanders en T.J.H.M. Eggen 1 Inleiding 1. N.H. Veldhuijzen en F.G.M. Kleintjes 2 Dataverzameling 17

Klantonderzoek: statistiek!

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek.

Stroke-Adapted Sickness Impact Profile (SA-SIP-30)

Conflict van belangen

Vragen oefententamen Psychometrie

PROMIS Een integraal systeem voor het meten van patientgeraporteerde

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Met factoranalyse worden heel veel variabelen ingekort tot een aantal variabelen.

Stijn Hoppenbrouwers en Tom Heskes. Onderzoeksmethoden (vervolg)

Responsiviteit van meetinstrumenten. Prof. dr. ir. Riekie de Vet. EMGO Instituut, Amsterdam

Het meetinstrument heeft betrekking op de volgende categorieën Lichaamsregio Bovenste extremiteit

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Beschrijvende statistieken

Samenvatting. J. Nachtegaal, S.E. Kramer, J.M. Festen (Amsterdam)

GEZONDHEIDSGERELATEERDE LEVENSKWALITEIT BIJ SCHISISPATIËNTEN: ONTWIKKELING EN VALIDATIE VAN DE NEDERLANDSTALIGE VELO-

Het meetinstrument heeft betrekking op de volgende categorieën Lichaamsregio Overige, ongespecificeerd

Patient-reported outcome measures. Spreker Diana Delnoij Plaats Kwaliteitsinstituut

Werkinstructies voor de CQI Astma en COPD

Overzicht. Relaties tussen persoonlijke factoren, activiteiten, participatie en kwaliteit van leven. Wat weten we al? Wat weten we al?

Diagnosestelling en de vernieuwde IADL-vragenlijst

Tentamen Biostatistiek 3 / Biomedische wiskunde

nederlandse samenvatting Dutch summary

Hoofdstuk 4 Uitvoeren en verslag leggen van een betrouwbaarheidsanalyse

3 Werkwijze Voordat een CQI meetinstrument mag worden ingezet voor reguliere metingen moet het meetinstrument in twee fases getest worden.

04 Uitkomsten meting. 1 Inleiding. 2 De ontvangen zorg

Samenvatting Beloop van beperkingen in activiteiten bij oudere patiënten met artrose van heup of knie

Nederlandse Samenvatting

Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak

Analyse van kruistabellen

Met testscores bepalen we de kwaliteit van bepaalde items. De eisen voor kwaliteit zijn van groot belang voor psychologische testen.

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox

Introduction and thesis outline. Samenvatting. CRAVING NAAR BENZODIAZEPINEN De ontwikkeling van de Benzodiazepine Craving Questionnaire

PROMIS. De nieuwe gouden standaard voor vragenlijsten. Caroline Terwee

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

De ziektelastmeter COPD: de betrouwbaarheid en de ervaringen van huisartsen tot nu toe. Onno van Schayck. Cahag Conferentie

Werkinstructies voor de CQI Heup-/Knieoperatie

BURNOUT ASSESSMENT TOOL

Innovatie van dienstverlening via Loket. Reden voor gebruik en gebruikerstevredenheid.

Vragenlijst conflicthantering

Welke Factoren hangen samen met Kwaliteit van Leven na de Kanker Behandeling?

Hebben mannen en vrouwen gelijke kansen. bij selectieproeven met intelligentietests? Samenvatting

Hoofdstuk 1 is de algemene inleiding van dit proefschrift. Samenvattend, depressie is een veelvoorkomende stoornis met een grote impact op zowel het

Werkinstructie PREM Fysiotherapie NIVEL, december 2016

Patient reported Outcomes in Cognitive Impairement (PROCOG)

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

Nederlandse Samenvatting

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Summery. Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers

Dysphagia Risk Assessment for the Community-dwelling Elderly

DATA-ANALYSEPLAN (20/6/2005)

Zimmerman, Sheeran, & Young. Beoordelen van de aanwezigheid van depressie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Transcriptie:

Item-responstheorie (IRT) niet direct voor een dubbeltje, maar wel erg cool op het podium Ruth van Nispen 1 Caroline Terwee 2 1 Afdeling Oogheelkunde 2 Afdeling Epidemiologie en Biostatistiek VU medisch centrum

Klassieke testtheorie Onze constructen kunnen we niet direct meten: vragenlijst (items) nodig Observed score = true score + error Somscores: elk item draagt evenveel bij aan het onderliggende construct houdt dus geen rekening met de mate van samenhang tussen het item en het onderliggende construct

Somscore gaat goed als: Scores betrouwbaar en valide zijn (bijv gebaseerd op een groot aantal gecorreleerde items) Voldoende variabiliteit is en scores min of meer normaal verdeeld zijn Er geen missende waarden zijn (m.n. items) Lezen van kleine druk dimensie van de Low Vision Quality Of Life questionnaire Hoeveel problemen heeft u met het lezen van geen matige veel onmogelijk Etiketten (bijv op medicatie) 0 1 2 3 4 5 Krantentekst en boeken 0 1 2 3 4 5 Uw post (bijv brieven) 0 1 2 3 4 5

Item-responstheorie Statistische modellen die de relatie meten tussen de score van een persoon op een bepaald construct, en de waarschijnlijkheid dat iemand een bepaalde antwoordcategorie kiest op elk item van het construct (latente of onderliggende variabele). Zowel persoons- als item parameters Gebruik: vroeger in onderwijs, nu steeds meer in gezondheidsmetingen en bij item banking * P ij exp[ αi( θ s βij )] ( θ s) = 1+ exp[ α ( θ β )] i s ij

Voordelen IRT Model fit: empirisch bewijs dat de geobserveerde responses kunnen worden verklaard door een onderliggend construct Modellen gaan goed om met missende waarden - imputeren niet nodig Vloer/plafond effecten, scheve verdelingen geen probleem want specificatie van verdeling is vrij aanname van het model correct; interpretaties vrij van bias

Item response curve 1.0 probability of responding positively 0.8 0.6 0.4 0.2 0.0-4 -2 0 2 4 theta (increasing disability)

Aannamen IRT modellen Validatie / calibratieproces: Unidimensionaliteit Lokale onafhankelijkheid Monotoniciteit Item toetsen Item equivalentie: Differentieel item en test functioneren (DIF) Betrouwbaarheid en precisie Item / test informatie functies

Voorafgaand aan IRT Unidimensionaliteit Items behoren tot één onderliggend construct Lokale onafhankelijkheid Items (residuen) ongecorreleerd, ofwel kans op positieve respons op een item is niet gerelateerd aan de kans op een positieve respons op een ander item van dit construct voor respondenten met dezelfde disability, gemeten met een (dimensie op) vragenlijst Onderzoeken met factoranalyse

Wat heb je nodig? - Baseline meting - Voldoende respons - Mplus is handig (SPSS of andere software)

Monotoniciteit We nemen aan dat de item respons curves monotoon stijgen Het IRT model moet de data accuraat weergeven Onderzoeken van de door het model voorspelde uitkomst (verwachte uitkomst) te vergelijken met de geobserveerde uitkomst probability of responding positively 1.0 0.8 0.6 0.4 0.2 0.0-4 -2 0 2 4 theta (increasing disability) Item fit toetsen

Wat heb je nodig? - Baseline meting - SAS of andere software - IRT-expert

DIF Onderzoek naar de relatie tussen de item respons en een groepsvariabele conditioneel op de onderliggende variabele Demografische variabelen (geslacht, leeftijds cat.) Cultuurverschillen (taal) Verandering over tijd (response shift)

Wat heb je nodig? - Baseline meting - IRTLRDIF van Thissen: vrij op internet - Literatuur (bijv. J Teresi et al)

Item / test informatie Precisie wordt afgebeeld m.b.v. item of test informatie curves Disability bereik waarover een bepaald item of test (dimensie) informatie geeft Inverse van wortel uit de informatie functie is gelijk aan de SE van theta (disability) B. Test information curve VCM1 (n=296) 20 18 16 14 test information 12 10 8 6 4 2 0-3 -2-1 0 1 2 3

Ideeën voor publicaties Factoranalyse IRT calibratie: Item fit + DIF + item / test informatie Nieuwe vragenlijst valideren of inkorten Oude vragenlijst herevalueren Longitudinale analyses

Groepsopdracht Bedenk met elke promovendus tenminste 1 klinimetrisch / IRT artikel Terugkoppeling Succes!

Software suggesties Exploratory factor analyses (rotation) Item response model Polychoric correlations (promax) - Mplus Graded response model - gllamm (Stata)/ MULTILOG Item-test S X 2 -test - SAS DIF analyses Likelihood Ratio (G 2 ) - IRTLRDIF Precision Item & test information - MULTILOG Reliability Index of person separation - MULTILOG

Literatuur suggesties Embretson S, Reise S. Item response theory for psychologists. Mahwah NJ: Earlbaum, 2000. Themanummers over IRT Quality of Life Research 2007; 16 suppl. Medical Care 2007; 45, suppl.