Onderzeksmethden II: structurele vergelijkingsmdellen deel 2 1. Latente variabelen mdellen Cntinue latente variabelen (p interval niveau). Categrische latente variabelen (nminaal / rdinaal). Explratief versus Cnfirmatrisch. Latente variabelen bestaan uit 2 dingen: Gebserveerde manifeste variabelen. Niet gebserveerde (latente variabelen): we cnstrueren die want we hebben ze ndig. 2. Cnfirmatrische Factr Analyse (CFA) Attitudes vragenlijst (kun je niet rechtstreeks meten). 2.1. Delstelling De primaire delstelling van Cnfirmatrische Factr Analyse (CFA) is m na te gaan f een a priri vastgelegde factrstructuur in vereenstemming is met de data De factrstructuur bepaalt het aantal latente variabelen (factren), de relatie tussen de indicatren en de factren, de cvarianties tussen de factren, etc... Deze factrstructuur is gebaseerd p eerder nderzek (EFA?) en/f theretische argumenten Typische tepassingen van Cnfirmatrische Factr Analyse zijn: Psychmetrische evaluatie van test instrumenten die theretische cnstructen pgen te meten (zijn het 2 f 3 factren, he best scres berekenen, betruwbaarheid, cf. IRT). Cnstruct Validatie (cnvergente en discriminante validiteit, uitzuiveren van cmmn methd effecten ). Evaluatie van meetinvariante ver grepen en/f ver tijd. Tt slt is CFA altijd de eerste stap m later een structureel vergelijkingsmdel te fitten; zlang het meetmdel niet adequaat is, heeft het geen zin m de structurele relaties tussen de factren te bestuderen. Dubbele pijlen bv. Crrelatie tussen 2 futtermen. Vanaf dit geen standaard FA mdel bv. Crr, dubbele pijl tussen e5 en e6 dan iets gemeenschappelijk tussen de 2. Vr elke latente variabelen maar 1 pijl naar item, strikt nderscheiden, geen verlap. Factren = latente variabele die cntinue zijn. Latente variabele: wat de bservaties presenteren. 2.2. Het standaard CFA mdel Als iemand depressief is zu die hge scre meten hebben p de latente variabele. Hier 3 items per latente variabele. Bvb. depressie OZ Unidimensineel mdel. Hier latente variabele gecrreleerd, maar men weet niet waarm. Veel ruis dus plus: In CFA gaan we ervan uit dat alle variabelen gecrreleerd zijn met elkaar, men zegt dat ze gecrreleerd zijn, maar niet waarm, men analyseert dit niet.
Eigenschappen standaard CFA mdel: Een standaard CFA mdel heeft de vlgende drie eigenschappen: Elke indicatr y is een cntinue variabele die beïnvled wrdt dr twee mgelijke rzaken: De latente variabele (factr) waarvan de indicatr een deelaspect hrt te meten. Alle verige rzaken die een invled kunnen hebben p y: de niet - gebserveerde errr - term De errr- termen zijn niet gecrreleerd met elkaar, en niet gecrreleerd met de factren Alle crrelaties tussen de factren zijn niet -geanalyseerd. Waar pijlen vertrekken = reflectieve variabele. Waar pijlen tekmen = frmatief variabele. Elementen van het standaard CFA mdel: indicatren en factren De indicatren beschuwen we als endgene variabelen: de factren als exgene variabelen. De indicatren zijn bedeld (deelaspecten van) de factren te meten Vaak zijn het items van een vragenlijst. Of scres p een subtesten (bvb. in een intelligentie test). De factren crrespnderen met hypthetische cnstructen die niet (direct) bserveerbaar zijn. Vaak gaan we de factren benemen naar het hypthetisch cnstruct (bvb. sciale steun f brderline persnality ). Let wel: dit betekent niet ndzakelijk dat de factr dit cnstruct meet (=naming fallacy) Een hypthetisch cnstruct crrespndeert niet ndzakelijk met de realiteit (=reificatin). Zie bvb. het bek: Guld (1981). The Mismeasure f Man. Vr vrbeelden van reificatin p basis van EFA studies van intelligentie De schattingen van de directe effecten van de factren p de indicatren nemt men factrladingen we kunnen die factrladingen interpreteren als regressiecëfficiënten. We kunnen die factrladingen interpreteren als regressiecëfficiënten:. De regressiecëfficiënten kunnen we standaardiseren (dr zwel de indicatren als de factren te standaardiseren). Elementen van het standaard CFA mdel: errr termen We beschuwen de errr termen als exgene variabelen (net zals de disturbance termen in padanalyse). Het effect van de errr term p de indicatr representeert het gecmbineerd effect van. Alle (weggelaten f nbekende) variabelen die een invled hebben p de indicatr (bvb. methde effecten). Meetfut. De variantie van de errr term nemt men de unieke variantie van de indicatr (eigen aan de indicatr, versus gemeenschappelijk met de verige indicatren). Het direct effect van de errr term p de indicatr wrdt gefixeerd p 1: p die manier leggen we de schaal vast van de errr term.
2.3. Unidimensineel versus multidimensineel meetmdel Andersn and Gerbing (1988) maken een nderscheid tussen een unidimensineel versus een multidimensineel meetmdel. Unidimensineel: Het standaard CFA mdel. Elke indicatr is gerelateerd aan slechts 1 factr. De errr termen zijn niet gecrreleerd. multidimensineel: Het CFA mdel bevat mgelijks kruisladingen. Een indicatr is gerelateerd aan meer dan 1 factr. Het CFA mdel bevat mgelijks errr - crrelaties: een crrelatie (cvariantie) tussen twee errr termen. Vrbeeld: multidimensineel meetmdel Argumenten pr/cntra uni / multidimensinele meetmdellen Errr- crrelaties reflecteren de assumptie dat indicatren iets meten dat ze gemeenschappelijk hebben maar niet in het mdel is pgenmen Een mdel znder errr- crrelaties reflecteert de assumptie dat alle indicatr crrelaties (cvarianties) kunnen wrden verklaard p basis van de factren die in het mdel werden pgenmen. Dit crrespndeert met de lcal independence hypthese: de indicatren zijn (statistisch) nafhankelijk indien men cntrleert vr de (juiste set van) factren. Errr- crrelaties kunnen nuttig zijn: bvb. bij herhaalde metingen kunnen ze autcrrelatie patrnen representeren. Errr- crrelaties kunnen k methde-effecten aangeven (bvb. crrelaties tussen alle items die negatief gefrmuleerd werden) Smmige indicatren kunnen van nature meerdere dmeinen (factren) meten: zijn ze factrially cmplex (Catell, 1978) (bvb. Big Five ). 2.4. Hiërarchische CFA mdellen
is een exgene secnd rder factr. en zijn endgene First rder fatren. Vrbeeld: hiërarchische factrstructuur vr cgnitive ability 2.5. Reflectieve versus frmatieve indicatren Reflectieve indicatren wrden beïnvled dr een factr. Frmatieve indicatren hebben een effect p de factr (en niet mgekeerd). Bijvrbeeld: de factr sci-ecnmische status (SES) wrdt beïnvled dr gebserveerde variabelen zals inkmen, pleiding, berep, etc (Bllen & Lennx, 1991). Mdellen waar dit vrkmt zijn geen CFA mdellen (meer), maar structurele vergelijkingsmdellen. 2.6. Identificatie Unidimensineel CFA mdel Er zijn minstens 3 vrwaarden pdat een CFA mdel geïdentificeerd zu zijn: Het aantal vrije parameters is kleiner (f gelijk aan) het aantal datapunten. Elke latente variabele heeft een vaste schaal: De errr termen: schaal wrdt bepaald dr de indicatren (wegens direct effect gefixeerd p 1). Vr de factren zijn er twee mgelijkheden: UVI f ULI. Een minimum aantal indicatren per factr: Vr een CFA met (slechts) 1 factr: minstens drie indicatren. Vr een CFA met meerderen factren: minstens twee indicatren per factr. Parameters en datapunten Net zals bij padanalyse is het aantal datapunten gelijk aan het aantal (niet redundante) elementen van de variantie cvariantie matrix: De vrije parameters van een CFA mdel: De regressiecëfficiënten vr alle directe effecten van de factren p de indicatren (i.e. de factrladingen). De variaties van de errr termen. Optineel: de crrelaties / cvarianties tussen de errr termen. Bij ULI: de varianties van de factren. Bij niet hiërarchische CFA: de cvarianties tussen de factren. Bij hiërarchische CFA: de directe effecten van de secnd rder factren.
Vrijheidsgraden (degrees f freedm, df): aantal datapunten min het aantal vrije parameters. Schaal factren: UVI f ULI Er zijn twee curante manieren m de schaal vast te leggen van de factren: Unit Lading Identificatin (ULI): de niet-gestandaardiseerde regressiecëfficiënt (factrlading) van een bepaalde indicatr van deze factr wrdt p 1 gefixeerd; men nemt deze indicatr de referentie indicatr. Unit Variance Identificatin (UVI): de variantie van de factr wrdt p 1 gefixeerd. UVI versus ULI Vr een standaard CFA mdel zu het geen verschil mgen maken. Nadeel ULI: welke indicatr meten we kiezen: typisch de eerste, maar in feite best deze indicatr met de hgste betruwbaarheid. Vrdeel UVI: alle factrladingen zijn vrije parameters. Nadeel UVI: enkel vr exgene factren (bvb. in hiërarchische CFA zijn er tevens endgene factren). Nadeel UVI: niet geschikt vr multi - grup CFA. Identificatie van multi dimensinele CFA mdellen Het is niet evident m a priri te bepalen f multidimensinele CFA mdellen geïdentificeerd zijn f niet De aanwezigheid van errr- crrelaties en kruisladingen leidt vaak tt identificatieprblemen Pragmatische aanpak: indien een SEM prgramma het CFA mdel kan fitten znder prblemen is het mdel (wellicht) geïdentificeerd. Men kan het mdel fitten p bestaande data. Indien de data ng dient te wrden verzameld: men kan het CFA mdel tten p gesimuleerde data. Wat indien niet geïdentificeerd? Indien theretisch verantwrd: vrije parameters fixeren. Tevegen indicatren. 2.7. Stappen m een CFA analyse uit te veren De specificatie van het mdel (f de verschillende mdellen) Bepaal a priri de factrstructuur die je wenst te tetsen aan de data Het is vaak nuttig m alternatieve mdellen vrp te stellen (bvb. een 1-factr structuur versus een 2- factren structuur) Ga na f alle mdellen identificeerbaar zijn Verzamel de data, en prepareer de data vr analyse: Gebruik bij vrkeur de vlledige dataset, f de variantie -cvariantie matrix van de variabelen Indien naast de crrelatie -matrix k de standaardafwijkingen werden gerapprteerd: transfrmeer naar variantie -cvariantie matrix. Schat het mdel met behulp van SEM sftware. Evalueer de fit van het mdel; indien ndermaats, herspecificeer het mdel (zie verder). Kijk na f alle parameterschattingen aan de verwachtingen vlden (bvb. zijn alle factrladingen significant? zijn alle varianties psitief?) Indien mdel ké, ga na f het meetmdel k geldt in andere grepen (zie verder: multiple grup CFA) Rapprteer de resultaten. 2.8. Schatten van de parameters in het CFA mdel Enkel via SEM sftware! Standaard prcedure vr cntinue indicatren: Maximum Likelihd (ML) schatting vertrekkende van de variantie/cvariantie matrix (niet de crrelatie matrix). Assumptie: alle indicatren zijn van intervalniveau en bvendien multivariaat nrmaal verdeeld: Indien indicatren weliswaar cntinue, maar scheef - verdeeld is een crrectie ndig (bvb. de Satrra- Bentler crrectie).
Vr likert scales wrdt sms gesuggereerd m smscres te berekenen p basis van een (klein) aantal likert items die samen hren; vervlgens hanteert men deze smscres als (cntinue) indicatren; men nemt dit item parceling, dch de techniek is cntrversieel (zie Bandals & Finney, 2001, vr een verzicht). Vr de analyse van crrelatie-matrices bestaan er speciale methdes (cnstrained ptimizatin, Brwne, 1982): dit is een ML methde waarbij nietlineaire cnstraints wrden pgelegd aan bepaalde parameters. Enkel autmatisch beschikbaar in de prgramma s SEPATH en RAMONA). Manueel mgelijk in alle verige prgramma s Indien indicatren categrisch (binair/rdinaal): speciale technieken zijn ndig, dch geen enkel prbleem met recente sftware zals Mplus (en binnenkrt k lavaan). 2.9. Mdel evaluatie De essentie van CFA: past ( fit ) het mdel ged met de data f niet? Drie aspecten dienen we te evalueren: Algemene gdness-f-fit (f lack-f-fit ) maten: De statistiek is idealiter niet significant (zeldzaam met grte N). Vuistregels: CFI en TLI > 0.95, RMSEA < 0.05, SRMR < 0.06. Deze vuistregels zijn vaak het nderwerp van discussie in de SEM literatuur. Specifieke rzaken van misfit; daarvr bestuderen we: De (gestandaardiseerde) residuals (= de verschillen tussen de gebserveerde en geïmpliceerde elementen van de variantie/cvariantie matrix). De mdificatin indices. Interpreteerbaarheid, grtte en significantie van de parameterwaarden. Ongeldige parameterschattingen (bvb. negatieve errr- varianties, negatieve factr- varianties, crrelaties grter dan 1.0) zijn een signaal dat er prblemen zijn (te kleine sample, slecht gespecificeerd mdel,... ). Zijn de factrladingen in de juiste richting (psitief f negatief)? Zijn alle vrije parameters (factrladingen, factr- crrelaties, errr - varianties) significant? (z niet, kunnen we ze weglaten?) Zijn de standaardfuten van de vrije parameters niet excessief hg? Is de cvariantie/crrelatie tussen de factren in de juiste richting (psitief f negatief)? 2.10. Vrbeeld: 8 subschalen mtrent persnlijkheid Data N=250 persnen die psychtherapie vlgen (utpatients) werden gescrd p 8 subschalen uit een persnlijkheidstest (Brn: Brwn (2006), figuur 4.1) anxiety (N1) hstility (N2) depressin (N3) self-cnsciusness (N4) warmth (E1) gregariusness (E2) assertiveness (E3) psitive emtins (E4) Men pstuleert twee gecrreleerde factren: neurtisme en extraversie.
Gegeven: crrelatie matrix + standaardafwijkingen (ptineel) Diagnaal De gebserveerde cvariantie matrix De lavaan mdel syntax + mdel fit Indicatren die bepalen he we neurt bepalen Output lavaan Past mdel met data? Hier: ja! Slechter: dan grter dan 19!
Standaardfut. Standaard nrmale verdeling -2 +12 >2 dus significant Allemaal significant Ok -5,476 is significant -0,435: vlgens dit mdel hge scre p latente variabele dan lage scre p extraversie! Mdel geïmpliceerde cvariantie matrix Mdel past ged bij de data. Ged mdel: z ged mgelijk gelijkend p het gebserveerde data = slide 31. Residuals: verschil gebserveerde en geïmpliceerde cvarianties
Gestandaardiseerde residuals Genegeerd en p nul gezet! Gestandaardiseerd m te interpreteren. X scres. -2 +2 Grter dan dit dan niet ged gecapteerd. Mdificatin indices Mdificatin indices NA: gemdificeerd p 0 f 1 weet niet wat te den! 0 = pijlen staan er al Mcht mdel pnieuw fitten en deze tevegen dan zakt die 54,416 met 1,328. Nit slechter mdel dr te te vegen. Zeken naar het grtste getal: grtste winst bij teveging. Pijl die p 0 gezet is geweest, is de belangrijkste ntbrekende. 2.11. Vergelijken van 2 mdellen geneste CFA mdellen: via de chi-square difference test : De statistiek ( ) vlgt een chi-kwadraat verdeling met als aantal vrijheidsgraden:. Vrbeeld geneste mdellen: een CFA mdel met 2 factren die niet gecrreleerd zijn (mdel 1), is genest in een CFA mdel waarbij de factren wel mgen crreleren (mdel 2). Bvb. neurtisme/extraversie: mdel 1, mdel 2, difference test:. Let p: CFA mdellen met een verschillend aantal factren kunnen nit genest zijn! Indien de mdellen niet genest zijn: Vergelijken van de verige Gdness-f-fit maten. Eventueel kijken naar de AIC f BIC scre: he kleiner, he beter.
Alternatief mdel: geen crrelatie tussen de factren 1 verschil N E Met p 0 gezet wrden. Achteraf mgen deze latente variabelen niets met elkaar te maken hebben. Orthgnaal: ldrecht nder elkaar: znder relatie. Output lavaan 54,416 x4 bij vrige keer DF: zuiniger mdel: 1 variabele / paramter minderen want vastgelegd p 0 Super significant >.95 Ng redelijk >0.05 Niet z ged Mdel is niet z slecht, maar k niet perfect >0.05
Gefixeerd p 0 Futtermen gaan de lucht in Mdel vergelijkingstets: blique versus rthgnaal 54,416 13,285 = 41 verschil met 1 DF verschil 2 e mdel is significant slechter dan 1 e mdel Mdellen vergelijken: ké. Maar genest f niet genest belangrijk. Mdellen meten genest zijn. Smmige parameter p 0 f = aan elkaar. Restrictiever mdel dan eerst. Vaak meerderen mdellen en hypthesen. Zeer verleidelijk m mdellen te vergelijken. Mdel wrdt gefit: meestal waarden dicht bij elkaar. Ofwel genest fwel niet. A B C A-B: genest A-C: niet genest wel iets gemeenschappelijk B: waarden p bepaalde waarde gezet dus kleinere gelijkenis Maar 1 factr: geen tets vr. Kijk naar bepaalde waarden die verschillen. AIC en BIC. He kleiner, he beter, maar geen p waarde alleen rdening vlgens één van de twee waarden. Mdificatin indices grter dan 10.00 Alleen waarden grter dan 10 geschatte waarde: zakken met ngeveer 37,828 een heden. Epc: expected parameter change Mcht je die parameter tevegen, wat zu dan ngeveer de waarde zijn? Maar grt f niet? -0,434: crrelatie: de meite (gestandaardiseerd) die met ik vrij laten. -0,003: te dicht bij 0: niet praktisch significant. 2.12. Herspecificatie van CFA mdellen Indien de fit het CFA mdel niet adequaat is zijn er verschillende manieren m het mdel te wijzigen:
Het wijzigen van het aantal factren. Het tevegen van factr- indicatr effecten (kruisladingen). Het tevegen van errr- crrelaties. Het verwijderen van prblematische indicatren. Idealiter gebeuren deze wijzigingen p basis van theretisch ged gefundeerde argumenten Het is echter k mgelijk m explratief wijzigingen uit te prberen dr te kijken naar de mdificatin indices. Het heeft geen zin m pijlen te te vegen (f restricties te wijzigen) die theretisch niet kunnen nderbuwd wrden. Mdificatin indices De mdificatin indices geven aan welke pijlen we eventueel meten tevegen aan het mdel (f welke restricties we meten laten vallen) teneinde de fit van het mdel te verbeteren. Deze mdificatin indices weerspiegelen (bij benadering) de verbetering in fit (in termen van ) indien de pijl zu wrden tegevegd (f de restrictie wegvalt). Vuistregel: mdificatin indices grter f gelijk aan 3.84 (=kritische drempel vr met 1 vrijheidsgraad p ) verdienen aandacht. Deze mdificatin- indices zijn echter sterk afhankelijk van de huidige steekpref; kijk k naar de expected parameter change (EPC) waarden m te berdelen indien de gewijzigde parameterwaarde de meite lnt. Eventuele wijzigingen p deze manier bekmen dienen we idealiter te cnfirmeren in een nafhankelijke steekpref. 2.13. En verder Multiple grup CFA Vr elke grep een aparte variantie/cvariantie matrix Nagaan van meetinvariante: meet het CFA mdel hetzelfde (en p dezelfde manier) in verschillende ppulaties? Vergelijken van de gemiddelde scres p de latente factren in verschillende ppulaties (cf. t -test f ANOVA maar dan p latente gemiddelden) CFA met cvariaten (bvb. een variabele geslacht ) 1 1 variantie/cvariantie matrix. MIMIC: multiple indicatrs and multiple causes. is er een direct effect p de factr? Dit zu wijzen p hetergeniteit: verschillen tussen mannen en vruwen wat betreft de latente factr gemiddelden. Is er een direct effect p een indicatr (intercept)? Dit zu wijzen p indicatr bias (= item bias, differential item functining). CFA analyse van Multitrait -Multimethd (MTMM) data Elk van de verschillende traits (latente factren) werd gemeten aan de hand van verschillende methdes (bvb. self- reprt scale, bserver rating, clinical interview) Nagaan van divergente en discriminante validiteit en methde-effecten Het schatten van factrscres binnen een CFA mdel 2 CFA met binaire/rdinale variabelen 3... CFA is vaak de vrbde van een SEM analyse! 4 Fit mdel in één grep en andere grep (bijvrbeeld mannen versus vruwen f klinische versus niet klinische. 1 Meetinstrument beïnvled dr verschillende factren. Men cntrleert vr externe cvarianties en regressies. 2 Op het einde van de rit willen we scres zien. Factrscres vr latente variabelen en daarmee verder werken. 3 IRT 4 Meetinstrument daarna relaties tevegen = idee structure base mdel.
2 variabelen vergelijken = multiple grup CFA MAAR we meten ervr zrgen dat de latente variabelen een relatie hebben en dat ze gelijke indicatren hebben. Gelijk intercept f factrlading. Gelijk meten mannen en vruwen. Bvb. culturen tegenver elkaar: landen / meetinvariantie!