Onderzoeksmethoden II: introductie multilevel analyse



Vergelijkbare documenten
Onderzoeksmethoden II: overzicht en herhaling interpretatie output

Onderzoeksmethoden II: het multivariaat lineair

Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 3

Analytische boekhouding

VERSLAG PRACTICUM 6 Pattern Recognition. PCA

Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 2

TOELICHTING KOSTEN MOZAÏEKBEHEER OPEN GRASLAND

Huiswerk Informatie voor alle ouders

Pestprotocol. 1 Achtergrond. 1.1 Uitgangspunt. 1.2 Pesten in het cluster-4-onderwijs. Onderwijs. Pestprotocol Versie: 1.0 Datum: 20 mei 2014

Een observatie door de IB-er en directeur. Bij kinderen die aangemeld worden voor de groepen 3 t/m 8: Een eerste gesprek met de ouders.

LOGBOEK van: klas: 1

Veel gestelde vragen huurbeleid 18 oktober 2012

Betreft: Reactie op Consultatiedocument 'Standaard 4400N - Opdrachten tot het verrichten van overeengekomen specifieke werkzaamheden (2e ontwerp)'

Beleidsplan directe instructie : 1. Verantwoording 2. Doelstellingen 3. Model 4. Kijkwijzer 5. -Werkwijze en tijdsplanning.

Plaatsingsrichtlijnen Dr. Nassau College

Getallen 1 is een programma voor het aanleren van de basis rekenvaardigheden (getalbegrip).

Chic, zo n gedragspatroongrafiek!

HOW TO REVIEW THE LITERATURE AND CONDUCT ETHICAL STUDIES

VAN OUDERCOMITÉ NAAR OUDERRAAD

Verbanden 3. Doelgroep Verbanden 3. Omschrijving Verbanden 3

Toegepaste data-analyse: oefensessie 2

VWO-I CENTRALE EXAMENCOMMISSIE VASTSTELLING OPGAVEN CORRECTIEVOORSCHRIFT. Bij het examen: NATUURKUNDE VWO 1986-I. 2 Scoringsvoorschrift

Tips Digiduif. 1. U logt in op digiduif met uw adres en wachtwoord.

Opbrengsten VSO Panta Rhei College schooljaar

Observatielijst: Zelfregulatie in het onderwijs

Hoe zet ik een tent op?

Begeleidende tekst bij de presentatie Ieder kind heeft recht op Gedifferentieerd RekenOnderwijs.

Rietschans College Overgangsnormen

Werkwoordspelling op maat

CMD EVALUATIE STAGEBEDRIJVEN 2014

Pestprotocol basisschool Pieter Wijten

Het Muiswerkprogramma Basisgrammatica bestrijkt de grammatica die nodig is voor het leren van de Nederlandse spelling en zinsbouw.

Grondslagen vd Engineering

Beslissingsondersteunende instrumenten. Criteria September 2015 Stichting Kwaliteit in Basis GGZ

Theoretische elektriciteit 5TSO

Zijn in de aanvraag bijlagen genoemd en zijn die bijgevoegd? Zo ja, welke? Nummer desgewenst de bijlagen.

Nieuwsbrief 3: Special De Wet werk en zekerheid en het inrichten van regionale vervangingscentra.

Cursussen CJG. (samenwerking tussen De Meerpaal en het onderwijs in Dronten) Voortgezet Onderwijs

DYSCALCULIE. Naam:... Adres:... Postcode:... Woonplaats:... Geboortedatum:... Naam:... Adres:... Postcode:... Woonplaats:... Telefoonnummer:...

Academiejaar PSYCHOMETRIE LESSEN + NOTA S. 0. Psychometrie. Dr. Wilfried De Corte Door: Delfien Vansteelandt

Alternatief voor giscorrectie dat niet nadelig is voor risicoschuwe studenten

Voorbeeld oefentypes online e-learningmodules CommArt Int.

Vergaderen Informatieblad (VP) IEV1 Bladzijde 1 van 7. Vergaderen

Pedagogisch klimaat en autisme. Pedagogisch klimaat en de Klimaatschaal. Groepsprocessen bij jongeren: rol van de leerkracht.

OVERSTAP 4VMBO- 4HAVO Bertrand Russell College havo en vwo

BEGELEIDING LEERLINGEN MET DYSCALCULIE

20. Multilevel lineaire modellen

De volgende kenmerken die betrekking hebben op de algemene ontwikkeling kunnen wijzen op een ontwikkelingsvoorsprong.

Bergermeer Gasopslag Microseismisch monitoring

Protocol: Pestprotocol

Meldcode bij een vermoeden van kindermishandeling voor scheidingsbegeleiders [versie ]

PESTEN. Deze folder is een hulpmiddel voor jou en je kind om samen te leren over pesten en hoe je dit kan stoppen.

Communicatie voor beleid Interactie (raadplegen, dialoog, participatie) en procescommunicatie; betrokkenheid, betere besluiten en beleid

Documentatie. KERN Timemanagement

Projectcyclusbeheer: een handige tool bij het uitbouwen van een werking

De kans is groot dat uw testament niet voldoet aan uw wensen, geen gebruik maakt van

BELANGENVERENIGING PENSIOENGERECHTIGDEN PFZW KEUZEMOGELIJKHEID TUSSEN LAAG-PENSIOEN

Succesvol samenwerken met ouders. Onderzoek Ouderbetrokkenheid. Bundel in te kijken in de leraarskamer.

BETER IN BEDRIJF. Voel je Beter in Bedrijf! Uw organisatie Beter in Bedrijf. Verzuimbegeleiding & Arboadvies

Saxionstudent.nl CE 1

Pestprotocol. Uitleg van de petten van de Kanjertraining VOOR ALLE KINDEREN VOOR HET GEPESTE KIND

Beleidsregels voorziening jobcoaching Participatiewet 2015

Muiswerk Verbanden 2 besteedt aandacht aan het rekenen met grafieken en tabellen.

Statistische Modellen voor Longitudinale Data. Geert Verbeke

EVALUATIE TER STATE. Marion Matthijssen, Marn van Rhee. Centrum voor Onderzoek en Statistiek (COS) juli In opdracht van Raad van State

DYSLEXIE. Naam:... Adres:... Postcode:... Woonplaats:... Geboortedatum:... Naam:... Adres:... Postcode:... Woonplaats:... Telefoonnummer:...

Let op!! Niet zwemmen i.v.m. blauwalg. Leerdoelen: Kerndoelen Curriculum watereducatie SLO: NME leergebied: Werkvormen: Vakgebied: Niveau: Tijdsduur:

Stap 1. Wat wil jij?

Geavanceerde data wetenschappen

Deel 1. Procedure voor het indienen van een schakelprogramma

Muiswerk Studievaardigheid richt zich op de belangrijkste deelvaardigheden die nodig zijn voor studievaardigheid.

Dyslexie, Dyscalculie & Spellingsbegeleiding

Als uitgangspunt zijn er drie wensen waar jij uit kunt kiezen:

Zorg op K.S.T.S. Temse-Velle

1. Opstellen van de enquête

Prospectbeheer : Te exporteren adressen

Transcriptie:

Onderzeksmethden II: intrductie multilevel analyse Vraf: Verschillende niveaus in één analyse bereken. Multilevel: bijvrbeeld alles met schlen. L1: leerlingen in de schlen selecteren. L2: schlen in grepen selecteren. L3: verschillende grepen/regi s in Eurpa kiezen. Dit kan p basis van bijvrbeeld schlkarakteristieken f het SES van de schl. Straks SES berekenen in vrbeeld. Geclusterde data. Resultaat: lineair mdel niet meer kunnen gebruiken aanpassen lineair mixed mdel. Brede tepassing: multi level analyse. 1. Data met afhankelijke bservaties 1.1 Afhankelijk Wanneer zijn bservaties niet nafhankelijk? Er zijn in het algemeen twee situaties waarin zich dit vrdet. Expliciete afhankelijkheid: De data wrdt (met pzet) z verzameld, zdat de bservaties niet nafhankelijk zijn. Bijvrbeeld: Eerst trekken we een steekpref van schlen: daarna trekken we in elke schl een steekpref van leerlingen, van elke leerling verzamelen we scren ivm begrijpen lezen. We meten de bleddruk van een patiënt elke dag gedurende tien weken. In een experiment zijn er 4 cndities: elk subject drlpt 4 cndities. Lezen met muziek. Lezen met harde muziek. Lezen terwijl er gepraat wrdt. Lezen als het helemaal stil is. En dit bij 1 persn testen dus de scres zullen afhankelijk zijn van elkaar. Bijvrbeeld turven bij haperingen! Prbleem Bijvrbeeld 20x de lengte van een persn meten afhankelijk! Randm kiezen. Op een rijtje zetten: randm dr elkaar: nafhankelijk. Je weet wel in welke range het ngeveer zit. Allerlei vrmen van afhankelijkheid. Bijvrbeeld bleddruk van een patiënt wrdt gedurende 10 weken gemeten. Niet afhankelijk. Persn met persnseffect. Andere patiënt 10w eken vlgen. Bijvrbeeld dag 1= lage bleddruk. 10-70 mensen uit het publiek hun bleddruk meten = nafhankelijk van elkaar. Bijvrbeeld bij schlen leerlingen zitten in klassen met sms uitstekende leraar = niveaus kunnen verschillen tussen de leraren. Vrtest. Interventie (actie/placeb).

Psttest. Ng testen blijft effect duren. Randm schlen selecteren (kathlieke net wel selecteren) ± 100 schlen. Randm leerlingen kiezen, maar meestal klasgewijs ±25 leerlingen. Klas f schleffect zijn mgelijk evenals het leraareffect. Hiermee rekening huden tijdens de analyse. Multi level analyse: afhankelijke data creëren. Impliciete afhankelijkheid Ongewenste mstandigheden vervuilen de data: Data mtrent alchlgebruik (en misbruik) in een grte (randm) steekpref wrdt verzameld p basis van interviews; vijf verschillende interviews (elk met hun eigen stijl) wrden ingezet m de interviews af te nemen. Passief. Suggestief. 5 types van alchlmisbruik. Te veel vervuiling van het intervieweffect. Data mtrent depressie wrdt verzameld in een grte (randm) steekpref ver een peride van 10 dagen; de laatste twee dagen zijn grijs en regenachtig. Gemiddelde scres lager p de laatste twee dagen. Inwisselbaarheid Onafhankelijke bservaties zijn inwisselbaar; niet nafhankelijk bservaties niet. 1.2 Verschillende types niet nafhankelijkheid Geclusterde data Smmige bservaties hren van nature bijeen: f ng: ze behren tt dezelfde cluster f grep. De clusters f grepen zijn randm gekzen: alle bservaties die tt cluster f grep behren gaan autmatisch deel uit maken van de steekpref. Vrbeeld: een gezin, een gebit, een kppel Observaties die behren tt dezelfde cluster f grep zijn niet nafhankelijk. Hiërarchische data Steekpreftrekking vindt plaats p verschillende niveaus (levels); de niveaus zijn genest in elkaar. Vrbeeld: schlen en leerlingen, klinische centra en patiënten, West-Eurpa en de bedrijven met hun werknemers Sms zijn de bservaties niet perfect genest: een werknemer werkt vr meer dan 1 bedrijf, f een patiënt wrdt behandeld in meerdere centra; men nemt dit partial nesting f partial crssing. De bservaties binnen eenzelfde niveau zijn niet nafhankelijk. Gematchte data Men vertrekt van een bestaande set van nafhankelijke bservaties; vr elke bservatie gaat men p zek naar een gelijkaardige bservatie. Delicaat m grep die medicijnen krijgt te vergelijken met een cntrlegrep (tenzij je er 2000 hebt). Vrbeeld: case cntrl studies: Men vertrekt van een randm steekpref van patiënten. Vr elke patiënt zekt men een andere patiënt met een gelijkaardig prfiel (matching); p die manier bekmt men telkens paren. Van elk paar wrdt er 1 patiënt tegewezen aan de cntrle grep, terwijl de andere patiënt wrdt tegewezen aan de behandelingsgrep. Matching kan gebeuren p basis van 1 dimensie (bijvrbeeld leeftijd), maar k (en vaker) p basis van verschillende criteria (leeftijd, geslacht, berep, etc.) 1-1 matching versus 1-N matching.

Observaties die werden bekmen via matching zijn gelijkaardig en daarm zijn nafhankelijk. Lngitudinale data Data gemeten ver de tijd tijd speelt een rl. Lngitudinale data bekmt men wanneer men bij dezelfde bservaties gegevens verzameld gedurende een bepaalde tijdsperide. De nderzeksvragen spitsen zich drgaans te p het verlp in de tijd. Vrbeeld: bij leerlingen neemt men een rekentest af, en dit 4 maal: bij het begin van het 5 de leerjaar, en bij het begin en einde van het 6 de leerjaar; we bekmen 4 metingen p 4 tijdsmmenten. Lngitudinale data kan k wrden beschuwd als hiërarchische data: de individuele metingen zijn het eerste niveau, de individuen zelf het tweede niveau (hewel de tijdspunten hier vaak vastliggen, en drgaans niet randm gekzen wrden). Observaties van hetzelfde individu zijn niet nafhankelijk van elkaar. Opmerking: de terminlgie zals hier gepresenteerd is niet universeel en de termen wrden vaak dr elkaar gebruikt. 1.3 Het prbleem met niet-nafhankelijke data Vr het standaard lineair mdel is niet nafhankelijke data prblematisch. Vanuit een technisch gpunt: het standaard lineair mdel insisteert dat de errrtermen (en dus de bservaties) nafhankelijk zijn; z niet, is het mdel niet valide. Vanuit een cnceptueel gpunt: De accuraatheid van schattingen (en nze cnfidentie) wrdt gecapteerd dr standaardfuten van de regressiecëfficiënten. Het lineair mdel verndersteld dat er N nafhankelijk bservaties zijn bij het berekenen van de standaardfut (meer crrect: N-p 1, eenmaal de vrijheidsgraden in rekening wrden gebracht). Indien de bservaties afhankelijk (en dus gecrreleerd) zijn, zijn er in feite minderen dan N nafhankelijke bservaties, en de geschatte standaardfuten zijn daardr klein. De standaardfuten bepalen de p waarden, en dus besluiten die we trekken p basis van de data. 3 assumpties Verwachte waarde is 0. Futtermen dezelfde vr iedereen. Futtermen vr iedereen gelijk zijn = prbleem. Tetst steunt p nafhankelijkheid, tets cmpleet verkeerd als je dit negeert. 1.4 He lssen we het prbleem p? Er zijn verschillende benaderingen: Gecrrigeerde f rbuuste standaardfuten: Indien nze enige zrg is: (meer) crrecte standaardfuten verkrijgen vr een standaard lineair mdel, dan zijn er methdes m de standaardfuten te crrigeren vr het feit dat de bservaties niet nafhankelijk zijn. Deze crrecties zijn gebaseerd p het werk Huber en White en wrden vaak Huber White gecrrigeerde standaardfuten genemd. Omwille van de ABA vrm van de frmule die wrdt gebruikt m ze te berekenen spreekt men k van sandwich estimatrs. Standaardfuten meer rbuust maken waardr fut grter wrdt en p waarde stijgt. De fixed effects benadering Men kan in het mdel rekening huden met de grepen f clusters dr expliciet een variabele in het mdel p te nemen die aangeeft uit welke grep f cluster een bservatie kmt; p die manier verdwijnt het prbleem van de afhankelijkheid : we huden expliciet rekening met het feit dat de data kmen uit

verschillende grepen/clusters, en de futtermen (gecrrigeerd vr het grepseffect) zijn pnieuw nafhankelijk. Vrbeeld: m te cntrleren vr het effect van de J schlen waaruit de leerlingen afkmstig zijn, kan men J 1 hulpvariabelen tevegen aan het mdel: vr elke schl zal er een specifieke regressiecëfficiënt berekend wrden. De factr schl wrdt hier als fixed beschuwd: de cnclusies zijn enkel geldig vr deze J schlen, niet vr alle schlen. We vegen predictr (categrisch) te = additinele teveging. Categrische variabele hercderen = explsie van variabelen. Schl = fixed (ligt vast); dus wanneer we pnieuw den met = schlen resultaten alleen vr deze schlen. De mixed effects benadering Analg met de fixed effects benadering, maar de grep/cluster variabele wrdt als randm beschuwd: De niveaus van de randm factr zijn slechts een steekpref uit de vlledige ppulatie. De cnclusies achteraf slaan p de vlledige ppulatie. De verige cvarianten / factren wrden als fixed beschuwd. We hebben zwel randm als fixed effecten in eenzelfde mdel: we verkrijgen een mixed effects mdel. De data analyse is een stuk meer gecmpliceerd, en maakt gebruikt van een uitbreiding van het standaard lineair mdel: de lineair mixed mdel. Je met niet hercderen! He variëren de schlen? Variatie van randm effecten is hier schlvariabele. Veralgemenen naar andere schlen is mgelijk. 1.5 De vele gezichten van de mixed - effects mdellen Mixed effects mdellen zijn ntwikkeld in verschillende disciplines, elk met hun eigen benaming en nmenclatuur: Randm effects mdels, randm effects ANOVA (statistiek, ecnmetrie) Variance cmpnent smel (statistiek) Hierarchical lineair mdels (nderwijskunde, scilgie) Cntextuals effects mdels (scilgie) Randm cefficient mdels (ecnmetrie) Repeated measures mdel, repeated measures ANOVA (experimentele psychlgie) Hewel ze grtendeels equivalent zijn, verschillen ze van elkaar in termen van: Mtivatie en ntatie. Assupties mtrent de randm effecten. Schattingsmethde. 1.6 Sftware vr mixed - mdels MLwiN 2: rigineel ntwikkeld dr Gldstein nder de naam MLn. HLM 7: veel gebruikt in USA. Mplus SAS (Prc Mixed): zeer flexibel, zeer gede dcumentatie. SPSS (Mixed): redelijk beperkt, slecht gedcumenteerd. R 2. De linear mixed mdel 19 2.1 Een eenwegs randm - effects ANOVA mdel Het mdel genteerd in de klassiek effect ANOVA ntatie. Het effect mdel kan als vlgt wrden geschreven vr een bservatie j, in niveau i:.

: een intercept. : het (randm) effect van niveau/level i van de randm factr A. : de (randm) futterm. De variaties en wrden variance cmpnents genemd. Vrbeeld: 6 subjecten, 3 scres per subject Is er een effect van de (randm) factr subject? We beschuwen subject als een fixed factr. SPSS GLM univariate: subject als fixed factr. We beshuwen subject al seen randm factr SPSS GLM univariate; subject al seen randm factr Klassieke ANOVA benadering We beschuwen subject als een randm factr He kunnen we berekenen p basis van deze utput: Vreerst, we weten dat = MSE 1 = 2,5. Tepassing van de regels mtrent de verwachtingsperatr leert ns dat E(MSA) = Hieruit vlgt: Dit vrbeeld van de ANOVA benadering m te berekenen. 1 de gemiddelde kwadratische fut (Eng. Mean squared errr (M.S.E.)) van de vrspelling.

In meer cmplexe mdellen wrdt dit schier nmgelijk. We beschuwen subject als een randm factr Variance cmpnents mdel SPSS GLM variance cmpnents Subject als een randm factr. ANOVA (f MINQUE) benadering m variantie cmpnenten te berekenen We beschuwen subject als een randm factr Mderne benadering via (restricted) maximul likelihd. SPSS mixed mdels univariateµ Het mdel in mderne ntatie Het mdel in de Laird ware ntatie: : de (fixed) intercept = 1 : de fixed effect (cnstante regressr) : de randm effect cëfficiënt vr subject i (de afwijking van dit subject tv de intercept). = 1 de randm effect (cnstante regressr) : de (randm) errr term (de afwijking van de j scre van subject i tv het subject gemiddelde). De variatie cmpnenten De twee variantie cmpnenten in dit mdel zijn: ( We gaan er drgaans van uit dat de randm effect cëfficiënten niet gecrreleerd en nrmaal verdeeld zijn: 2.2 De structuur van de linear mixed mdel De linear mixed mdel in Laird Ward ntatie: is de scre p de respns variabele vr de j de van bservaties die behren tt subject/cluster/grep i = 1,2,, N. zijn de scres p de p regressren vr bservatie i; ze wrden als (fixed) cnstanten beschuwd. In vele mdellen wrden een cnstante term tegevegd; nemt men de intercept. De regressiecëfficiënten zijn de fixed effect cëfficiënten, en zijn dezelfde vr elk subject / cluster /grep. zijn de randm effect cëfficiënten vr subject / cluster/ grep i; de randm effect cëfficiënten wrden beschuwd als randm variabelen, en niet als parameters (net zals de futtermen.

zijn de randm effect regressren; ze zijn vaak een subset van de fixed regressren; drgaans wrdt een randm intercept term tegevegd en wrdt een randm intercept genemd. is de randm futterm vr de j de bservatie van subject / cluster i. Stchastische assumpties van de lineair mixed mdel (ptineel) De gebruikelijke assumpties vr de randm effect cëfficiënten: De gebruikelijke assumpties vr de futtermen: Het mdel in matrix ntatie Het Laird mdel in matrix ntatie: Met vr de bservaties van de i- de cluster: is de respnsvectr is de mdel matrix vr de fixed effects. is vectr van fixed effect cëfficiënten. is mdel matrix vr de randm effects. is vectr van randm effect cëfficiënten. is vectr van futtermen. Of vr alle clusters. Stchastische assumpties in matrix ntatie (ptineel) De randm effect cëfficiënten: en zijn nafhankelijk vr De futtermen: en zijn nafhankelijk vr D bevat q(q+1)/2 parameters; bevat elementen De variantie cmpnenten De elementen van D en de elementen van (vr elk i) nemen we cllectief de variantie cmpnenten (variance cmpnents) Vrbeeld

Op subject niveau: Vlledig mdel: 2.3 Parameterschatting Schatten van de fixed cëfficiënten. Indien we vernderstellen dat D en (en dus V) gekend zijn, dan is de weighted least ) squares schatter (gegeven een symmetrische gewicht matrix W) gelijk is aan: Waarbij de gewicht matrix gelijk is aan:. In de praktijk meten we V eerst schatten, dan berekenen, pnieuw V schatten, herberekenen, enzvrt; men nemt deze methden reweighted least squares. Een alternatief is m alle parameters simultaan te schatten via (restricted) maximum likelihd. Schatten van de variantie cmpnenten (ptineel) Simultaan schatten van alle parameters in het mdel. Dit is de mderne benadering. Twee methdes die wrden gebruikt in de mderne benadering zijn: Maximum likelihd (ML). Restricted maximum likelihd (REML). 2.4 Tetsen van hyptheses in een linear mixed mdel Tetsen mtrent de fixed effects. In de praktijk hanteert men een t statistiek vr tetsen van de vrm en een F statistiek vr mdelvergelijkingen. Helaas is dit een simplificatie (mdat V nbekend is). Daarm is het vaak ndig een crrectie dr te veren; sms kan dit dr het aantal vrijheidsgraden bij te stellen; enkele veel gebruikte methdes zijn: De cntainment methde (vaak de default in sftware). Satterhwaite s apprximatin Kenward and Rger apprximatin. Let wel: vr grte datasets met vele clusters maakt dit weinig uit. Mderne benaderingen hanteren een Bayesiaanse methde.

Tetsen mtrent variantie cmpnenten. Een typische hypthese is dat de variantie van een randm cëfficiënt gelijk is aan nul:. Veel sftware pakketen rapprteren hiervr een Wald z tets. Helaas is dit nzin: aan een belangrijke assumptie vr deze tetsen is hier niet vldaan: namelijk dat de parameter (nder de nulhypthese) niet p de grens mag liggen van de parameterruimte. Een alternatief is de likelihd rati test: Ok hier stelt zich het grensprbleem. Het lijkt niettemin tch behrlijk te werken indien (dit is de default bij de meeste multilevel analyses, maar niet bij bijvrbeeld lngitudinale analyses). Misschien beter vermijden? 3. Multilevel analyse 40 3.1 Overzicht In het bijznder in de nderwijskunde (denk leerlingen in schlen ) is het gebruik van linear mixed mdels vr de analyse van hiërarchische data bijznder ppulair. Wanneer nderzekers in de sciale wetenschappen de term multilevel analyse hanteren, dan bedelen ze drgaans de tepassing van de (mderne versie van) linear mixed mdels p hiërarchische data. Typisch vr dit type data is het scherp nderscheid tussen de verschillende niveaus f levels; bijvrbeeld het leerling niveau en het schl niveau (met leerlingen genest binnen de schl). De data bevat vaak variabelen p leerling niveau en p schl niveau; één van de vrdelen van een multilevel analyse is dat beide srten variabelen simultaan in dezelfde analyse kunnen betrkken wrden. 3.2 Vrbeeld: de high schl and beynd dataset Data in verband met de high schl and beynd survey uitgeverd in 1982. 7185 studenten (level 1) uit 160 schlen (level 2, 70 kathlieke en 90 publieke) namen deel. Een selectie de van variabalen in de dataset: 2 Schl: de schl van de student (factr met 160 niveaus). 3 Clustervariabelen, geeft aan in welke schl een leerling zit SES: sciaal ecnmische status van de student mach: (math achievement) scres p een wiskunde test Meanses: gemiddelde SES per schl Sectr: factr met twee niveaus 1 = public 2 = cathlic schlvariabele Cses: SES van de student gecentreerd binnen elke schl leerling-variabele variabelen die we gaan gebruiken p leerling-niveau p schlniveau Relatie tussen SES en uitkmstvariabelen zal sterk differentiëren Variatie tussen schlen; hiermee rekening huden. y mach SES x 2 Plitiek gevelige dataset want berekend de cntrversiële SES. 3 Bepaald de structuur van de analyse.

Veel variatie tussen de schlen, kunnen we dit verklaren? In 1 schl gemiddelde berekenen vr SES = meanses Centreren van schl per schl (=0). Per schl berekenen. Onderzeksvragen Het del van deze studie was na te gaan p welke manier de wiskundescre van de studenten samenhangt met de sciaal ecnmische status; de belangrijkste variabelen p studentniveau zijn: mach: de afhankelijke variabele SES: de belangrijkste predictr in deze studie Deze relatie kan best variëren ver schlen. Indien er variatie is ver schlen, kunnen we dan schl karakteristieken vinden die deze variatie verklaren? We zullen hier gebruik maken van twee variabelen: Sectr Meanses Mdel 1: een randm effect neway ANOVA Dit wrdt vaan het lege mdel genemd daar het geen predictren bevat, maar enkel de geneste structuur reflecteert. Er zijn geen niveau -1 (student) f niveau -2 (schl) predictren. Dit kmt vereen met het vlgende mdel: is algemeen gemiddelde vr alle schlen. is de afwijking f de variatie tussen de schlen. de futterm f de variantie binnen de schl. We hebben één fixed effect: de intercept. We hebben één randm effect: die de afwijking van schl j tegenver het ppulatiegemiddelde reflecteert, en daarnaast de (randm) futterm het schlgemiddelde reflecteert. Er zijn in dit mdel twee variantie cmpnenten: : de variantie van de randm intercept. : de variantie van studenten binnen dezelfde schl. die de afwijking van individu i uit schl j tegenver Extra Alleen structuur znder SPSS variabele. Daarna cmplexer maken en dan terug meer simpel. i = leerlingen j = schlen ij= scre vr 1 leerling uit 1 schl. Binnen schlen kijken wat het effect is = b (met index j=schl) = randm effect. Fixed effect met = zelfde vr iedereen. Randm effect met b = verschillende vr iedereen. Kijken he grt de verschillen zijn? De tussen de schlen variantie =. Binnen elke schl zijn er ng verschillen. De variantie binnen eenzelfde schl = futterm =. SPSS utput Dataset maken in SPSS dr vlgende stappen: Analyse Mixed mdels Linear (cntinue afhankelijke variabele en niet binair. Wat is de clustervariabele (subject variabele). Schl subjects. Bij + regi k regi tevegen.

Wat is de afhankelijke variabele + predictren? mach = afhankelijke variabele (dependent). Min : niet gebruiken. Cses: cntinue variabele = cvariate. Meanses: cntinue variabele = cvariate. Sectr: categrische variabele = factr. Fixed: fixed effect ingeven OF Randm: randm effect Mdel fitten znder predictren: fixed + include intercept. Randm: schl clustervariabele cmbinatins + include intercept + cvariance type: unstructured kiezen. Statistics: parameter estimates OK Cvariance parameters Estimates f fixed effects. Estimates f cvariance parameters. 12,636974 = (idee van gemiddelde scre) Is deze cëfficiënt gelijk aan 0? Nee! Dus significant! 39,148322 = variantie van j 8,614025 = randm effect (variantie ervan) Variantie binnen de schl > variantie tussen de schl znder rekening te huden met andere variabelen. Heel klein = geen schleffect. P - waarde berekenen = 8,614 = 39,148 He kleiner het getal, he meer gelijkend de schlen zijn. Er zijn telkens twee delen: Een fixed effects deel (estimates f fixed effects) Een variance cmpnents deel (estimates f cvariance parameters) Interpretatie Bij de fixed effects staat enkel de intercept ( = 12.637); dit is de geschatte gemiddelde scre p de wiskundetest ver alle schlen heen. Bij de variantie cmpnenten vinden we: = 8,614 = 39,148 De variantie tussen de schlen is (in dit mdel) aanzienlijk kleiner dan de variantie binnen de shclen; er zijn dan k ng geen predictren in het mdel pgenmen. De intra class crrelatin cefficient (ICC) vr deze data is:

Dit is de prprtie variantie te wijten aan het schl effect (in het algemeen nemt men dit het cluster effect). Mdel 2: één level 1 predictr We behuden de fixed intercept en de randm intercept. We vegen één level 1 predictr te: SES. Ten beheve van de interpretatie van de fixed intercept zullen we eerst SES centreren binnen enkel schl (per schl trekken we het schlgemiddelde af vr alle SES scres binnen die schl) 4. Dit geeft het vlgende mdel: Dr het centreren van SES zal pnieuw de geschatte gemiddelde scre p wiskunde reflecteren in de ppulatie. Er zijn ng steeds twee variantie cmpnenten: : de variantie van de randm intercept : de futvariantie van de binnen schl regressies SPSS utput Dataset maken in SPSS dr vlgende stappen: Idem mdel 1 Fixed effect Cses tevegen bij mdel. De rest = Mdellen (zie verder) Output: Verder: Estimate intercept: niet veel veranderd. SES variabele gecentreerd mdat intercept gelijk zu blijven! Estimates f cvariance ~ mdel 1 2,19 (significant) Alle scres: SES en wiskunde hebben verband: slecht vr een schl. Cses neemt met 1 eenheid te dan wiskunde +2.19. Interpretatie Op basis van het significante effect van de fixed variabele cses (sciaalecnmische status gecentreerd binnen de schl) besluiten we dat er (aldus dit mdel) een psitief verband bestaat tussen cses (de relatieve sci - ecnmische status binnen de schl) en de wiskunde scre (mach). Vr elke stijging met e en eenheid vr sciaal - ecnmische status, stijgt de verwachte scre p de wiskunde test met 2.1912, en dit (aldus dit mdel) in alle schlen. De tabel met de randm effecten tnt dat de futvariantie van het mdel lichtjes is gedaald (van 39.148 naar 37.010). De tabel met de randm effecten tnt k dat de extra fixed variabele de variantie tussen de schlen niet verklaart (de variantie stijgt zelfs lichtjes van 8.614 naar 8.672). 4 Gecentreerd!

Mdel 3: randm intercept + slpe vr cses We behuden de fixed en randm effecten uit mdel 2. We laten nu echter de slpe van cses (de sterkte van het effect van cses p mach) variëren van schl tt schl. Dit geeft het vlgende mdel: Dit mdel heeft vier variantie cmpnenten: : de variantie van de randm intercept : de variantie van de randm slpe (van cses) : de cvariantie tussen de binnen schl intercepts en slpes. : de futvariantie van de binnen schl regressies SPS utput Dataset maken in SPSS dr vlgende stappen: Daarnet regressielijn vr iedereen gelijk, maar dit is niet realistisch. Elke schl heeft andere regressielijn. Bereken variantie hellingsgraad. Variantie gemiddelde scres =. Relatie wiskunde en SES. Alles wat verblijft aparte variantie. Aparte regressielijn. Randm cses tevegen. Tabelletjes Output: Estimates fixed effects: zijn ngeveer gelijk gebleven. Estimates f cvariance parameters: meer infrmatie: 36,700200 variantie van de futen 5 8,680969 cvariantie tussen intercept en slpe 6 0,693989 variantie van de regressiecëfficiënt b1 7 UN= unstructured: laat te m cvariantie te schatten. Best wel belangrijke parameter. Interpretatie De standaardfut p de schatting van het fixed effect van cses wrdt iets grter, maar het effect blijft significant. De variantie van de randm slpe vr cses is relatief klein (0.694), en lijkt dus minder van belang: het effect van cses lijkt niet heel sterk te variëren van schl tt schl. Zwel de variantie van de randm intercept per schl (8.681) als de futvariantie (37.700) blijven van dezelfde rde als in de eerste twee analyses. 5 Alles wat niet verklaard is. 6 ~ crrelatie; z ged als nul. 7 Klein getal.

Er is (in dit mdel) een licht psitieve cvariantie tussen de intercepts en de slpes van cses (0.047) (he hger de intercept, he grter de slpe). Mdel 4: 1 level 2 predictr We behuden alle fixed en randm effecten uit mdel 3, maar vegen een eerste level-2 predictr te: meanses, f de gemiddelde sciaal ecnmische status per schl. Dit geeft het vlgende mdel: In een multilevel cntext is het wel vaker z dat de gemiddelde scre binnen een cluster van een predictr (hier meanses) meer van belang is dan de individuele scre p deze predictr (hier cses); men nemt dit het cntext effect. De variantie cmpnenten blijven gelijk aan deze van mdel 3. SPSS utput Dataset maken in SPSS dr vlgende stappen: Extra predictr tevegen. Fixed predictr tevegen. Meanses Fixed cses en meanses mdel. Oké. Uitkmsten. Output: Estimates meanses: Psitief. He hger scre meanses, he hger scre p wiskunde in het algemeen. Vrij grt getal. Tename +1 bij meanses dan tename 5,89 p wiskunde. Meanses: significant (0,000). Estimates f cvariance parameters: -0,264782 nu wel negatief. Interpretatie Het fixed effect van meanses is significant: p schlen met een hgere gemiddelde sciaal - ecnmische status wrdt hger gescrd p de wiskunde test; vr elk stijging met een eenheid p meanses stijgt de verwachte scre p de wiskunde test met 5.896.

De variantie van de intercept tussen de schlen (2.693) is sterk gedaald tegenver het vrig mdel (8.680); aangezien meanses de enige predictr is die er bij kwam in vergelijking met mdel 3 kunnen we stellen dat deze predictr een grt deel van de intercept variantie pslrpt f verklaart. Het is altijd het streefdel van een nderzeker m de randm cluster varianties (hier tussen schlen) z veel mgelijk te verklaren dr de ndige level-2 predictren in het mdel p te nemen. De cvariantie tussen de intercepts en slpes is (in dit mdel) nu negatief (he grter de intercept, he zwakker de slpe). Mdel 5: interactie tussen level 1 en level 2 predictr We behuden alle fixed en randm effecten uit mdel 4. We vegen de interactie tussen meanses en cses te. Dit geeft het vlgende mdel: De interactieterm reflecteert de hypthese dat de invled van cses afhangt van meanses (en mgekeerd). Bemerk dat cses een level-1 predictr is, terwijl meanses een level-2 predictr is; dch in een multilevel analyse is dit geen prbleem. De variantie cmpnenten zijn dezelfde als in mdel 4. SPSS utput Dataset maken in SPSS dr vlgende stappen: Fixed. Cses (met shift) en meanses factrial cses * meanses. Oké Ouput: Cses * meanses (interactie) niet significant in dit mdel. Wrdt significant want mdel ng niet cmpleet. Cnditineel afhankelijk van het mdel. Sectr belangrijke variabele maar wrdt hier ng niet bij gerekend. Interpretatie Bij de fixed effects kunnen we aflezen dat (in dit mdel!) de interactie tussen cses en meanses niet significant is (p = 0.372). De waarden vr de verige fixed effecten zijn nauwelijks gewijzigd. Ok de variantie cmpnenten zijn nageneg ngewijzigd gebleven. Mdel 6: tweede level 2 predictr. We behuden alle fixed en randm effecten uit mdel 5. We vegen de level-2 predictr sectr te (1=Public, 2=Cathlic). We vegen meteen k de interactie tussen cses en sectr te. We bekmen het vlgende mdel:.

De variantie cmpnenten zijn dezelfde als in mdel 5. SPSS utput: Dataset maken in SPSS dr vlgende stappen: Sectr tevegen en sectr *cses (interactie) tevegen.! Geen index j = hetzelfde getal vr alle factren. Structuren gelijk. Randm = intercept = gemiddelde scre per schl. Slpe = variantie van de schl per schl (alleen factren). Meanses = schlvariantie Fixed Cses *sectr Cses Sectr Meanses Cses * meanses = 3 hfdeffecten en 2 interactie effecten SPSS utput Hfdeffecten geven hellingsgraad. T = est/std. Errr en is hier extreem grt (60,848). Intercept = gemiddelde schlen die behren tt sectr (13,354509). Cses = Regressiehelling. Als rest =0 (1,302366) stijging met 1,3 wanneer meanses=0 en sectr=2= kathliek. Cses * meanses 1,04 = significant. Effect meanses 5,33 als cses =0 wanneer +1 bij dan hellingsgraad + 1,03. 5,33 + waarde cses x 1,03. Hellingsgraad vr kathliek = 1,03. Publiek 1,03 + 1,64! Verband sterker. Verschil tussen sectren is sterk significant. Kathliek is referentieniveau. Meer dan verdubbeling (slecht nieuws vr publieke schlen). Wanneer SES meer invled heeft dan slecht vr schlen. 5,33 + waarde cses x1,03

Interpretatie Bij de fixed effecten zien we dat de nieuw tegevegde interactie tussen cses en sectr significant is (p < 0.05): Het effect van cses is psitief zwel bij de Public als de Cathlic schlen; echter, het effect van cses is veel sterker bij de Public schlen (slpe: 1.302366+1.642674 = 2.94504) dan bij de Cathlic schlen (slpe: 1.302366). De interactie tussen cses en meanses is in dit mdel wel signficant (in tegenstelling tt mdel 5): indien meanses = 0 is er een psitief effect van cses (slpe: 1.302366); echter vr elke stijging met een eenheid vr meanses, stijgt de slpe vr cses met 1.039232. Dus indien meanses=2, is de (geschatte) slpe vr cses 1.302366 + 2 1.039232 = 3.38083. Bij de variantie cmpnenten merken we dat de variantie vr de randm slpe van cses (0.101) ng kleiner is gewrden; de cvariantie tussen de intercept en de slpe is nu pnieuw psitief. Mdel 7: znder randm slpe vr cses Nu we alle predictren en interactietermen die we vrp hadden gesteld in het mdel hebben pgenmen, kunnen we prberen het mdel wat te vereenvudigen. Bij de fixed effecten is er weinig speelruimte, want alle effecten zijn significant. Bij de variantie cmpnenten lijkt het zinvl m de randm slpe van cses te laten vallen. Hierdr krijgen we pnieuw slechts 2 variantie cmpnenten (de variantie van de intercept, en de futvariantie). Het verwijderen van de randm slpe heeft z ged als geen enkele invled p de rest van het mdel; de cnclusies en interpretaties van mdel 6 blijven dan k behuden. SPSS utput Dataset maken in SPSS dr vlgende stappen: Fixed mdel = gelijk. Estimates f cvariance parameters: Residual: 36,76609 Futterm; ng veel nverklaarde variantie. Intercept: 2,375337 Kleiner want betere verklaring p schlniveau. Mdelbuwstrategie Een typische strategie bij het pstellen van een mdel in een multilevel analyse met twee niveaus: We beginnen met een mdel met enkel een intercept en een randm intercept vr de cluster (het lege mdel ); we berekenen de ICC (cluster - effect). We vegen geleidelijk level-1 predictren te, samen met de randm slpes die daar bij hren

We vegen geleidelijk level-2 predictren te. We vegen interacties te tussen de level-1 en level-2 predictren in de hp een deel van de randm slpe varianties te kunnen verklaren. Nadat alle fixed effects in het mdel zijn pgenmen, laten we de (duidelijk) niet - significante effecten weg (1 per 1) Eenmaal het fixed - effects deel van het mdel definitief is, laten we de (relatief) kleine randm intercepts/slpes weg, zlang het geen effect heeft p de rest van het mdel. Heel typisch vr multilevel. Zeken naar wat er in randm met en wat in fixed met! Leeg mdel. Fixed tevegen. Randm tevegen.