Toegepaste data-analyse: sessie 3



Vergelijkbare documenten
Toegepaste data-analyse: oefensessie 2

Oefeningenreeks 4: SEM mediatie en moderatie

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

Structural Equation Modeling

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

20. Multilevel lineaire modellen

1. Reductie van error variantie en dus verhogen van power op F-test

College 3 Meervoudige Lineaire Regressie

11. Multipele Regressie en Correlatie

Hoofdstuk 8: Multipele regressie Vragen

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 1

9. Lineaire Regressie en Correlatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

HOOFDSTUK VII REGRESSIE ANALYSE

College 7 Tweeweg Variantie-Analyse

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

Praktijkbundel Amos 6.0 in de praktijk

Gegevensverwerving en verwerking

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Data analyse Inleiding statistiek

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

2.3 Examenopdracht Bespreking Deel 1 - Gegevens voorbereiden. Analyse oefeningen en programmeertechnieken 7 / 22

Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 3

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

College 6 Eenweg Variantie-Analyse

College 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit

Classification - Prediction

Statistiek voor Natuurkunde Opgavenserie 4: Lineaire regressie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Hoofdstuk 10: Regressie

duidelijk. Welke groepen verschillen wel/niet van elkaar?wat zijn je hypothesen?

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens

Tentamen Biostatistiek 3 / Biomedische wiskunde

Hoofdstuk 5 Een populatie: parametrische toetsen

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR Feedback Praktische Proef

Labo IDP. In dit labo gaan we IDP gebruiken voor het analyseren van logische circuits. XOR Q AND. Figuur 1: Een logisch circuit.

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Examen G0N34 Statistiek

Samenvatting (Summary in Dutch)

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Voorbeeld regressie-analyse

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

Statistiek II. Sessie 4. Feedback Deel 4

ONGEWENST INTRUSIEF GEDRAG: EEN STUDIE NAAR DE ROL VAN RELATIEKENMERKEN BIJ GESCHEIDEN EX-KOPPELS.

Toegepaste Statistiek, Dag 7 1

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Wiskunde B - Tentamen 2

Statistiek voor Natuurkunde Opgavenserie 1: Kansrekening

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

College 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

2.9 Het adolescentieonderzoek Opgaven 72

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

11. Meerdere gemiddelden vergelijken, ANOVA

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Les 1: Waarschijnlijkheidrekening

De interpretatie van interactieeffecten in regressiemodellen. Jan Pickery

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

8. Analyseren van samenhang tussen categorische variabelen

Statistiek II. Sessie 5. Feedback Deel 5

mlw stroom 2.1: Statistisch modelleren

. Dan geldt P(B) = a d. 3 8

Examen G0N34 Statistiek

Feedback examen Statistiek II Juni 2011

Examen Statistiek I Feedback

Het ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:

A c. Dutch Summary 257

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

College 2 Enkelvoudige Lineaire Regressie

Experimenteel Onderzoek en Experimentele Controle

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS

SPSS. Statistiek : SPSS

TYPE EXAMENVRAGEN VOOR TOEGEPASTE STATISTIEK

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Transcriptie:

Toegepaste data-analyse: sessie 3 Mixed Models II: Actor-partner model Corr (Yij, Yik) = σσ 2 kkkkkkkkkkkk σσ 2 kkkkkkkkkkkk+ σσ 2 rrrrrr Je kan deze data niet modelleren a.d.h.v. lineaire regressie. Er zijn 2 manieren om dit op te lossen, nl. door op te delen in een random effecten model ofwel gebruik te maken van een marginaal model. Bij een random effecten model, ga je het intercept random nemen. Bij het marginaal model ga je dat niet doen, maar ga je de variantie-covariantiestructuur gaan fixeren. In SPSS is er een groot verschil tussen deze beide mogelijkheden. Bij random effecten ga je in het 1 ste kadertje Repeated leeg laten en wel random effecten toevoegen bij Random. Bij het marginaal model ga je de kader Repeated invullen en een variantiecovariantiestructuur kiezen. Het kadertje Random ga je hier niet invullen. Bij een hiërarchisch model ga je een onderscheid kunnen maken tussen binnen-groep en tussen-groep variantie en ga je dus duidelijk kunnen zeggen waar de variantie vandaan komt. Bij een marginaal model kan je dit niet Je kan random effecten gebruiken bij ongebalanceerde data en marginale modellen niet (enkel gebalanceerde data!). Bij een actor-partner model ga je kijken naar de dynamieken in een koppel. Wat is het effect van aantrekkelijkheid man op relatietevredenheid man? Wat is het effect van aantrekkelijkheid vrouw op relatietevredenheid vrouw? Maar ook: wat is het effect van aantrekkelijkheid man op relatietevredenheid vrouw? En wat is het effect van de aantrekkelijkheid van de vrouw op de relatietevredenheid van de man. Actoreffecten vs. Partnereffecten. Two-intercept approach - Mogelijkheid om effecten apart te schatten - Intercept maken voor mannen en één voor vrouwen - Twee intercepten maken het mogelijk om de effecten apart te beschouwen Interaction approach - Mogelijkheid om te zien of er een verschil is tussen de effecten - 1 intercept zegt wat de gemiddelde relatietevredenheid is

1. Maak een nieuwe dataset aan in SPSS volgens de gegevens in de tabel. Let er op dat je per lijn 1 subject weergeeft. Je kunt je baseren op het voorbeeld in de cursus. Hoeveel subjecten zijn er in het totaal? Hoe zijn deze subjecten geclusterd? Wat zijn de variabelen? Sla de dataset op op je H-schijf als TDA relatietevredenheid.sav. Gaan we nu niet doen. Interessant om te bekijken als je zelf voor je thesis nieuwe datasets moet invoeren. Data zien er een beetje vreemd uit: twee keer dezelfde data op een ander lijntje. 2. Maak een figuur waarbij je het verband onderzoekt van respectievelijk de eigen en de ander zijn/haar aantrekkelijkheid op de relatietevredenheid. Doe dit zo wel voor mannen en vrouwen. Is er indicatie voor actor of partner effecten bij mannen en vrouwen? Of interacties? Respondent = geslacht 1 zijn mannen en 2 zijn vrouwen

Bijna geen actor effect voor de vrouwen. Een klein negatief actor effect voor de mannen. Voor beide geslachten een positief partner-effect van aantrekkelijkheid. Het gaat om een interactie-effect: voor een man is het belangrijker voor de relatietevredenheid dat zijn partner (vrouw) aantrekkelijk is. [De lijn stijgt stijler]

3. Is er een significant actor effect bij mannen en bij vrouwen? Is er een partnereffect? Toets dit met de Two-intercept approach. Maak gebruik van een random intercept om de correlatie tussen metingen binnen koppels te modelleren. Dit moet je eigenlijk zelf weten dat je dit met deze aanpak moet doen! Immers: je wil apart het effect weten van mannen en van vrouwen. Met één intercept kan je hier niet tussen differentiëren! Subjects = koppel (want dat is het hoogste niveau) Random effecten model Repeated wordt leeg gelaten

Geen Include Intercept want we willen geen globaal intercept. Wel apart intercept voor mannen en vrouwen, door Respondent op te nemen in het model. Bovendien willen we ook het actor- en het partner-effect opnemen, zowel voor mannen als voor vrouwen. Dit is dus een interactie-effect met het geslachtspecifiek intercept. We hebben wél een random intercept (Include Intercept aanvinken)!

Interpretatie van de Fixed Effects: - Marginaal significant actor-effect bij mannen (p=0.06). - Geen significant actor-effect bij vrouwen. - Significant partner-effect bij mannen - Marginaal significant partner-effect bij vrouwen. Hoe rapporteren? - Actor-effect mannen: t(29.257)=-1.936, p=.063 - Partner-effect mannen: t(26.257)=2.426, p<.05 Als niet significant, exacte p-waarde vermelden. Als wel significant, gewoon vermelden dat p<.05 4. Wat is de correlatie tussen observaties binnen hetzelfde koppel? Corr (Yij, Yik) = σσ 2 kkkkkkkkkkkk σσ 2 kkkkkkkkkkkk+ σσ 2 rrrrrr = 1.046 / (1.046+1.55) 5. Zijn de actor en partner effecten significant verschillend tussen mannen en vrouwen. Toets dit met de Interaction Approach. Hoofdeffecten en intercept toevoegen in fixed gedeelte. Bij random laten we alles staan. Nog steeds een random intercept per koppel.

We zijn op zoek naar een interactie-effect met geslacht. Met betrekking tot het actoreffect, zien we dat er geen significante interactie is met geslacht. Het effect van aantrekkelijkheid van de actor is dus niet afhankelijk van het geslacht en verschilt dus niet tussen mannen en vrouwen. Met betrekking tot het partner effect zien we hetzelfde: de invloed van aantrekkelijkheid van de partner op de relatietevredenheid verschilt niet tussen mannen of vrouwen. 6. Toets nu dezelfde hypothese, maar met de marginale aanpak. Hierbij veronderstellen we geen random effecten maar gaan we de residuele covariantie binnen koppels modelleren. Gebruik hiervoor de meest algemene unstructured vorm. Je wil de variantie covariantiematrix tussen mannen en vrouwen gaan modelleren, dus bij Repeated ga je ook het geslacht opgeven.

Meestal is het gegeven of je een hiërarchisch model of een marginaal model moet toepassen. Het is wel zo dat je bij ongebalanceerde en/of onvolledige data enkel het random effecten model kan gebruiken (flexibeler). De output is min of meer hetzelfde. 7. Welke extra assumpties worden gemaakt bij de Random Intercept approach? Je gaat veronderstellen dat de residuele variantie hetzelfde is bij mannen als bij vrouwen. Door het invoeren van het random intercept hou je rekening met de clustering en net hierdoor zal je variantie ook hetzelfde zijn. Structurele vergelijkingsmodellen (SEM) Taal SES inkomen IQ economische status Rekenen QoL depressie Stress Meetgedeelte* Structuurgedeelte Meetgedeelte * Tekening proberen maken = het belangrijkste op het examen!! Daarmee begin je altijd! Daarna parameters aanduiden/opschrijven. Daarna pas model fitten in R. Latente variabelen omcirkeld. Geobserveerde variabelen (alles wat in je dataset zit) is omkaderd. Enkel in het structuurgedeelte wordt er een onderscheid gemaakt tussen endogene (er komen pijlen toe) en exogene (er vertrekken pijlen) variabelen. *Meetgedeelte = hoe de latente variabelen gemeten worden

Soorten structurele vergelijkingsmodellen: - Padanalyse houdt zich enkel bezig met het structuurgedeelte, maar dan enkel met geobserveerde variabelen en niet met latente variabelen. - CFA houdt zich enkel bezig met meetgedeelte. - SEM houdt zich bezig met beide. Predictiefouten: we weten dat SES en QoL bijvoorbeeld door allerlei andere zaken worden verklaard, die niet in het model opgenomen zijn. Predictiefouten kunnen bij latente of geobserveerde variabelen voorkomen. Meetfouten: latente variabelen kunnen we niet rechtstreeks gaan meten, maar d.m.v. observeerbare variabelen. Daardoor zal er een bepaalde fout zijn in de mate dat we latente variabelen kunnen gaan meten. (Meetfouten dus enkel bij latente variabelen). 1. Beschouw een model waarbij de vier onafhankelijke variabelen (Intelligence, Siblings, FatherEd en FatherOcc) allen een effect hebben op de drie afhankelijke variabelen (Grades, EducExp en OccupAsp). Stel het model grafisch voor, duid alle te schatten parameters aan en geeft het aantal vrijheidsgraden. Fit het model en bestudeer de output. Is het model adequaat? Zo niet, hoe zou je het model eventueel aanpassen? Intelligence Siblings Grades 1 FatherEd EducExp 2 Father Occ OccupAsp 3 Correlaties in lavaan automatisch toegevoegd, voor de zuiver endogene variabelen! Elke pijl heeft de naam γγ11, γγ21, enzovoort. Deze parameters gaan de effecten aanduiden. is de predictiefout, ofwel de onverklaarde variantie in Grades, op EductExp en OccupAsp. Bovendien zijn er ook correlaties tussen de predictiefouten onderling. De parameters bij deze pijlen kunnen we bijvoorbeeld φφ11, φφ12, gebruiken. # datapunten - # parameters = 18 18 = 0 [p(p+1)]/2 = 18 datapunten

Tussen de aanhalingstekens staat het model gespecifieerd. Je gaat aangeven welke pijlen er allemaal toekomen in de variabelen Grades, EducExp en OccupAsp.

Als je een fout hebt gemaakt staat er een + i.p.v. een >. Op dat moment kan je beter stoppen en terug naar je script gaan om te kijken waar je fout zit. Dit doe je door in de console op Stop te duwen. Zo vermijd je verdere verwarring. Door head(data.kerckhoff) als commando te geven kan je checken of je wel de juiste data hebt. Handig voor op het examen om te garanderen dat je geen vergissingen maakt. Er is altijd een foutmelding bij lavaan. Niets van aantrekken. We gaan de fit van het model nagaan. Tussen haakjes moet je het model specifiëren (dat we in dit geval gewoon model hebben genoemd) en de data. Commando s echt zo, stap voor stap en eerst in script en dan in console uitvoeren!! Helpt om fouten te voorkomen!!

Voor fit naar de verschillende fitmaten gaan kijken en kijken waar het grootste deel naar wijst (goede of slechte fit). Output zie feedback 2. Beschouw een alternatief model waarbij er op OccupAsp enkel nog een direct effect is van FatherOcc (niet van de andere exogene variabelen). Laat nu ook de volgende effecten toe: (1) van Grades naar EducExp, (2) van Grades naar OccupAsp, en (3) van OccupAsp naar EducExp. Stel het model grafisch voor. Vergelijk de fit van dit model met het vorige model. Intelligence Siblings Grades 1 FatherEd EducExp 2 Father Occ OccupAsp 3 Enkel correlaties tussen zuiver endogene variabelen. De enige zuivere endogene variabele is hier EducExp en voor een correlatie heb je minstens 2 variabelen nodig; dus de correlaties tussen de predictiefouten vallen weg. # datapunten - # parameters = 18 15 = 3 vrijheidsgraden Voor fit naar de verschillende fitmaten gaan kijken en kijken waar het grootste deel naar wijst (goede of slechte fit). Output zie feedback