Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 1

Maat: px
Weergave met pagina beginnen:

Download "Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 1"

Transcriptie

1 Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 1 1. Overzicht Padanalyse, CFA & SEM o Padanalyse Onderscheid tussen exogene en endogene variabelen. Indirecte effecten (mediatie)! o Geobserveerde of manifeste variabelen. Univariaat regressiemodel. Exogene variabelen: x1 x4 komt geen enkele pijl toe Endogene variabelen Dubbel statuut: x5-x6 = mediatoren = mediëren. X7: uitkomstvariabele of hoofdvariabele. X1 x7 met een omweg. Voorstelling van de realiteit: hypothese van de onderzoeker. Wanneer padanalyse is uitgezet, dan alle data verzamelen (x1 x7). Model toetsen aan de data Model past. Model past niet: aanpassingen doen en nieuw model maken. Nieuwe mediërende variabelen. Confirmatorische analyse: padanalyse. Pijlen die er niet staan zijn ook belangrijk! Exploratieve analyses: model proberen bloot te leggen. Eerst model (theorie). Daarna variabelen; Welke modellen passen, welke niet? Competitie tussen modellen om eerst theorie te vinden. Fraude in de wetenschappen: Data verzamelen. Model aanpassen aan de data. Confirmatorische factoranalyse (CFA) Aantal factoren + samenhang met indicatoren ligt vast. Confirmatorisch: past dit model met de data: ja of nee? = latente variabelen proberen te meten. o Structurele vergelijkingsmodellen (SEM) Samenvloeiing van padanalyse en confirmatorische factoranalyse. Software voor SEM

2 o The big four 1 : LISREL (1972) EQS (1985) AMOS (1994) Mplus: meest geavanceerde pakket. (1998) o Als onderdeel van statistische pakketten: Proc calis / tcalis (1990) Sepath (1995) Ramona ( ) o Niet commercieel Mx (1991) Gllamm (2002) R packages (gratis pakket): Sem (2001) Open Mx (2009) Lavaan (2010) 2. Padanalyse 2.1. Inleiding Padanalyse: analyse van structurele modellen waarbij alle variabelen geobserveerd (manifest) zijn. Een structureel model representeert de causale hypothese omtrent de patronen van direct of indirecte effecten tussen deze variabelen. Elk theoretisch construct in het model (bvb. stress, depressie, welbevinden ) wordt gemeten door 1 geobserveerde variabele, en correspondeert dus met 1 variabele in de dataset Voorbeeld Roth, D.L., Wiebe, D.J., Fillingim, R.B., & Shay, K.A. (1989). Life events, fitness, hardiness, and health: A simultaneous analysis of proposed stress-resistance effects. Journal of Personality and Social Psychology, 57, o Metingen voor exercise, hardiness, fitness, stress, illness in een steekproef van 373 university studenten. Illness: mate van fysieke ziektesymptomen (laatste maand). Stress: mate van stressvolle life events (laatste maand). Fitness: self-perceived physical fitness. Exercise: current exercise activity (participatie in fysieke oefeningen). Hardiness: dispositional traits such as resiliency and willingness to look for opportunities in difficult situations o Onderzoeksvraag: direct of indirect effect van exercise/hardiness op illness? o Interpretatie figuur Exercise: oefening, sport Exogene variabele. Hardness: hoe sterk ben je mentaal gezien? Exogene variabele. Stress: stress. Mediator. Fitness: fitheid. Mediator. 1 Namen kennen en associëren met structurele vergelijkingsmodellen;

3 o Illness: hoe ziek voelt u zich. Uitkomstvariabele. Voorbeeld komt uit de persoonlijkheidspsychologie. Hardness direct effect op illness of is het zo dat dit eigenlijk via stress verloopt? Hardness stress illness. Enige eventuele latente variabelen zouden alle andere invloeden kunnen zijn op stress: Foutterm voor elke afhankelijke variabele: 2.3. Elementen van een padanalyse model Geobserveerde exogene variabelen: o De oorzaken van exogene variabelen worden niet verklaard binnen het model: bij een exogene variabele komt er nooit een enkele pijl toe. o Exogene variabelen mogen covarieren (correleren), doch er wordt geen antwoord gegeven op de vraag waarom deze variabelen correleren (bvb. gemeenschappelijke oorzaak, de ene veroorzaakt de andere,... ). Geobserveerde endogene variabelen: o De (veronderstelde) oorzaken van endogene variabelen maken expliciet deel uit van het model. o Padanalyse poogt een verklaring te bieden waarom endogene variabelen (al of niet) correleren met elkaar. o Bij elke endogene variabele komt er minstens een enkele pijl toe. Niet geobserveerde (latente) exogene variabelen (distrubance term): o Elke endogene variabele heeft een disturbance term: deze disturbance term representeert alle weggelaten of niet-gekende oorzaken. o De (geschatte) variantie van deze disturbance term Var(ζ1) is een maat voor de proportie niet-verklaarde variantie van de endogene variabele y1: met R² de proportie verklaarde variantie van y1 (=de determinatiecoëfficiënten op basis van de regressie van y1 op alle variabelen die een direct effect hebben op y1). R² hoog: veel verklaard goed model. 1-R²: niet verklaarde variantie = variantie disturbance = getal. (Veronderstelde) directe causale effecten: enkele pijl o De schatting van een direct effect is een pad coëfficiënt. o Analoog met regressiecoëfficiënten. o Het effect is lineair. Allemaal lineair = nadeel. o Hoe sterk zijn de padcoëfficiënten?! o Door de opeenvolging van directe effecten kunnen in een padanalyse op een natuurlijke wijze indirecte effecten worden gemodelleerd (mediatie) E representeer het direct effect van x1 op y3. Het indirect effect van x1 op y3:. Totaal effect van x1 op y3: direct + indirect : E + buitenste direct effect + binnenste direct effect In niet recursieve modellen is het mogelijk dat er direct en/of indirecte feedback lussen ontstaan: Voorbeeld directe feedback:

4 Voorbeeld indirecte feedback: Varianties van de exogene variabelen (zowel geobserveerde variabelen, als de latente disturbances) o worden doorgaans niet expliciet aangeduid op het paddiagram. o Covarianties tussen de exogene variabelen (dubbele pijl) o (a) tussen twee geobserveerde variabelen: o o o (b) tussen twee disturbance termen (enkel in niet-recursieve, bow-free of bow-pattern modellen, zie verder). (c)tussen een geobserveerde exogene variabele en een disturbance term (zowat nooit gebruikt). Elke variabele heeft een variantie Covariantie: exercises vs hardness (a) Standaardvariantie (5) Variantie van distrubance 2.4. Stappen om een padanalyse uit te voeren Er zijn 6 basis stappen en 2 optionele stappen: De specificatie van het model: o De door de onderzoeker vooropgestelde set van hypotheses (geen effect, direct effect, indirect effect,... ) in verband met een set van variabelen worden vertaald in een paddiagram. o Dit model bepaalt de parameters die moeten worden geschat op basis van de beschikbare data. o Wellicht de meest belangrijke stap. Identificatie o Is het (statistisch) mogelijk om unieke schattingen te bekomen voor elke parameter in het model? Zo niet, dienen we het model te herspecifieren (zie verder). o 5 variabelen = 5 kolommen met variabelen. Verzamel de data, en prepareer de data voor analyse: o Gebruik bij voorkeur de volledige dataset, of de variantie - covariantie matrix van de variabelen. De volledige dataset gaat altijd voor op de correlatie matrix. Alleen als het pakket het niet toe laat alle gegeven toe te voegen dn kan de correlatie matrix gebruikt worden. o Indien echt geen andere keus, gebruik dan de correlatie - matrix. o Indien naast de correlatie - matrix ook de standaardafwijkingen werden gerapporteerd: transformeer naar variantie - covariantie matrix. Schat het model (met behulp van een adequaat softwareprogramma). o Evalueer de fit van het model; indien niet oké, ga naar stap 5. o Interpreteer de parameter schattingen: zijn ze zinvol en in de lijn van de verwachtingen? o Bedenk of er geen alternatieve modellen mogelijk zijn die evengoed de data zouden fitten. o Ga naar stap 6. Herspecifieer het model (op basis van theoretisch gefundeerde overwegingen en ga terug naar stap 4). Rapporteer de resultaten op een adequate manier (model die goed fit). o Rapportering vaak ondermaats in de psychologische literatuur. o Zie richtlijnen. Optioneel: repliceer de resultaten met een nieuwe steekproef. Optioneel: gebruik het model om bijvoorbeeld uitkomstvariabelen te voorspellen.

5 2.5. Padanalyse en correlaties De input voor een pad - analyse is vaak een variantie - covariantie matrix van de variabelen die het model worden betrokken. Het doel van padanalyse is om te verklaren waarom twee variabelen X en Y (en zo ook voor alle andere geobserveerde variabelen) al of niet covariëren (correleren!). Voorbeeld: geobserveerde correlatie matrix Roth et.al (1989). o Paddiagram één van de vele mogelijkheden om te verklaren hoe variabelen samenhangen. Waarom observeren we correlaties tussen twee variabelen? o Er zijn verschillende redenen waarom X en y mogelijks correleren: Er is sprake van een (veronderstelde) causale relatie: Unidirectionele effecten. Feedback loops. Er is sprake van een (veronderstelde) niet causale relatie: Niet geanalyseerde correlaties. Spurieuze correlaties. X en y: correleren: hoe kan dit? = 0,50 Invloed van de ene waarde op e andere Correleren niet Kan ons niet schelen, is gewoon zo. Valse correlatie: deze correlatie bloot leggen via padanalyse. Noot: soms is er geen (bivariate) geobserveerde correlatie tussen X en Y omwille van suppressie: een of meerdere variabelen mediëren de relatie tussen X en Y en onderdrukken het verband. Geen correlatie terwijl er wel een correlatie is = suppressie: correlatie wordt onderdrukt door het mechanisme. o Unidirectionele effecten: Er een direct (causaal) effect van X naar Y (of omgekeerd). Er is een indirect (causaal) effect van X naar Y via een of meerdere mediërende variabelen (of omgekeerd). o Feedback loops Er is directe feedback tussen X en Y. Er is indirecte feedback tussen X en Y via e en of meerdere mediërende variabelen o Niet geanalyseerde correlaties: Het is niet gekend waarom twee variabelen covariëren. Drie mogelijkheden: Correlatie tussen de twee exogene geobserveerde variabelen. Correlatie tussen twee (exogene latente) disturbance termen. Dit noemt men een disturbance correlatie (of covariantie). Dit reflecteert de assumptie dat er een gemeenschappelijke (doch onbekende) gemeenschappelijke oorzaak is die verklaart waarom de disturbance termen correleren. Problematisch (want wijst doorgaans op een deficit in de theorie). correlatie tussen een exogene geobserveerde variabele en een disturbance term

6 o niet gebruikelijk wegens inhoudelijk moeilijk te interpreteren: dit zou impliceren dat er een onbekende gemeenschappelijke oorzaak zou zijn voor deze correlatie. Spurieuze correlaties Spurieuze correlaties worden in een padanalyse model gerepresenteerd door een gemeenschappelijke oorzaak te veronderstellen. Doorgaans is er slechts 1 gemeenschappelijke oorzaak, doch er kunnen er ook meerdere zijn. Voorbeeld waarbij de volledige correlatie tussen Y1 en Y2 als spurieus wordt beschouwd: Bijvoorbeeld: Verdwijnen kerkuilen (y1). Afnemen kerkgangers (y2). Relatie met elkaar? Nee! Wel beïnvloed door de tijd (x1). Tweede voorbeeld: Hoeveelheid calorieën die je eet (y1). Lichaamsgewicht bepaald (y2). Maar causaal verband (klopt niet). X1: lichaamslengte bijvoorbeeld zorgt ervoor dat dit een spurieus verband wordt. Wetenschappelijke reflectie op dit soort modellen is zeer belangrijk! Komt elke dag voor! Voorbeeld waarbij een deel van de correlatie tussen Y1 en Y2 als spurieus wordt beschouwd; het direct effect van Y1 op Y2 wordt uitgezuiverd (gecontroleerd) voor dit gemeenschappelijk effect: Genuanceerd verhaal! Sterk gezuiverd door variabelen. Zonder x was vorig voorbeeld. Met x gezuiverd. Heel ander verhaal Padanalyse en causaliteit Padanalyse (en aanverwante methodes) voor de analyse van causale modellen kunnen nooit causaliteit bewijzen. Ze kunnen hoogstens ondersteuning bieden voor de causale verbanden die door een onderzoeker vooropgesteld worden; of falsifiëren. Wat is er idealiter nodig om vast te stellen dat er een causaal effect is van X op Y? o De oorzaak (X) gaat het gevolg (Y ) vooraf in de tijd: Confirmatie/falsificatie enkel mogelijk met longitudinale studies. Longitudinale studies zijn niet zonder problemen (bvb. uitval van subjecten, lange duurtijd, hoge kost). o De richting van het effect is correct gepreciseerd (X veroorzaakt Y, niet omgekeerd) De onderzoeker moet beschikken over sterke theoretische argumenten om te stellen dat X een effect heeft op Y en niet omgekeerd (indien ze op hetzelfde moment werden gemeten). o De relatie tussen X en Y verdwijnt niet indien men rekening houdt met andere relevante variabelen; kortom, de relatie is niet spurieus. Padanalyse kan hierbij een belangrijke rol spelen. Het is aan de onderzoeker om grondig na te denken over welke variabelen eventueel een rol kunnen spelen (en dus in het model moeten worden betrokken). o Vermoedde causaliteit

7 o Ondersteunen Weerleggen Bewijzen dat gaat nooit. Data van experimentele dingen kan nooit alle bewijzen geven alleen ondersteunen Specificatieprobleem en meetfout Net zoals bij lineaire modellen moet men bij padmodellen rekening houden met: o Het specificatieprobleem: Het weglaten van cruciale variabelen in een model kan leiden tot (ernstig) vertekende schattingen van de parameters in het model, en dus verkeerde conclusies omtrent de vermeende causale relaties. Vaak gaat het om onder - estimatie van relaties (eerder dan over - estimatie) van de causale effecten. o De meetfout: In het bijzonder voor de exogene variabelen. Elk construct wordt gemeten door (slechts) 1 geobserveerde variabele. Het is van belang dat enkel variabelen worden gebruikt met goede psychometrische kenmerken (bvb. betrouwbaarheid). Meetfout kan leiden tot vertekende schattingen van de parameters. o Opletten met goed passend model want er kan altijd heel ander model zijn die er even goed of beter bij past. o Specificatieprobleem: belangrijke variabele vergeten. o Meetfout: ruwe manier van meten. Ruis op alle variabelen = nadelig effect op de uitkomsten. Voorzichtigheid! 2.8. Vrije parameters, datapunten en vrijheidsgraden De vrije parameters in een padanalyse model: o De padcoefficiënten van de directe effecten. o De varianties van de disturbance termen. o De covarianties tussen de disturbance termen (zeldzaam). o Optioneel: de varianties van de geobserveerde exogene variabelen. o Optioneel: de covarianties tussen de geobserveerde exogene variabelen. 2 Noot: wat betreft de (co)varianties van de exogene variabelen zijn er twee tradities: Fixed.x=TRUE : ze worden niet beschouwd als vrije parameters; we nemen gewoon de geobserveerde variantie/covariantie waarden over; deze geobserveerde (co)varianties worden eveneens niet meegerekend als datapunten. Fixed.x=FALSE : ze worden wel beschouwd als vrije parameters o Hoe meer data hoe meer datapunten. p = Hoe meer pijlen, hoe meer schatten. Zuinig model oprichten! Zo weinig mogelijk pijlen! Veel pijlen Gesatureerd model. 2 Klassieker op het examen!!!

8 Past perfect bij de data. Genoeg pijlen toevoegen. Tellen van de vrije parameters in vergelijking met datapunten. DF: vrijheidsgraden = 0 dan gesatureerd model (niet goed of niet slecht). Ideaal is DF 0. Het aantal datapunten in een padanalyse model o In een padanalyse berekent men het aantal datapunten op basis van het aantal (niet - redundante) elementen in de covariantie - matrix van de variabelen. o Indien er p geobserveerde variabelen in het model worden betrokken zijn er p varianties, en covarianties, of samen elementen. Het aantal datapunten blijft gelijk indien er meer observaties (subjecten) worden toegevoegd aan de dataset. Het aantal parameters van een model kan niet groter zijn dan het aantal datapunten waarop de analyse wordt uitgevoerd: het model is niet geïdentificeerd. In de fixed.x=true benadering worden de (co)varianties van de exogene variabelen niet meegerekend als datapunten; indien er q exogene variabelen zijn, zijn er slechts datapunten. In speciale gevallen worden ook de means (gemiddelden) van de geobserveerde variabelen in rekening gebracht (bvb: multiple group analyse). Vrijheidsgraden o Jet verschil tussen het aantal datapunten en het aantal vrije parameters in het model noemt men de vrijheidsgraden [Engels: degrees of freedom (df)]. o Indien het aantal parameters exact gelijk is aan het aantal datapunten, is het model gesatureerd (net geïdentificeerd), en zal de fit van het model perfect zijn; niettemin blijft de interpretatie van de parameters zinvol. o Indien er minder parameters zijn, is het model niet - gesatureerd (of nog: over - geïdentificeerd; in dit geval is het mogelijk (en noodzakelijk) de globale fit van het model te toetsen. o De kunst van padanalyse is om met zo weinig mogelijk vrije parameters (model is zo zuinig mogelijk) toch een goede (globale) fit te bekomen. Voorbeeld: aantal parameter en aantal datapunten o Manier 1: Aantal enkele pijlen: 9 (9 parameters en 9 regressiecoëfficiënten). Variaties (5 variaties = evenveel als er parameters zijn). Covarianties (tussen elk paar van exogene variabelen) =1. De som = 15. En =0 = DF. o Manier 2 9 parameters. Varianties 3 want geen exogene (3 varianties. Covarianties niet want exogene variabelen tellen niet mee. Maar exogene variabelen mogen ook niet mee tellen inhet model! Q = 2 = exogene variabelen = 0 = DF Voorbeeld: aantal parameters en aantal datapunten (fixed.x = FALSE)

9 o Aantal parameters: 15 9 padcoëfficiënten. Exogene variabelen: 2 varianties en 1 covariantie. 3 disturbances (residuele varianties). o Aantal datapunten: p = 5 dus. o Het model is volledig gesatureerd (df=0). Voorbeeld aantal parameters en aantal datapunten (fixed.x = TRUE) o Aantal parameters: 12 9 padcoëfficiënten. 3 disturbances (residuele varianties). o Aantal datapunten: p = 5 en q = 2 dus Vrije gefixeerde en gebonden parameters o Vrije parameters 3 : kunnen vrij geschat worden op basis van de dataset (let wel: varianties moeten in principe positief zijn). o Gefixeerde parameters 4 [Engels: fixed parameters]: de waarde van de parameter is gefixeerd op een constante (typisch 1 of 0). Het fixeren van padcoefficiënten op nul correspondeert vaak met zinvolle theoretische hypotheses (bvb. er is geen direct verband tussen de variabelen X en Y ). Indien het model de data slecht fit, kan dit mogelijks te verklaren zijn omdat een parameter ten onrechte op nul werd gefixeerde (i.e. een direct effect werd verkeerdelijk niet gepreciseerd in het model). o Gebonden parameters [Engels: constrained parameters] 5 : de waarde van de parameters kan vrij geschat worden onder bepaalde restricties: Gelijkheidsrestrictie: twee (of meerdere parameters) worden geforceerd om dezelfde waarde aan te nemen (bvb. bij multiple- group padanalyse: het effect van X op Y is gelijk bij mannen en vrouwen). Proportionele restrictie: de waarde van een parameter moet een proportie (bvb. de helft) of een factor (bvb. twee keer zo groot) zijn van een andere parameter. Niet-lineaire restrictie: de ene parameter is een niet-lineaire functie (bvb. de vierkantswortel) van een andere parameter. Ongelijkheidrestrictie: de waarde van een parameter moet groter zijn dan een vooropgestelde waarde (bvb. > 5.0) Verschillende types van padmodellen Recursieve modellen o Alle causale effecten zijn unidirectioneel (geen feedback loops). o Geen correlaties tussen de disturbance termen. o Voorbeeld: Niet recursieve modellen o Feedback loops zijn toegelaten. o Correlaties tussen de disturbance termen zijn mogelijk. o Voorbeeld: 3 Parameters die geschat worden in het model. 4 Parameters die niet mee gerekend worden in het model. 5 2 regressiecoëfficiënten moeten gelijk zijn, maar 1 vrij andere niet, maar 1 laten mee tellen!!

10 Bow Free modellen (optioneel) o Correlaties tussen de disturbance termen zijn mogelijk; doch geen direct effect tussen de bijhorende endogene variabelen (y1 en y2). o Wordt beschouwd als (partieel) recursief. o Voorbeeld: Bow Pattern modellen (optioneel) o Correlaties tussen de disturbance termen zijn mogelijk met een direct effect tussen de bijhorende endogene variabelen. o Wordt beschouwd als (partieel) niet recursief. o Voorbeeld: Recursief versus non recursief o De analyse van recursieve modellen kan worden uitgevoerd aan de hand van een reeks van multiple lineaire regressie analyses: 1 regressie voor elke endogene variabele. o Causale effecten die niet unidirectioneel zijn (bvb. feedback loops) kunnen niet worden gerepresenteerd in recursieve modellen. o Niet-recursieve modellen worden ten onrechte zelden gebruikt in de sociale wetenschappen (uitzondering: economie!), mogelijks om SEM software te vermijden Model identificatie Een (pad)model is geïdentificeerd indien het (theoretisch) mogelijk is om een unieke waarde te berekenen voor elke parameter van het model op basis van de data: o Onafhankelijk van de steekproefgrootte. o Eigenschap van het model, niet de data. Twee minimum vereisten voor de identificatie van een structureel vergelijkingsmodel (inclusief padmodellen): o Minstens evenveel datapunten (i.e. elementen in de variantie - covariantie matrix) als vrije parameters (df 0). o De schaal (metriek) van elke latente variabele ligt vast. Recursieve padmodellen zijn altijd geïdentificeerd (tenzij er problemen rijzen zoals bvb. multicollineariteit). o Er kunnen niet meer parameters zijn dan datapunten. o De schaal van de latente variabelen (i.e. disturbance termen) wordt vastgelegd door het (niet-gestandaardiseerde) padcoëfficiënt te fixeren op 1.0. Niet-recursieve modellen kunnen niet- geïdentificeerd zijn zelfs indien aan de twee minimum vereisten wordt voldaan. Indien een model niet- geïdentificeerd is, moeten we het herspecifieren: o Restrictie van parameters (bvb. padcoëfficiënten op nul fixeren). o Exogene variabelen toevoegen (kan enkel vooraleer de data wordt verzameld!).

11 2.11. Het schatten van de parameters: via lineaire regressie Enkel voor recursieve modellen. Omslachtig, doch kan worden uitgevoerd met standaard software (SPSS, SAS, R, ) De analyse komt neer op een serie van multiple regressie analyses: o Telkens een endogene variabele als afhankelijke variabele. o Alle variabelen die een direct effect hebben op deze endogene variabele beschouwen we als predictoren. o De bekomen regressiecoëfficiënten zijn meteen de padcoëfficiënten. o De schatting van de error -variantie ( ) is meteen een schatting van de disturbance varianties voor deze endogene variabele Het schatten van de parameters: via SEM software Zowel recursieve als niet-recursieve modellen. De meest courante schattingsmethode: maximum likelihood estimation o Voor gesatureerde recursieve modellen: exact dezelfde parameterschattingen als met multiple regressie methode. o Voor niet -gesatureerde recursieve modellen: zeer gelijkaardige (doch niet identieke) parameterschattingen als met multiple regressie methode. o Assumptie: endogene variabelen multivariaat normaal verdeeld. o Alle parameters worden tezelfdertijd geschat (nadeel: indien het model verkeerd werd gepreciseerd heeft dit een impact op de schattingen van alle parameters) o De schatting is iteratief: start met initiële waarden die na elke iteratie worden geüpdatet. o Vertrekt van de variantie - covariantie matrix (en niet de correlatie matrix). o Analyse van correlatie- matrices is problematisch: het berekenen van de standaardfouten voor de parameterschattingen is hier niet evident. Het gebruik van SEM software biedt bijzonder veel voordelen: o Indirecte en totale effecten kunnen (doorgaans) automatisch worden berekend, inclusief (gebootstrapte) confidentie intervallen voor deze effecten. o Verscheidene goodness- of- fit indices worden gerapporteerd ter evaluatie van de algemene fit van het model. o Niet-recursieve modellen geen probleem. o... Voorbeeld: Roth et al. (1989) o Hypotheses die we wensen te toetsen: Het effect van exercise op illness is indirect, en enkel gemedieerd door fitness. Het effect van hardiness op illness is indirect, en enkel gemedieerd door stress. Er is geen direct effect van fitness op stress. o Strategie: we gaan een padmodel toetsen die alle veronderstelde directe effecten (volle pijlen) en tevens de niet-veronderstelde (gestreepte pijlen) bevat Dit model is gesatureerd. De (directe of indirecte) effecten waarvan men veronderstelt dat ze gelijk zijn aan nul mogen niet significant zijn. De overige paden dienen wel significant te zijn. o Voorbeeld: uivoering met lavaan

12 o Output lavaan Resultaten o De resultaten bevestigen (bijna) alle hypotheses in verband met de veronderstelde en niet-veronderstelde directe effecten; enige uitzondering: een niet- significant (p = 0.046) effect voor fitness stress o Indirecte effect = product directe effecten: Bvb. tussen exercise en illness: = Is dit indirect effect significant? voor indirecte effecten met e en mediator kunnen we Sobel s test uitvoeren (zie OMI) Beter: bootstrap methode om standaardfouten (en dus p-waarde) te berekenen voor deze indirecte effecten Indirecte effecten: lavaan input

13 Lavaan output (sobel test) Lavaan output (bootstrap) Het model geïmpliceerde covariantie matrix Eenmaal de parameters werden geschat kan men op basis van het paddiagram de bivariate covarianties/correlaties proberen te reconstrueren. De zo bekomen covarianties/correlaties noemt men model -geïmpliceerde covarianties/correlaties. In een gesatureerd model corresponderen deze exact met de geobserveerde covarianties/correlaties; in een niet -gesatureerd model is er vaak een (hopelijk zo kleine mogelijke) discrepantie tussen de voorspelde en geobserveerde covarianties/correlaties (=residuals). Dit verschil kan dienen als een maat van model fit. Voor niet-recursieve modellen laten we de berekening over aan SEM software. Voor recursieve modellen kunnen we deze eventueel manueel berekenen op basis van de padcoëfficiënten. Lavaan: model geïmpliceerde covariantiematrix + residuals

14 Model zonder directe effecten en niet significante paden Lavaan output Lavaan: model geïmpliceerde covarantiematrix + residuals

15 2.14. Model fitmaten In principe is de interpretatie van parameters slechts zinvol indien het (pad)model de data adequaat fit. SEM software rapporteert doorgaans een waaier van fitmaten o De chi - kwadraat toets (mag in principe niet significant zijn, doch zeer gevoelig aan de steekproefgrootte). o Incrementele maten zoals de CFI en de TLI (vergelijken een volledig model met een basismodel alwaar er geen enkele correlatie wordt verondersteld tussen de variabelen) (vuistregel: groter dan 0.90 of 0.95). o Overige maten: RMSEA, SRMR,... (vuistregel: kleiner dan 0.05 of 0.06) En verder Vergelijken van geneste modellen. Vergelijken van niet geneste modellen (laagste AIC of BIC). Equivalente modellen. Herspecificatie van het model (modifiation indices). Power analyse. Padanalyse met latente variabelen = SEM! Multiple group padanalyse. Padanalyse met categorische (bvb. binaire) endogene variabelen. Multilevel padanalyse.

16

Toegepaste data-analyse: sessie 3

Toegepaste data-analyse: sessie 3 Toegepaste data-analyse: sessie 3 Mixed Models II: Actor-partner model Corr (Yij, Yik) = σσ 2 kkkkkkkkkkkk σσ 2 kkkkkkkkkkkk+ σσ 2 rrrrrr Je kan deze data niet modelleren a.d.h.v. lineaire regressie. Er

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Oefeningenreeks 4: SEM mediatie en moderatie

Oefeningenreeks 4: SEM mediatie en moderatie Oefeningenreeks 4: SEM mediatie en moderatie 3 soorten structurele vergelijkingsmodellen. Met structurele vergelijkingsmodellen kan je een uitspraak gaan doen over latente variabelen en we kunnen deze

Nadere informatie

20. Multilevel lineaire modellen

20. Multilevel lineaire modellen 20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Structural Equation Modeling

Structural Equation Modeling Workshop Structural Equation Modeling Eva Van den Bussche 2007 Overzicht Deel I: Theoretische kadering SEM Deel II: Introductie AMOS: Demonstratie Deel III: Practicum op basis van real-life datasets 2

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Samenvatting Nederlands

Samenvatting Nederlands Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

6 De relatie tussen de intentie tot exploratie, binding en delinquent gedrag

6 De relatie tussen de intentie tot exploratie, binding en delinquent gedrag 6 De relatie tussen de intentie tot exploratie, binding en delinquent gedrag 6.1 Inleiding Is de toe- en afname van het aantal jongeren met delinquent gedrag in de adolescentie een gevolg van de intentie

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit

Kwantitatieve modellen. Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit Kwantitatieve modellen voor BCO PMC Harry B.G. Ganzeboom 18 april 2016 College 1: Meetkwaliteit Drie colleges Validiteits- en betrouwbaarheidsanalyse Causale analyse met confounding en mediatie Causale

Nadere informatie

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016

Causale modellen: Confounding en mediatie. Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016 Causale modellen: Confounding en mediatie Harry Ganzeboom Kwantitatieve Methoden voor PMC-BCO College 2: 25 april 2016 Correlatie en causatie Een standaard wijsheid in methodologie is dat correlatie (samenhang)

Nadere informatie

Hoofdstuk 8: Multipele regressie Vragen

Hoofdstuk 8: Multipele regressie Vragen Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted

Nadere informatie

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen. Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 3

Onderzoeksmethoden II: structurele vergelijkingsmodellen deel 3 Onderzeksmethden II: structurele vergelijkingsmdellen deel 3 1. Structurele vergelijkingsmdellen 1.1. SEM in vgelvlucht SEM is een algemene techniek m de (lineaire) samenhang tussen variabelen te mdelleren.

Nadere informatie

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom

Analyse van confounders en mediatoren. Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom Analyse van confounders en mediatoren Cursus Bachelor Project 2 B&O College 3 Harry B.G. Ganzeboom 1 AGENDA Nabespreking Practicum 2. Terug naar College 2: regressie met dummyvariabelen. Confounding en

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Structural Equation Modeling in Stata, R en Mplus

Structural Equation Modeling in Stata, R en Mplus Structural Equation Modeling in Stata, R en Mplus Harrie Jonkman 18 juni 2017 Opzet Wat is Structural Equation Modeling SEM in STATA SEM in R SEM in Mplus Wat is Structural Equation Modeling Korte geschiedenis

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

2.3 Examenopdracht Bespreking Deel 1 - Gegevens voorbereiden. Analyse oefeningen en programmeertechnieken 7 / 22

2.3 Examenopdracht Bespreking Deel 1 - Gegevens voorbereiden. Analyse oefeningen en programmeertechnieken 7 / 22 Analyse oefeningen en programmeertechnieken 7 / 22 2.3 Examenopdracht 1 2.3.1 Opgave: Structurele Vergelijkingsmodellen 2.3.2 Algemene bespreking De meeste stukken van deze oefening zijn ok. In het structureel

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie.

Dit jaar gaan we MULTIVARIAAT TOETSEN. Bijvoorbeeld: We willen zien of de scores op taal en rekenen van kinderen afwijken in de populatie. Toetsen van hypothesen Bijvoorbeeld: nagaan of het gemiddeld IQ bij een bepaalde steekproef groter/kleiner is als in de populatie. µ = 100 Normaalverdeling, waarbij we de score van de steekproef gaan vergelijken

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

DATA-ANALYSEPLAN (20/6/2005)

DATA-ANALYSEPLAN (20/6/2005) DATA-ANALYSEPLAN (20/6/2005) Inleiding De manier waarop data georganiseerd, gecodeerd en gescoord (getallen toekennen aan observaties) worden en welke technieken daarvoor nodig zijn, dient in het ideale

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

(slope in het Engels) en het snijpunt met de y-as, b 0

(slope in het Engels) en het snijpunt met de y-as, b 0 8. Regressie Een introductie Al vaak is genoemd dat statistische modellen allemaal neerkomen op uitkomst = model + error. Dit model kun je ook gebruiken om de uitkomst te voorspellen, met een correlatie

Nadere informatie

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA 16. MANOVA MANOVA Multivariate variantieanalyse (MANOVA) kan gebruikt worden in een situatie waarin je meerdere afhankelijke variabelen hebt. Met MANOVA kan er 1 onafhankelijke variabele gebruikt worden

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Feedback examen Statistiek II Juni 2011

Feedback examen Statistiek II Juni 2011 Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven

Nadere informatie

Toegepaste data-analyse: oefensessie 2

Toegepaste data-analyse: oefensessie 2 Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid

Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd

Nadere informatie

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

Gegevensverwerving en verwerking

Gegevensverwerving en verwerking Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen. Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Samenvatting. Inleiding

Samenvatting. Inleiding Samenvatting Het percentage volwassenen met een hoog risico op een angststoornis of depressie ligt in de gemeenten Roosendaal (9.7%) en Rucphen (11.0%) significant en relevant hoger dan landelijk (7.1%).

Nadere informatie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Examen Statistiek I Feedback

Examen Statistiek I Feedback Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).

Nadere informatie

Hertentamen Biostatistiek 3 / Biomedische wiskunde

Hertentamen Biostatistiek 3 / Biomedische wiskunde Hertentamen Biostatistiek 3 / Biomedische wiskunde 2 juni 2014; 18:30-20:30 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het

Nadere informatie

Praktijkbundel Amos 6.0 in de praktijk

Praktijkbundel Amos 6.0 in de praktijk Praktijkbundel Amos 6.0 in de praktijk Van den Bussche Eva 1 1. Woord vooraf In deze praktijkbundel vind je 2 oefeningen terug die stap voor stap worden uitgewerkt en geïllustreerd met screenshots. De

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

VU University Amsterdam 2018, Maart 27

VU University Amsterdam 2018, Maart 27 Department of Mathematics Exam: Voortgezette biostatistiek VU University Amsterdam 2018, Maart 27 c Dept. of Mathematics, VU University Amsterdam NB. Geef een duidelijke toelichting bij de antwoorden.

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Met testscores bepalen we de kwaliteit van bepaalde items. De eisen voor kwaliteit zijn van groot belang voor psychologische testen.

Met testscores bepalen we de kwaliteit van bepaalde items. De eisen voor kwaliteit zijn van groot belang voor psychologische testen. Psychometrie: College 1: Schaling en Normering 04-09-2012 Kees van Putten Psychometrie: In de psychometrie bestudeert met de testscore. Hierbij gaat men van kwalitatief materiaal (antwoorden op testitems)

Nadere informatie

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus Dat economie in essentie geen experimentele wetenschap is maakt de econometrie tot een onmisbaar

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Les 2: Toetsen van één gemiddelde

Les 2: Toetsen van één gemiddelde Les 2: Toetsen van één gemiddelde Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie & Biotechnologie 22 oktober 2018 Het statistisch testen van één gemiddelde is een veel voorkomende toepassing

Nadere informatie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3

Statistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3 Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke

Nadere informatie

MULTIPELE IMPUTATIE IN VOGELVLUCHT

MULTIPELE IMPUTATIE IN VOGELVLUCHT MULTIPELE IMPUTATIE IN VOGELVLUCHT Stef van Buuren We hebben het er liever niet over, maar allemaal worden we geplaagd door ontbrekende gegevens. Het liefst moffelen we problemen veroorzaakt door ontbrekende

Nadere informatie

Les 1: de normale distributie

Les 1: de normale distributie Les 1: de normale distributie Elke Debrie 1 Statistiek 2 e Bachelor in de Biomedische Wetenschappen 18 oktober 2018 1 Met dank aan Koen Van den Berge Indeling lessen Elke bullet point is een week. R en

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4 statviewtoetsen 18/12/2000 Contents............................................................ 1 1 Statview toets, 2K WE, 30 mei 1995 2 1.1 Fitness-campagne................................................

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Statistiek II. Sessie 4. Feedback Deel 4

Statistiek II. Sessie 4. Feedback Deel 4 Statistiek II Sessie 4 Feedback Deel 4 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 4 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met

Nadere informatie

beoordelingskader zorgvraagzwaarte

beoordelingskader zorgvraagzwaarte 1 beoordelingskader zorgvraagzwaarte In dit document geven we een beoordelingskader voor de beoordeling van de zorgvraagzwaarte-indicator. Dit beoordelingskader is gebaseerd op de resultaten van de besprekingen

Nadere informatie

Item-responstheorie (IRT)

Item-responstheorie (IRT) Item-responstheorie (IRT) niet direct voor een dubbeltje, maar wel erg cool op het podium Ruth van Nispen 1 Caroline Terwee 2 1 Afdeling Oogheelkunde 2 Afdeling Epidemiologie en Biostatistiek VU medisch

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

Statistiek voor A.I.

Statistiek voor A.I. Statistiek voor A.I. College 13 Donderdag 25 Oktober 1 / 28 2 Deductieve statistiek Orthodoxe statistiek 2 / 28 3 / 28 Jullie - onderzoek Tobias, Lody, Swen en Sander Links: Aantal broers/zussen van het

Nadere informatie

Hoofdstuk 5: Steekproevendistributies

Hoofdstuk 5: Steekproevendistributies Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel

Nadere informatie

Tentamen Biostatistiek 3 / Biomedische wiskunde

Tentamen Biostatistiek 3 / Biomedische wiskunde Tentamen Biostatistiek 3 / Biomedische wiskunde 25 maart 2014; 12:00-14:00 NB. Geef een duidelijke toelichting bij de antwoorden. Na correctie liggen de tentamens ter inzage bij het onderwijsbureau. Het

Nadere informatie

11. Meerdere gemiddelden vergelijken, ANOVA

11. Meerdere gemiddelden vergelijken, ANOVA 11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke

Nadere informatie

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek

werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke

Nadere informatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Psychometrie werkgroep: De antwoorden

Psychometrie werkgroep: De antwoorden Psychometrie werkgroep: De antwoorden Week 1: Schaling en Normering Opdracht 1. a) Psychometrie is de studie naar procedures die gebruikt worden om items van testen te schatten en te evalueren. Gedrag

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 7 juni 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

Missing Data: Multipele Imputatie

Missing Data: Multipele Imputatie Missing Data: Multipele Imputatie Mark Huisman Rijksuniversiteit Groningen Statistiek in de Praktijk 30 maart 2006 Missing Data: Multipele Imputatie 1 Inhoud 1. Omgaan met ontbrekende scores: Imputeren

Nadere informatie

Les 5: Analysis of variance

Les 5: Analysis of variance Les 5: Analysis of variance 2de bachelor in de chemie en biologie 14/11/2018 Jeroen Gilis Gebaseerd op slides Caroline De Tender Testen die we tot nu toe gezien hebben: Toetsen van één gemiddelde ten opzichte

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00

3de bach TEW KBM. Theorie. uickprinter Koningstraat Antwerpen ,00 3de bach TEW KBM Theorie Q www.quickprinter.be uickprinter Koningstraat 13 2000 Antwerpen 168 6,00 Online samenvattingen kopen via www.quickprintershop.be BOEK 1: ENKELVOUDIGE EN MEERVOUDIGE REGRESSIE

Nadere informatie

1 Inleiding. 2 Methode en selectie

1 Inleiding. 2 Methode en selectie 1 Inleiding In de CPB Policy Brief over de positie van de middeninkomens op de woningmarkt (CPB, 2016) spelen subsidies in de verschillende segmenten van de woningmarkt een belangrijke rol als verklaring

Nadere informatie

EEN STAPSGEWIJZE HANDLEIDING

EEN STAPSGEWIJZE HANDLEIDING F5 LISREL VOOR DUMMIES EEN STAPSGEWIJZE HANDLEIDING Versie 0.1 Harry B.G. Ganzeboom Vrije Universiteit Amsterdam 23 maart 2009 LISREL VOOR DUMMIES: STAPJE VOOR STAPJE Stap 1: Schrijf het conceptueel (causaal)

Nadere informatie

4 Domein STATISTIEK - versie 1.2

4 Domein STATISTIEK - versie 1.2 USolv-IT - Boomstructuur DOMEIN STATISTIEK - versie 1.2 - c Copyrighted 42 4 Domein STATISTIEK - versie 1.2 (Op initiatief van USolv-IT werd deze boomstructuur mede in overleg met het Universitair Centrum

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie