1. Reductie van error variantie en dus verhogen van power op F-test
|
|
- Adriaan Gert van de Velden
- 4 jaren geleden
- Aantal bezoeken:
Transcriptie
1 Werkboek ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De onafhankelijke variabelen hebben twee meetniveaus, namelijk nominaal (factoren) en interval (covariaten). Wanneer en waarom wordt de ANCOVA gebruikt? Door nominale en interval voorspellers te combineren kan een betere voorspelling van de afhankelijke variabele gedaan worden in vele situaties. ANCOVA wordt veel gebruik in (quasi-)experimenten. Er wordt gekeken hoe groepen verschillen in hun gemiddelden op de afhankelijke variabele. Het toevoegen van covariaten heeft twee voordelen: 1. Reductie van error variantie en dus verhogen van power op F-test 2. Eliminatie van systematische bias door het includeren van verstorende variabelen als covariaat. Dit heet statistische controle. Er zijn altijd individuele verschillen in een onderzoek. Bij een variantieanalyse eindigen deze in de error (MS w ). Hoe hoger de error, hoe lager de F-waarde: F = MS b / MS w. De echte verschillen tussen groepen kunnen dus verborgen raken door de grote individuele verschillen. Switchen van ANOVA naar ANCOVA kan bijvoorbeeld door het toevoegen van een pre-test meting (interval variabele). De error variantie bestaat dan uit twee componenten: Individuele verschillen in de pre-test meting Echte errorvariantie Als de toegevoegde covariaat voldoende correleert met de afhankelijke variabele zal de errorvariantie verminderen en de power van de F-toets verhogen. 1
2 Systematische bias kan ontstaan wanneer gewerkt wordt met reeds bestaande groepen. Hierdoor kunnen de echte effecten onzichtbaar zijn of worden onjuiste effecten gecreëerd. Zie p.19/20 van het werkboek voor een voorbeeld. ANOCVA model Een ANOVA model heeft drie componenten: Het grote gemiddelde: De afwijking van de groep ten opzichte van het grote gemiddelde: α j = De error of afwijking van ieder individu ten opzichte van het groepsgemiddelde: e ij = Y ij - Y j Dit geeft het volgende model: Y ij = + α j + e ij. De variantie van Y wordt in een tussengroepscomponent (α j ) en een binnengroepscomponent (e ij ) opgedeeld. In het ANCOVA model wordt er een covariaat aan de formule toegevoegd: Y ij = + α j + b w (C ij - ) + e ij. Met deze formules proberen we de Y ij score van elk individu i uit groep j zo goed mogelijk te voorspellen. Het verschil tussen ANOVA en ANCOVA is dat we bij ANOVA alleen weten tot welke groep het individu behoort, terwijl we bij ANCOVA ook de individuele score op de covariaat hebben. Daardoor is de voorspelling bij ANCOVA preciezer. De ANCOVA formule bestaat uit een variantieanalyse component ( + α j ) en een regressie analyse component (b w (C ij - )). De beste voorspelling voor een persoon uit groep j is het aangepaste gemiddelde van zijn groep. Echter wijken veel mensen af van het gemiddelde, en daar houdt de regressieanalyse component rekening mee door de individuele score op de covariaat mee te nemen. De individuele afwijking van het covariaatgemiddelde (C ij - ) wordt vermenigvuldigd door het regressie gewicht b w, waarna het wordt opgeteld bij de variantieanalyse component. Doordat de covariaat meegenomen wordt verandert de tussengroepscomponent (α j ) en de binnengroepscomponent (e ij ). Dit model is weer te geven in een diagram (zie werkboek p.22 voor een voorbeeld). 2
3 Het regressie gewicht b w heet zo, omdat het de pooled within-groups regressie gewicht is, oftewel de voorspelling van Y uit C voor elke groep. Er wordt vanuit gegaan dat b w gelijk is in alle groepen. De b w is echter niet gelijk aan het totale regressie gewicht b van de relatie tussen de covariaat en de afhankelijke variabele. Hetzelfde geldt voor de totale (r YC ) en pooled-within correlatie (r YC(W) ) tussen de covariaat en de afhankelijke variabele. F-test in ANCOVA De F-test in ANCOVA is gelijk aan die van ANOVA, alleen wordt er met aangepaste een sum of squares en vrijheidsgraden gewerkt waarbij de overlap met de covariaat eruit gefilterd is. De totale aangepaste kwadratensom bestaat uit een tussengroepscomponent en een binnengroepscomponent: SS T *= SS b * + SS W *. Met de volgende formule is de totale variantie van de afhankelijke variabele te berekenen: SS T * = SS T r YC2 SS T = (1- r YC2 )SS T. r YC2 SS T geeft aan hoeveel variantie de covariaat verklaart. De binnengroepscomponent wordt als volgt uitgerekend: SS W * = (1- r YC(W)2 )SS W. de tussengroepsvariantie kan dan makkelijk berekend worden: SS B * = SS T * - SS W *. Voordat de F-waarde berekend kan worden, moeten we MS (mean squares) uitrekenen door de kwadratensom door de vrijheidsgraden te delen. MS b * = SS b * / k-1 en MS W * = SS W * / N-k-c. Hierbij is k het aantal groepen, N de steekproefgrootte en c het aantal covariaten. Nu kan de F-waarde berekend worden: MS b * / MS W * met vrijheidsgraden df b = k-1 en df w = N - k - c. De binnengroepsvariantie blijft gelijk of verlaagd bij aanpassing voor de covariaat, terwijl de tussengroepsvariantie gelijk blijft, verhoogd of verlaagd. Daardoor kan F ook toenemen of afnemen. Het toevoegen van een covariaat heeft dus veel invloed. Over de invloed van r YC en r YC(W) op de F-toets kan op p.25 in het werkboek gekeken worden voor een voorbeeld. Aangepast groepsgemiddelde Het aangepaste groepsgemiddelde kan afgeleid worden uit de volgende formule: j = + α j + b w (C i - ). Omdat j* = + α j is het aangepaste groepsgemiddelde: j* = j - b w (C i - ). Als dit weergegeven wordt in een diagram, wordt het aangepaste groepsgemiddelde gevonden op de intersectie van de regressielijn van de groep met de lijn C =. Zie p.27/28 van het werkboek voor een voorbeeld. Over het algemeen geldt dat groepen met een hoog gemiddelde op de covariaat na aanpassing een lager gemiddelde hebben op de afhankelijke variabelen. Groepen met een laag gemiddelde op de covariaat hebben echter een hoger gemiddelde op de afhankelijke 3
4 variabele na aanpassing. Als de groep met de hoogste score de laagste score heeft op de covariaat worden de verschillen op de afhankelijke variabele dus groter, terwijl als deze groep ook de hoogste score heeft op de covariaat de verschillen kleiner worden, ze verdwijnen of het signaal wisselt. Het bovenstaande geldt alleen bij een positieve b w. Als b w negatief is geldt precies het omgekeerde. Reductie van errorvariantie Als groepen niet verschillen op de covariaat zijn de aangepaste groepsgemiddelden gelijk aan de originele gemiddelden. Toch leidt het toevoegen van een covariaat wel tot veranderingen in de resultaten. Het vermindert namelijk de errorvariantie. Door het toevoegen van een covariaat wordt het effect van de factor beter geschat en heeft de F-test meer statistische power. Gebruik covariaten spaarzaam Door het toevoegen van een covariaat vermindert het aantal vrijheidsgraden. Dit leidt tot een verhoging van MS w * ten opzichte van MS w. Als r YC r YC(W) 0 of als de covariaat niets toevoegt aan de afhankelijke variabele kan het toevoegen van een covariaat leiden tot een lagere F-waarde. Doordat er minder vrijheidsgraden zijn is de drempelwaarde voor significantie ook hoger. Daarnaast verandert een covariaat de interpretatie van de afhankelijke variabele. Dit kan op drie manieren: 1. Irrelevante interpretatie: het gebruik van een covariaat die irrelevant is voor het onderzoeksdoel. 2. Niet-bestaande of niet-bestudeerde groep. 3. Elimineren van een deel van het effect: als een covariaat gemeten wordt nadat behandelingen zijn toegediend, is er een mogelijkheid dat de score op de covariaat bepaald is door de manier waarop individuen over de groepen zijn verdeeld Op p.30 van het werkboek staat bij elk van de bovenstaande punten een voorbeeld. Assumpties Er moet sprake zijn van een normale verdeling, homogeniteit van varianties en onafhankelijke observaties. Deze gelden voor elke ANOVA. Wanneer er een covariaat bij komt kijken zijn er nog een aantal assumpties, die hieronder besproken worden. 4
5 Geen error in de covariaat De covariaat moet vrij zijn van error door selectie als door meetfouten. Deze fouten kunnen leiden tot een onderschatting van de relaties met andere variabelen. Volgens Huitema zijn er drie typen overtredingen: vaste covariaat met meetfouten, random covariaat zonder meetfouten en random covariaat met meetfouten. Alleen de laatste leidt tot ernstige problemen zoals te weinig aanpassing in de aangepaste groepsgemiddelden waardoor verkeerde conclusies getrokken kunnen worden. Lineariteit De relatie tussen de covariaat en de afhankelijke variabele moet het best te formuleren zijn door een rechte lijn in plaats van een kromme lijn. Deze assumptie is belangrijk, omdat overtreding kan leiden tot een onderschatting van de relatie tussen de covariaat en de afhankelijke variabele en daardoor een inadequate aanpassing van de groepsgemiddelden. Doordat er geen test is voor lineariteit vertrouwen we op visuele inspectie van het diagram waar voorspelde waardes afgezet worden tegen de errors. Er moet een horizontale band zichtbaar zijn. Als de relatie niet lineair is, is er niet veel aan de hand, omdat het voordeel van een niet-lineair model over een lineair model maar klein is. Bij serieuze niet-lineariteit kan een niet-lineaire vorm van ANCOVA gebruikt worden. Parallelliteit Alle groepen hebben hetzelfde regressiegewicht b w. dit betekent parallelle regressielijnen (bij één covariaat), parallelle regressievlakken (bij twee covariaten) of parallele regressiehypervlakken (bij drie of meer covariaten). Een andere manier om hier naar te kijken is dat er geen interactie mag zijn tussen de covariaat en de behandeling. Als de assumptie van parallelliteit overtreden wordt zijn de aangepaste gemiddelden, aangepaste kwadratensommen en F-testen niet meer correct. De validiteit en de interpreteerbaarheid van de ANCOVA vermindert enorm. Door elke groep een eigen regressiegewicht en eigen aanpassing te geven kan dit probleem opgelost worden, alleen verandert hierdoor de berekening van de aangepaste gemiddelden en verandert hun betekenis. Er moet altijd een ANCOVA uitgevoerd worden waarin de covariaat * behandeling interactie wordt meegenomen. Als de F-toets voor deze interactie niet significant is kan er overgegaan worden op het normale ANCOVA model. Als het wel significant is, moet de variabele niet als covariaat gebruikt worden. 5
6 ANCOVA in SPSS Voor een voorbeeld wordt verwezen naar p.35 van het werkboek. Bij het gebruik van een post-test meting als afhankelijke variabele en een pre-test meting als covariaat laten de aangepaste scores zien of een persoon of groep beter of slechter presteerde dan we zouden verwachten op basis van de pre-test meting. Het is dan niet het hoofdeffect van de onafhankelijke variabele dat invloed heeft op de afhankelijke variabele, maar de verandering van de onafhankelijke variabele tussen pre- en post-test meting. Het vinden van de kwadratensommen in de SPSS output van een ANCOVA wordt vaak als moeilijk beschouwd. De SS T is te vinden onder de rij Corrected Total. SS b en SS b * zijn de kwadratensommen van de onafhankelijke variabele en SS w en SS w * zijn de Error. SS T * wordt berekend door SS b * en SS w * op te tellen. De rij Corrected Model staat voor de totale verklaarde variantie. Het is gelijk aan de som van de kwadratensommen van de onafhankelijke variabele, de covariaat en de overlap tussen de onafhankelijke variabele en de covariaat. De ANCOVA assumpties moeten altijd eerst gecheckt worden. Een scatterplot van de voorspelde waardes tegenover de residuen kan gebruikt worden om lineariteit te checken. Hieruit kan ook gehaald worden of er sprake is van hetero- of homoscedasticiteit. Bij heteroscedasticiteit is de errorvariantie niet gelijk over alle voorspelde waarden. In het scatterplot kunnen ook uitbijters zichtbaar worden. Om achter de parallelliteitsassumptie te komen moet een ANCOVA uitgevoerd worden met het interactie-effect van de covariaat met de onafhankelijke variabele. Daarbij moeten ook altijd de hoofdeffecten meegenomen worden. Echter bij het beschrijven van de hoofdeffecten moet nooit de output van de analyse met het interactie-effect gebruikt worden, omdat de interpretatie van de hoofdeffecten flink veranderd wordt door de interactie toe te voegen. Een niet-significant interactie effect kan ook komen doordat er te weinig power is. Beperkingen van ANCOVA ANCOVA is belangrijk in experimentele, quasi-experimentele en correlationele ontwerpen. Er zijn echter ook wat beperkingen. In het werkboek is er een experimenteel perspectief ten opzichte van ANCOVA aangenomen. Men kan echter ook focussen op de relatie tussen de kwantitatieve onafhankelijke variabelen en de afhankelijke variabelen, waardoor de categorische variabele gezien wordt als de verstorende variabele en ANCOVA voornamelijk de aangepaste regressiegewichten schat. Daarnaast kan het regressieperspectief gebruikt worden waarbij de categorische en interval voorspellers dezelfde status hebben. Daarnaast 6
7 zouden post-hoc testen weer kunnen geven welke aangepaste groepsgemiddelden significant verschillen. Helaas zijn deze niet aanwezig in SPSS en moeten deze met de hand berekend worden. Zoals eerder genoemd zorgt een extra covariaat voor minder vrijheidsgraden en een veranderde interpretatie (zie Gebruik covariaten spaarzaam ). De validiteit van ANCOVA vermindert als het uitgevoerd wordt bij reeds bestaande groepen. Er is namelijk sprake van oninterpreteerbaarheid en referentie naar niet-bestaande of niet-bestudeerde groepen. Het voorbeeld op p.41 van het werkboek maakt dit punt duidelijk. Daarnaast zullen reeds bestaande groepen altijd verschillen op bepaalde (onbekende) variabelen. Men moet dus altijd voorzichtig zijn in het interpreteren en conclusies trekken van data gebaseerd op bestaande groepen. 7
Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:
13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke
Nadere informatieBij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R
14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten
Nadere informatie11. Multipele Regressie en Correlatie
11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in
Nadere informatieAanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling
Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl
Nadere informatie9. Lineaire Regressie en Correlatie
9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)
Nadere informatieHoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse
Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse 10.1 Eenwegs-variantieanalyse: Als we gegevens hebben verzameld van verschillende groepen en we willen nagaan of de populatiegemiddelden van elkaar verscihllen,
Nadere informatie11. Meerdere gemiddelden vergelijken, ANOVA
11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke
Nadere informatie16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA
16. MANOVA MANOVA Multivariate variantieanalyse (MANOVA) kan gebruikt worden in een situatie waarin je meerdere afhankelijke variabelen hebt. Met MANOVA kan er 1 onafhankelijke variabele gebruikt worden
Nadere informatieHoofdstuk 8: Multipele regressie Vragen
Hoofdstuk 8: Multipele regressie Vragen 1. Wat is het verschil tussen de pearson correlatie en de multipele correlatie R? 2. Voor twee modellen berekenen we de adjusted R2 : Model 1 heeft een adjusted
Nadere informatieHoofdstuk 10: Regressie
Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.
Nadere informatieb) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte
Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte
Nadere informatieCollege 2 Enkelvoudige Lineaire Regressie
College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:
Nadere informatieBerekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt
A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:
Nadere informatie(slope in het Engels) en het snijpunt met de y-as, b 0
8. Regressie Een introductie Al vaak is genoemd dat statistische modellen allemaal neerkomen op uitkomst = model + error. Dit model kun je ook gebruiken om de uitkomst te voorspellen, met een correlatie
Nadere informatieHet ANCOVA model is een vorm van het general linear model (GLM), en kan als volgt geschreven worden qua populatie parameters:
Hoofdstuk 4 4.1 De ANCOVA is een vorm van statistische controle, en was specifiek ontworpen om on-uitgelegde foutvariatie ( error variation ) te verminderen. Om dit te doen is er een co-variabele ( covariate
Nadere informatieCollege 6 Eenweg Variantie-Analyse
College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld
Nadere informatieMeervoudige ANOVA Onderzoeksvraag Voorwaarden
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatieFormuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i
Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de
Nadere informatieHoofdstuk 12: Eenweg ANOVA
Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake
Nadere informatieCollege 3 Meervoudige Lineaire Regressie
College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html
Nadere informatiemlw stroom 2.1: Statistisch modelleren
mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht
Nadere informatie20. Multilevel lineaire modellen
20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze
Nadere informatieOplossingen hoofdstuk XI
Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij
Nadere informatieData analyse Inleiding statistiek
Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen
Nadere informatieHOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)
HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:
Nadere informatieOefenvragen bij Statistics for Business and Economics van Newbold
Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd
Nadere informatieEnkelvoudige ANOVA Onderzoeksvraag Voorwaarden
Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd
Nadere informatie1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.
Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van
Nadere informatieZowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y
1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld
Nadere informatieSamenvatting Nederlands
Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.
Nadere informatieVoorbeeldtentamen Statistiek voor Psychologie
Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij
Nadere informatieStatistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef
Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,
Nadere informatieCollege 7. Regressie-analyse en Variantie verklaren. Inleiding M&T Hemmo Smit
College 7 Regressie-analyse en Variantie verklaren Inleiding M&T 2012 2013 Hemmo Smit Neem mee naar tentamen Geslepen potlood + gum Collegekaart (alternatief: rijbewijs, ID-kaart, paspoort) (Grafische)
Nadere informatieStatistiek ( ) eindtentamen
Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op
Nadere informatieHoofdstuk 5 Een populatie: parametrische toetsen
Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie
Nadere informatieStatistiek II. Sessie 3. Verzamelde vragen en feedback Deel 3
Statistiek II Sessie 3 Verzamelde vragen en feedback Deel 3 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 3 1 Statismex en bloeddruk 1. Afhankelijke variabele: Bloeddruk (van ratio-niveau) Onafhankelijke
Nadere informatieVoorbeeld regressie-analyse
Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke
Nadere informatie2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72
Inhoud Hoofdstuk 1 Design en analyse 11 1.1 Specificatie van designs 13 1.2 Definities 14 1.3 Het verschil tussen een afhankelijke variabele en een niveau van een within-subjectfactor 19 1.4 Kiezen van
Nadere informatieCollege 6. Samenhang tussen variabelen. Inleiding M&T Hemmo Smit
College 6 Samenhang tussen variabelen Inleiding M&T 2012 2013 Hemmo Smit Overzicht van deze cursus 1. Grondprincipes van de wetenschap 2. Observeren en meten 3. Interne consistentie; Beschrijvend onderzoek
Nadere informatieHOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN
HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.
Nadere informatiewerkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen scattergram cursus Statistiek
cursus 23 mei 2012 werkcollege 8 correlatie, regressie - D&P5: Summarizing Bivariate Data relatie tussen variabelen onderzoek streeft naar inzicht in relatie tussen variabelen bv. tussen onafhankelijke
Nadere informatieExamen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008
Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer
Nadere informatieANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003
ANOVA in SPSS Hugo Quené hugo.quene@let.uu.nl opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003 1 vooraf In dit voorbeeld gebruik ik fictieve gegevens, ontleend aan
Nadere informatieCursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015
Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%
Nadere informatieStatistiek II. Sessie 5. Feedback Deel 5
Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :
Nadere informatieLes 5: Analysis of variance
Les 5: Analysis of variance 2de bachelor in de chemie en biologie 14/11/2018 Jeroen Gilis Gebaseerd op slides Caroline De Tender Testen die we tot nu toe gezien hebben: Toetsen van één gemiddelde ten opzichte
Nadere informatieInhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28
Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische
Nadere informatieEIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010
EIND TOETS TOEGEPASTE BIOSTATISTIEK I 5 februari - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 9 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.
Nadere informatieVerband tussen twee variabelen
Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en
Nadere informatieExperimenteel en Correlationeel Onderzoek
Experimenteel en Correlationeel Onderzoek In veel onderzoek is het doel: Het vaststellen van oorzaak-gevolg (causale) relaties Criteria voor causaliteit 1. Samenhang (correlatie, covariantie) 2. Opeenvolging
Nadere informatieINDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers
Nadere informatieToegepaste data-analyse: oefensessie 2
Toegepaste data-analyse: oefensessie 2 Depressie 1. Beschrijf de clustering van de dataset en geef aan op welk niveau de verschillende variabelen behoren Je moet weten hoe de data geclusterd zijn om uit
Nadere informatieVandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses
Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling
Nadere informatieStatistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018
Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht
Nadere informatieToegepaste Statistiek, Dag 7 1
Toegepaste Statistiek, Dag 7 1 Statistiek: Afkomstig uit het Duits: De studie van politieke feiten en cijfers. Afgeleid uit het latijn: status, staat, toestand Belangrijkste associatie: beschrijvende statistiek
Nadere informatieHoofdstuk 2: Verbanden
Hoofdstuk 2: Verbanden Inleiding In het gebruik van statistiek komen we vaak relaties tussen variabelen tegen. De focus van dit hoofdstuk ligt op het leren hoe deze relaties op grafische en numerieke wijze
Nadere informatieCollege 7 Tweeweg Variantie-Analyse
College 7 Tweeweg Variantie-Analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11 Jolien Pas ECO 2012-2013 Het Experiment
Nadere informatieToetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen
M, M & C 7.3 Optional Topics in Comparing Distributions: F-toets 6.4 Power & Inference as a Decision 7.1 The power of the t-test 7.3 The power of the sample t- Toetsende Statistiek Week 5. De F-toets &
Nadere informatieHoofdstuk 5: Steekproevendistributies
Hoofdstuk 5: Steekproevendistributies Inleiding Statistische gevolgtrekkingen worden gebruikt om conclusies over een populatie of proces te trekken op basis van data. Deze data wordt samengevat door middel
Nadere informatieHOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES
HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieHoofdstuk 6 Twee populaties: parametrische toetsen
Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.
Nadere informatieANTWOORDEN Statistiek
ANTWOORDEN Statistiek cursuscode 200300427, cursusjaar 2004-2005, blok 2 maandag 31 januari 2005, 15:00-17:30 uur, Trans 10, zaal 0.17 Schrijf je naam en student-nummer op elk vel papier dat je inlevert.
Nadere informatieExperimenteel Onderzoek en Experimentele Controle
Experimenteel Onderzoek en Experimentele Controle ECO 2011-2012 Hemmo Smit Wilhelm Wundt en William James 3 criteria voor Causaliteit (herhaling) 1. Covariantie: samenhang tussen variabelen aantonen 2.
Nadere informatieHOOFDSTUK VII REGRESSIE ANALYSE
HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens
Nadere informatieduidelijk. Welke groepen verschillen wel/niet van elkaar?wat zijn je hypothesen?
Opdracht 3 t-test ANOVA one way ANOVA two way 33038 discussie post-hoc is niet duidelijk. Welke groepen verschillen wel/niet van elkaar?wat zijn je hypothesen? je behandeling van de two-way anova is niet
Nadere informatieInhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox
van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox Bram Ramaekers Bianca de Greef KEMTA Masterclass Inhoud Data Kaplan-Meier curve Hazard rate Log-rank test Hazard ratio Cox regressie
Nadere informatieAntwoordvel Versie A
Antwoordvel Versie A Interimtoets Toegepaste Biostatistiek 13 december 013 Naam:... Studentnummer:...... Antwoorden: Vraag Antwoord Antwoord Antwoord Vraag Vraag A B C D A B C D A B C D 1 10 19 11 0 3
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en
Nadere informatieHoofdstuk 7: Statistische gevolgtrekkingen voor distributies
Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan
Nadere informatieMethoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2
Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte
Nadere informatieHoofdstuk 19. Voorspellende analyse bij marktonderzoek
Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieExamen Statistiek I Feedback
Examen Statistiek I Feedback Bij elke vraag is alternatief A correct. Bij de trekking van een persoon uit een populatie beschouwt men de gebeurtenissen A (met bril), B (hooggeschoold) en C (mannelijk).
Nadere informatieHoofdstuk 8 Het toetsen van nonparametrische variabelen
Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn
Nadere informatie8. Analyseren van samenhang tussen categorische variabelen
8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde
Nadere informatieEIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009
EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.
Nadere informatieGegevensverwerving en verwerking
Gegevensverwerving en verwerking Staalname - aantal stalen/replicaten - grootte staal - apparatuur Experimentele setup Bibliotheek Statistiek - beschrijvend - variantie-analyse - correlatie - regressie
Nadere informatieTentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.
Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.
Nadere informatiemlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2
mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart
Nadere informatietoetskeuze schema verschillen in gemiddelden
toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets week 5: het toetsen van
Nadere informatieStatistiek II. Sessie 4. Feedback Deel 4
Statistiek II Sessie 4 Feedback Deel 4 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 4 We hebben besloten de bekomen grafieken in R niet in het document in te voegen, dit omdat het document met
Nadere informatieHoofdstuk 12 : Regressie en correlatie. Marnix Van Daele. Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent.
Hoofdstuk 12 : Regressie en correlatie Marnix Van Daele MarnixVanDaele@UGentbe Vakgroep Toegepaste Wiskunde en Informatica Universiteit Gent Regressie en correlatie p 1/26 Regressielijn Vraag : vind het
Nadere informatieEindtoets Toegepaste Biostatistiek
Eindtoets Toegepaste Biostatistiek 2013-2014 29 januari 2014 Dit tentamen bestaat uit vier opgaven, onderverdeeld in 24 subvragen. Begin bij het maken van een nieuwe opgave steeds op een nieuw antwoordvel.
Nadere informatieConclusies. Martijn de Ruyter de Wildt en Henk Eskes. KNMI, afdeling Chemie en Klimaat Telefoon +31-30-2206431 e-mail mruijterd@knmi.
Lotos-Euros v1.7: validatierapport voor 10 en bias-correctie Martijn de Ruyter de Wildt en Henk Eskes KNMI, afdeling Chemie en Klimaat Telefoon +31-30-2206431 e-mail mruijterd@knmi.nl Conclusies Bias-correctie:
Nadere informatieHoofdstuk 3 Statistiek: het toetsen
Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.
Nadere informatieReconstructie Bedrijfsstatistiek 2016
Reconstructie Bedrijfsstatistiek 2016 Open vragen Vraag 1 1. Bewijs dat σ^² een onvertekende schatter is voor σ²=σi 1/n * Xi² 2. Bereken de variantie van o^² 3. Is de schatter consistent? 4. Teken chi-kwadraat
Nadere informatieKansrekening en Statistiek
Kansrekening en Statistiek College 14 Donderdag 28 Oktober 1 / 37 2 Statistiek Indeling: Hypothese toetsen Schatten 2 / 37 Vragen 61 Amerikanen werd gevraagd hoeveel % van de tijd zij liegen. Het gevonden
Nadere informatieFeedback examen Statistiek II Juni 2011
Feedback examen Statistiek II Juni 2011 Bij elke vraag is alternatief A correct. 1 De variabele X is Student verdeeld in een bepaalde populatie, met verwachting µ X en variantie σ 2 X. Je trekt steekproeven
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, 14.00-17.00 uur De uitwerkingen van de opgaven dienen duidelijk geformuleerd
Nadere informatieM M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51
INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 7 1. Een onderzoeker wil nagaan of de fitheid van jongeren tussen 14 en 18 jaar (laag, matig, hoog) en het geslacht (M, V) een
Nadere informatieWiskunde B - Tentamen 1
Wiskunde B - Tentamen Tentamen 57 Wiskunde B voor CiT vrijdag januari 5 van 9. tot. uur Dit tentamen bestaat uit 6 opgaven, formulebladen en tabellen. Vermeld ook uw studentnummer op uw werk en tentamenbriefje.
Nadere informatieTentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op woensdag 22 april 2009 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het
Nadere informatieCollege 3 Interne consistentie; Beschrijvend onderzoek
College 3 Interne consistentie; Beschrijvend onderzoek Inleiding M&T 2012 2013 Hemmo Smit Overzicht van dit college Kwaliteit van een meetinstrument (herhaling) Interne consistentie: Cronbach s alpha Voorbeeld:
Nadere informatieTECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.
TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine
Nadere informatieTentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur
Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven
Nadere informatieCollege 1 Grondprincipes van de Wetenschap
College 1 Grondprincipes van de Wetenschap Inleiding M&T 01 013 Hemmo Smit Overzicht van dit college Korte inleiding in het vakgebied Praktische informatie over het vak Wat is wetenschap? De empirische
Nadere informatieintroductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets
toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:
Nadere informatieRobuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid
Robuustheid regressiemodel voor kapitaalkosten gebaseerd op aansluitdichtheid Dr.ir. P.W. Heijnen Faculteit Techniek, Bestuur en Management Technische Universiteit Delft 22 april 2010 1 1 Introductie De
Nadere informatieCollege Week 1 Grondprincipes van de Wetenschap
College Week 1 Grondprincipes van de Wetenschap Inleiding in de Methoden & Technieken 013 014 Hemmo Smit Overzicht van dit college Korte inleiding in het vakgebied Praktische informatie over het vak Wat
Nadere informatieExperimenteel en Correlationeel Onderzoek (ECO)
Experimenteel en Correlationeel Onderzoek (ECO) In veel onderzoek is het ultieme doel: Het vaststellen van oorzaak-gevolg (causale) relaties Rode draad ECO: Met behulp van onderzoek zo goed mogelijk uitspraken
Nadere informatie