Overzicht verschillende analyse methodes:

Maat: px
Weergave met pagina beginnen:

Download "Overzicht verschillende analyse methodes:"

Transcriptie

1 Overzicht verschillende analyse methodes: Variantie analyse Dependent (afhankelijkheid tussen variabele) Doel: is om te achterhalen of groepen verschillen in hun score op de afhankelijke variabele. Je kunt hierbij denken aan een experimentele setting. Een onderzoeker wil weten of zijn manipulaties, zijn treatments, invloed hebben op de afhankelijke variabele. Variantieanalyse wordt niet alleen gebruikt bij experimenteel onderzoek. Het wordt ook gebruikt bij sociaalwetenschappelijk onderzoek, waarbij je bijvoorbeeld wilt weten of mannen en vrouwen in hun inkomen. Het draait uiteindelijk allemaal om de verschillen tussen groepen in hun score op de afhankelijke variabele. Kan verklarend en beschrijvend Analyse van gegevens Spreiding rondom gemiddelde Opzoek naar verschillen. 1. Anova eenweg veriantie analyse 1 factor 1 afhankelijk variabele 2. Factorial Anova tweeweg variantie analyse meer factoren, 1 afhankelijke variabele 3. Ancova covariantie variantie analyse 1 of meer factoren 1 of meer afhankelijk variabele. Deze gaat voor deze cursus te ver. Over de onafhankelijk variabele heeft de onderzoeker controle over niveaus van ordinaal of nominaal. heten treatment variabele of factoren De afhankelijk variabele interval of ratio meetniveau. Binnen 1 toets twee verschillende meetniveaus bruikbaar. Toetsen van verschillen in meerdere groepen. 1. Ho= alles gelijk u1 = u2 = u3 2. H1 = minstens 1 wijkt af Variantie analyse bestaat uit grofweg drie stappen: 1. het controleren van de assumpties a. Er is een afhankelijke variabele en deze moet van metrisch meetniveau zijn (interval of ratio). Als er sprake is van meerdere afhankelijke variabelen, dan spreken van MANOVA en niet meer van ANOVA. b. Een of meerdere onafhankelijke variabelen (factoren noemen we die) die van ofwel nominaal ofwel ordinaal meetniveau zijn (categorische variabelen). c. In geval van een experiment geldt ook dat we te maken moeten hebben met onafhankelijke en aselect gekozen experimentele eenheden. d. De populaties zijn normaal verdeeld. e. De varianties binnen categorieen van de factoren zijn homogeen. 2. het analyseren van de hoof- en interactie effecten. a. H0: μ1= μ2 = μ3 = μk Ha: minstens een μ wijkt af van de andere Daarbij gebruik je de toetsingsgrootheid van F. Je stelt een α vast, die bepaalt wanneer je de H0 verwerpt en wanneer niet. Vervolgens kun je in de ANOVA tabel gaan kijken wat de resultaten zijn. Welke factoren hebben een significante F en wat zegt dat jou? Het is vaak ook zo dat je een factor hebt die meer dan twee categorieën bevat. Bij opleidingsniveau zien we vaak dat een indeling in drie categorieën wordt gehanteerd. Als dat het geval is, wil je meestal ook weten welke categorieën van je factor er nu voor zorgen dat je een significant effect hebt. Om dit te achterhalen, voeren we een post hoc analyse uit. In een post hoc analyse kun je namelijk zien welke groepen nu van elkaar verschillen en welke niet. Dan gebruik je de Levene s test om te bepalen welke post hoc test je moet gebruiken. Als de assumptie niet geschonden is, gebruik je de Tukey. Als deze niet geschonden, maar je hebt geen gelijke groepsgroottes, dan gebruik je de Hochberg. Wanneer je assumptie van homogeniteit geschonden is, gebruik je de Games Howell. In deze analyse kun je dan zien welke groepen significant van elkaar verschillen. Als je meerdere onafhankelijke variabelen hebt (vanaf two-way omhoog), dan vraag je ook altijd de interacties tussen deze variabelen op. Meestal heb je daar ook theoretisch hypothesen over opgesteld en ben je juist geïnteresseerd in de interactie-effecten. In het geval van meerdere onafhankelijke variabelen en interacties kijk je altijd eerst naar de interactie-effecten. Zijn ze significant? Daarna kijk je pas naar de hoofdeffecten.

2 3. het analyseren van de richting van de significant bevonden verschillen. a. Bij het bepalen de richting van de effecten, kijk je naar je sum of squares en naar je post hoc analyse. Zeker met ordinale variabele, zoals opleidingsniveau, kun je dan snel zien wat de richting van het verband is. Is het hoe hoger, hoe meer of hoe lager, hoe meer. Wanneer alle stappen zijn gezet, rapporteer je hierover op een correcte wijze. Zo wordt meestal de hypothese is bevestigd (F(2,15) = 16.88, p <.001) formulering gehanteerd. T-toetsen uitvoeren mag niet, want gaat te snel dingen als significant beschouwen. Je krijgt dan een te grote alfa. Zie sheet. Je gaat kijken naar de spreiding tussen de groepen (groepsgemiddelde) wordt vergeleken met de spreiding binnen de groepen. Spreiding binnen de groepen NL elftal hockey kunnen allemaal ongeveer even ver slaan. Spreiding buiten groepen verschil NL elftal en Nijmegen hockey club m.b.t. verslaan. Als de spreiding tussen de groepen klein is in verhouding tot de spreiding binnen de groepen, concluderen we dat de groepen wat het gemiddelde betreft niet significant van elkaar verschillen. Als de spreiding tussen de groepen groot is in verhouding tot de spreiding binnen de groepen, concluderen we dat de groepen wat het gemiddelde betreft wel significant van elkaar verschillen, dat wil zeggen dat er minstens één gemiddelde afwijkt. SS= sum of squares in de aantekeningen lezen. Heilkelpunt is een grote groep heeft meer invloed dan een kleine groep. Daarom moeten de groepen ongeveer even groot zijn. F < 0.05 dan significant en H0 verwerpen rekensom zie aantekeningen Levene test: 1. Siginificantie van < 0.05 dan h0 verwerpen. 2. Met Levene kijk je of de test homogeen of hetrogeen is. H0 is homogeen = geen verschil in variantie H1 is hetrogeen = wel verschil in variantie 3. Levene static is een soort F Post hoc: 4. Verschil tussen gemiddelde toetsen, welke groepen schelen van elkaar. Tukey homogeen; gelijke groepsgroottes (kolom N) Hockberg Homogen; ongelijke groepsgroottes Games Howell heterogeen. Dan Levene test doen. 5. Uit tabel komt mean differens en significantie. Bij sig. < 0.05 verschilt de groep van elkaar. In het hoorcollege en het boek van Hair is gesproken over covariaten. Leg in je eigen woorden uit wat covariaten zijn en waarom het belangrijk kan zijn om deze bij het uitvoeren van variantieanalyse mee te nemen. Tot nu toe hebben we gesproken over onafhankelijke variabelen die categorisch zijn. Soms is het echter zo dat je als onderzoeker wilt controleren voor metrische onafhankelijke variabele. Je wilt er namelijk zeker van zijn dat je gevonden effecten echt zijn en niet eigenlijk worden veroorzaakt door een andere variabele. Leeftijd is bijvoorbeeld een variabele die veel variantie van de afhankelijke variabele kan wegnemen. Door deze variabele als covariaat mee te nemen in je analyse, zorg je ervoor dat de hoofdeffecten in je model zo veel mogelijk van de variantie verklaren die over blijft na controle voor je covariaat. De covariaten zijn daarbij altijd van metrische (interval of ratio) meetniveau. Het is daarbij van belang dat het covariaat wel samenhangt met de afhankelijke variabele, maar niet met de onafhankelijke! Je wilt dat het covariaat variantie in de afhankelijke variabele verklaart, maar niks te maken heeft met de onafhankelijke factoren. Factor analyse Opdracht 3 vraag 5 nog een keer bekijken. Statistisch, beschrijvend Doel: Latente structuur vinden die ten grondslag ligt aan meerdere items. Data reductie en analyse van gegevens Opzoek naar achterliggend aspect Interdependent Multi dimensionaal, het heeft betrekking op meerdere constructen/dimensies Compositioneel geen vrije keus, maar expliciete vragen met antwoordcategorieën. Komt voor betrouwbaarheidsanalyse Beginnen met correlatie analyse

3 1 analyse, meerdere dimensies onderscheiden Idee is hetzelfde als bij betrouwbaarheidsanalyse: je bent opzoek naar latent kenmerk en bezig met data reductie en interpretatie. Variabele minimaal interval niveau Factoren = componenten= dimensies Hoeft niet te hercoderen, mag wel Stappen plan: 1. Uitgangspunt is correlatiematrix Je moet genoeg waarnemingen hebben per variabele en in elk geval 5 keer zoveel als dat je variabelen hebt. Ideaal is als je 10 waarnemingen per variabele hebt. Je moet er ook zeker van zijn dat factoranalyse de geschikte techniek is. Daarvoor moet je kijken naar de Bartlett s test of sphericity. In het hoorcollege zagen we al dat ook de KMO test hierbij hoort 2. Kies benadering Principale componenten analyse/component analysisalles wordt bij deze vorm verklaard, door de andere variabele in het model. Meer wiskunde/natuurkunde. Alle variatie wordt algemeen of gedeeld verondersteld. Dit model voor factor analyse is het meest geschikt indien: Datareductie een primair belang is, waarbij de nadruk wordt gelegd op het minimaliseren van het aantal factoren dat nodig is om de maximale hoeveelheid totale variantie te verklaren. Aan de hand van kennis die op voorhand bekend is, blijkt dat specifieke en error variantie een geringe hoeveelheid is van de totale variantie. Pricipale factor analyse/common factor Analysis altijd gedeelde variantie, kies je meestal voor. De variantie van elke variabelen kan niet volledig worden verklaard door de andere variabelen in het model; elke variabele heeft een uniek deel. Deze methode is van toepassing als: Het hoofddoel het herkennen van de latente dimensies of constructen in de originele variabelen is. De onderzoeker weinig kennis heeft van de hoeveelheid specifieke en error variantie in de totale variantie en daarom deze variantie wil elimineren. 3. Factor analyse geschikt check op stap 1 KMO -test vergelijkt de correlaties uit de correlatiematrix met de partiële correlaties. Factoranalyse is geschikt indien waarde > 0.50 Bartlett's test of sphericity nulhypothese: alle correlaties zijn 0 factoranalyse is geschikt indien H0 verworpen kan worden, ofwel een significante waarde voor 2 Barlett s test moet significant zijn (p <.05 of.01). 4. Initiële factoren berekenen. Componenten worden zodanig getrokken dat: 1e component extraheert zoveel mogelijk variantie van de oorspronkelijke variabelen (bevat zoveel mogelijk informatie van de oorspronkelijke variabelen) 2e component verklaart zoveel mogelijk van de overgebleven variantie, enzovoort vandaar de term Principale Componenten Analyse of Principal Axis Factoring (principaal=belangrijkst/voornaamst) Componenten staan (in deze fase) loodrecht op elkaar (orthogonaliteit) 5. Bepaal aantal factoren totale verklaarde variantie moet rond de 0.60 liggen. Maar minst belangrijkste eis. De eigenwaarde moet hoger zijn dat 1, dit is de belangrijkste eis. Dubbellader laat hoog op meerdere factoren, verschil < 0.20 de kleinste dubbellader als eerste eruit halen. Maar houdt de theorie in de gaten 6. Roteer de initiële oplossing blz 123 t/m 125 Doel: verhogen interpreteerbaarheid van factoren. 2 vormen:

4 Orthogonaal: (varimaxx) onafhankelijk factoren loodrecht op elkaar Obliqueroteren: altijd doen om te kijkn naar factoren samenhang. Dit moet je doen als 1 waarde boven de 0.3 zit in de factor correlatie matrix. Als het niet tussen de. En de.. zit dan nog een keer orthogonaal roteren. 7. Benoemen factoren Bepaal voor elke factor welke variabelen het hoogst laden (het gezicht van de factor bepalen) en geef op basis van deze variabelen een label aan de dimensie. 8. score per respondent Iteratief proces, je kijkt of het goed gaat aan de hand van de volgende vragen 1. Scoren KMO en Bartlett voldoende? 2. Aantal factoren: De keuze voor het aantal factoren kan op meerdere statistieken worden gebaseerd, namelijk eigenwaarde/ eigenvalue, scree plot en verklaarde variantie. De eis aan de eigenvalue is dat deze groter is dan 1 (eigenvalue > 1). De scree plot stelt dat de plek waarop de knik zit de laatste factor is die je nog meeneemt (meestal levert deze techniek een factor meer op). Tot slot de verklaarde variantie; deze zou rond de 60% moeten zitten (of hoger uiteraard). Maar dit is niet de meest belangrijke methode, de andere twee zijn belangrijker. Wanneer de keuze meer conceptueel is, zijn er geen duidelijke statistieken. Je laat je dan in elk geval adviseren door bovenstaande criteria. 3. Type rotatie; door Oblique te roteren bij je oplossing krijg je een factor correlatie matrix. Wanneer correlaties hoger dan.30 of lager dan -.30 zijn, is Oblique roteren gerechtvaardigd. Wanneer dat niet zo is, wordt Varimax gebruikt, Orthogonaal rotatie. 4. Zijn er items met communaliteiten onder de.20? Zo ja, dan verwijderen. Dit gebeurt één voor één (na verwijdering telkens eerst opnieuw analyseren) 5. Zijn er (in de factor matrix na rotatie) dubbelladers (verschil van minder dan.20)? Zo ja, dan mogelijk verwijderen. 6. Interpretatie van de factoren: zijn de factoren te interpreteren en komt deze interpretatie in de buurt van de vooraf bedachte interpretatie? Verschil tussen betrouwbaarheidsanalyse en factor analyse: betrouwbaarheidsanalyse een unidimensionele schaaltechniek. De verschillende items worden teruggebracht tot een schaal. Factoranalyse is echter (meestal) multidimensioneel. Verschillende items worden op een bepaalde manier samengebracht, zodat er (mogelijk) meerdere factoren (schalen) ontstaan. Daarnaast kun je nog zeggen dat hoewel beide technieken de correlatiematrix als uitgangspunt hebben, ze beide andere manieren (formules) gebruiken om tot een oplossing te komen. Bij betrouwbaarheidsanalyse kijk je naar de mate van interne consistentie en bij factoranalyse naar factorladingen. Betrouwbaarheids analyse Uni dimensionaal, het heeft betrekking op 1 construct/dimensie Doel: Latente structuur vinden die ten grondslag ligt aan meerdere items. Data reductie en analyse van gegevens Interdependent Komt na factor analyse Kan maar voor 1 latent kenmerk Respons set voorkomen Hoge score betekent hoge latent kenmerk, dus iedere vraag moet met neus dezelfde kant op staan. Combrachs alfa = maat interne consistentie Hoe meer items, hoe hoger alfa Op grond van welke criteria beslis je bij betrouwbaarheidsanalyse of een schaal voldoende betrouwbaar is? Bij betrouwbaarheidsanalyse kijken we naar de Cronbachs alfa. Een alfa van boven de.85 wordt als een goede (betrouwbare) schaal gezien. Een alfa van minder dan.60 wordt als onvoldoende betrouwbaar gezien. Alle waarden ertussen zijn redelijk tot goed. Deels is de interpretatie van de alfa afhankelijk van de hoeveelheid items. Wanneer we maar weinig items hebben (<10), mag de alfa wat lager zijn (in principe niet onder de.60). Wanneer je veel items hebt (>10), moet de alfa hoog zijn (boven de.80 of.85). Iteratief: schakel tussen data en theorie, en 1 voor 1 verwijderen

5 In spss is een functie waar staat alfa stijgt als dit item wordt verwijderd. Wanneer item verwijderen? Als stijging hoger is dan Stijging lager dan 0.01 dan nooit verwijderen Hoe hoger alfa, hoe beter het klopt Beginnen met correlatie analyse Sheet 13 hc6 Vervolgens meetschalen maken Item niet verwijderen als theorie zegt dat het erbij hoort. Je kunt de keuze voor somscores of factorscores baseren op meerdere criteria (zie bv. Rules of Thumb 3-8 op p140 van Hair). In het hoorcollege is aangegeven dat factorscores worden gebruikt bij Oblique rotatie en somscores bij Orthogonale rotatie. We voegen daar hier aan toe dat somscores vaak makkelijker te interpreteren zijn (vooral als je weinig items hebt) maar in ieder geval dichter bij de oorspronkelijke scores blijven. Gemiddelde scores zijn het makkelijkst te interpreteren, aangezien je op die manier de range van de oorspronkelijke antwoordcategorieën terugkrijgt en bij Likert items, waar 5 antwoordalternatieven mogelijk waren, een gemiddelde score van 3 terug verwijst naar de (meestal) neutrale categorie in de antwoordmogelijkheden. Om die reden kiezen we hier voor somscores of gemiddelde scores. Correspondentie analyse Multidimensionale techniek Interndependent Analyse van gegevens Doel: het inzicht te verkrijgen in de samenhang ( correspondentie ) tussen kolom- en rijcategorieen van een kruistabel door deze samen af te beelden in een visuele presentatie. Aan de hand van deze visuele presentatie kunnen eventuele dimensies die de samenhang tussen kolommen en rijen verklaren, worden geïnterpreteerd. Hierbij wordt gestreefd naar een zo interpreteerbaar en zuinig (= klein aantal dimensies) mogelijk interpretatie. Kruistabellen, contigentie tabellen Explorerende techniek, dus geen hypothese toetsing Compositioneel Geen vrije keuks, maar expliciete antwoord categorieën. Zo min mogelijk dimensies, complexen tabellen reduceren Bourdieu ff goed bekijken, lang over gegaan in college. Gebruik maken van chi-kwardraat toets. o Hoe hoger (Fe-Fo)2 hoe meer het brijdraagt aan chi-kwardraat toets. o Fe < Fe = veel correspondenten = + teken??? 1. Actual sales lower than expected negatieve samenhang o Fe> Fo = weinig correspondenten = - teken??? 2. Actual sales higher than expected positieve samenhang. o Fe = rijtotaal x kolomtotaal / totaal = verwachte totaal o Fo =?? geobserveerde?? Samenhang in categorieën weergeven. 6 stappenplan 1. doel Welk doel voor ogen? datareductie Relatie tussen rij- of kolomcategorieën Relatie tussen rij- en kolomcategorieën Vooraf bedenken welke objecten je nodig hebt benadering: compositionele methode; vgl. factoranalyse welke dataverzameling 2. onderzoeksontwerp 3. assumpties Heel weinig, maar wel vergelijkbare objecten alle attributen let op: CA biedt géén significantietoetsen, het is een explorerende analyse, geen toetsende soms kun je door exploratie gevonden verbanden gaan na-toetsen Chi kwardraat toets. Om de samenhang in een kruistabel te toetsen, gebruiken

6 we een χ2-toets. Deze toetst de nulhypothese dat er geen samenhang bestaat tussen de twee variabelen in de kruistabel tegen de alternatieve hypothese dat er wel samenhang bestaat. We verwerpen de nulhypothese als de overschrijdingskans bij een berekende χ2-waarde kleiner is dan het vastgestelde significantieniveau (p < α). 4. analyse uitvoeren en fit beoordelen Fit beoordelen aan de hand van wortel inertia en eigenwaarde 5. interpretatie resultaten 6. validering resultaten Geen likert schalen etc. maar kruistabellen. Singel value: hoger dan wortel inertia = singervaleu 2 = > 0.04 De goede dimensie is degene waar de puntjes het grootste/meeste stuk innemen. Verschil met factor analyse: o Factor analyse werkt met antwoordschalen en CA met frequenties o Factor analyse meer vuistregels o CA zelf dimensie interpreteren. Correspondentieanalyse is gebaseerd op een kruistabel. Beschrijf op welke vier manieren je variabelen kunt combineren om een kruistabel voor correspondentieanalyse te maken. Om correspondentieanalyse te kunnen gebruiken, moeten de data op een bepaalde manier worden geprepareerd. Het bestand muziek_tabel2.sav is hier een voorbeeld van. Een dergelijk bestand is op vier manieren samen te stellen: 1. Je neemt een eenvoudige, bivariate kruistabel als uitgangspunt en zet deze om naar het format zoals omschreven in het hoorcollege en gedaan in muziek_tabel2.sav. De rijen bevatten dan categorieën van de ene variabele en de kolommen van de andere variabelen (bv. opleidingsniveau tegenover een muzieksoort). 2. De vergelijkt een set objecten niet op een kenmerk, maar op meerdere kenmerken. De rijen bevatten dan de objecten (bv. laag opgeleiden, middelbare opgeleiden, hoog opgeleiden) en de kolommen meerdere muzieksoorten. In de rijen staat dus een variabele, in de kolommen staan meerdere variabelen. 3. Een variant op optie 2 is dat je meerdere objecten vergelijkt op een kenmerk. Je neemt naast opleidingsniveau bv. ook inkomen mee en vergelijkt deze objecten op een muzieksoort. De rijen bevatten nu dus categorieën van meerdere variabelen en de kolommen van een variabelen. 4. De laatste mogelijkheid is een combinatie van 2 en 3: je vergelijkt meerdere objecten op meerdere kenmerken (ook wel multipele correspondentieanalyse genoemd), bv. opleidingsniveau en inkomen op meerdere muzieksoorten. Bij het uitvoeren en interpreteren van correspondentieanalyse let je op de volgende zaken: a. De fit van de oplossing. De totale inertia is een maat voor de verklaarde variantie van de oplossing. Dit is een indicatie van de verklaringskracht van de dimensies die getrokken zijn. b. Het aantal dimensies. Je bepaalt het aantal dimensies aan de hand van een combinatie van statistische en inhoudelijke criteria. In principe neem je dimensies met een singular value > 2 mee. Deze moeten echter wel inhoudelijk te interpreteren te zijn (ondersteuning vanuit theorie?). Het kan ook voorkomen dat je een dimensies die statistisch (net) niet bijdraagt aan de oplossing toch inhoudelijk erg sterk is en dat je deze daarom meeneemt. Verder neem je bij voorkeur zo min mogelijk dimensies mee (maximaal 2 a 3). c. Interpretatie. Je kunt inzicht verkrijgen in de correspondentie tussen de rijen en kolommen door naar de afstanden tussen de categorieën te kijken: hoe kleiner de afstand, hoe groter de correspondentie. Hetzelfde principe kun je toepassen bij het interpreteren van de dimensies. Over een twee-dimensioneel plaatje mag je een loodrecht assenstelsel leggen. Categorieën of combinaties van categorieën die bij de extremen van de assen liggen, geven inzicht in de betekenis van die assen (= dimensies). Verschillende cijfermatige uitkomsten uit de analyse kunnen ook helpen bij het benoemen van de dimensies. De massa geeft het gewicht c.q. het belang van een categorie in de oplossing aan. De overzichten van de row points en column points geven aan hoe de dimensies en de categorieën aan elkaar gerelateerd zijn. Zo geeft de kolom contribution of point to inertia of dimension aan hoe zwaar een categorie meetelt in een dimensie. Deze waarden zijn vergelijkbaar met factorladingen in factoranalyse en maken interpretatie van de dimensies makkelijker.

7 Multiple regressie analyse Interval meetniveau Analyse van gegevens dependent Statisch verklarend Stappenplan: 1. Hypothetiseren regressie coëfficiënt 2. Schat basismodel Doel: na gaan in hoeverre aanpassingen door schendingen van assumpties substantiële verbeteringen opleveren. 3. Check verdeling variabele Scheefheid van variabele o Maten van symmetrie bepalend voor onderschatting van werkelijke correlatie o Gewenste situatie bij benadering symmetrisch verdeeld. (klokvorm) o Symmetrisch heeft twee eigenschappen Scheefheid Skewness > 2 keer standaard error dan scheef Steilheid Kurtosis> 2x standaard error dan steil/plat. Als het afwijkt dan heb je vier mogelijkheden om het op te lossen. Inverse, worteltrekken, logaritme en kwadraten. Deze vier vormen zorgen voor meer symmetrie. 4. Check model assumpties Interval meetniveau Afhankelijk variabele niet repareerbaar Onafhankelijke variabele wel repareerbaar Dichomtome variabele is interval. Want tussen de twee afhankelijke zit evenveel ruimte en rangorde. Wanneer je van een variabele een dichtome variabele maakt, noem je dat een dummy variabele. Lineariteit is strikte eis! Nog niet helemaal duidelijk Relatie tussen on- en af- hanekelijke lineir anders onzuivere schatting. Eerst kijken naar de scheefheid van de afhankelijke variabele. Polynome termen variable in kwardraat. Polynome is ander woord voor kwardraat. De macht min 1 is het aantal knikken waarvoor gecorrigeerd wordt. Je moet de hoogste macht bepalen die significant is. En alles wat daaronder zit neem je mee. Dus X3 = significant, dan neem je ook X2 en X mee. Multicollineariteit wil je niet Relatie tussen onafhankelijke Correlatie tussen onafhankelijke variabele re hoog slecht Gevolg schending standaard error, een misschatting van standaard error = misschatting van significantie. Kijken naar tolerantie waarden 1. Zegt niet proportie verklaarde variantie, maar 1- proportie verklaarde variantie. 2. < 0.25 alert worden; < 0,10 serieus probleem. Van oorspronkelijke x- xgem en xgem = 0. Die moet je gaan kwadrateren. Dus oorspronkelijke x centreren rondom gemiddelde 0. Dan haal je multicollineariteit eruit. Oplossing: het verwijderen of samenvoegen van onafhankelijke variabele. Homoscedasticiteit wil je wel Spreiding tussen groepjes ongeveer gelijk. 1. Levene test, anders geen eerlijk vergelijk mogelijk Plotjes bekijken of er structuur inzit Geschatte regressiewaarden / SE = t- waarde Oplossen: Transformeren van scheve/platte/steile variabelen (vooral de afhankelijke variabele) OF Toepassen van Weighted Least Squares (WLS) (behoort niet tot de stof)

8 5. Schat definitieve model 6. Evalueer het model Bruikbaarheid hele model (F-toets) Significantietest regressiecoëfficiënten Determinatie coëfficiënt R2 7. Interpreteer bevindingen Gebruik methodes ordinaire least square. o Schatting van coëfficiënt o Recht lijn o BLEU Best Linear Unbiases Estimated Zuiverheid Efficientie standaard error rondom significantie (om significantie te bepalen) Dummy variabelen zijn hercoderingen van een nominale of ordinale variabele die je als onafhankelijke variabele in een regressieanalyse wilt meenemen. Door voor iedere categorie van een nominale of ordinale variabele een dummy aan te maken met codering 0/1 kun je die variabele als het ware een interval karakter geven en toch meenemen in een regressieanalyse. o Interpreteren van dummy variabele? Het opnemen van dummy variabelen geeft inzicht in de verschillen in groepsgemiddelden. De t-toets (t-waarde en bijbehorende p-waarde) geeft aan of de b-waarde van een dummy variabele significant van 0 afwijkt. De b-waarde geeft aan wat het verschil in gemiddelde is van de categorie waar die dummy voor staat ten opzichte van de referentiecategorie, onder controle van de overige variabelen in het model (voorbeeld hoorcollege: het verschil in gemiddelde omzet tussen de clothing en de electronics branche, onder controle van het aantal werknemers en de veranderingen die het bedrijf heeft ondergaan). o Waarom is gestandaardiseerde regressiecoëfficiënt van dummyvariabele en polynome termen niet goed interpreteerbaar? Gestandaardiseerde regressiecoefficienten (symbool β) geven aan met hoeveel standaarddeviaties de afhankelijke variabele toe- of afneemt als de betreffende onafhankelijke variabele met een standaarddeviatie toeneemt, onder controle van de overige variabelen. De gestandaardiseerde regressiecoefficienten van dummy variabelen en polynome termen zijn niet te interpreteren, omdat deze variabelen samen verwijzen naar een onderliggende variabele. Daarmee is het niet mogelijk om bv. de β van variabele x te interpreteren onder controle van variabele x2. x en x2 zijn immers aan elkaar gerelateerd. Eenzelfde redenering geldt voor dummy variabelen. OPLOSSING: Door een compound variabele aan te maken voeg je een set dummy variabelen of polynome termen weer samen tot een variabele. Die sets vervang je in een nieuwe regressieanalyse door de compound. De β die bij de compound hoort, geeft nu wel het relatieve belang weer van de onderliggende variabele, omdat je het effect nu wel onder controle van de andere variabelen kunt interpreteren. Compoun variabele: Vanuit het hoorcollege kennen we enkele checks voor de analyse met compounds, zodat we weten of het goed is gegaan of niet. o De b-waarden van de compound moeten 1 zijn. o De b-waarden van de andere variabelen en de R2 moeten gelijk blijven. Wat is representativiteit en waarom is representativiteit belangrijk? Een steekproef is representatief op het moment dat dezelfde kenmerken worden vertoond als de populatie waar de steekproef uit getrokken is. Meer concreet houdt representativiteit in dat de verdeling van de onderzochte variabelen in de steekproef hetzelfde is als in de populatie. Representativiteit is van groot belang voor de generaliseerbaarheid van de onderzoeksresultaten. Als bepaalde groepen in de steekproef onder- of oververtegenwoordigd zijn in de steekproef, dan mogen de onderzoeksresultaten niet zonder meer van toepassing worden verklaard op de populatie. De representativiteit van de steekproef heeft dus consequenties voor de externe validiteit van het onderzoek. Welke analysetechnieken kun je gebruiken om de representativiteit na te gaan? Maak hierbij onderscheid tussen beschrijvende en toetsende technieken en geef aan met welke SPSS procedures je deze technieken kunt uitvoeren.

9 Om een uitspraak te kunnen doen over de representativiteit moeten we de verdelingen van variabelen in de steekproef vergelijken met de populatieverdelingen. Dat betekent dus dat we moeten beschikken over populatiegegevens. De meest basale manier om een verdeling in steekproef te bestuderen, is het analyseren van een frequentietabel. Voor variabelen van interval en ratio meetniveau wordt een frequentietabel snel onoverzichtelijk. Dan kan ook worden gekozen voor grafische weergavemethoden als het histogram of een stam-en-blad diagram. De verdelingen van de variabelen in de steekproef zijn dan op het oog te vergelijken met de populatieverdelingen. In SPSS is het een en ander op te vragen via Analyze _ Frequencies. Als we met meer zekerheid uitspraken willen doen over de representativiteit van een steekproef, dan moeten we specifiek toetsen op representativiteit. Die zekerheid drukken we bij toetsing uit met α (het significantieniveau). Of een verdeling van een nominale of ordinale variabele (bv. geslacht of opleidingsniveau) overeenkomt met de populatieverdeling is te toetsen met behulp van een unidimensionele chi2-toets. Deze procedure is te benaderen via Analyze _ Nonparametric Tests _ Chi-Square. Voor variabelen van interval of ratio niveau (bv. leeftijd of gewicht) kan gebruik worden gemaakt van een z- of t-toets (Analyze _ Compare Means _ One Sample T-Test). Bij het uitvoeren van de toets op representativiteit die je bij vraag 5 hebt uitgevoerd, heb je waarschijnlijk een significantieniveau gehanteerd van 30%, zoals dat in het hoorcollege is aangegeven. Soms wordt bij een toets op representativiteit uitgegaan van een nog hoger significantieniveau van bv. 85%. Bij de meeste andere statistische toetsen kies je je alfa zo laag mogelijk, bv. 1% of 5%. Leg uit waarin de uitgevoerde representativiteitstoets verschilt van andere statistische toetsen en waarom een hoger significantieniveau hierbij gerechtvaardigd is. Betrek in je antwoord het onderscheid tussen de type I en type II fout. Een type I fout treedt op wanneer H0 wordt verworpen, terwijl H0 feitelijk waar is. De keuze om H0 te verwerpen wordt beïnvloed door het gestelde significantieniveau (alfa). In veel gevallen heeft deze een waarde van.05. Hoe lager de alfa waarde wordt gesteld, hoe moeilijker het wordt om H0 te verwerpen. De kans dat H0 foutief wordt verworpen, wordt dus kleiner wanneer de gestelde alfa zo klein mogelijk is. Een type II fout vindt plaats wanneer H0 wordt aangehouden, terwijl deze eigenlijk onwaar is. De kans op deze fout kan niet door middel van een zelf gestelde grens worden bepaald. De kans op een type II fout drukken we uit met beta waarde en hangt samen met de gestelde alfa: hoe hoger de gekozen alfa, hoe lager de beta. Bij de meeste statistische toetsen wil je de kans op een type I fout zo klein mogelijk houden. Doorgaans heb je immers hypothesen die gaan over een verschil, een verandering of een correlatie. Je wilt niet te snel de nulhypothese dat er geen verschil, geen verandering of geen correlatie is verwerpen en het risico lopen dat de nulhypothese toch waar is (= de definitie van een type I fout). Bij de uitgevoerde representativiteitstoetsen wil je juist dat de nulhypothese opgaat. Je wilt te snel de nulhypothese behouden, terwijl deze eigenlijk niet waar is. Ofwel, je wil de kans op een type II fout minimaliseren. De kans op een type II fout (beta) hangt van verschillende zaken af (zie Hair, 2006, pp. 9-13), waaronder van de gekozen alfa. Hoe hoger de gekozen alfa, hoe lager de waarde voor beta. Om die reden kiezen we hier voor de hogere alfa waarde van 30% en wordt soms gewerkt met nog hogere waarden, bv. 85%. Dit sluit beter aan bij het doel dat we nastreven bij het toetsen van representativiteit. Wat verstaan we onder datacleaning? Welke specifieke activiteiten verricht je daarbij? Geef tevens aan met welke analysetechnieken en procedures je die activiteiten kunt realiseren in SPSS. Nadat er enquêtes afgenomen zijn bij de respondenten moet de onderzoeker de verkregen data overzetten in SPSS. Tijdens het overzetten van de gegevens kunnen er allerlei fouten optreden. Wanneer de data in SPSS staat moet de onderzoeker zich ervan vergewissen dat de data goed is. Hij zal de data moeten bekijken en eventuele fouten of slordigheden moeten corrigeren. Allereerst kijkt de onderzoeker of alle gegevens in de datamatrix kloppen. Dat doet hij door middel van vier stappen: Codes Missings declareren Routings Response set (zie bijlage 1) Daarna zal hij een missing value analyse uitvoeren. Om de data nader te bekijken, kun je een aantal stappen doen. Je kunt frequentietabellen draaien van je variabelen en kijken of je fouten of slordigheden zit. Je zou ook kruistabellen kunnen draaien en kijken of je daar opmerkelijke zaken ziet.

10 Een andere manier is te kijken naar je meta-data (data over je data). Dit doe je door te kijken in net tabblad Variable View. Hier kun je de meta-data aanpassen bij geconstateerde fouten en slordigheden. Kortom, datacleaning wordt gebruikt om de verkregen data op te schonen, te controleren en goed weer te geven in een statistisch programma, waarna begonnen kan worden aan statistische procedures. Wat verstaan we onder response set? Licht toe wat de consequenties van response set kunnen zijn en hoe je hiermee kunt omgaan. Wanneer respondenten op een bepaalde systematische manier de vragen niet serieus invult, zodanig dat dit ten koste gaat van de validiteit van de meting. Wanneer bijvoorbeeld een aantal Likert-items vragen achter elkaar gevraagd worden, kan het zijn dat respondenten een patroon laten zien zonder dat het inhoudelijk (meet je wat je wil meten) logisch is. Er zijn verschillende oorzaken die kunnen leiden tot response set, een voorbeeld is dat de respondent geen zin heeft of geïrriteerd is geraakt door de lang durende enquête dat hij snel overal sterk ja invoert zonder de vraag te lezen. Wanneer je als onderzoeker te maken hebt met respondenten met een verdacht response set moet je maatregelen treffen. Een response set beïnvloedt namelijk je validiteit, meet ik wat ik wil meten. Wanneer je een response set hebt waargenomen moet je kijken of het inhoudelijk (kijken naar de vragen) inconsistent is. Hierna zal je als onderzoeker moeten kijken naar wat de omvang is van het aantal respondenten, is deze laag zou je ze bijvoorbeeld kunnen verwijderen of de betreffende variabelen missing maken. Wat verstaan we onder missing value analyse en waarom is missing value analyse van belang? Met missing value analyse gaat de onderzoeker kijken of er in de ontbrekende scores op variabelen samenhang te vinden is. Het is van belang om te onderzoeken welke processen hebben geleid tot missing data, zodat de juiste stappen kunnen worden ondernomen om om te gaan met missing data. Een onderscheid kan gemaakt worden tussen random en non-random missing data. Random betekent dat de missing scores willekeurig over de respondenten en vragen voorkomen. Non-random betekent dat er onderliggende patronen aanwezig zijn tussen missing data en andere vragen. Missing data heeft praktische consequenties, namelijk dat de steekproefgrootte kan worden aangetast en dus ook de statistische power. Ook de geldigheid van uitspraken die over de onderzoekseenheden worden gedaan kan worden aangetast. Welke stappen zet je bij het uitvoeren van missing value analyse? Geef voor elke stap welke keuzes je bij die stap maakt en waar je die keuzes op baseert. Hair beschrijft zeer gedetailleerd welke stappen er genomen dienen te worden bij Missing Value Analysis (MVA). De stappen die hij beschrijft zijn (Hair p. 53): Stap 1: type missing data vaststellen Bij deze stap onderzoek je of je de missing data negeerbaar is. Hair geeft drie voorbeelden van negeerbare missing data, namelijk: non-response/steekproef; routings en censored data/ontwerp. Naast negeerbare missing data heeft de onderzoeker ook vaak te maken met data dat niet te negeren is. Hair onderscheidt twee categorieen niet negeerbare data; te verklaren missing processen en onverklaarbaar missing processen. Met de niet negeerbare missing data zal de onderzoeker aan de slag moeten. De volgende stappen zijn nodig om accurate remedies te kiezen om met de missing data om te gaan. Stap 2: omvang van de missing data vaststellen Hoeveel respondenten blijven erover voor de analyse van je data? Hier dien je te kijken naar het percentage van variabelen met missing data voor elke respondent en naar het aantal respondenten met missing data voor elke variabele. Missing data lager dan 10% is te verwaarlozen mits de data random is (zie ook Hair p.55). Hair geeft aan dat de onderzoeker moet kijken of respondenten dan wel variabelen verwijderd kunnen worden wanneer deze buitensporig hoge missings hebben. Stap 3: nagaan of de missing data random zijn Nadat de onderzoeker heeft vastgesteld dat de omvang van missing data groot is moet er gekeken worden of de missing data randorm is. Er zijn twee soorten van random data, namelijk: MCAR: missing completely at random. MAR: missing at random. Het soort van random data geeft straks aan welke substitutiemethodes je kan gebruiken. Met andere woorden welke methoden je mag gebruiken om de missing data te vervangen door een gekozen score.

11 De volgende tests in SPSS moeten gedaan worden om MCAR dan wel MAR vast te stellen: MAR: hierbij ga je voor elke variabele die je wilt onderzoeken verdelen in twee groepen. Een groep met alle respondenten die een geldige score hebben en een groep met respondenten met een missing op die variabele. SPSS draait een tabel uit met in de rijen de variabelen met de twee groepen en in de kolommen de variabelen met in de cellen een aantal gegevens. Voor elke combinatie van variabelen wordt een t-toets uitgevoerd. Hair geeft aan dat wanneer een t-toets significant is dit een teken kan zijn voor MAR (let op: metrische data). De onderzoeker moet in de tabel zoeken naar consistente patronen om aan te kunnen geven dat de data MAR is (Hair, p.57). Voor niet metrische data kunnen kruistabellen worden bestudeerd om te zoeken naar patronen in missing data. MCAR: de tweede manier is om een algehele chi2-toets uit te voeren om te kijken of het MCAR is. Wanneer deze toets niet significant is, dan hebben we te maken met MCAR. Om een uitspraak te kunnen doen of de missing data MAR dan wel MCAR is, gebruik je alle informatie die je voorhanden hebt. Het antwoord wordt gebaseerd op de volgende drie informatiebronnen: Is het aantal missing groter dan 10%? (stap 2) Is er een systematisch patroon te herkennen in de tabel? (stap 3: MAR test) Is de toets voor MCAR significant of niet? (stap 3: MCAR test) Stap 4: substitutie methode kiezen en uitvoeren MAR: Modelling Based Approaches MCAR: Missing data vervangen en Missing data niet vervangen. (zie verder Hair p.58) Validiteit: De mate waarin de gemeten kenmerken daadwerkelijk de kenmerken zijn van de ondezochte objecten (systematische of random error). Betrouwbaarheid: De mate waarin de metingen van de kenmerken dezelfde resultaten oplevert als het onderzoek onder dezelfde omstandigheden zou worden herhaald. Bruikbaarheid: De mate waarin de onderzoeksresultaten goed aansluiten bij het probleem van de opdrachtgever, ofwel die daadwerkelijk kunnen bijdragen aan de oplossing van een praktijkprobleem. AANTAL ONDERZOEKS- AANTAL OBJECTEN VARIABELEN OVERIGE KENMERKEN SURVEY groot groot - matige controle - arbeidsextensief - breed - kwantitatieve analyse - gesloten dataverzameling - een of meer meetmomenten EXPERIMENT klein klein - matig tot sterke controle - gericht op causale relaties - uitgekiend ontwerp CASE STUDY klein variërend - weinig controle - arbeidsintensief - triangulatie - diep - een of meer meetmomenten / tijd - waarneming op locatie BUREAU- ONDERZOEK (secundaire variërend variërend - bestaand materiaal - meestal geen direct contact met onderzoeksobject - geringe dataverzameling analyse) - variërende controle - elementen uit andere designs

12 DESIGN ANALYSEMODEL PRE- EXPERIMENT ECHT- EXPERIMENT QUASI- EXPERIMENT one shot case study one group pretest-posttest static group pretest-posttest control group posttest only control group solomon four group design timeseries multiple time series Zie sheet 15 Opstellen vragenlijst: stappen 1. Specificeer de benodigde informatie 1. De variabelen die nodig zijn om de onderzoeksvraag te beantwoorden. 2. Kies een adequate dataverzamelingstechniek. 1. Observatie participerend / niet- participerend 2. Inhoudsanalyse kwantitatief / kwalitatief 3. Enquête/Interview schriftelijk (post, , web) persoonlijk (traditioneel, CAPI) telefonisch (traditioneel, CATI, gsm) 3. Kies de inhoud van de vragen 1. Is de vraag noodzakelijk? 2. Is er meer dan 1 vraag nodig? 4. Bedenk of de respondent de vragen kan beantwoorden 1. Is de respondent geïnformeerd? 2. Kan de respondent het zich herinneren? 3. Kan de respondent de vraag beantwoorden? 5. Bedenk of de respondent de vragen wil beantwoorden 1. Inspanning voor de respondent 2. Context 3. Legitimatie van het doel 4. Gevoelige informatie 5. Verhoog bereidheid (incentive) 6. Kies adequate structuren voor de vragen 1. Open vragen 2. Gesloten vragen 3. Single/multiple respons 4. Dichotome vragen 5. Schaal items (bijvoorbeeld Likert) 7. Kies adequete formuleringen (inclusief verbingsteksten) 1. Gebruik gewone woorden 2. Gebruik eenduidige woorden 3. Vermijd impliciete veronderstellingen 4. Vermijd generalisaties en schattingen 5. Gebruik positieve en negatieve stellingen 8. Kies een adequate volgorde voor de vragen en 9. adequate lay out. 1. Openingsvragen 2. Type informatie 3. Moeilijke vragen 4. Effect op volgende vragen 5. Logische volgorde 6. Routings 7. Rustige en overzichtelijke vormgeving 9. Test de vragenlijst 1. Test je vragenlijst altijd bij een of enkele personen die tot de beoogde populatie behoren en/of laat de vragenlijst checken bij experts

13 non-respons: dat deel van de onderzoekseenheden in de steekproef van wie uiteindelijk geen bruikbare gegevens beschikbaar zijn, onder meer door weigeringen populatie: het totaal van objecten waarop een onderzoek betrekking heeft en waarover een uitspraak wordt gedaan representativiteit: de mate waarin de onderzochte steekproef beschouwd kan worden als een adequate vertegenwoordiging van de populatie waarover het onderzoek handelt selectiviteit: de steekproef vormt geen representatieve afspiegeling van de beoogde populatie steekproef: gedeelte uit een (operationele) populatie op basis waarvan uitspraken kunnen worden gedaan over de populatie waaruit de steekproef is getrokken aselect: steekproef waarbij de objecten zijn gekozen volgens een toevalsprocedure validiteit: de mate waarin gemeten wordt wat je beoogt te meten. externe: reikwijdte of generaliseerbaarheid van conclusies naar populaties (en andere omstandigheden) interne: kwaliteit van de conclusies van een onderzoek weging: representativiteit van een steekproef verbeteren om die zo meer op de populatie te laten lijken. Onderzoekseenheden worden gewogen als in een steekproef groepen over- of ondervertegenwoordigd zijn t.o.v. de populatie. Nog doen: we mogen de missing data beschouwen als MCAR (Hair, p.53 en 55). o MAR (modeling approach erg pittig): maximum likelihood estimation (EM) missing data gezien als subset van de steekproef o MCAR: listwise deletion pairwise deletion mean substitution voor het geheel voor subgroepen regression techniques Eventueel bijlage opdracht 2 bekijken. Wat is power precies; aantal respondenten bij analyses nog meer?? Rules of thump???

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Samenvatting Nederlands

Samenvatting Nederlands Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

DATA-ANALYSEPLAN (20/6/2005)

DATA-ANALYSEPLAN (20/6/2005) DATA-ANALYSEPLAN (20/6/2005) Inleiding De manier waarop data georganiseerd, gecodeerd en gescoord (getallen toekennen aan observaties) worden en welke technieken daarvoor nodig zijn, dient in het ideale

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze

Regressie-analyse doel menu hulp globale werkwijze aandachtspunten Doel: Voor de uitvoering in SPSS: Missing Values Globale werkwijze Regressie-analyse Regressie-analyse is gericht op het voorspellen van één (numerieke) afhankelijke variabele met behulp van een of meerdere onafhankelijke variabelen (numerieke en/of dummy-variabelen).

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011 Meten: algemene Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011 OPZET College 1: Algemene College 2: Meting van attitudes (ISSP) College 3: Meting van achtergrondvariabelen via MTMM College 4:

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens

Waar waren we? Onderzoekspracticum BCO ANALYSEPLAN. Soorten gegevens. Documentatie. Kwalitatieve gegevens. Coderen kwalitatieve gegevens Waar waren we? BCO ANALYSEPLAN Harry Ganzeboom 14 april 2005 Probleemstelling, deelvragen, theorie Definities, conceptueel model Hypothesen Onderzoekzoeksopzet, operationalisatie Dataverzameling Data-analyse

Nadere informatie

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden een handreiking 71 hoofdstuk 8 gegevens analyseren Door middel van analyse vat je de verzamelde gegevens samen, zodat een overzichtelijk beeld van het geheel ontstaat. Richt de analyse in de eerste plaats

Nadere informatie

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid 65 56 83 68 64 47 59 63 93 65 75 68 68 51 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 7 1. Een onderzoeker wil nagaan of de fitheid van jongeren tussen 14 en 18 jaar (laag, matig, hoog) en het geslacht (M, V) een

Nadere informatie

Beschrijvende statistieken

Beschrijvende statistieken Elske Salemink (Klinische Psychologie) heeft onderzocht of het lezen van verhaaltjes invloed heeft op angst. Studenten werden at random ingedeeld in twee groepen. De ene groep las positieve verhaaltjes

Nadere informatie

College 7 Tweeweg Variantie-Analyse

College 7 Tweeweg Variantie-Analyse College 7 Tweeweg Variantie-Analyse - Leary: Hoofdstuk 12 (p. 255 t/m p. 262) - MM&C: Hoofdstuk 12 (p. 618 t/m p. 623 ), Hoofdstuk 13 - Aanvullende tekst 9, 10, 11 Jolien Pas ECO 2012-2013 Het Experiment

Nadere informatie

Klantonderzoek: statistiek!

Klantonderzoek: statistiek! Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I

SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I SPSS 15.0 in praktische stappen voor AGW-bachelors Uitwerkingen Stap 7: Oefenen I Hieronder volgen de SPSS uitvoer en de antwoorden van de opgaven van Stap 7: Oefenen I. Daarnaast wordt bij elke opgave

Nadere informatie

4.2. Evaluatie van de respons op de postenquêtes. In dit deel gaan we in op de respons op instellingsniveau en op respondentenniveau.

4.2. Evaluatie van de respons op de postenquêtes. In dit deel gaan we in op de respons op instellingsniveau en op respondentenniveau. 4.2. Evaluatie van de respons op de postenquêtes 4.2.1. Algemeen In dit deel gaan we in op de respons op instellingsniveau en op respondentenniveau. Instellingsniveau (vragenlijst coördinator) provincie,

Nadere informatie

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. SPSS is een alom gebruikt, gebruiksvriendelijk statistisch programma dat vele analysemogelijkheden kent. Voor HBO en universitaire

Nadere informatie

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS

College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS College Week 3 Kwaliteit meetinstrumenten; Inleiding SPSS Inleiding in de Methoden & Technieken 2013 2014 Hemmo Smit Overzicht van dit college Kwaliteit van een meetinstrument Inleiding SPSS Hiervoor lezen:

Nadere informatie

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN INLEIDING Als je geïnteresseerd bent in de vraag welke van twee behandelingen of geneesmiddelen het beste werkt, zijn er grofweg twee manieren om dat te onderzoeken: experimenteel en observationeel. Bij

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

Experimenteel en Correlationeel Onderzoek

Experimenteel en Correlationeel Onderzoek Experimenteel en Correlationeel Onderzoek In veel onderzoek is het doel: Het vaststellen van oorzaak-gevolg (causale) relaties Criteria voor causaliteit 1. Samenhang (correlatie, covariantie) 2. Opeenvolging

Nadere informatie

Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009

Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Statistiek 1 Blok 6, Werkgroepopdrachten 11-6-2009 Opdracht 1 Onderstaande tabel bevat metingen aan de opbrengst van rozen bij verschillende mate van stikstofen fosfortoevoer. rozen/snijvak/dag fosfaatniveau

Nadere informatie

Vaardigheden IV Delphine De smet 3 theorielessen 2 practica in groepen per 40, oefenen in SPSS

Vaardigheden IV Delphine De smet 3 theorielessen 2 practica in groepen per 40, oefenen in SPSS Vaardigheden IV Delphine De smet 3 theorielessen 2 practica in groepen per 40, oefenen in SPSS Examen: week 20-24 april: schriftelijk examen met toepassing SPSS, geen open boek, wel sterk toepassingsgericht,

Nadere informatie

tudievragen voor het vak TCO-2B

tudievragen voor het vak TCO-2B S tudievragen voor het vak TCO-2B 1 Wat is fundamenteel/theoretisch onderzoek? 2 Geef een voorbeeld uit de krant van fundamenteel/theoretisch onderzoek. 3 Wat is het doel van fundamenteel/theoretisch onderzoek?

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) KWANTITATIEF TESTEN experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) tips Google Wikipedia MIT 14, 15 stats.stackexhchange.com ander onderzoek dat lijkt op het jouwe experimenteel ontwerp kwantitatieve

Nadere informatie

Ik wil de opdracht van VORIG ACADEMISCH JAAR laten meetellen bij de bepaling van het eindcijfer:

Ik wil de opdracht van VORIG ACADEMISCH JAAR laten meetellen bij de bepaling van het eindcijfer: VOORBLAD VOOR EEN SCHRIFTELIJK TENTAMEN/TOETS Vaknaam: METHODEN VAN BEDRIJFSECONOMISCH ONDERZOEK Vakcode: 300012 Datum tentamen: 25/05/2011 Duur tentamen: 150 MINUTEN Docent: BOUGIE, OSINGA, STALPERS ANR

Nadere informatie

DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR 2000 2001. Feedback Praktische Proef

DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR 2000 2001. Feedback Praktische Proef DATA-ANALYSE I OEFENINGEN ACADEMIEJAAR 2000 2001 Feedback Praktische Proef 1 Vooraf Het is onbegonnen werk om voor elke versie van de praktische proef een volledig uitgeschreven rapport te presenteren.

Nadere informatie

Residual Plot for Strength. predicted Strength

Residual Plot for Strength. predicted Strength Uitwerking tentamen DS mei 4 Opgave Een uitwerking geven is hier niet mogelijk. Het is van belang het iteratieve optimaliseringsproces goed uit te voeren (zie ook de PowerPoint sheets): screening design

Nadere informatie

Basishandleiding SPSS

Basishandleiding SPSS Basishandleiding SPSS Elvira Folmer & Marieke ten Voorde SLO, Juli 2008 Deze handleiding is gebaseerd op SPSS 16.0 for Windows Inhoud 1 Het maken van een gegevensbestand in de Variable View... 4 2 Het

Nadere informatie

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items

1. Gegeven zijn de itemsores van 8 personen op een test van 3 items 1. Gegeven zijn de itemsores van 8 personen op een test van 3 items item Persoon 1 2 3 1 1 0 0 2 1 1 0 3 1 0 0 4 0 1 1 5 1 0 1 6 1 1 1 7 0 0 0 8 1 1 0 Er geldt: (a) de p-waarden van item 1 en item 2 zijn

Nadere informatie

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN Interim Toegepaste Biostatistiek deel december 2009 Versie A ANTWOORDEN C 2 B C A 5 C 6 B 7 B 8 B 9 D 0 D C 2 A B A 5 C Lever zowel het antwoordformulier als de interim toets in Versie A 2. Dit tentamen

Nadere informatie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: 5.0 Voorkennis Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram: De lengte van de staven komt overeen met de hoeveelheid; De staven staan meestal los van

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur. VOORAF: Hieronder staat een aantal opgaven over de stof. Veel meer dan op het tentamen zelf gevraagd zullen worden. Op het tentamen zullen in totaal 20 onderdelen gevraagd worden. TECHNISCHE UNIVERSITEIT

Nadere informatie

WORKSHOP ONDERZOEKSMETHODEN

WORKSHOP ONDERZOEKSMETHODEN WORKSHOP ONDERZOEKSMETHODEN INHOUD Kwantitatieve onderzoeksmethoden Algemene kenmerken Enquête Experiment Kwalitatieve onderzoeksmethoden Algemene kenmerken Observatie Interview Kwaliteit van het onderzoek

Nadere informatie

Handleiding voor het maken van een online enquête formulier. Google Drive toepassing

Handleiding voor het maken van een online enquête formulier. Google Drive toepassing Handleiding voor het maken van een online enquête formulier. Google Drive toepassing HOGESCHOOL VAN ARNHEM EN NIJMEGEN Februari 2016 Opgesteld door: Jan-Willem Handleiding voor het maken van een online

Nadere informatie

Classification - Prediction

Classification - Prediction Classification - Prediction Tot hiertoe: vooral classification Naive Bayes k-nearest Neighbours... Op basis van predictor variabelen X 1, X 2,..., X p klasse Y (= discreet) proberen te bepalen. Training

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari 2009 14.00-17.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (2DM4), op maandag 5 januari 29 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Betrouwbaarheid, validiteit en overeenstemming

Betrouwbaarheid, validiteit en overeenstemming Betrouwbaarheid, validiteit en overeenstemming Inleiding Dit practicum sluit aan op het theoriegedeelte over betrouwbaarheidsanalyse van hoofdstuk II-16 (deel 2). In dit hoofdstuk wordt besproken hoe een

Nadere informatie

statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie

statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie statistiek voor de psychologie deel 2: toetsen voor twee gemiddelden en toetsingstheorie Statistiek voor de psychologie Deel 2: Toetsen voor twee gemiddelden en toetsingstheorie Jules L. Ellis Derde druk

Nadere informatie

Nominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht

Nominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht Ordinaal - Kwalitatief - Middelste niveau - Categorieën wel ordenen - Opleidingsniveau Interval / ratio - Kwantitatief - Hoogste

Nadere informatie

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus

Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus Implementations of Tests on the Exogeneity of Selected Variables and Their Performance in Practice M. Pleus Dat economie in essentie geen experimentele wetenschap is maakt de econometrie tot een onmisbaar

Nadere informatie

Verslag consumentenonderzoek zorgsector Breda

Verslag consumentenonderzoek zorgsector Breda Verslag consumentenonderzoek zorgsector Breda Inleiding: In het kader van het project economische barometer is in 2012 gekozen voor het onderwerp zorgverlening en vooral het gebruik van de zorgverleners,

Nadere informatie

Toegepaste data-analyse: sessie 3

Toegepaste data-analyse: sessie 3 Toegepaste data-analyse: sessie 3 Mixed Models II: Actor-partner model Corr (Yij, Yik) = σσ 2 kkkkkkkkkkkk σσ 2 kkkkkkkkkkkk+ σσ 2 rrrrrr Je kan deze data niet modelleren a.d.h.v. lineaire regressie. Er

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 28 oktober 2009, 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4) woensdag 8 oktober 9, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven Statistisch

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS.

Deze menu-aansturingen zijn van toepassing op versies 14.0 en 15.0 van SPSS. Menu aansturing van SPSS voorbeeld in hoofdstuk 8 over schaalconstructie met Cronbach s α en principale componenten analyse van meningen over strafdoelen Hieronder wordt uitgelegd hoe alle analyses besproken

Nadere informatie

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets Moore, McCabe, and Craig. Introduction to the Practice of Statistics Chapter

Nadere informatie

Experimenteel en Correlationeel Onderzoek (ECO)

Experimenteel en Correlationeel Onderzoek (ECO) Experimenteel en Correlationeel Onderzoek (ECO) In veel onderzoek is het ultieme doel: Het vaststellen van oorzaak-gevolg (causale) relaties Rode draad ECO: Met behulp van onderzoek zo goed mogelijk uitspraken

Nadere informatie

Auteurs: Baarda e.a. isbn: 978-90-01-80771-9

Auteurs: Baarda e.a. isbn: 978-90-01-80771-9 Woord vooraf Het Basisboek Methoden en Technieken biedt je een handleiding voor het opzetten en uitvoeren van empirisch kwantitatief onderzoek. Je stelt door waarneming vast wat zich in de werkelijkheid

Nadere informatie

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek

tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek tul Moleculaire Levenswetenschappen Stroom 2.1 2005-2006 Statistisch modelleren Werkboek Inhoudsopgave Rooster 2 Studiemateriaal 2 Werkvormen 2 Toetsing 3 Planningsgroep 3 Traject 4 1 Rooster Dag Datum

Nadere informatie

Schriftelijk tentamen - UITWERKINGEN

Schriftelijk tentamen - UITWERKINGEN Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB009t Soort tentamen : gesloten boek

Nadere informatie

Schriftelijk tentamen - UITWERKINGEN

Schriftelijk tentamen - UITWERKINGEN Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB0019t Soort tentamen : gesloten

Nadere informatie

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie. Handleiding SPSS tabellen en kruistabellen In een paar stappen van spss data naar bruikbare informatie. A) Het openen van een databestand File \ open \ data Kies de naam van je databestand, bijvoorbeeld

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamenopgaven Statistiek 2DD71: UITWERKINGEN 1. Stroopwafels a De som S van de 12 gewichten is X 1 + X 2 + + X 12. Deze is normaal

Nadere informatie

28-10-2015. Je kunt deze presentatie na afloop van de les downloaden.

28-10-2015. Je kunt deze presentatie na afloop van de les downloaden. Docent: Marcel Gelsing Je kunt deze presentatie na afloop van de les downloaden. Ga naar: www.gelsing.info Kies voor de map Eindopdrachten Download: Integrale eindopdracht Fase 1.pdf Les 1: fase 1 en 2

Nadere informatie

Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een

Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een statistische toets beslis je of een hypothese waar is.

Nadere informatie

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2]

Hoofdstuk 8. Toetsende statistiek. 8.1 Associatie van categoriale data: CROSSTABS [dv 32.2] Hoofdstuk 8 Toetsende statistiek Meestal zijn we niet alleen geïnteresseerd in beschrijvende statistiek (over de steekproef), maar ook in toetsende statistiek. Het doel hiervan is om hypothesen te toetsen,

Nadere informatie

Schriftelijk tentamen - UITWERKINGEN

Schriftelijk tentamen - UITWERKINGEN Business Administration / Bedrijfskunde Schriftelijk tentamen - UITWERKINGEN Algemeen Vak : Statistische Methoden Groep : niet van toepassing en Technieken Vakcode : BKB0019t Soort tentamen : gesloten

Nadere informatie

Operationaliseren van variabelen (abstracte begrippen)

Operationaliseren van variabelen (abstracte begrippen) Operationaliseren van variabelen (abstracte begrippen) Tabel 1, schematisch overzicht van abstracte begrippen, variabelen, dimensies, indicatoren en items. (Voorbeeld is ontleend aan de masterscriptie

Nadere informatie

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1

Regressie-analyse. Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom. Regressie-model en mediatie-analyse 1 Regressie-analyse Cursus Bachelor Project 2 B&O College 2 Harry B.G. Ganzeboom Regressie-model en mediatie-analyse 1 Agenda Lineaire regressie-model (herhaling) Enkelvoudig (simple) Meervoudig (multiple)

Nadere informatie

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling

Principe Maken van een Monte Carlo data-set populatie-parameters en standaarddeviaties standaarddeviatie van de bepaling statistische verdeling Monte Carlo simulatie In MW\Pharm versie 3.30 is een Monte Carlo simulatie-module toegevoegd. Met behulp van deze Monte Carlo procedure kan onder meer de betrouwbaarheid van de berekeningen van KinPop

Nadere informatie

20/04/2013: Kwalitatief vs. Kwantitatief

20/04/2013: Kwalitatief vs. Kwantitatief 20/04/2013: Kwalitatief vs. Kwantitatief Wat is exact het verschil tussen kwalitatief en kwantitatief marktonderzoek in termen van onderzoek (wat doe je) in termen van resultaat (wat kan je er mee) in

Nadere informatie

Handleiding voor het maken van een online enquête formulier. Google Drive toepassing

Handleiding voor het maken van een online enquête formulier. Google Drive toepassing Handleiding voor het maken van een online enquête formulier. Google Drive toepassing HOGESCHOOL VAN ARNHEM EN NIJMEGEN Januari 7 2014 Opgesteld door: Jan-Willem 1//2014 Handleiding voor het maken van een

Nadere informatie

WOT statistiek. Betrouwbaarheidsanalyse. CLIN Centre for Linguistics. Els Schoonjans

WOT statistiek. Betrouwbaarheidsanalyse. CLIN Centre for Linguistics. Els Schoonjans WOT statistiek Betrouwbaarheidsanalyse Els Schoonjans CLIN Centre for Linguistics 1 Betrouwbaarheid Betrouwbaarheid van een meetinstrument: consistentie; instrument geeft vergelijkbare resultaten in vergelijkbare

Nadere informatie

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data An Carbonez Leuven Statistics Research Centre Katholieke Universiteit Leuven Voorstelling van de

Nadere informatie

2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72

2.9 Het adolescentieonderzoek 69 2.10 Opgaven 72 Inhoud Hoofdstuk 1 Design en analyse 11 1.1 Specificatie van designs 13 1.2 Definities 14 1.3 Het verschil tussen een afhankelijke variabele en een niveau van een within-subjectfactor 19 1.4 Kiezen van

Nadere informatie

Toetsende Statistiek Week 7. Verdelingsvrije toetsen

Toetsende Statistiek Week 7. Verdelingsvrije toetsen Toetsende Statistiek eek 7. Verdelingsvrije toetsen MM&C, 15 Nonparametric Tests 15.1 2 Independent Samples Chemicus Ontwikkelde de Rank-Sum test en Signed-Rank test (1945) 15.2 2 Dependent Samples NB

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

Item-responstheorie (IRT)

Item-responstheorie (IRT) Item-responstheorie (IRT) niet direct voor een dubbeltje, maar wel erg cool op het podium Ruth van Nispen 1 Caroline Terwee 2 1 Afdeling Oogheelkunde 2 Afdeling Epidemiologie en Biostatistiek VU medisch

Nadere informatie

10. Verantwoord prioriteiten stellen: een oplossing voor onbetrouwbare belangscores

10. Verantwoord prioriteiten stellen: een oplossing voor onbetrouwbare belangscores 10. Verantwoord prioriteiten stellen: een oplossing voor onbetrouwbare belangscores E. DE VRIES-VAN KETEL, C. TCHAOUSSOGLOU en R. VAN OSSENBRUGGEN SAMENVATTING Managers moeten hoofd- en bijzaken onderscheiden

Nadere informatie

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant?

d. Formuleer voor het hoofdeffect Afmeting H_0 en H_a. Is dit hoofdeffect significant? Opdracht 14a ------------ Twee-factor ANOVA In een groot research-project bestudeerde men de fysische eigenschappen van multiplex houtmaterialen, vervaardigd door kleine plakjes hout aan elkaar te hechten.

Nadere informatie

!!!!!!!!!!!!!!!!!!!!!!!!!!

!!!!!!!!!!!!!!!!!!!!!!!!!! !!!!!!!!!!!!!!!!!!!!!!!!!!!!!! +++!!!!!!! Kbo!efo!Pvetufo!!! 3:2238!!!!! Sfjojfs!wbo!Iffse!! 3:287:!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! Case Assignment Vliegtarieven.nl Statistische Methoden en technieken 2005/2006

Nadere informatie

Inductieve statistiek voor informatiewetenschappers

Inductieve statistiek voor informatiewetenschappers INDUCTIEVE STATISTIEK VOOR INFORMATIEWETENSCHAPPERS I 570 1 Inductieve statistiek voor informatiewetenschappers HENK VOORBIJ 1. Inleiding Er zijn twee soorten statistiek: beschrijvende en inductieve (ook

Nadere informatie

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur

Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 2 voor BMT (2DM50), op dinsdag 5 april 2011 9.00-12.00 uur Bij het tentamen mag alleen gebruik worden gemaakt van een zakrekenmachine. Het gebruik

Nadere informatie

Grafieken Cirkeldiagram

Grafieken Cirkeldiagram Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak

Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak Inzet van social media in productontwikkeling: Meer en beter gebruik door een systematische aanpak 1 Achtergrond van het onderzoek Bedrijven vertrouwen meer en meer op social media om klanten te betrekken

Nadere informatie

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 6 1. De 15 leden van een kleine mountainbikeclub vragen zich af in welk mate de omgevingstemperatuur een invloed heeft op hun

Nadere informatie

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum]

[aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum] 6 Multiple response [aanvullend hoofdstuk, behorend bij Grotenhuis, M. te & Matthijssen, A. (2006). Basiscursus SPSS, versie 10-14, Assen: Van Gorcum] 6.1 Inleiding Het komt regelmatig voor dat respondenten

Nadere informatie

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK 1 1. INLEIDING Parametrische statistiek: Normale Verdeling Niet-parametrische statistiek: Verdelingsvrij Keuze tussen de twee benaderingen I.

Nadere informatie

Meervoudige variantieanalyse

Meervoudige variantieanalyse Meervoudige variantieanalyse Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-12 (deel2) van het statistiekboek, wordt besproken hoe met SPSS gemiddelden van verschillende groepen met elkaar vergeleken

Nadere informatie

Toelichting Ankeronderzoek met Referentiesets. Ankeronderzoek. Beschrijving ankeronderzoek. Saskia Wools & Anton Béguin, Cito 2014

Toelichting Ankeronderzoek met Referentiesets. Ankeronderzoek. Beschrijving ankeronderzoek. Saskia Wools & Anton Béguin, Cito 2014 Toelichting Saskia Wools & Anton Béguin, Cito 2014 Ankeronderzoek Deze handleiding bevat een korte beschrijving van ankeronderzoeken. In het algemeen geldt dat meer informatie te vinden is in het boek

Nadere informatie

Hoorcollege 2: Onderzoeksmethoden 08-01-13!!

Hoorcollege 2: Onderzoeksmethoden 08-01-13!! Hoorcollege 2: Onderzoeksmethoden 08-01-13 Stof hoorcollege Hennie Boeije, Harm t Hart, Joop Hox (2009). Onderzoeksmethoden, Boom onderwijs, achtste geheel herziene druk, ISBN 978-90-473-0111-0. Hoofdstuk

Nadere informatie

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)? Vraag 1. Welk design bevat geen random assignment: a) Een design gebaseerd op matching b) Een design gebaseerd op blocking c) Een factorial design d) Elk van de hierboven genoemde designs Vraag 2. In een

Nadere informatie

Eindtermen, Toetstermen, Taxonomie, Toetsmatrijs en Cesuur MA/MMW Deskundige Marktanalyse - Taxateur

Eindtermen, Toetstermen, Taxonomie, Toetsmatrijs en Cesuur MA/MMW Deskundige Marktanalyse - Taxateur ,, Taxonomie, Toetsmatrijs en Cesuur MA/MMW Deskundige Marktanalyse - Taxateur De programmabeschrijvingen worden in het volgende schema gegoten: PROGRAMMABESCHRIJVING Toetsonderwerpen Toetsdoelstelling

Nadere informatie