De steekproefgrootte bepalen

Maat: px
Weergave met pagina beginnen:

Download "De steekproefgrootte bepalen"

Transcriptie

1 De steekproefgrootte bepalen Foeke van der Zee (Hulp bij onderzoek, Groningen, versie 1, september 2014) over- onderzoek.nl

2 Voorwoord Dit white paper maakt deel uit van een reeks white papers. Hierin behandel ik een aantal onderwerpen die te maken hebben met het doen van onderzoek. Op deze manier kan ik de onderwerpen uitgebreider bespreken dan op de site. De papers zijn ontstaan als blogartikel of ter voorbereiding van een nog uit te geven of reeds uitgegeven publicatie. Het staat je vrij om dit paper te printen voor eigen gebruik. Je mag het ook doorsturen naar anderen, als die behoefte hebben aan deze informatie. Je mag de inhoud van dit paper echter niet gebruiken voor publicatie in deze of een andere vorm, en in welk medium dan ook, zonder mijn schriftelijke toestemming. Wil je in je thesis of verslag refereren naar dit white paper, doe dat dan op de officiële manier, zoals dat in jouw vakgebied gebruikelijk is. Alle informatie staat op de voorkant. Heb je een probleem met onderzoek? Neem dan gerust contact met me op. Ik help je graag! Foeke van der Zee Andere publicaties van Foeke van der Zee Kennisverwerving in de empirische wetenschappen (2004) Een introductie in de filosofie van Foeke van der Zee over onderzoek en wat je ermee kunt De enquête (2007) Dit boekje gaat over enquêtes voor schriftelijke en/of online afname Online enquêteren (2008) In dit boekje staan de do s en don ts van online onderzoek Methodologie voor onderzoek in economie en bedrijfskunde (2010) Studieboek met handleiding voor het opzetten en uitvoeren van onderzoek Methodologie voor onderzoek in de sociale wetenschappen (2010) Studieboek met handleiding voor het opzetten en uitvoeren van onderzoek Methodologie voor onderzoek in de gezondheidszorg (2010) Studieboek met handleiding voor het opzetten en uitvoeren van onderzoek Methodologie voor onderzoek in de verpleegkunde (2010) Studieboek met handleiding voor het opzetten en uitvoeren van onderzoek Statistiek; alles wat een onderzoeker moet weten om zijn gegevens te analyseren (in voorbereiding; vermoedelijk voorjaar 2015 klaar) Kijk voor meer informatie op over- onderzoek.nl

3 1. Inleiding Docenten en opdrachtgevers willen graag weten hoe groot de steekproef moet zijn die je wilt trekken. Als je een te klein aantal noemt, denken ze dat het onderzoek niets voorstelt, maar als je een te groot aantal noemt, vinden ze het te duur en niet realistisch. Als je een goed antwoord weet te geven, verhoogt dat jouw aanzien als onderzoeker en krijg je hun vertrouwen dat het wel goed komt met het onderzoek. Om geloofwaardig te zijn moet je je antwoord natuurlijk wel kunnen onderbouwen. Ook voor jezelf is het belangrijk om vooraf de steekproefgrootte aan te geven, want daarmee kun je bepalen welke kosten verbonden zijn aan het verzamelen van de data en hoeveel werk het zal zijn om de gegevens te verzamelen en te bewerken. Er is overigens wel een groot verschil tussen de steekproefgrootte en de uiteindelijke respons. Sommigen duiden de respons aan als de nettosteekproef. Als ik het heb over het bepalen van de steekproefgrootte, praat ik over het bepalen van de respons, oftewel over de netto- steekproef. Als je bijvoorbeeld een respons wilt hebben van honderd personen en je verwacht dat slechts één op de tien aangeschreven personen zal reageren, moet je duizend personen benaderen. Stel dat je honderd personen zou hebben aangeschreven dan krijg je een respons van tien. Dat is te weinig.!"#$%&'() *'))+#,")-+&.), *'))+#,")- /)0#"10!"##$%&'()*$% +$&+$,)%)*)$ -$./0$%&%)$* */*&+$&1/1(#"*)$ 6)7%&)%8/00$8* 2$''$%&3$$%&3/$+$ 3$3$4$%5&""%3$#$4$0+ 2. Overzicht van de methoden Er zijn verschillende methoden om de steekproefgrootte vast te stellen. Deze kun je indelen in drie groepen: 1. Methoden gebaseerd op ervaring en gevoel 2. Methoden gebaseerd op statistische significantie 3. Methoden gebaseerd op statistische power 2.1 Methoden gebaseerd op ervaring en gevoel Deze methoden zijn gebaseerd op het arbitrair vaststellen van een getal. De opdrachtgever of een andere onderzoeker heeft bijvoorbeeld altijd gewerkt met vijfhonderd respondenten, dus moet dat aantal ook dit keer weer gerealiseerd worden. Waarop het getal van vijfhonderd is gebaseerd, wordt meestal niet onderbouwd. Het is 1

4 ooit bepaald op basis van fingerspitzengefühl en dat houdt men dan maar aan. Als de opdrachtgever per se dit aantal wil, moet je de begroting en het tijdsschema daarop aanpassen. Je kunt proberen om het genoemde aantal te onderbouwen met een logische redenering. Stel dat het in je onderzoek gaat om het vinden van een percentage; je wilt bijvoorbeeld antwoord geven op de vraag hoeveel procent van de inwoners van Nederland woont in een huurwoning? Als je een representatieve steekproef hebt getrokken, maakt een procentje meer of minder meestal niet zoveel uit. Het gaat immers om het maken van een schatting en dan mag je er iets naast zitten. Als van honderd respondenten één in de andere groep valt, levert dat een verschil op van 1 procent. Bij tweehonderd respondenten is dat 0,5 procent en bij vierhonderd respondenten is dat 0,25 procent. De opdrachtgever zal het niet veel uitmaken of je er een half procentje of zo naast zit. Maar noem je een te klein aantal bijvoorbeeld een steekproefgrootte van tien dan betekent één respondent in de andere groep dat je er meteen 10 procent naast zit met je schatting, en dat is nogal veel. Mijn ervaring is dat je aan honderdvijftig tot tweehonderd respondenten meestal wel voldoende hebt om een goede schatting te maken van een percentage. Als het gaat om een verschil, moet je anders redeneren. Voor een t- toets heb je naar mijn ervaring dertig tot vijftig respondenten per groep nodig om statistische verschillen te kunnen vinden. Neem je te weinig respondenten, dan is bijna niets statistisch significant. Neem je er echter te veel en dan moet je denken aan duizend respondenten dan wordt alles statistisch significant. Voor variantieanalyses geldt iets soortgelijks. Het hangt af van het aantal groepen dat wordt onderscheiden. Per groep kun je het best minimaal dertig respondenten aanhouden. Als het gaat om een MANOVA met meerdere cellen, moet je minimaal dertig per cel aanhouden. Bij regressieanalyses zijn over het algemeen minder respondenten nodig om enigszins betrouwbare resultaten te vinden. Voor kruistabellen daarentegen veel meer. Daarom geef ik het advies om alles zo veel mogelijk op intervalniveau te meten. Dan heb je minder respondenten nodig om toch statistisch significante resultaten te vinden. Om een lang verhaal kort te maken: voor de meeste statistische analyses zit je met tussen de honderd en driehonderdvijftig respondenten wel goed. Bij hogere aantallen kun je ook analyses op subgroepen maken, in plaats van alleen maar op het totaal. Dat is wel iets om rekening mee te houden. 2.2 Methoden gebaseerd op statistische nauwkeurigheid Je kunt de steekproefomvang ook bepalen door een getal te noemen dat is gebaseerd op een statistische analyse die je gaat toepassen. Volgens de meeste statistiekboeken is er slechts één mogelijkheid, namelijk de toets voor het maken van een puntschatting van een percentage. Soms wordt een tweede genoemd: het vergelijken van twee gemiddelden. In 2004 heb ik daar in het boek Kennisverwerving in de empirische wetenschappen drie aan toegevoegd, namelijk de chikwadraattoets voor een reeks, de chikwadraattoets voor een kruistabel en de toets voor productmomentcorrelaties. 2

5 Het kenmerkende van deze methoden is dat ze gebaseerd zijn op het toetstheorema van Fisher, waarbij je een alfawaarde vaststelt en vervolgens nagaat of het toetsresultaat statistisch significant is. Met deze methoden bereken je het omslagpunt waarin iets statistisch significant wordt. Neem je een kleiner aantal, dan kun je op voorhand aangeven dat je geen statistisch significant resultaat zult vinden. Omdat je dat vaak juist wel wilt, moet je een groter aantal nemen. Het vervelende van al deze methoden is dat je aannames moet doen en dat die aannames soms niet kloppen. Maar laten we eerst de methoden bespreken en ze daarna pas bekritiseren. De puntschatting voor een percentage Soms moet je op basis van je onderzoek een schatting maken van een percentage. Bijvoorbeeld: hoeveel mannen dragen dagelijks een stropdas? of hoeveel Nederlanders roken sigaretten? Je kunt in plaats van een afwijking van een percentage uitgaan van het betrouwbaarheidsinterval. Voor het berekenen van het interval rondom een percentage gebruiken we de volgende formule: waarin: π = de verwachte proportie in de populatie (de boven- en ondergrens worden berekend) p = de gevonden proportie in de steekproef z α/2 = het betrouwbaarheidsinterval n = het aantal respondenten Als we de formule aanpassen zodat de n voor het =- teken komt te staan en de rest daarachter, dan krijg je: waarin: n = het aantal respondenten z α/2 = het betrouwbaarheidsinterval (een- of tweezijdig) p = de verwachte proportie (in procenten) D = de afwijking van de proportie (eenzijdig; in procenten) Voor het berekenen van een optimale n dat wil zeggen: de respons moet je een inschatting maken van de p- waarde en de afwijking daarvan. Stel dat je aanneemt dat 20 procent van de Nederlanders rookt en dat je er maximaal 5 procent naast wilt zitten. Je uitkomst moet dan liggen tussen 15 en 25 procent. Dat kun je invullen in de formule. Het enige wat je verder nog moet weten, is de z- waarde. We toetsen in de statistiek bijna alles tweezijdig met een betrouwbaarheidsniveau van 95 procent (α =.05). Daarom zet je de z- waarde op 1,96. Je krijgt dan: 3

6 Je hebt dus 246 respondenten nodig (altijd naar boven afronden) om statistisch aan te tonen dat het percentage rokers tussen 15 en 25 procent ligt. Dat is wat meer dan de schatting uit de losse pols van 150 waarbij je er een procentpunt naast mag zitten. Kun je geen inschatting maken, kies dan voor een p- waarde van 50 procent en een D- waarde van 5 procent. Dit voorbeeld zie je in ieder statistiekboek als de optimale steekproef en daar komt altijd 384,2 uit. Je kunt de berekeningen ook doen met de steek- proefcalculator op de site. Deze calculator gaat uit van tweezijdig toetsen, dus moet je voor een alfa van.05 kijken bij 97,5 procent. Deze calculator heeft nog een voordeel. Als je weet hoe groot de respons moet zijn, kun je meteen laten uitrekenen hoeveel personen je moet benaderen om deze responsaantallen te krijgen. Het verschil tussen twee gemiddelden Dit is volgens de oprechte statistici niet mogelijk. Formeel hebben ze gelijk, maar met enige goede wil is er wel een mouw aan te passen. De formule voor de toets voor het verschil tussen twee gemiddelden is deze: waarin: t = de te berekenen toetswaarde, = het gemiddelde van x respectievelijk y nx, ny = het aantal cases van groep x respectievelijk groep y sx, sy = de standaarddeviatie van groep x respectievelijk y Veronderstel dat de standaarddeviaties van beide groepen en de aantallen in de groepen gelijk zijn; dit zijn overigens ook de twee voorwaarden om bovenstaande formule te mogen gebruiken. Ga er verder van uit dat we het verschil tussen beide gemiddelden kunnen aanduiden met een D (van difference, verschil). De formule wordt dan: 4

7 Het probleem is nu alleen nog dat de t- waarde afhankelijk is van het aantal vrijheidsgraden. Het aantal vrijheidsgraden is gelijk aan nx+y- 2 en als je de t- waarde naar de andere kant van het =- teken brengt, staat er een n voor en na het =- teken.. Hoe lossen we dat op? Dat is op te lossen door in plaats van een t- waarde de z- waarde in te vullen. De t- verdeling lijkt op de standaardnormaalverdeling. Bij een oneindig aantal vrijheidsgraden is de t- verdeling hetzelfde als de standaardnormaalverdeling, maar vaak hoef je zover niet te gaan. Vanaf honderdtwintig vrijheidsgraden is de t- waarde bijna hetzelfde als de z- waarde, en vanaf dertig vrijheidsgraden is het verschil al beperkt tot meestal één of twee respondenten. Omdat het maar zo n klein verschil oplevert, vervangen we de t- waarde door de z- waarde, en de s door een sigma. Dat levert de volgende formule op: Nu kun je de formule omwerken naar: Je hoeft alleen nog maar een schatting te maken van het vermoedelijke verschil tussen beide gemiddelden en de standaarddeviatie. De berekeningen kun je doen met behulp van de steekproefcalculator op de site van Hulp bij onderzoek. Dan hoef je je ook niet meer druk te maken over de vraag of je het wel goed doet. De formule is ook goed te gebruiken voor het bepalen van een afwijking van een norm, oftewel de one sample t- test. Bijvoorbeeld: normaal gesproken haalt iedereen een 7 voor een toets statistiek. Hoe groot moet een steekproef zijn om aan te tonen dat het gemiddelde 8 afwijkt van deze norm? Je vult de formule in met als schatting voor de standaarddeviatie het getal 1,5. Dat blijkt niet eens zo n hoog aantal op te leveren (achttien cursisten). Je kunt hiermee spelen door de standaard op 6,5 te zetten en/of de standaarddeviatie kleiner of groter te maken. Chikwadraattoets voor een reeks In onze video over de chikwadraattoets voor een reeks is verteld dat die analyse heel geschikt is om na te gaan of de steekproef representatief is. Het gaat dan om de afwijking ten opzichte van een bepaalde normverdeling. Je kunt de vraagstelling ook omdraaien: in welke mate mag een verdeling afwijken van de normverdeling voordat hij statistisch significant wordt? 5

8 De te gebruiken formule voor het bepalen van de steekproefomvang is: waarin: = de chikwadraatwaarde (behorende bij een vast te stellen α) = het verschil tussen verwacht en norm (per cel in het kwadraat) = het aantal cellen In het boek Kennisverwerving in de empirische wetenschappen leg ik uit hoe ik aan deze formule gekomen ben. Misschien snap je niks van deze formule, maar in het gebruik valt hij erg mee. Ook hier moet je het een en ander veronderstellen. Het komt erop neer dat je een normverdeling en een uitkomsten- verdeling moet poneren. Stel dat je een tevredenheid hebt gemeten op een vijfpunts Likertschaal. Je kunt dan bijvoorbeeld als norm stellen: De verwachte verdeling zet je daartegen af, bijvoorbeeld: Je moet er wel voor zorgen dat het totaal 100 procent is. De is dan te berekenen als 10-8 in het kwadraat, in het kwadraat, et cetera. Dat vermenigvuldig je elke keer met het aantal cellen; in dit geval is dat vijf. De chikwadraatwaarde haal je uit je tabellenboek. Je moet kijken bij vier vrijheidsgraden, want je hebt vijf cellen. Bij een alfa van 5 procent vind je de waarde 9,4877. De uitkomst is nu te berekenen: = 7,7 (afgerond 8) Er komt een belachelijk getal uit (namelijk acht respondenten); daarmee kun je de cellen niet eens fatsoenlijk vullen. Dat komt omdat de normverdeling zeer sterk afwijkt van de verwachte verdeling. Als je de verwachte verdeling realistischer maakt (bijvoorbeeld: ), krijg je een realistischer schatting van de te trekken steekproefgrootte: = 774,5 (afgerond 775) Foeke van der Zee 6 White paper: De steekproefgrootte bepalen

9 Uiteraard kun je dit ook uitrekenen met de steekproefcalculator op de site Hulp bij onderzoek. Je kunt daar de gegevens invullen. Nadat je hebt geklikt op Reken uit, krijg je de uitkomst voor je minimale steekproefgrootte. Chikwadraattoets voor een kruistabel Voor een kruistabel kun je precies dezelfde formule gebruiken. Het grote verschil is dat je in dit geval geen norm of verwachting hoeft te geven. In kruistabellen worden die namelijk berekend uit de randtotalen. Als je niet meer weet hoe dat gaat, bekijk dan de video over dit onderwerp bij de Online video s over statistiek. De berekeningen hoef je niet handmatig uit te voeren. In de steekproefcalculator op de site Hulp bij onderzoek staan de meest gangbare kruistabellen. Daar kun jij je gegevens invoeren. De grootte van de minimale steekproefomvang wordt dan weer snel uitgerekend voor diverse waarden van betrouwbaarheid. De productmomentcorrelatie De productmomentcorrelatiecoëfficiënt wordt getoetst met deze formule: waarin: t = de te berekenen kritieke t-waarde r = de berekende productmomentcorrelatiecoëfficiënt n = het aantal combinaties van x i en y i Je kunt de n eruit halen, zodat die voor het =- teken komt te staan. Je krijgt dan: waarin: n = het aantal cases r = de geschatte productmomentcorrelatiecoëfficiënt t = de kritieke t-waarde Het probleem is ook hier de t- waarde, want die hangt af van het aantal vrijheidsgraden. Als je een t- waarde kiest van 1,70 bij een betrouwbaarheid van 95 procent, van 2,05 bij een betrouwbaarheid van 97,5 procent of van 2,46 bij een betrouwbaarheid van 99 procent, kun je er niet ver naast zitten wat betreft het minimale aantal respondenten. 7

10 Als je een hoge correlatie verwacht zeg.60 dan blijk je aan zeven respondenten al genoeg te hebben om statistisch significante resultaten te krijgen. Bij een correlatie van.30 heb je aan tweeëndertig respondenten genoeg. Correlaties lager dan.30 zijn meestal niet zo interessant. Kortom: het berekenen van het benodigde aantal respondenten voor correlaties is niet zo zinvol, omdat je redelijk snel statistisch significante resultaten vindt. Bovendien veronderstelt kwantitatief onderzoek dat er minimaal dertig onderzoekseenheden zijn. Als de samenhang substantieel is, is die dus ook vrijwel altijd statistisch significant. Overige statistische toetsen Hoe zit het met regressie, ANOVA, MANOVA en ANCOVA? Zijn daar geen formules voor? Regressieanalyse is gebaseerd op correlatieanalyse, dus zou je ook daar het minimale aantal van dertig kunnen aanhouden. Dat geldt dan wel voor de univariate variant met één afhankelijke en één voorspellende variabele. Voor multipele regressie hanteert men de duimregel: * het aantal variabelen in de analyse. En voor ANOVA, MANOVA en ANCOVA? Helemaal niks. Dus vallen we terug op onze ervaring van minimaal vijftien, liever dertig en het liefst vijftig per cel Methoden gebaseerd op de power Er zijn ook methoden die gebaseerd zijn op de power van een toets. De power of het onderscheidend vermogen wordt meestal pas bekeken aan het eind van de analyses. Eerst wordt gekeken of de analyse een statistisch significant verschil oplevert, en pas daarna of dat verschil ook steekhoudend is. Ook in de Online cursus statistiek wordt bijna nergens over de power gesproken. Toch een paar korte opmerkingen. De power van een toets is gebaseerd op het toetstheorema van Neijman- Pearson. In dat theorema ga je na hoe groot de kans is op een verkeerde beslissing. Dat kun je uitzetten in een tabel en uitgaande van een normaalverdeling kun je van de statistische uitkomsten een grafiek maken. Deze grafiek maakt twee dingen duidelijk: dat de kans op een verkeerde beslissing (β) aan de andere kant van de kritieke waarde ligt; dat je nog meer veronderstellingen moet doen dan bij de toetsen uit de vorige sectie. Met name dat laatste vind ik een groot bezwaar, want het wordt steeds moeilijker om al die veronderstellingen aannemelijk te maken. Je kunt wel veronderstellen dat Nederlanders 1 meter 86 lang zijn, met als alternatief 1,87 meter, maar je had net zo goed 1,85 meter of 1, meter kunnen 8

11 veronderstellen. Dat maakt het er allemaal niet gemakkelijker op. Daarom wordt deze methode in de meeste wetenschappen niet gebruikt. Een uitzondering is de geneeskunde. Dat heeft te maken met het feit dat een verkeerde beslissing in deze wetenschap heel nare gevolgen kan hebben. Je zult maar iemands been afzetten terwijl dat niet nodig is, of iemand geen medicijnen voorschrijven terwijl diegene dat juist wel nodig heeft. Het nemen van een verkeerde beslissing kan in de geneeskunde desastreus zijn; daarom is het in deze wetenschap belangrijk om ook de power van de analyses te bepalen. Het hebben van een voldoende grote steekproef is daarvoor heel belangrijk. Wil je een schatting maken van de steekproefgrootte op basis van de power, dan raad ik je aan het programma g- power te downloaden. Dit programma van de Universiteit van Düsseldorf is gratis te downloaden en te installeren. Ga naar Daar vind je de manual en onderaan de downloadlink. 2.4 Slotopmerkingen Misschien had je verwacht dat je in dit white paper het verlossende antwoord zou vinden op de prangende vraag hoe groot jouw steekproef moet zijn. Het ultieme antwoord op die vraag bestaat echter niet. In dit paper is wel een aantal strategieën besproken die tot een acceptabel antwoord leiden. Aan jou de taak om de juiste te kiezen. Overigens, met het kiezen van een bepaalde strategie ben je er nog niet. Onderzoek bestaat vaak uit meerdere deelvragen en voor iedere deelvraag kun je een andere methode gebruiken, wat kan leiden tot heel tegenstrijdige antwoorden. Bij een onderzoek naar vijf soorten koekjes kun je bijvoorbeeld vragen wat de respondent zou willen betalen voor een heel pak, en welk van de vijf koekjes de respondent het lekkerst vindt. De eerste vraag naar de prijs betreft een variabele op intervalniveau. Daarvoor zou een steekproefgrootte van zestig personen voldoende kunnen zijn. De tweede vraag is gemeten op een Likertschaal (zeer smakelijk ß à zeer onsmakelijk). Dat betreft een ordinale variabele en daarvoor is een steekproefgrootte gewenst van driehonderd respondenten. Hoe groot moet je steekproef nu zijn: zestig of driehonderd? Kies je voor zestig, dan zal de tweede vraag nooit een significant resultaat kunnen opleveren. Kies je voor driehonderd, dan kun je bijna met zekerheid stellen dat de eerste vraag een statistisch significant resultaat zal gaan opleveren. Dit maakt statistiek zo verdraaid lastig. Je kunt je door statistiek laten leiden, maar je kunt er ook onder lijden. In de Online cursus statistiek leg ik uit hoe je statistiek moet gebruiken. Statistiek is overigens heel simpel als je het principe snapt. Ik zou het je graag willen leren, zodat jij je weerbaar kunt opstellen tegen mensen die beweren dat iets waar is omdat het statistisch is aangetoond. Maar dan moet je de hele cursus volgen en niet alleen een white paper lezen. Ik wens je heel veel succes met je onderzoek. Foeke van der Zee 9

12 OVERZICHT VAN DE LESSEN IN DE ONLINE CURSUS STATISTIEK Algemene basiskennis voor het kunnen verrichten van statistische analyses Kenmerken van variabelen Les 1 Populatie en steekproef Les 2 De toetsprocedure van Fisher Les 3 Statistische tabellen Les 4 Het maken van een keuze voor de juiste toets Les 5 Verschil tussen groepen De t- toets om de gemiddelden van twee groepen met elkaar te vergelijken twee groepen Les 6 afhankelijke variabele is gemeten op intervalniveau Variantieanalyse om de gemiddelden van meer dan twee groepen met elkaar te vergelijken meer dan twee groepen Les 7 afhankelijke variabele is gemeten op intervalniveau De Mann- Whitneytoets twee groepen Les 8 afhankelijke variabele is gemeten op ordinaal niveau De Kruskal- Wallistoets meer dan twee groepen Les 9 afhankelijke variabele is gemeten op ordinaal niveau Verschil tussen kenmerken De t- toets om het gemiddelde uit een steekproef te vergelijken met een standaard De t- toets om de gemiddelden van twee kenmerken met elkaar te vergelijken één variabele op interval- Les 10 één standaard twee kenmerken op interval- Les 11 Variantieanalyse voor herhaalde metingen meer dan twee kenmerken op interval- Les 12 De Wilcoxontoets twee kenmerken op ordinaal niveau Les 13 De Friedmantoets De chikwadraattoets voor een kruistabel De chikwadraattoets voor een reeks meer dan twee kenmerken op ordinaal niveau twee kenmerken op nominaal/categoraal niveau kenmerken op nominaal/categoraal niveau één standaard die je zelf mag opstellen Les 14 Les 15 Les 16 Foeke van der Zee 10

13 Samenhang tussen kenmerken De productmomentcorrelatie van Pearson twee variabelen op interval- Les 17 De rangcorrelatie van Spearman twee variabelen op ordinaal niveau Les 18 De rangcorrelatie van Kendall twee variabelen op ordinaal niveau Les 19 Phi en Cramérs V twee variabelen op nominaal/categoraal niveau Les 20 Test- en schaalconstructie Factoranalyse Cronbachs alfa Regressie Lineaire regressie Multipele regressie Regressie met dummy s meer dan twee variabelen op ordinaal niveau meer dan twee variabelen op ordinaal niveau alle variabelen op interval- alle variabelen op interval- afhankelijke variabele op interval- minimaal één variabele op interval- minimaal één variabele als een dichotomie Les 21 Les 22 Les 23 Les 24 Les 25 Moderatie specifieke vorm van regressieanalyse Les 26 Mediatie specifieke vorm van regressieanalyse Les 27 Meervoudige variantie MANOVA Varia ANCOVA afhankelijke variabele op interval- twee of meer variabelen op nominaal niveau afhankelijke variabele op interval- minimaal één variabele op nominaal/categoraal niveau minimaal één variabele op interval- Les 28 Les 29 Steekproefgrootte bepalen Les 30 Foeke van der Zee 11

14 OVERZICHT VAN DE LESSEN IN DE ONLINE CURSUS SPSS Gegevens invoeren Data in Excel Aanmaken in Excel en inlezen in SPSS Les 1 Basisvaardigheden SPSS Het codeboek De datafile van SPSS Les 2 Hercoderen en berekeningen De opdrachten Compute en Recode Les 3 maken Dataselectie De opdrachten Select Cases en Split File Les 4 De SPSS- files De data- output en syntaxfiles Les 5 Files samenvoegen en aggregeren Les 6 Beschrijvende statistiek Frequenties en gemiddelden Frequencies Les 7 Kruistabellen Crosstabs Les 8 Correlaties Correlate Les 9 Grafieken Graphs Les 10 Test- en schaalconstructie Factoranalyse De opdracht Scale Les 11 Cronbachs alfa De opdracht Reliability Les 12 Variantieanalyses t- test Independent samples t- test Les 13 Means, ANOVA en GLM Drie vormen voor het uitvoeren van een ANOVA Les 14 MW- toets en KW- toets Gepaarde metingen Non- parametrische alternatieven voor een ANOVA t- toets voor paren, herhaalde metingen ANOVA, de Wilcoxon- en de Friedmantoets Les 15 Les 16 MANOVA Meervoudige indelingen en covariaten Les 17 Regressieanalyses Lineaire regressie Univariate, multipele en hiërarchische regressieanalyse Les 18 Dummy s Zin en onzin over dummy s Les 19 Interactie Voorkom fouten, moderatie en mediatie Les 20 Foeke van der Zee 12

Wat te doen met die lange variabele- labels in SPSS?

Wat te doen met die lange variabele- labels in SPSS? Wat te doen met die lange variabele- labels in SPSS? (Hulp bij Onderzoek, Groningen, versie 8 april 2014) mag zowel met als zonder streepjes Voorwoord In onze white papers behandelen we onderwerpen die

Nadere informatie

Maak je eigen statistische tabellen in Excel

Maak je eigen statistische tabellen in Excel Maak je eigen statistische tabellen in Excel (Hulp bij Onderzoek, Groningen, versie 7 april 2014) mag zowel met als zonder streepjes Voorwoord In een reeks white papers behandelen we een aantal onderwerpen

Nadere informatie

Welke statistische toets moet! mag je gebruiken?

Welke statistische toets moet! mag je gebruiken? Welke statistische toets moet! mag je gebruiken? Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016) www.hulpbijonderzoek.nl Voorwoord Dit paper maakt deel uit van een reeks papers

Nadere informatie

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28 Inhoud Woord vooraf 13 Hoofdstuk 1. Inductieve statistiek in onderzoek 17 1.1 Wat is de bedoeling van statistiek? 18 1.2 De empirische cyclus 19 1.3 Het probleem van de inductieve statistiek 20 1.4 Statistische

Nadere informatie

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013 7.2.4 Voorbeeld van een kwantitatieve analyse (fictief voorbeeld) In onderstaand voorbeeld werken we met fictieve data. Doel van dit voorbeeld is dat je inzicht krijgt in hoe een onderzoeksrapport van

Nadere informatie

Replicatieonderzoek. Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016)

Replicatieonderzoek. Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016) Replicatieonderzoek Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016) Voorwoord Dit paper maakt deel uit van een reeks papers waarin ik een aantal onderwerpen behandel die te maken

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding. SPSS is een alom gebruikt, gebruiksvriendelijk statistisch programma dat vele analysemogelijkheden kent. Voor HBO en universitaire

Nadere informatie

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistiek 2 deel A 30 minuten over statistisch toetsen Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014 Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie +

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

Representativiteit. Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016)

Representativiteit. Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016) Representativiteit Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 2, februari 2016) www.hulpbijonderzoek.nl Voorwoord Dit paper maakt deel uit van een reeks papers waarin ik een aantal onderwerpen

Nadere informatie

Fasen in het onderzoeksproces

Fasen in het onderzoeksproces Fasen in het onderzoeksproces Gegevensbestand Controleren gegevens Bewerken gegevens Analyseren gegevens Interpreteren resultaten Nieuwe vragen? ja Onderzoeksverslag 1 Bestand opmaken Variabelen definiëren:

Nadere informatie

Statistiek ( ) eindtentamen

Statistiek ( ) eindtentamen Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Bij Excel denken de meesten niet direct aan een statistisch programma. Toch biedt Excel veel mogelijkheden tot statistische

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

Klantonderzoek: statistiek!

Klantonderzoek: statistiek! Klantonderzoek: statistiek! Statistiek bij klantonderzoek Om de resultaten van klantonderzoek juist te interpreteren is het belangrijk de juiste analyses uit te voeren. Vaak worden de mogelijkheden van

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

Hoofdstuk 13. De omvang van een steekproef bepalen

Hoofdstuk 13. De omvang van een steekproef bepalen Hoofdstuk 13 De omvang van een steekproef bepalen Steekproefnauwkeurigheid Steekproefnauwkeurigheid: verwijst naar hoe dicht een steekproefgrootheid (bijvoorbeeld het gemiddelde van de antwoorden op een

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

Workshop Qualtrics & SPSS

Workshop Qualtrics & SPSS Workshop Qualtrics & SPSS Voor afstudeerbegeleiders en examinatoren CE Sjoukje Goldman: s.p.k.goldman@hva.nl 24 april 2018 1 Inhoud 1. Aan de slag met Qualtrics 2. Validiteit, betrouwbaarheid & representativiteit

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5 1. De onderzoekers van een preventiedienst vermoeden dat werknemers in een bedrijf zonder liften fitter zijn dan werknemers

Nadere informatie

Onderzoek. B-cluster BBB-OND2B.2

Onderzoek. B-cluster BBB-OND2B.2 Onderzoek B-cluster BBB-OND2B.2 Succes met leren Leuk dat je onze bundels hebt gedownload. Met deze bundels hopen we dat het leren een stuk makkelijker wordt. We proberen de beste samenvattingen voor jou

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Hoofdstuk 7: De analyse en rapportering van jouw empirisch onderzoek

Hoofdstuk 7: De analyse en rapportering van jouw empirisch onderzoek Hoofdstuk 7: De analyse en rapportering van jouw empirisch onderzoek Nadat je je empirisch of veldonderzoek voltooide, en je hebt de data ingevoerd, moet je die ook analyseren, verwerken en rapporteren.

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee

Methodologie voor onderzoek in de verpleegkunde. Foeke van der Zee Methodologie voor onderzoek in de verpleegkunde Foeke van der Zee Inhoudsopgave 1. Onderzoek, wat is dat eigenlijk... 1 1.1 Hoe is onderzoek te omschrijven... 1 1.2 Is de onderzoeker een probleemoplosser

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren: INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 4 1. Toets met behulp van SPSS de hypothese van Evelien in verband met de baardlengte van metalfans. Ga na of je dezelfde conclusies

Nadere informatie

Toegepaste Statistiek, Week 6 1

Toegepaste Statistiek, Week 6 1 Toegepaste Statistiek, Week 6 1 Eén ordinale en één nominale variabele Nominale variabele met TWEE categorieën, 1 en 2 Ordinale variabele normaal verdeeld binnen iedere categorie? Variantie in beide categorieën

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Statistiek II. Sessie 5. Feedback Deel 5

Statistiek II. Sessie 5. Feedback Deel 5 Statistiek II Sessie 5 Feedback Deel 5 VPPK Universiteit Gent 2017-2018 Feedback Oefensessie 5 1 Statismex, gewicht en slaperigheid2 1. Lineair model: slaperigheid2 = β 0 + β 1 dosis + β 2 bd + ε H 0 :

Nadere informatie

Onderzoeksleidraad (tevens checklist voor onderzoek)

Onderzoeksleidraad (tevens checklist voor onderzoek) Onderzoeksleidraad (tevens checklist voor onderzoek) Foeke van der Zee (Hulp bij Onderzoek, Groningen, versie 1, augustus 2015) Voorwoord Dit white paper maakt deel uit van een reeks white papers. Hierin

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6 1. Iemand kiest geblinddoekt 4 paaseitjes uit een mand met oneindig veel paaseitjes. De helft is melkchocolade, de andere

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) KWANTITATIEF TESTEN experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) tips Google Wikipedia MIT 14, 15 stats.stackexchange.com ander onderzoek dat lijkt op het jouwe experimenteel ontwerp kwantitatieve

Nadere informatie

Verband tussen twee variabelen

Verband tussen twee variabelen Verband tussen twee variabelen Inleiding Dit practicum sluit aan op hoofdstuk I-3 van het statistiekboek en geeft uitleg over het maken van kruistabellen, het berekenen van de correlatiecoëfficiënt en

Nadere informatie

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA)

HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) HOOFDSTUK VIII VARIANTIE ANALYSE (ANOVA) DATA STRUKTUUR Afhankelijke variabele: Eén kontinue variabele Onafhankelijke variabele(n): - één discrete variabele: één gecontroleerde factor - twee discrete variabelen:

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt A. Effect & het onderscheidingsvermogen Effectgrootte (ES) De effectgrootte (effect size) vertelt ons iets over hoe relevant de relatie tussen twee variabelen is in de praktijk. Er zijn twee soorten effectgrootten:

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij: Correlatie analyse Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1

Nadere informatie

werkcollege 6 - D&P9: Estimation Using a Single Sample

werkcollege 6 - D&P9: Estimation Using a Single Sample cursus 9 mei 2012 werkcollege 6 - D&P9: Estimation Using a Single Sample van frequentie naar dichtheid we bepalen frequenties van meetwaarden plot in histogram delen door totaal aantal meetwaarden > fracties

Nadere informatie

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek.

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek. Bijeenkomst 3 1 Programma Mini-presentaties Vragenlijst maken Kwaliteit van de vragenlijst: betrouwbaarheid en validiteit Vooruitblik: analyse van je resultaten Aan de slag: - Construct-> dimensies ->

Nadere informatie

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking Opdracht 9a ----------- t-procedures voor een enkelvoudige steekproef Voor de meting van de leesvaardigheid van kinderen wordt als toets de Degree of Reading Power (DRP) gebruikt. In een onderzoek onder

Nadere informatie

Professionaliseringstraject onderzoeksvaardigheden voor docenten. prof. dr. Saskia Brand-Gruwel

Professionaliseringstraject onderzoeksvaardigheden voor docenten. prof. dr. Saskia Brand-Gruwel Professionaliseringstraject onderzoeksvaardigheden voor docenten prof. dr. Saskia Brand-Gruwel Leerdoelen Na het volgen van dit professionaliseringtraject: heeft u kennis en inzicht in de gehele onderzoekscyclus;

Nadere informatie

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren Hoofdstuk 18 Verbanden tussen variabelen vaststellen en interpreteren Analyse van verbanden Analyse van verbanden: bij de analyse van verbanden stel je vast of er een stabiel verband bestaat tussen twee

Nadere informatie

Statistische variabelen. formuleblad

Statistische variabelen. formuleblad Statistische variabelen formuleblad 0. voorkennis Soorten variabelen Discreet of continu Bij kwantitatieve gegevens gaat het om meetbare gegeven, zoals temperatuur, snelheid of gewicht. Bij een discrete

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op dinsdag 5-03-2005, 9.00-22.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing Bijlage 3 Statistische toetsing: werkwijze, toetsen, formules, toepassing In dit boek wordt kennis van statistiek en statistische ( hypothese)toetsing in principe bekend verondersteld. Niettemin geven

Nadere informatie

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen. Oplossingen hoofdstuk IX 1. Bestaat er een verband tussen het geslacht en het voorkomen van dyslexie? Uit een aselecte steekproef van 00 leerlingen (waarvan 50% jongens en 50% meisjes) uit het basisonderwijs

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

werkcollege 6 - D&P10: Hypothesis testing using a single sample

werkcollege 6 - D&P10: Hypothesis testing using a single sample cursus huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 werkcollege 6 - D&P10: Hypothesis testing using a single sample Activities 9.3 en 9.4 van schatting naar toetsing vorige bijeenkomst: populatie-kenmerk

Nadere informatie

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf. Opdracht 10a ------------ t-procedures voor gekoppelde paren t-procedures voor twee onafhankelijke steekproeven samengestelde t-procedures voor twee onafhankelijke steekproeven Twee groepen van 10 leraren

Nadere informatie

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15)

KWANTITATIEF TESTEN. experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) KWANTITATIEF TESTEN experimenteel ontwerp (MIT 14) statistische analyse (MIT 15) tips Google Wikipedia MIT 14, 15 stats.stackexhchange.com ander onderzoek dat lijkt op het jouwe experimenteel ontwerp kwantitatieve

Nadere informatie

Toegepaste Statistiek, Week 3 1

Toegepaste Statistiek, Week 3 1 Toegepaste Statistiek, Week 3 1 In Week 2 hebben we toetsingstheorie besproken mbt een kwantitatieve (ordinale) variabele G, en met name over zijn populatiegemiddelde E(G). Er waren twee gevallen: Er is

Nadere informatie

tudievragen voor het vak TCO-2B

tudievragen voor het vak TCO-2B S tudievragen voor het vak TCO-2B 1 Wat is fundamenteel/theoretisch onderzoek? 2 Geef een voorbeeld uit de krant van fundamenteel/theoretisch onderzoek. 3 Wat is het doel van fundamenteel/theoretisch onderzoek?

Nadere informatie

1. Introductie tot SPSS

1. Introductie tot SPSS 1. Introductie tot SPSS Wat is SPSS? SPSS is een statistisch computerprogramma dat door wetenschappers wordt gebruikt om gegevens te verzamelen, analyseren en te bewerken. Het wordt voornamelijk gebruikt

Nadere informatie

Analyse van kruistabellen

Analyse van kruistabellen Analyse van kruistabellen Inleiding In dit hoofdstuk, dat aansluit op hoofdstuk II-13 (deel2) van het statistiekboek wordt ingegaan op het analyseren van kruistabellen met behulp van SPSS. Met een kruistabel

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets

Nadere informatie

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling Bijlage II Aanvullende analyses 1 Inleiding In aanvulling op de kwantitatieve informatie over de diverse arbeid-en-zorg thema s, is een aantal analyses verricht Aan deze analyses lagen de volgende onderzoeksvragen

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden

gegevens analyseren Welk onderzoekmodel gebruik je? Quasiexperiment ( 5.5) zonder controle achtergronden een handreiking 71 hoofdstuk 8 gegevens analyseren Door middel van analyse vat je de verzamelde gegevens samen, zodat een overzichtelijk beeld van het geheel ontstaat. Richt de analyse in de eerste plaats

Nadere informatie

1 Basisbegrippen, W / O voor waar/onwaar

1 Basisbegrippen, W / O voor waar/onwaar Naam - Toetsende Statistiek Rijksuniversiteit Groningen Lente Docent: John Nerbonne Tentamen di. 22 juni om 14 uur tentamenhal Belangrijke instructies 1. Schrijf uw naam & studentnummer hierboven, schrijf

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen? Opdracht 15a ------------ Spearman rangcorrelatie coefficient (non-parametrische tegenhanger van de Pearson correlatie coefficient) Wilcoxon symmetrie-toets (non-parametrische tegenhanger van de t-procedure

Nadere informatie

Statistiek is zo saai nog niet! Een integratie van theorie en praktijk Manfred te Grotenhuis

Statistiek is zo saai nog niet! Een integratie van theorie en praktijk Manfred te Grotenhuis Docentendag Arnhem, 19 maart 2013 Statistiek is zo saai nog niet! Een integratie van theorie en praktijk Manfred te Grotenhuis Statistiek is zo saai nog niet: de boeken 2 Basiscursus SPSS Hoe is het ontstaan?

Nadere informatie

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi

Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi Inhoudsopgave Voorwoord van Hester van Herk... iii Voorwoord van Foeke van der Zee... iv Verantwoording... vi INTRODUCTIE... 1 1. Wat is onderzoek... 2 1.1 Een definitie van onderzoek... 2 1.2 De onderzoeker

Nadere informatie

Experimenteel en Correlationeel Onderzoek

Experimenteel en Correlationeel Onderzoek Experimenteel en Correlationeel Onderzoek In veel onderzoek is het doel: Het vaststellen van oorzaak-gevolg (causale) relaties Criteria voor causaliteit 1. Samenhang (correlatie, covariantie) 2. Opeenvolging

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets Vandaag Onderzoeksmethoden: Statistiek 4 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap: Hypothese toetsen t-toets

Nadere informatie

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K.

Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K. Antwoorden bij Testtheorie. Inleiding in de theorie van de psychologische test en zijn toepassingen, door P. J. D. Drenth en K. Sijtsma Opmerking vooraf: Enkele docenten hebben ons laten weten dat zij

Nadere informatie

Ene variabele. Nonparametrische toetsen. Kolmogorov-Smirnov. Kolmogorov-Smirnov. Andere variabele. Onderzoekspracticum.

Ene variabele. Nonparametrische toetsen. Kolmogorov-Smirnov. Kolmogorov-Smirnov. Andere variabele. Onderzoekspracticum. Nonparametrische Data Analyse (NPDA) Nonparametrische toetsen Andere variabele Onderzoekspracticum Sessie Gjalt-Jorn Peters gjp@ou.nl Ene variabele Dichotoom: afhankelijke Dichotoom: Meer dan twee Nominaal

Nadere informatie

Omnibusenquête deelrapport. Werk, zorg en inkomen

Omnibusenquête deelrapport. Werk, zorg en inkomen Omnibusenquête 2015 deelrapport Werk, zorg en inkomen Omnibusenquête 2015 deelrapport Werk, zorg en inkomen OMNIBUSENQUÊTE 2015 deelrapport WERK, ZORG EN INKOMEN Zoetermeer, 25 januari 2016 Gemeente Zoetermeer

Nadere informatie

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef Statistiek II Onderdeel toetsen binnen de cursus: 1. Eenvoudig toetsen Toetsen en schatten ivm één statistiek of steekproef Via de z-verdeling, als µ onderzocht wordt en gekend is: Via de t-verdeling,

Nadere informatie

werkcollege 7 - D&P10: Hypothesis testing using a single sample

werkcollege 7 - D&P10: Hypothesis testing using a single sample cursus 11 mei 2012 werkcollege 7 - D&P10: Hypothesis testing using a single sample huiswerk opgaven Ch.9: 1, 8, 11, 12, 20, 26, 36, 37, 71 Activities 9.3 en 9.4 experimenten zelf deelnemen als proefpersoon

Nadere informatie

De zin en onzin van sample size berekeningen. Jos Twisk

De zin en onzin van sample size berekeningen. Jos Twisk De zin en onzin van sample size berekeningen Jos Twisk Sample size berekeningen Nodig voor subsidiegevers Nodig voor medisch etische commissies Nodig in verband met consort statement Sample size berekening

Nadere informatie

Methodologie voor onderzoek in zorg, welzijn en hulpverlening. Foeke van der Zee

Methodologie voor onderzoek in zorg, welzijn en hulpverlening. Foeke van der Zee Methodologie voor onderzoek in zorg, welzijn en hulpverlening Foeke van der Zee Niets uit deze uitgave mag worden verveelvuldigd, opgeslagen in een geautomatiseerd gegevensbestand, of openbaar worden gemaakt,

Nadere informatie

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008 Examen Statistische Modellen en Data-analyse Derde Bachelor Wiskunde 14 januari 2008 Vraag 1 1. Stel dat ɛ N 3 (0, σ 2 I 3 ) en dat Y 0 N(0, σ 2 0) onafhankelijk is van ɛ = (ɛ 1, ɛ 2, ɛ 3 ). Definieer

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) Avondopleiding. donderdag 6-6-3, 9.-. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

feb 2013 Instituut CMI SPSS les 2

feb 2013 Instituut CMI SPSS les 2 feb 2013 Instituut CMI SPSS les 2 Onderzoek toont aan.. Mobiele nieuwssites populairst onder 18-34 jarigen 18 tot 34 jarigen maken over de gehele dag het meest gebruik van mobiel internet. Dit blijkt uit

Nadere informatie