Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

Vergelijkbare documenten
Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Onderzoek. B-cluster BBB-OND2B.2

Analyse van kruistabellen

A. Week 1: Introductie in de statistiek.

Bestaat er een betekenisvol verband tussen het geslacht en het voorkomen van dyslexie? Gebruik de Chi-kwadraattoets voor kruistabellen.

Oplossingen hoofdstuk 9

8. Analyseren van samenhang tussen categorische variabelen

9. Lineaire Regressie en Correlatie

SPSS. Statistiek : SPSS

Workshop Qualtrics & SPSS

Vergelijken van twee groepen (SPSS)

DEEL 1 Probleemstelling 1

Je kunt al: -de centrummaten en spreidingsmaten gebruiken -een spreidingsdiagram gebruiken als grafische weergave van twee variabelen

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Verband tussen twee variabelen

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

Fasen in het onderzoeksproces

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

11. Multipele Regressie en Correlatie

gemiddelde politieke interesse van hoger opgeleide mensen)

Het gebruik van SPSS voor statistische analyses. Een beknopte handleiding.

De correlatie kan opgevraagd worden via Analyze Correlate Bivariate en vervolgens maken we een keuze voor de variabelen. Dit levert als output op:

Basishandleiding SPSS

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen....

Hoofdstuk 5 Een populatie: parametrische toetsen

Open het databestand in SPSS en kies Analyze > Correlate > Bivariate. Vul vervolgens het dialoogvenster in als volgt:

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Hoofdstuk 8: Multipele regressie Vragen

1BA PSYCH Statistiek 1 Oefeningenreeks 2 1

Meten: algemene beginselen. Harry B.G. Ganzeboom ADEK UvS College 1 28 februari 2011

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

lengte aantal sportende broers/zussen

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Beschrijvende statistiek

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen gewest, tetra en freq.

Opdracht 5a Kruistabellen

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Statistiek 2 deel A 30 minuten over statistisch toetsen

Statistische variabelen. formuleblad

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling

DEEL II DOEN! - Praktische opdracht statistiek WA- 4HAVO

Klantonderzoek: vraagstelling!

HOOFDSTUK VII REGRESSIE ANALYSE

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Opgaven hoofdstuk 12 Enkelvoudige lineaire regressie

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Data analyse Inleiding statistiek

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

4.1 Cijfermateriaal. In dit getal komen zes nullen voor. Om deze reden geldt: = 10 6

Handleiding SPSS tabellen en kruistabellen. In een paar stappen van spss data naar bruikbare informatie.

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Spreidingsdiagram, kleinste-kwadraten regressielijn, correlatiecoefficient

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

mlw stroom 2.1: Statistisch modelleren

Gegevensverwerving en verwerking

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Pagina 0 van 49. Webshop Bol.com. Onderzoeksvaardigheid Hogeschool Inholland Muilwijk, Sammy

Statistiek Hoorcollege 5. Χ 2 toets 10/7/2009. De Collegereeks Statistiek. Deze week. Vandaag. Keuze voor een toets

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Antwoordvel Versie A

Oplossingen hoofdstuk Het milieubesef

Inleiding tot het opstellen van een elektronische enquête met LimeSurvey

Statistiek. Beschrijvend statistiek

Hypertensie en Diabetes Mellitus in Curaçao

DOS-oefening 2. lengte Aantal sportende broers/zussen

Oplossingen hoofdstuk 4

Handleiding voor het maken van tabellen en figuren

Niveauproef wiskunde voor AAV

Voer de gegevens in in een tabel. Definieer de drie kolommen van de tabel en kies als kolomnamen groep, vooraf en achteraf.

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Beknopte beschrijving van het alcoholgebruik van automobilisten in weekeindnachten

DATA-ANALYSEPLAN (20/6/2005)

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Auteur: Vicky Franssen (2013). Update: Liesbet Matthys (2014) Methodologie en Redactie BAP Arteveldehogeschool P 138

Technische uitwerkingen voor het SPSS practicum Toetsende Statistiek

Kansrekening en Statistiek

Statistiek II. Sessie 5. Feedback Deel 5

Experimenteel en Correlationeel Onderzoek

Beschrijvende statistiek

Toegepaste Statistiek, Week 3 1

Havo A deel 1 H2 Statistiek - Samenvatting

1. CTRL- en SHIFT-knop gebruiken om meerdere variabelen te selecteren

Oefenvragen bij Statistics for Business and Economics van Newbold

6.1 Kwadraten [1] HERHALING: Volgorde bij berekeningen:

K ruistabellen. Wat is een kruistabel?

Inleiding tot de meettheorie

Kansrekening en Statistiek

Kansrekening en Statistiek

Grafieken Cirkeldiagram

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Transcriptie:

Hoofdstuk 18 Verbanden tussen variabelen vaststellen en interpreteren

Analyse van verbanden Analyse van verbanden: bij de analyse van verbanden stel je vast of er een stabiel verband bestaat tussen twee variabelen Voorbeelden: Welk verband bestaat er tussen de lengte van de verkooptraining en klanttevredenheid? Welk verband bestaat er tussen demografische variabelen en herhaalaankopen van merk A?

Soorten verbanden tussen twee variabelen Verband: een consistente en systematische koppeling tussen de niveaus of benamingen van twee variabelen. De term niveaus impliceert dat de schaal een metrische is, namelijk interval of ratio. De term benaming impliceert dat de schaal niet metrisch is, maar nominaal of ordinaal.

Soorten verbanden tussen twee variabelen Niet-monotoon: bij een niet-monotoon verband wordt de aanwezigheid (of afwezigheid) van de ene variabele systematisch gerelateerd aan de aanwezigheid (of afwezigheid) van een andere variabele. McDonald s weet bijvoorbeeld uit ervaring dat ochtendklanten meestal koffie kopen terwijl middagklanten meestal frisdrank kopen. Dat verband is op geen enkele manier exclusief: er is geen garantie dat een ochtendklant altijd koffie bestelt of dat een middagklant altijd frisdrank koopt.

McDonald s-voorbeeld van een niet-monotoon verband voor het soort drinken dat klanten bestellen bij het ontbijt en de lunch

Soorten verbanden tussen twee variabelen Monotoon: een monotoon verband is een verband waarbij de onderzoeker slechts de algemene richting van de samenhang tussen de twee variabelen kan aanduiden Stijgend Dalend Voorbeeld: De eigenaar van een schoenwinkel weet dat oudere kinderen doorgaans grotere schoenen nodig hebben dan jongere kinderen, maar er is geen manier om de leeftijd van kinderen te koppelen aan de juiste schoenmaat. Er bestaat geen universele regel voor de snelheid waarmee de voet van een kind groeit, noch voor de uiteindelijke schoenmaat die het kind krijgt. Er bestaat echter een monotoon stijgend verband tussen de leeftijd van het kind en zijn schoenmaat.

Soorten verbanden tussen twee variabelen Lineair: een rechtlijnige samenhang tussen twee variabelen. Hier levert kennis van de omvang van de ene variabele automatisch kennis op over de omvang van de andere variabele.

Soorten verbanden tussen twee variabelen Curvilineaire verbanden: die verbanden waarbij de ene variabele samenhangt met de andere variabele, maar het verband eerder de vorm van een kromme heeft dan van een rechte lijn. Een voorbeeld van een curvilineair verband dat je moet kennen is de kromme voor de levenscyclus van een product die het verkooppatroon beschrijft van een nieuw product dat langzaam groeit tijdens de introductie, vervolgens in de groeifase snel in opwaartse richting spurt en ten slotte een plateau bereikt of aanzienlijk langzamer groeit als de markt verzadigd raakt.

Verbanden tussen variabelen karakteriseren Aanwezigheid: verwijst naar de vraag of er een systematisch verband bestaat tussen twee variabelen. Richting: een monotoon verband kan stijgen of dalen. Sterkte van het verband: afhankelijk van het soort verband dat wordt onderzocht kan de sterkte van de samenhang tussen twee variabelen worden voorgesteld als sterk, gematigd, zwak of nietbestaand. Let op, volgorde is van belang: 1. Aanwezigheid 2. Richting en 3. Sterkte

Kruistabellen Kruistabellen: een tabel waarin de data worden vergeleken door middel van een indeling in rijen en kolommen. Frequentietabel: vier getallen in elke cel Frequentie Ruw percentage Tabel met kolompercentages Tabel met rijpercentages In SPSS: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS

SPSS kan kruistabellen genereren: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS

SPSS kan kruistabellen genereren: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS

Kruistabellen Bij een chi-kwadraatanalyse (χ 2 -analyse) bestudeer je de frequenties van twee nominale variabelen in een kruistabel om te bepalen of er tussen de variabelen een niet-monotoon verband bestaat. In deze situatie, twee variabelen met een nominale schaal, testen we voor een niet-monotone verband. Voorbeeld: we willen onderzoeken of er er een verband bestaat tussen studeren en studieresultaten en beiden zijn op een nominale schaal gemeten

Kruistabellen Een handig grafisch instrument dat een nietmonotoon verband illustreert is een staafdiagram.

Kruistabellen We kunnen het verband zien, maar hoe weten we of dit een systematisch verband is? Met andere woorden, is dit statistisch significant? Krijgen we dezelfde resultaten bij het herhalen van de analyse? We gebruiken de Chi-kwadraatanalyse om vast te stellen of er niet-monotone verbanden bestaan. In SPSS: ANALYZE, DESCRIPTIVE STATISTICS, CROSSTABS en in het crosstabs-venster: klik op STATISTICS en selecteer CHI- SQUARE

Chi-kwadraatanalyse Chi-kwadraatanalyse: bij een chi-kwadraatanalyse (χ 2 - analyse) bestudeer je de frequenties van twee nominale variabelen in een kruistabel om te bepalen of er tussen de variabelen een niet-monotoon verband bestaat. Waargenomen frequenties: de feitelijke tellingen in de kruistabel. Verwachte frequenties: theoretische frequenties die worden afgeleid van deze hypothese van geen verband tussen de twee variabelen.

Chi-kwadraatanalyse De berekende χ2-waarde:

Chi-kwadraatanalyse De vorm van de chi-kwadraatverdeling wordt bepaald door het aantal vrijheidsgraden. Een tabel met chi-kwadraatwaarden bevat kritieke punten om de breuk te bepalen tussen het acceptatie- en het verwerpingsgebied bij verschillende significantieniveaus.

Chi-kwadraatanalyse Hoe je een chi-kwadraatuitkomst interpreteert Uit de chi-kwadraatanalyse komt de kans naar voren dat de onderzoeker bewijs vindt voor de nulhypothese als hij het onderzoek zeer vele keren zou herhalen met onafhankelijke steekproeven. Als bijvoorbeeld uit de chi-kwadraatanalyse een kans van 0,02 blijkt voor de nulhypothese, concludeert de onderzoeker dat hij in slechts 2 procent van de gevallen bewijs vindt voor de nulhypothese. Dit betekent dat er een significant verband bestaat.

Chi-kwadraatanalyse Hoe interpreteer je een chi-kwadraatuitkomst? De chi-kwadraattoets is een van onze vlaggen die aangeeft of het wel of niet de moeite waard is om alle rij- en kolompercentages nader te onderzoeken SPSS zal de percentages van de rijen en kolommen voor je berekenen.

Wanneer kun je een kruistabel en een Chikwadraatanalyse gebruiken? Als je wil weten of er een verband bestaat tussen twee variabelen Als de schaal interval of ratio is... Let op: Je kan kruistabellen en de Chikwadraatanalyse uitvoeren als tenminste één variabele gemeten is op een interval- of ratioschaal. Maar die variable mag maar een beperkte hoeveelheid niveau s hebben. Maximaal zeven. Anders kunnen de resultaten niet correct geïnterpreteerd worden.

Hoe kunnen we het verband tussen twee variabelen van interval- en/of rationiveau meten? In dit geval proberen we de aanwezigheid, richting en de sterke van een monotone verband te bepalen. We worden hierbij geholpen door de productmomentcorrelatiecoëfficiënt van Pearson In SPSS: ANALYZE, CORRELATE, BIVARIATE

Correlatiecoëfficiënten en covariatie Covariatie grafisch weergeven met een spreidingsdiagram

De product-momentcorrelatiecoëfficiënt van Pearson Aanwezigheid. Bepaal of er een significant verband bestaat. De p- waarde van de coëfficiënt moet eerst onderzocht worden. Als die niet significant is (>0,05), dan bestaat er geen verband. Als p 0,05, dan is er wel een significant verband. We kijken dan naar Richting van het verband. Kijk naar de coëfficiënt. Is het positief (+) of negatief (-)? Sterkte van het verband. Dit getal ligt altijd tussen de -1,0 en + 1,0. Correlatiecoëfficiënten die dichter bij +1,00 of -1,00 liggen, geven een sterker verband aan. Er zijn vuistregels voor de omvang van de correlatiecoëfficiënt

Vuistregels voor de omvang van de correlatiecoëfficiënt De correlatiecoëfficiënt is een indexgetal dat altijd tussen de -1,0 en + 1,0 ligt en de sterkte en de richting van het verband tussen twee variabelen aangeeft. Het teken voor de coëfficiënt geeft de richting van het verband aan.

De product-momentcorrelatiecoëfficiënt van Pearson De product-momentcorrelatiecoëfficiënt van Pearson: hiermee meet je het lineaire verband tussen twee variabelen van interval- en/of rationiveau, zoals de variabelen die worden afgebeeld in een spreidingsdiagram

De product-momentcorrelatiecoëfficiënt van Pearson Speciale overwegingen bij procedures voor lineaire correlaties: Bij de correlatiecoëfficiënt wordt er alleen naar het verband tussen twee variabelen gekeken. Er wordt niet gekeken naar interacties met andere variabelen. Er wordt bij de correlatiecoëfficiënt expliciet niet uitgegaan van een oorzaak-engevolgverband De product-momentcorrelatiecoëfficiënt van Pearson drukt slechts lineaire verbanden uit

Als er geen verband bestaat, dan zal de p-waarde voor de correlatie groter dan 0,05 zijn

Als er wel een verband bestaat, dan zal de p-waarde voor de correlatie kleiner dan 0,05 zijn Voorbeelden: Er is een significant negatief verband tussen de afstand tot de klant en de omzet Er is een significant positief verband tussen de lengte van de verkooptraining en omzet

Afsluitende opmerkingen over de analyse van verbanden Onderzoekers zullen altijd de nul-hypothese testen dat er geen verband of geen correlatie bestaat. Als de nul-hypothese wordt verworpen, dan kan de onderzoeker de belangrijke economische bevindingen met de manager delen.