Hoofdstuk 3 Statistiek: het toetsen

Vergelijkbare documenten
Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Toetsen van Hypothesen. Het vaststellen van de hypothese

Kansrekening en Statistiek

Voorbeeldtentamen Statistiek voor Psychologie

Hoofdstuk 12: Eenweg ANOVA

Sheets K&S voor INF HC 10: Hoofdstuk 12

Toetsen van hypothesen

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Kansrekening en Statistiek

Data analyse Inleiding statistiek

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 17

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Statistiek voor A.I.

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Sheets hoorcollege 1 (over paragraaf 7.1) Uitgewerkte opgaven week 6 Antwoorden uitgewerkte opgaven week 6

Hoofdstuk 10: Regressie

Kansrekening en Statistiek

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

11.0 Voorkennis. Wanneer je met binomcdf werkt, werk je dus altijd met een kans van de vorm P(X k)

15.1 Beslissen op grond van een steekproef [1]

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Kansrekening en Statistiek

Kansrekening en Statistiek

Kansrekening en Statistiek

Oefenvragen bij Statistics for Business and Economics van Newbold

Kansrekening en Statistiek

DEEL 3 INDUCTIEVE STATISTIEK INLEIDING TOT DE INDUCTIEVE STATISTIEK 11.2 DE GROOTSTE AANNEMELIJKHEID - METHODE

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Kansrekening en Statistiek

DEZE PAGINA NIET vóór 8.30u OMSLAAN!

Les 2: Toetsen van één gemiddelde

Feedback examen Statistiek II Juni 2011

Antwoordvel Versie A

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Examen Statistiek I Januari 2010 Feedback

Inhoudsopgave. Deel I Schatters en toetsen 1

werkcollege 6 - D&P9: Estimation Using a Single Sample

Populatie: De gehele groep elementen waarover informatie wordt gewenst.

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Hoofdstuk 5: Steekproevendistributies

Toegepaste Statistiek, Week 3 1

11. Multipele Regressie en Correlatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Les 7-8: Parameter- en Vergelijkingstoetsen

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

We illustreren deze werkwijze opnieuw a.h.v. de steekproef van de geboortegewichten

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Toegepaste Statistiek, Week 6 1

werkcollege 7 - D&P10: Hypothesis testing using a single sample

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

6.1 Beschouw de populatie die wordt beschreven door onderstaande kansverdeling.

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Hoofdstuk 4 Hypothese toetsen

Statistiek II. Sessie 1. Verzamelde vragen en feedback Deel 1

Beschrijvende statistiek

6.1 Beschouw de populatie die beschreven wordt door onderstaande kansverdeling.

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Wiskunde B - Tentamen 1

Hoofdstuk 6 Hypothesen toetsen

Kansrekening en statistiek wi2105in deel 2 27 januari 2010, uur

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Wiskunde B - Tentamen 2

9. Lineaire Regressie en Correlatie

3de bach HI. Econometrie. Volledige samenvatting. uickprinter Koningstraat Antwerpen A 11,00

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Lesbrief hypothesetoetsen

Deeltentamen 2 Algemene Statistiek Vrije Universiteit 18 december 2013

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

College 2 Enkelvoudige Lineaire Regressie

Examen Statistiek I Feedback

Samenvatting Statistiek

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

SOCIALE STATISTIEK (deel 2)

Tentamen Kansrekening en statistiek wi2105in 25 juni 2007, uur

Beslissen op grond van een steekproef Hoofdstuk 15

Tentamen Mathematische Statistiek (2WS05), vrijdag 29 oktober 2010, van uur.

Transcriptie:

Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander. Vaak wil je door middel van het steekproefgemiddelde het gemiddelde van de populatie schatten. Het steekproef gemiddelde heet de schatter. Wanneer is een schatter een goede schatter? 1. Wanneer de schatter zuiver is. Een schatter mag geen systematische afwijkingen bevatten ten opzichte van de te schatten populatiegemiddelde. 2. De schattingen moeten ook bij kleine populaties in de buurt van de echte populatiewaarde liggen. Dit heet efficiëntie. 3.2 Wanneer heb je een steekproevenverdeling nodig: Een steekproevenverdeling stel je op wanneer je wil weten welke verschillen tussen het steekproefgemiddelde en het populatiegemiddelde je kan verwachten. Dit doe je, omdat wanneer je een aselecte steekproef ter grootte van n uit een populatie trekt, hij meestal niet precies gelijk is aan het populatiegemiddelde. Steekproevenverdeling van het gemiddelde: Deze verdeling bestaat uit alle mogelijke waarden van de steekproefgemiddelden en de kansen op die waarden. is de kansvariabele. De verwachte waarde van de steekproevenverdeling is: = E ( ) = (P( ) * ( ) De variantie van de steekproevenverdeling is: = E ( - )² Daarnaast kan je ook nog de verwachte waarde van de steekproevenverdeling vergelijken met de verwachte waarde van de populatie(μ). Deze zijn aan elkaar gelijk. E ( ) = = μ. Standaardfout van het gemiddelde: Dit is in feite de standaardafwijking van de fouten die je hebt gemaakt bij de schatting van μ. Die bereken je als volgt: = = Het gemiddelde van de steekproef is een zuivere schatter van het gemiddelde van de populatie omdat E ( ) = = μ. Dit is zo, omdat de verwachte waarde van de steekpoevenverdeling van het gemiddelde gelijk is aan de verwachte waarde van de populatie. Je hebt ook onzuivere schatters, dit zijn schatters die niet overeenkomen met de te schatten parameters in de populatie. Wanneer de steekproef groter wordt, wordt de schatting van het gemiddelde nauwkeuriger. Dit komt doordat de standaardfout kleiner wordt. Wanneer de steekproevenverdeling normaal verdeeld is, kunnen we op grond van het gemiddelde van de steekproef M en de steekproefgrootte n conclusies trekken over het populatiegemiddelde μ. Wanneer je daarbij de tabel voor de standaard normale verdeling wilt gebruiken, moet je het steekproefgemiddelde M eerst omzetten in een z-score door de verwachte waarde van de steekproevenverdeling ervan af te trekken (μm) en het verschil

te delen door de standaarddeviatie van de steekproevenverdeling (σm). Z-score van het steekproefgemiddelde Zm = M- μ : σm De overschrijdingskans van deze z-score kan je vervolgens opzoeken in de tabel. 3.3 Onderzoek heeft betrekking op een theorie waarvan we de juistheid willen nagaan. Een theorie is in algemene termen gefomuleerd. Hieruit kunnen meerdere onderzoekshypothesen worden afgeleiden. Deze hypothesen zijn meer specifiek. Begrippen die in de hypothese voorkomen moeten worden geoperationaliseerd. Er moet dus worden aangegeven hoe de begrippen worden gemeten. Dit leidt tot de geherformuleerde hypothese. Uit deze geherformuleerde hypothese kan een statistische hypothese worden afgeleid. De statistische hypothese wordt getoetst tegen de nulhypothese (H0), zodat je ze kan vergelijken. Een nulhypothese is een statistische bewering die zegt dat er geen verband is tussen de variabelen of dat er sprake is van een tegengestelde relatie aan die in de statistische hypothese (ofwel alternatieve hypothese). Dus = = 0 of = 0. Voorbeeld: μ=50 en σ= 10. Als het gaat om proefpersonen in een experiment die hoger gehaald moeten hebben dan het gemiddelde van 50, dan is de alternatieve hypothese dus H1: μ > 50. De alternatieve hypothese is dus de hypothese wanneer de proefpersonen bijvoorbeeld een experiment zijn ondergaan. De nulhypothese zegt het volgende: H0= μ 50. H0 gaat dus over de oppervlakte dat niet door H1 wordt bestreken Wanneer er een steekproef gehouden wordt met 64 mensen waarbij het gemiddelde 53 is en de standaarddeviatie 7 is, betekend dit niet dat je de nulhypothese kan verwerpen. Je gaat juist kijken wat de rechter overschrijdingskans van = 53 als μ= 50 is. De overschrijdingskans meet de kans op het geobserveerde steekproefgemiddelde, of een steekproefgemiddelde nog extremer. Dit gebeurt wel onder de aanname dat H0 waar is. De overschrijdingskans wordt ook wel de p-waarde genoemd. Om de richting van extreem te bepalen,, kijk je naar de alternatieve hypothese. Wanneer deze > (groter dan) zegt, ga je zoeken naar de kans dat het gemiddelde groter is. Dan zijn er 2 opties 1. Als deze kans groot is, dan komt het verschil tussen = 53 en μ= 50 waarschijnlijk door toeval. De nulhypothese wordt dan niet verworpen. 2. Als deze kans klein is (0,05 en 0,01), dan komt het verschil tussen van = 53 en μ= 50 niet door toeval. In dit geval wordt de nulhypothese verworpen. De onbetrouwbaarheidsdrempel is 0,05 en 0,01. Dit wordt ook wel het significantieniveau genoemd en wordt aangegeven met α (alfa). De grootte van de kans wordt uitgedrukt in het significantieniveau. De waarde van 0,05 of 0,01 wordt hierbij vaak gehanteerd. Deze waarde wordt aangegeven met de Griekse letter α van Alfa. De beslissingsregel hierbij is dat de nulhypothese wordt verworpen als de p- waarde kleiner is of gelijk is aan de vooraf gekozen waarde van het significantieniveau α. Verder is het van belang dat wanneer je de standaardafwijking van de populatie kennen, dat je dan die gebruikt in plaats van de standaardafwijking van de steekproef. Ook moet je nog steeds van een normale verdeling overgaan op de standaardnormale verdeling.

Formule: Dus in ons voorbeeld zou je het volgende krijgen: Dan zoek je bij P ( 53) = P(z 2,40) de kans op in de tabel. Dit is 0,0082. Er is dus sprake van een hele kleine kans. Er kan dus bijna geen sprake zijn dat het verschil op basis van toeval tot stand is gekomen. De vraag is in deze of de nul hypothese moet worden verworpen en de alternatieve hypothese moet worden aangenomen. Dan ga je kijken of de overschrijdingskans kleiner of gelijk is aan de vooraf gekozen waarde van de kans van α. Dit was 0,05. 0,0082 is kleiner dan 0,05 dus de nulhypothese moet worden verworpen. Er is dan een significant resultaat. Rapporteren: wanneer je deze resultaten gaat rapporteren, ga je niet opschrijven dat de nulhypothese verworpen is, maar je zegt dat de resultaten significant zijn. Wanneer je weet dat iets significant is, ga je kijken naar de relevantie. Dit doe je door naar de effectgrootte te kijken. Een significant resultaat is dus niet altijd relevant. Hoe groter het effect, hoe groter de relevantie. Bij het gemiddelde bereken je de effectgrootte met Cohen s d. d : M - μ0 : σ M = het gemiddelde van de steekproef μ0 = het veronderstelde gemiddelde uit H0 σ = de populatiestandaarddeviatie Richtlijnen van Cohen bij de beoordeling van de effectgrootte zijn: 0,20 : klein effect 0,50 : middelmatig effect 0,80 : groot effect Significantie is een noodzakelijke, maar geen voldoende voorwaarde voor relevantie. Iets kan significant zijn, maar als het effect zeer klein is, is het niet relevant. 3.4 Keuze van α: Hoe groot je α neemt hangt er vanaf hoe groot je het risico neemt om fouten te maken Er zijn dus 4 soorten beslissingen: 1. Fout van het eerste soort: H0 wordt verworpen terwijl H0 wel juist is (kans α, dus bijvoorbeeld 0,05 is 5%). 2. Juiste beslissing: H0 wordt niet verworpen en H0 is juist (kans 1-α, dus bijvoorbeeld 1-0,05 is 95%).

3. Juiste beslissing: H0 wordt verworpen en H0 is onjuist (kans 1-β). 4. Fout van de tweede soort: H0 wordt niet verworpen, maar H0 is onjuist (kans β). α= dit is de kans op het ten onrechte verwerpen van H0. β= dit is de kans op het ten onrechte niet verwerpen van H0. Wanneer je dus kiest voor een kleine α wordt de foutenkans β groter en andersom. Dit betekent dus ook dat je met een steekproef niet het verband in de populatie kan aantonen. Wanneer je α veel kleiner maakt, wordt de kans heel groot om een fout van de tweede soort te maken. Dat betekent dat de kans dan erg groot is dat er bijvoorbeeld in de populatie wel een verband aanwezig is, maar dat niet lukt om met behulp van een steekproef aan te tonen. Het onderscheidingsvermogen/power van de toets wordt steeds kleiner wanneer er een grotere steekproef genomen wordt. 3.5 Rechtseenzijdig toetsen: wanneer je gaat kijken of het steekproefgemiddelde ( ) groter is dan het populatiegemiddelde (μ). H0 wordt verworpen als de overschrijdingskans van de z-waarde van het gemiddelde kleiner is dan de gekozen α. Dus om het even duidelijk te stellen, bij rechtseenzijdig toetsen is er sprake van een bovengrens, en je kijkt of het steekproefgemiddelde groter is dan het populatiegemiddelde. - H0 verwerpen als: Pr (z ) α Linkseenzijdig toetsen: dit is wanneer je gaat kijken of het steekproefgemiddelde ( )kleiner is dan het populatiegemiddelde (μ). Hier is sprake van een ondergrens. - H0 verwerpen als: Pl (z ) α Tweezijdig toetsen: dit is wanneer je gaat kijken of het steekproefgemiddelde ( ) gelijk is aan het populatiegemiddelde. Je kijkt of het steekproefgemiddelde voldoende ver afwijkt van dat populatiegemiddelde (μ).hierbij wordt geen richting gespecificeerd zoals bij linkseenzijdig en rechtseenzijdig toetsen. Bij tweezijdig toetsen kijk je dus zowel naar de kant waarbij het steekproefgemiddelde te ver van die μ afwijkt omdat het te klein is, maar je kijkt ook naar de andere kant waarbij het steekproefgemiddelde te ver van die μ afwijkt omdat het te groot is. Het steekproefgemiddelde kan dus toevallig te laag uitvallen en toevallig te hoog uitvallen. Beide kansen wegen even zwaar en samen zijn ze α. Wanneer het steekproefgemiddelde hoger is dan μ, dan berekenen we de rechter overschrijdingskans. Wanneer het steekproefgemiddelde lager is dan μ, dan berekenen we de linker overschrijdingskans. - Als < μ verwerp de H0 wanneer Pd (z ) = 2Pl (z ) α - Als > μ verwerp de H0 wanneer Pd (z ) = 2Pr (z ) α Eenzijdig of tweezijdig toetsen: de keuze voor een eenzijdige toets of tweezijdige toets wordt bepaald door de formulering van de alternatieve hypothese. Als in de onderzoekshypothese duidelijk staat dat onder conditie A hoger wordt gescoord als onder conditie B, is er duidelijk sprake van een verwachte richting (rechtseenzijdig). Wordt er alleen gesproken over een verwacht verschil tussen twee groepen of een verwacht verbant tussen twee variabelen, dan wordt er tweezijdig getoetst. De keuze voor een- of tweezijdig toetsen kan soms bepalend zijn voor de vraag of resultaten significant zijn. Daarom moet je van tevoren bepalen of je eenzijdig of tweezijdig toetst.

Z-toets: hierbij ga je er vanuit dat je twee normaal verdeelde populaties hebt. Dus je hebt μ1 en σ1 van populatie 1. Daarnaast heb je μ2 en σ1 van populatie 2. Je wilt dan de gemiddelden met elkaar vergelijken met behulp van de Z-toets. Je trekt dan uit elke populatie aselect een steekproef, dan krijg je twee onafhankelijke steekproeven. Je hebt dan het gemiddelde en standaarddeviatie nodig van de steekproeven. Je krijgt dan 1 en S1 voor steekproef 1. En 2 en S2 voor steekproef 2. Voorwaarden Z-toets: 1. Wanneer de standaardafwijking (σ) bekend is en de populatie normaal verdeeld is. 2. Wanneer σ niet bekend is en de populatie niet normaal verdeeld is, n 100. Je mag dan de standaardafwijking van de steekproef (Sx) invullen als schatter. De Z-toets mag niet als: 1. Populatie niet normaal verdeeld is en n kleiner dan 100 is. Als dit het geval is nemen we bij een n tussen 30 en 100 een t-verdeling. Bij een n kleiner dan 30, gebruik je non-parametrische toetsen. Dit kan je verder vergeten voor dit vak. 2. Wanneer de populatie wel normaal verdeeld is, maar σ onbekend is en n kleiner dan 100 is. Hiervoor gebruik je de t-toets. Hypothesen Z-toets: Linkseenzijdig toetsen: H0: μ μo EN Ho < μo Rechtseenzijdig toetsen: H0: μ μo EN Ho > μo Tweezijdig toetsen: H0: μ= μo EN Ho = μo Toetsingsgrootheid Z-toets: De Z-score is de toetsingsgrootheid. De formule van de Z-score is als volgt: = = = verkregen steekproefgemiddelde = veronderstelde waarde voor het populatiegemiddelde μ n = steekproefgrootte σ = standaarddeviatie van de populatie. Beslissingsregel: De nulhypothese kan je met behulp van overschrijdingskansen en kritieke waarden verwerpen. Overschrijdingskansen H0 verwerpen als: Linkseenzijdige toetsing: Pl ( ) α Rechtseenzijdige toetsing: Pr ( ) α Tweezijdige toetsing: Pd ( ) = 2 * Pl ( ) α als < μ = 2 * Pr ( ) α als > μ Kritieke waarden Eerst moet je bepalen welke Z-waarde hoort bij welke α. De linkszijdige kritieke waarde is bij een α=0.05-1,64 en de rechtseenzijdige kritieke waarde is dan +1,64. H0 wordt verworpen als de Z-score van het gemiddelde kleiner is dan -1,64 of groter is dan +1,64. Voor tweezijdige toetsing wordt H0 verworpen als de Z-score van het gemiddelde kleiner i dan -1,96 of groter is dan +1,96. Deze zones heten de kritieke zones.

Betrouwbaarheidsinterval: De formule voor 100 (1-α)%-betrouwbaarheidsinterval van het gemiddelde is als volgt: z * < μ < + z * = verkregen steekproefgemiddelde n = steekproefgrootte μ = populatiegemiddelde α = significantieniveau σ = standaarddeviatie van de populatie z = positieve Z-waarde waarvoor geldt dat Pd(z) = α.