Statistiek 2 deel A 30 minuten over statistisch toetsen

Vergelijkbare documenten
Inhoud. Woord vooraf 13. Hoofdstuk 1. Inductieve statistiek in onderzoek 17. Hoofdstuk 2. Kansverdelingen en kansberekening 28

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Formules Excel Bedrijfsstatistiek

HOOFDSTUK VI NIET-PARAMETRISCHE (VERDELINGSVRIJE) STATISTIEK

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

College 3 Meervoudige Lineaire Regressie

Statistiek 1. R.J. Baars, MSc Kruytgebouw N710 december 2013

Zomerschool Vakdidactisch Onderzoek Leuven, 8-10 september 2010 Sessie 8: Analyse van kwantitatieve data

toetskeuze schema verschillen in gemiddelden

Toegepaste Statistiek, Week 6 1

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Cursus Statistiek Parametrische en non-parametrische testen. Fellowonderwijs Intensive Care UMC St Radboud

Introductie periode 2b. Fysische Chemie en Statistiek 1

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Parametervrije toetsen

2 Meetwaarden verschillen. Hoe komt dat? 3 Spreiding van data (meetresultaten)

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Les 1: Waarschijnlijkheidrekening

Toegepaste Statistiek, Dag 7 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

5.0 Voorkennis. Er zijn verschillende manieren om gegevens op een grafische wijze weer te geven: 1. Staafdiagram:

Schriftelijk tentamen - UITWERKINGEN

a. Wanneer kan men in plaats van de Pearson correlatie coefficient beter de Spearman rangcorrelatie coefficient berekenen?

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

8. Analyseren van samenhang tussen categorische variabelen

Inhoud. 1 Inleiding tot de beschrijvende statistiek Maatstaven voor ligging en spreiding Kansrekening 99

Fasen in het onderzoeksproces

Data analyse Inleiding statistiek

9. Lineaire Regressie en Correlatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Niet-Parametrische Statistiek

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

Inhoudsopgave. Deel I Schatters en toetsen 1

Statistiek met Excel. Schoolexamen en Uitbreidingsopdrachten. Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14

Toegepaste Statistiek, Week 3 1

Data analyse Inleiding statistiek

Kansrekening en Statistiek

introductie toetsen power pauze hypothesen schatten ten slotte introductie toetsen power pauze hypothesen schatten ten slotte

Kruis per vraag slechts één vakje aan op het antwoordformulier.

Kansrekening en Statistiek

Antwoordvel Versie A

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Verklarende Statistiek: Toetsen. Zat ik nou in dat kritische gebied of niet?

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

Statistische variabelen. formuleblad

Oefenvragen bij Statistics for Business and Economics van Newbold

Nominaal Ordinaal Interval (ratio) Nominaal - Kwalitatief - Laagste niveau - Categorieën niet ordenen - Geslacht

Inductieve statistiek voor informatiewetenschappers

beoordelingskader zorgvraagzwaarte

Bijlage Bijlage 3. Statistische toetsing: werkwijze, toetsen, formules, toepassing

Data analyse Inleiding statistiek

Onderzoek. B-cluster BBB-OND2B.2

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

Statistiek 1. Dr. M.J. Louwerse David de Wiedgebouw 4.88 december 2014

Beschrijvende statistiek

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Statistiek voor A.I.

Statistiek Casus Van het rechte pad

Open en Gepersonaliseerd Statistiekonderwijs (OGS) Deliverable 1.1 Requirements

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Statistiek. Statistiek in het laboratorium van de ziekenhuisapotheek; deel 1.

INDUCTIEVE STATISTIEK

Hoofdstuk 6 Twee populaties: parametrische toetsen

Statistiek II. Sessie 5. Feedback Deel 5

statviewtoetsen 18/12/ Statview toets, 2K WE, 30 mei Fitness-campagne Dominantie bij muizen... 4

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

7.1 Toets voor het gemiddelde van een normale verdeling

Statistiek I Samenvatting. Prof. dr. Carette

Hoofdstuk 18. Verbanden tussen variabelen vaststellen en interpreteren

College 2 Enkelvoudige Lineaire Regressie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

Havo A deel 1 H2 Statistiek - Samenvatting

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Modelexamen Statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

De data worden ingevoerd in twee variabelen, omdat we te maken hebben met herhaalde metingen:

Inhoud. Inleiding 15. Deel I Beschrijvende statistiek 17

Statistiek: Herhaling en aanvulling

Korte uitleg van twee veelvoorkomende statistische toetsen Veel wetenschappelijke hypothesen kunnen statistisch worden getoetst. Aan de hand van een

Statistiek ( ) eindtentamen

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Examen G0N34 Statistiek

HAVO 4 wiskunde A. Een checklist is een opsomming van de dingen die je moet kennen en kunnen. checklist SE1 wiskunde A.pdf

Hoeveel condities zijn er (ga er vanuit dat het design fully crossed is)?

Experimenteel en Correlationeel Onderzoek

Voorbeeldtentamen Statistiek voor Psychologie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek (2DD14) op vrijdag 17 maart 2006, uur.

Statistische toetsen

4 Domein STATISTIEK - versie 1.2

Vrije Universiteit 28 mei Gebruik van een (niet-grafische) rekenmachine is toegestaan.

Transcriptie:

Statistiek 2 deel A 30 minuten over statistisch toetsen R.J. Baars, MSc Kruytgebouw N710 r.j.baars@uu.nl februari 2014

Opbouw van statistiek Statistiek 1 (periode 2: vandaag) Dit college + zelfstudie + thuisopdracht Statistiek 2 (periode 3: 3/10/17 februari) Mini-college 1: statistisch toetsen Mini-college 2: Powerfit en ijklijnen Mini-college 3: Harris en verder Statistiek 3 (periode 3: 12 maart) Toetsvraag in de Harris-toets

Thuisopdracht 2 Wat heb je er voor nodig? Zie practicum.chem.uu.nl/ 3 mini-colleges (vooral deze) Handleiding Statistiek 1 Dictaat Statistiek voor Chemici Hoe, wanneer en waar lever je het in? uiterlijk 28 februari 2014, 17:00, op papier, Kruytgebouw N710 SUCCES!

De zin van statistiek Stellen van de juiste vragen Is mijn steekproef wel representatief voor de populatie? Zijn mijn twee steekproeven hetzelfde? Heb ik uitschieters in mijn meetgegevens? Iedere omstandigheid heeft een juiste vraag nodig, en een juiste toets. 4

Statistisch toetsen Doel R,I = Ratio, Interval O = Ordinaal N = Nominaal NV = Normaal Verdeeld NNV = Niet NV beschrijving van één groep vergelijk van één groep met theorie vergelijk van twee groepen vergelijk van meer dan twee groepen correlatie tussen twee variabelen voorspellingen NV R,I O N NNV ANOVA (+ variaties), Kruskal-Wallis test, Friedman test, Cochrane Q, e.a. (niet-)lineaire regressie R,I O N σ bekend σ niet bekend onafhankelijk (ongepaard) afhankelijk (gepaard) niet-parametrische regressie z-test t-test R,I O N R,I O N logistische regressie R,I O N Wilcoxon test Fisher s test R,I O N NV NNV χ 2 -test gemiddelde, st.dev. NV NNV NV NNV NV NNV mediaan, kwartielen σ bekend σ niet bekend t-test (gepaard) McNemar s test Spearman correlatie frequenties z-test (2 groepen) t-test (2 groepen) Mann- Whitney test Wilcoxon test Pearson correlatie kruistabel

Statistisch toetsen t-toets voor één steekproef (al bij Statistiek 1) t-toets voor twee steekproeven gelijke variantie ongelijke variantie F-toets voor varianties (zie dictaat) Dixon Q-toets voor uitschieters

t-toets voor één steekproef Is mijn steekproef representatief voor de populatie? oftewel Wijkt x significant af van μ? Nodig: μ, x, s en n. Bereken toetsvariabele t = x μ s/ n Zoek kritieke waarde van t op (bv. in Harris) bij het juiste aantal vrijheidsgraden ν = n 1 en α = 0.05 (95% betrouwbaarheid, tweezijdig) Als t berekend < t kritiek, dan is er geen significant verschil tussen x en μ.

Grafische weergave van t-toets t-verdeling met ν = 5 Toetsvariabele t = x μ s/ n Kritieke t-waarde (α = 0.05, tweezijdig) t = 2,571 95% gebied Alle t-waarden binnen dit gebied (t < t kritiek ) duiden op geen significant verschil.

Intermezzo: eenzijdig vs. tweezijdig tweezijdig t-verdeling met ν = 5 eenzijdig 95% gebied 95% gebied t kritiek t kritiek Voor tweezijdig: t kritiek = 2,571 (α = 0.05) Toetsvraag: x μ Voor eenzijdig: t kritiek = 2,015 Toetsvraag: x > μ of x < μ (α = 0.05) Let op of tabellen t-waarden voor eenzijdige of tweezijdige onzekerheid geven. Harris geeft tweezijdig. Desnoods omrekenen: t α,tweezijdig = t 2α,eenzijdig.

t-toets voor twee steekproeven Verschillen twee steekproef significant van elkaar? oftewel Wijkt x A af van x B? Bepaal of de steekproeven uit een populatie met gelijke variantie zijn genomen (F-toets): Gelijk σ 2 A = σ 2 B Ongelijk σ 2 A σ 2 B Verder hetzelfde als anders: bereken t, zoek kritieke t op en vergelijk. Als t berekend < t kritiek, dan is er geen significant verschil tussen x A en x B.

t-toets voor twee steekproeven Toetsvariabele t = x A x B S AB σ 2 A = σ 2 B S AB = 1 + 1 n A n B ν = n A + n B 2 n A 1 s 2 A+(n B 1)s 2 B n A +n B 2 σ 2 A σ 2 B S AB = s2 A n A ν = s2 A n A + s2 B n B + s2 B n B 2 s 2 A n A 2 B n B n A 1 + s2 2 n B 1 Varianties gelijk? Pas F-toets toe (zie dictaat)

Intermezzo: histogram Steekproef met n = 22 (waarden in ml) Hoe geef je dit slim grafisch weer? 10,4 10,8 10,9 10,7 10,2 10,3 10,6 10,6 10,4 10,7 10,6 10,4 10,1 10,6 10,8 10,3 11,3

Intermezzo: histogram Aantal Indelen in klassen Klasse (ml) 10,0 10,2 2 10,2 10,4 5 10,4 10,6 9 10,6 10,8 4 10,8 11,0 1 11,0 11,2 0 11,2 11,4 1 Aantal 10 8 6 4 2 0 Klassen (ml) Kies klassenbreedte met makkelijke getallen, niet te klein en niet te groot (of bekijk officiële procedure in het dictaat).

Intermezzo: histogram Aantal Indelen in klassen Klasse (ml) 10,0 10,2 2 10,2 10,4 5 10,4 10,6 9 10,6 10,8 4 10,8 11,0 1 11,0 11,2 0 11,2 11,4 1 Aantal 10 8 6 4 2 0 Klassen (ml) Kies klassenbreedte met makkelijke getallen, niet te klein en niet te groot (of bekijk officiële procedure in het dictaat).

Dixons Q-test voor uitschieters Is er een significant afwijkende meetwaarde in mijn steekproef aanwezig? Statistisch verantwoord negeren van een dergelijke uitschieter 10,4 10,6 10,8 10,9 10,7 10,6 10,1 10,3 10,2 10,4 10,6 10,6 10,8 10,4 10,3 10,7 11,3 Stap 1: sorteer de waarden zodat de verdachte waarde voorop staat (hoog naar laag, of laag naar hoog) 11,3 10,9 10,8 10,8 10,3 10,3 10,2 10,1 ml

Dixons Q-test voor uitschieters Stap 2: zoek op wat je moet berekenen (zie dictaat) Q berekend Q kritiek

Dixons Q-test voor uitschieters Voor n = 22, bereken Q = (x 3 x 1 )/(x n 2 x 1 ) 11,3 10,9 10,8 10,8 10,3 10,3 10,2 10,1 ml Stap 3: vergelijk Q s en trek conclusie Q berekend = (10,8 11,3)/(10,3 11,3) = 0,500 Q kritiek = 0,430 Als Q berekend < Q kritiek dan geen significante uitschieter. Hier: wel uitschieter! Dus: weglaten in de berekening van gemiddelde, st.dev., 95%-betrouwbaarheidsgebied, etc.