Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Vergelijkbare documenten
Les 5: ANOVA. Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 19 november 2018

Les 5: Analysis of variance

H7: Analysis of variance

College 6 Eenweg Variantie-Analyse

Les 2: Toetsen van één gemiddelde

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

College 2 Enkelvoudige Lineaire Regressie

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Statistiek II. 1. Eenvoudig toetsen. Onderdeel toetsen binnen de cursus: Toetsen en schatten ivm één statistiek of steekproef

Kansrekening en Statistiek

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Hoofdstuk 12: Eenweg ANOVA

11. Meerdere gemiddelden vergelijken, ANOVA

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

11. Multipele Regressie en Correlatie

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Statistiek ( ) eindtentamen

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

Algemeen lineair model

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

Kansrekening en Statistiek

Hoofdstuk 10: Regressie

Examen Kansrekening en Wiskundige Statistiek: oplossingen

Statistiek voor A.I. College 10. Donderdag 18 Oktober

Toegepaste biostatistiek

4 Domein STATISTIEK - versie 1.2

Kansrekening en Statistiek

9. Lineaire Regressie en Correlatie

Tentamen Kansrekening en Statistiek MST 14 januari 2016, uur

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

Statistiek II. Sessie 5. Feedback Deel 5

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Toegepaste Statistiek, Dag 7 1

Antwoordvel Versie A

Niet-parametrische Statistiek

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Kengetal Antwoord Nee Nee Ja Nee Ja Ja Nee Toetsgrootheid 1,152 1,113 2,048 1,295 1,152 1,113 0,607

16. MANOVA. Overeenkomsten en verschillen met ANOVA. De theorie MANOVA

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Statistiek voor A.I.

Examen G0N34 Statistiek

Kansrekening en Statistiek

H6: Enkelvoudige lineaire regressie

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Schriftelijk tentamen - UITWERKINGEN

Introductie tot de statistiek

Oriëntatie Econometrie Tijdreeksmodellen en Voorspellen. Marius Ooms. 23 April 2002, Amsterdam

Voorbeeldtentamen Statistiek voor Psychologie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

+ ( 1 4 )2 σ 2 X σ2. 36 σ2 terwijl V ar[x] = 11. Aangezien V ar[x] het kleinst is, is dit rekenkundig gemiddelde de meest efficiënte schatter.

Kansrekening en Statistiek

Opgeloste Oefeningen Hoofdstuk 8: Het Toetsen van Hypothesen

Data analyse Inleiding statistiek

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Statistiek. Lieven Clement. Statistiek: 2 de bach. in de Biologie, Biochemie en Biotechnologie, Biomedische Wetenschappen en Chemie

Data analyse Inleiding statistiek

Toetsen van hypothesen

werkcollege 6 - D&P10: Hypothesis testing using a single sample

1. Reductie van error variantie en dus verhogen van power op F-test

Feedback examen Statistiek II Juni 2011

Hoofdstuk 3 Statistiek: het toetsen

College 3 Meervoudige Lineaire Regressie

3 Enkelvoudige lineaire regressie

Kansrekening en Statistiek

Kansrekening en Statistiek

Tentamen Inleiding Statistiek (WI2615) 10 april 2013, 9:00-12:00u

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Meervoudig toetsen met de horseshoe prior

Toetsen van Hypothesen. Het vaststellen van de hypothese

Tentamen Statistische methoden MST-STM 1 juli 2010, 9:00 12:00

College 2 Enkelvoudige Lineaire Regressie

OCBS Vereniging zonder winstoogmerk Ravensteinstraat 4 B 1000 BRUSSEL TRA 418 TOEPASSINGSREGLEMENT HERZIENING 1.

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

toetskeuze schema verschillen in gemiddelden

G0N11C Statistiek & data-analyse Project tweede zittijd

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

Statistiek II. Sessie 4. Feedback Deel 4

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

Toegepaste Statistiek, Week 6 1

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Stochastiek 2. Inleiding in de Mathematische Statistiek 1 / 18

Opgaven hoofdstuk 10 Het ontwerpen van experimenten en variantieanalyse

werkcollege 7 - D&P10: Hypothesis testing using a single sample

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Examen Statistiek I Feedback

College 7 Tweeweg Variantie-Analyse

Les 1: de normale distributie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Kansrekening en Statistiek

10. De simultane kansverdeling van twee stochasten X en Y is gegeven door de volgende (onvolledige) tabel: X / /4 1. d. 0 e.

Stochastiek 2. Inleiding in the Mathematische Statistiek. staff.fnwi.uva.nl/j.h.vanzanten

Vandaag. Onderzoeksmethoden: Statistiek 4. Recap: Hypothese toetsen. Recap: One-sample t-toets

Transcriptie:

Les 5: ANOVA Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie 28 november 2018 1 Gebaseerd op de slides van Koen Van den Berge

Testen die we tot nu toe gezien hebben: Toetsen van n gemiddelde ten opzichte van een constante µ 0 H 0 : µ = µ 0 Toetsen van twee gemiddelden H 0 : µ 1 = µ 2 Het schatten van de associatie tussen twee variabelen met behulp van een enkelvoudig lineair regressiemodel van de vorm β 0 + β 1 x H 0 : β 1 = 0

Toetsen van 2 gemiddeldes Het toetsen van twee gemiddeldes met ongekende variantie H 0 : µ 1 = µ 2 vs.h 1 : µ 1 µ 2 kan men uitvoeren door de steekproefvarianties S1 2 en S 2 2 niet te poolen. Gepoolde varianties (σx 2 = σ2 Y ): al dan T = X Ȳ S p 1 n X + 1 n Y t nx +n Y 2 H 0 Niet gepoolde varianties (σ 2 X σ2 Y ): T = S 2 X n X X Ȳ + S2 Y n Y t min(nx 1,n Y 1) H 0

Wat met meer dan twee gemiddelden? Indien men gelijkheid tussen k gemiddelden wil testen zijn er k(k 1)/2 paarsgewijze combinaties om voor te testen. Hierin schuilt echter een risico om de kans op een vals positief resultaat (type I fout) niet langer te controleren op het vooropgestelde significantieniveau. Bijvoorbeeld, indien men k = 5 gemiddelden wil testen, en alle testen gebeuren op het 5% significantieniveau, dan P( 1 vals positief resultaat) =

Wat met meer dan twee gemiddelden? Indien men gelijkheid tussen k gemiddelden wil testen zijn er k(k 1)/2 paarsgewijze combinaties om voor te testen. Hierin schuilt echter een risico om de kans op een vals positief resultaat (Type I fout) niet langer te controleren op het vooropgestelde significantieniveau. Bijvoorbeeld, indien men k = 5 gemiddelden wil testen, en alle testen gebeuren op het 5% significantieniveau, dan P( 1 vals positief resultaat) = 1 P(geen vals positief resultaat ) = 1 (0.95 k(k 1)/2 ) = 1 (0.95 10 ) = 1 0.60 = 0.4

Wat met meer dan twee gemiddelden? Indien men gelijkheid tussen k gemiddelden wil testen zijn er k(k 1)/2 paarsgewijze combinaties om voor te testen. Hierin schuilt echter een risico om de kans op een vals positief resultaat (Type I fout) niet langer te controleren op het vooropgestelde significantieniveau. Bijvoorbeeld, indien men k = 5 gemiddelden wil testen, en alle testen gebeuren op het 5% significantieniveau, dan P( 1 vals positief resultaat) = 1 P(geen vals positief resultaat ) = 1 (0.95 k(k 1)/2 ) = 1 (0.95 10 ) = 1 0.60 = 0.4 Dus, indien men 10 testen uitvoert is de kans op minstens één vals positief resultaat (Type I fout) 40%

Wat met meer dan twee gemiddelden: Bonferroni procedure Een oplossing voor meervoudig toetsen is de Bonferroni procedure: indien men n test uitvoert en men controleert elke test op het α/n significantieniveau dan is het globaal significantieniveau over alle n tests α.

Wat met meer dan twee gemiddelden: Bonferroni procedure Een oplossing voor meervoudig toetsen is de Bonferroni procedure: indien men n test uitvoert en men controleert elke test op het α/n significantieniveau dan is het globaal significantieniveau over alle n tests α. Als we dit toepassen op de berekening van vorige slide (SN: α/n = 0.05/10 = 0.005): P( 1 vals positief resultaat) = 1 P(geen vals positief resultaat) = 1 (0.995 k(k 1)/2 ) = 1 (0.995 10 ) = 1 0.9511 = 0.0489 Waardoor de kans op een Type I fout (vals positief resultaat) nu gecontroleerd wordt.

Wat met meer dan twee gemiddelden: Bonferroni procedure De Bonferroni procedure kan men ook uitvoeren op de p-waarden i.p.v. het significantieniveau α. Indien men n tests uitvoert, dan kan men het significantieniveau α aanpassen naar α/n voor elke test de p-waarde van elke test aanpassen als p = p n, waarbij p de aangepaste p-waarde aanduidt

Wat met meer dan twee gemiddelden: ANOVA Gebrek aan power wordt verwacht doordat de Bonferroni procedure conservatief is, maar ook doordat bij elke vergelijking van 2 groepen, er minder gegevens voorhanden zijn dan wanneer alle groepen simultaan zouden vergeleken worden. Deze batterij aan paarsgewijze testen kan men echter ook testen aan de hand van een enkele test: de ANalysis Of VAriance (ANOVA) met H 0 : µ 1 = µ 2 =... = µ k vs. H 1 : minstens twee gemiddelden µ i, µ j met i j zijn verschillend van elkaar. die niet lijdt aan een gebrek in power De ANOVA heeft dus als voordeel om een hoge power te hebben, gecombineerd met een gecontroleerd significantieniveau.

Werking van ANOVA: kwadratensommen SStot = SSE = SST = n n i=1 i=1 n i=1 (Y i Ȳ ) 2 = SSR + SSE (Y i Ŷi) 2 ; MSE = SSE n g (Ŷ i Ȳ ) 2 ; MST = SST g 1 Teststatistiek F = MST MSE F g 1,n g H 0

Wat met meer dan twee gemiddelden: ANOVA post-hoc Na verwerping van de ANOVA H 0 doet men dan toch opnieuw beroep op paarsgewijze testen die men dan de post hoc analyse noemt. In de post hoc analyse houdt men rekening met meervoudig toetsen aan de hand van correcties zoals de Bonferroni of Tukey correctie. De ANOVA en post-hoc analyse heeft volgende assumpties: 1. Elke variabele (groep) volgt een normale verdeling (of bevat voldoende observaties zodat de centrale limietstelling opgaat). 2. De gegevens werden onafhankelijk van elkaar verzameld, zowel binnen als tussen groepen. 3. De varianties van de groepen zijn gelijk aan elkaar.