Les 5: ANOVA Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie 28 november 2018 1 Gebaseerd op de slides van Koen Van den Berge
Testen die we tot nu toe gezien hebben: Toetsen van n gemiddelde ten opzichte van een constante µ 0 H 0 : µ = µ 0 Toetsen van twee gemiddelden H 0 : µ 1 = µ 2 Het schatten van de associatie tussen twee variabelen met behulp van een enkelvoudig lineair regressiemodel van de vorm β 0 + β 1 x H 0 : β 1 = 0
Toetsen van 2 gemiddeldes Het toetsen van twee gemiddeldes met ongekende variantie H 0 : µ 1 = µ 2 vs.h 1 : µ 1 µ 2 kan men uitvoeren door de steekproefvarianties S1 2 en S 2 2 niet te poolen. Gepoolde varianties (σx 2 = σ2 Y ): al dan T = X Ȳ S p 1 n X + 1 n Y t nx +n Y 2 H 0 Niet gepoolde varianties (σ 2 X σ2 Y ): T = S 2 X n X X Ȳ + S2 Y n Y t min(nx 1,n Y 1) H 0
Wat met meer dan twee gemiddelden? Indien men gelijkheid tussen k gemiddelden wil testen zijn er k(k 1)/2 paarsgewijze combinaties om voor te testen. Hierin schuilt echter een risico om de kans op een vals positief resultaat (type I fout) niet langer te controleren op het vooropgestelde significantieniveau. Bijvoorbeeld, indien men k = 5 gemiddelden wil testen, en alle testen gebeuren op het 5% significantieniveau, dan P( 1 vals positief resultaat) =
Wat met meer dan twee gemiddelden? Indien men gelijkheid tussen k gemiddelden wil testen zijn er k(k 1)/2 paarsgewijze combinaties om voor te testen. Hierin schuilt echter een risico om de kans op een vals positief resultaat (Type I fout) niet langer te controleren op het vooropgestelde significantieniveau. Bijvoorbeeld, indien men k = 5 gemiddelden wil testen, en alle testen gebeuren op het 5% significantieniveau, dan P( 1 vals positief resultaat) = 1 P(geen vals positief resultaat ) = 1 (0.95 k(k 1)/2 ) = 1 (0.95 10 ) = 1 0.60 = 0.4
Wat met meer dan twee gemiddelden? Indien men gelijkheid tussen k gemiddelden wil testen zijn er k(k 1)/2 paarsgewijze combinaties om voor te testen. Hierin schuilt echter een risico om de kans op een vals positief resultaat (Type I fout) niet langer te controleren op het vooropgestelde significantieniveau. Bijvoorbeeld, indien men k = 5 gemiddelden wil testen, en alle testen gebeuren op het 5% significantieniveau, dan P( 1 vals positief resultaat) = 1 P(geen vals positief resultaat ) = 1 (0.95 k(k 1)/2 ) = 1 (0.95 10 ) = 1 0.60 = 0.4 Dus, indien men 10 testen uitvoert is de kans op minstens één vals positief resultaat (Type I fout) 40%
Wat met meer dan twee gemiddelden: Bonferroni procedure Een oplossing voor meervoudig toetsen is de Bonferroni procedure: indien men n test uitvoert en men controleert elke test op het α/n significantieniveau dan is het globaal significantieniveau over alle n tests α.
Wat met meer dan twee gemiddelden: Bonferroni procedure Een oplossing voor meervoudig toetsen is de Bonferroni procedure: indien men n test uitvoert en men controleert elke test op het α/n significantieniveau dan is het globaal significantieniveau over alle n tests α. Als we dit toepassen op de berekening van vorige slide (SN: α/n = 0.05/10 = 0.005): P( 1 vals positief resultaat) = 1 P(geen vals positief resultaat) = 1 (0.995 k(k 1)/2 ) = 1 (0.995 10 ) = 1 0.9511 = 0.0489 Waardoor de kans op een Type I fout (vals positief resultaat) nu gecontroleerd wordt.
Wat met meer dan twee gemiddelden: Bonferroni procedure De Bonferroni procedure kan men ook uitvoeren op de p-waarden i.p.v. het significantieniveau α. Indien men n tests uitvoert, dan kan men het significantieniveau α aanpassen naar α/n voor elke test de p-waarde van elke test aanpassen als p = p n, waarbij p de aangepaste p-waarde aanduidt
Wat met meer dan twee gemiddelden: ANOVA Gebrek aan power wordt verwacht doordat de Bonferroni procedure conservatief is, maar ook doordat bij elke vergelijking van 2 groepen, er minder gegevens voorhanden zijn dan wanneer alle groepen simultaan zouden vergeleken worden. Deze batterij aan paarsgewijze testen kan men echter ook testen aan de hand van een enkele test: de ANalysis Of VAriance (ANOVA) met H 0 : µ 1 = µ 2 =... = µ k vs. H 1 : minstens twee gemiddelden µ i, µ j met i j zijn verschillend van elkaar. die niet lijdt aan een gebrek in power De ANOVA heeft dus als voordeel om een hoge power te hebben, gecombineerd met een gecontroleerd significantieniveau.
Werking van ANOVA: kwadratensommen SStot = SSE = SST = n n i=1 i=1 n i=1 (Y i Ȳ ) 2 = SSR + SSE (Y i Ŷi) 2 ; MSE = SSE n g (Ŷ i Ȳ ) 2 ; MST = SST g 1 Teststatistiek F = MST MSE F g 1,n g H 0
Wat met meer dan twee gemiddelden: ANOVA post-hoc Na verwerping van de ANOVA H 0 doet men dan toch opnieuw beroep op paarsgewijze testen die men dan de post hoc analyse noemt. In de post hoc analyse houdt men rekening met meervoudig toetsen aan de hand van correcties zoals de Bonferroni of Tukey correctie. De ANOVA en post-hoc analyse heeft volgende assumpties: 1. Elke variabele (groep) volgt een normale verdeling (of bevat voldoende observaties zodat de centrale limietstelling opgaat). 2. De gegevens werden onafhankelijk van elkaar verzameld, zowel binnen als tussen groepen. 3. De varianties van de groepen zijn gelijk aan elkaar.