H7: Analysis of variance

Vergelijkbare documenten
Les 5: Analysis of variance

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Les 5: ANOVA. Koen Van den Berge Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 19 november 2018

H6: Enkelvoudige lineaire regressie

Algemeen lineair model

Statistiek II. Sessie 4. Feedback Deel 4

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor T (2S070) op vrijdag 8 oktober 1999, uur De u

Hoofdstuk 12: Eenweg ANOVA

Het gebruik van een grafische rekenmachine is toegestaan tijdens dit tentamen, alsmede één A4-tje met aantekeningen.

College 2 Enkelvoudige Lineaire Regressie

Hoofdstuk 10: Regressie

Niet-parametrische Statistiek

mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2

2DM71: Eindtoets Biostatistiek, op dinsdag 20 Januari 2015,

Modelselectie. Lieven Clement. 2 de bach. in de Biologie, Chemie, Biochemie en Biotechnologie en Biomedische Wetenschappen

Tentamen Biostatistiek 3 / Biomedische wiskunde

11. Multipele Regressie en Correlatie

College 6 Eenweg Variantie-Analyse

Feedback examen Statistiek II Juni 2011

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

Examen G0N34 Statistiek

Les 2: Toetsen van één gemiddelde

Kansrekening en Statistiek

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

11. Meerdere gemiddelden vergelijken, ANOVA

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Statistiek II. Sessie 6. Feedback Deel 6

Classification - Prediction

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

Statistiek 1 Blok 6, Werkgroepopdrachten

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

9. Lineaire Regressie en Correlatie

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Antwoordvel Versie A

Examen G0N34 Statistiek

Toegepaste data-analyse: oefensessie 2

Kansrekening en statistiek WI2211TI / WI2105IN deel 2 2 februari 2012, uur

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

Statistiek II. Sessie 5. Feedback Deel 5

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

toetskeuze schema verschillen in gemiddelden

Hoofdstuk 5 Een populatie: parametrische toetsen

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

DH19 Bedrijfsstatistiek MC, 2e Bach Hir, Juni 2009

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

Statistiek. Lieven Clement. Statistiek: 2 de bach. in de Biologie, Biochemie en Biotechnologie, Biomedische Wetenschappen en Chemie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica

Les 1: de normale distributie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamenopgaven Statistiek (2DD71) op xx-xx-xxxx, xx.00-xx.00 uur.

Hoofdstuk 6 Twee populaties: parametrische toetsen

Data analyse Inleiding statistiek

1. Reductie van error variantie en dus verhogen van power op F-test

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Hoofdstuk 10 Eenwegs- en tweewegs-variantieanalyse

laboratory for industrial mathematics eindhoven Endinet Regressie-analyse Energiekamer

M M M M M M M M M M M M M M La La La La La La La Mid Mid Mid Mid Mid Mid Mid

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 3 februari 2012

Gebruik van Correlatiecoëfficiënt in onderzoek

werkcollege 6 - D&P9: Estimation Using a Single Sample

College 3 Meervoudige Lineaire Regressie

Kansrekening en Statistiek

College 7 Tweeweg Variantie-Analyse

Examen Statistische Modellen en Data-analyse. Derde Bachelor Wiskunde. 14 januari 2008

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag ,

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

ANOVA in SPSS. Hugo Quené. opleiding Taalwetenschap Universiteit Utrecht Trans 10, 3512 JK Utrecht 12 maart 2003

Voorbeeldtentamen Statistiek voor Psychologie

Toegepaste biostatistiek

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Statistiek ( ) eindtentamen

Interim Toegepaste Biostatistiek deel 1 14 december 2009 Versie A ANTWOORDEN

Eindtoets Toegepaste Biostatistiek

Examen Statistiek II: Project

G0N11C Statistiek & data-analyse Project tweede zittijd

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

4 Domein STATISTIEK - versie 1.2

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

3 Enkelvoudige lineaire regressie

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 5

c. Geef de een-factor ANOVA-tabel. Formuleer H_0 and H_a. Wat is je conclusie?

Statistiek voor A.I. College 12. Dinsdag 23 Oktober

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Faculteit der Wiskunde en Informatica

Tentamen Biostatistiek 1 voor BMT (2DM40), op maandag 5 januari uur

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 5 februari 2010

INDUCTIEVE STATISTIEK VOOR DE GEDRAGSWETENSCHAPPEN OPLOSSINGEN BIJ HOOFDSTUK 8

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

mlw stroom 2.1: Statistisch modelleren

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

Kansrekening en statistiek wi2105in deel 2 16 april 2010, uur

werkcollege 6 - D&P10: Hypothesis testing using a single sample

Opgave 1: (zowel 2DM40 als 2S390)

Hoofdstuk 3 Statistiek: het toetsen

Transcriptie:

H7: Analysis of variance Lieven Clement Statistiek: 2 de bach. in de Biochemie en Biotechnologie, Biologie, Biomedische Wetenschappen, en de Chemie statomics, Krijgslaan 281 (S9), Gent, Belgium lieven.clement@ugent.be

Prostacycline studie Data exploratie Voorbeeld: Prostacycline studie Onderzoekers bestuderen het effect van arachidonzuur op het prostacycline niveau in het bloedplasma. Ze gebruiken hierbij 3 verschillende concentraties van arachidonzuur: laag, gemiddeld en een hoge dosis en ze meten het prostacycline niveau in het bloed plasma a.d.h.v. een gecalibreerde elisa fluorescentie meting. 12 ratten worden at random toegekend aan elke behandelingsgroep. Experimentele eenheid? Response variabele? Verklarende variabele(n)? Behandelingen? completely randomized design (CRD): experimentele eenheden at random toegekend aan de behandelingen. statomics, Ghent University lieven.clement@ugent.be 2/43

Prostacycline studie Data exploratie Data exploratie Onderzoekers bestuderen het effect van arachidonzuur op het prostacycline niveau in het bloedplasma. Ze gebruiken hierbij 3 verschillende concentraties van arachidonzuur: laag, gemiddeld en een hoge dosis en ze meten het prostacycline niveau in het bloed plasma a.d.h.v. een gecalibreerde elisa fluorescentie meting. Prostacycline (ng/ml) 20 40 60 80 100 120 10 25 50 Arachidonisch zuurdosis statomics, Ghent University lieven.clement@ugent.be 3/43

Prostacycline studie Statistisch model? Voorbeeld: Prostacycline studie Hoe kunnen we data modelleren? Normal Q Q Plot Normal Q Q Plot Normal Q Q Plot Sample Quantiles 10 20 30 40 50 60 70 80 Sample Quantiles 20 40 60 80 Sample Quantiles 60 70 80 90 100 110 1.5 1.0 0.5 0.0 0.5 1.0 1.5 Theoretical Quantiles 1.5 1.0 0.5 0.0 0.5 1.0 1.5 Theoretical Quantiles 1.5 1.0 0.5 0.0 0.5 1.0 1.5 Theoretical Quantiles Data in de drie groepen lijkt normaal verdeeld en de variantie is ongeveer gelijk: Y i groep j N(µ j, σ 2 ), met j = 1, 2, 3 statomics, Ghent University lieven.clement@ugent.be 4/43

Prostacycline studie Statistisch model? Vraagstelling kan vertaald worden in de hypotheses H 0 : µ 1 = µ 2 = µ 3 en H 1 : minstens twee gemiddelden zijn verschillend. statomics, Ghent University lieven.clement@ugent.be 5/43

Prostacycline studie Statistisch model? Vraagstelling kan vertaald worden in de hypotheses H 0 : µ 1 = µ 2 = µ 3 en H 1 : minstens twee gemiddelden zijn verschillend. naïeve benadering: nulhypothese op splitsen in partiële hypotheses H 0jk : µ j = µ k versus H 1jk : µ j µ k Elk van deze partiële hypotheses testen met two-sample t-testen Probleem van meervoudig toetsen + verlies van power. H 0 : µ 1 = µ 2 = µ 3 testen met 1 enkele test. statomics, Ghent University lieven.clement@ugent.be 5/43

Prostacycline studie Statistisch model? Correcte oplossing voor het testprobleem: variantie-analyse, afgekort door ANOVA (ANalysis Of VAriance) We leiden de methode af voor de meest eenvoudige uitbreiding met 3 groepen (prostacycline voorbeeld) De veralgemening naar g groepen g > 3 is triviaal statomics, Ghent University lieven.clement@ugent.be 6/43

Anova Model Stel dat Y i de uitkomst voorstelt van observatie i (i = 1,..., n), dan beschouwen we het lineaire regressiemodel Y i = g(x i1, x i2 ) + ε i met ε i i.i.d. N(0, σ 2 ) en met de dummy-regressoren x i1 en x i2. statomics, Ghent University lieven.clement@ugent.be 7/43

Anova Model Stel dat Y i de uitkomst voorstelt van observatie i (i = 1,..., n), dan beschouwen we het lineaire regressiemodel Y i = β 0 + β 1 x i1 + β 2 x i2 + ε i (1) met ε i i.i.d. N(0, σ 2 ) en met de dummy-regressoren x i1 = { 1 als observatie i behoort tot middelste dosisgroep (M) 0 als observatie i behoort tot een andere dosisgroep. en x i2 = { 1 als observatie i behoort tot de hoogste dosisgroep (H) 0 als observatie i behoort tot een andere dosisgroep. De lage behandelingsgroep (L) met x i1 = x i2 = 0 wordt in deze context de referentiegroep genoemd. statomics, Ghent University lieven.clement@ugent.be 8/43

Anova Model Voor observaties in dosisgroep L wordt het model (1) met ε i i.i.d. N(0, σ 2 ). Y i = β 0 + ε i Voor observaties in dosisgroep M wordt het model (1) met ε i i.i.d. N(0, σ 2 ). Y i = β 0 + β 1 + ε i Voor observaties in dosisgroep H wordt het model (1) met ε i i.i.d. N(0, σ 2 ). Y i = β 0 + β 2 + ε i statomics, Ghent University lieven.clement@ugent.be 9/43

Anova Model De interpretaties van de β-parameters is dus eenvoudig: β 0 = E {Y i behandeling met lage dosisgroep L} β 1 = (β 0 + β 1 ) β 0 = E {Y i behandeling M} E {Y i behandeling L} β 2 = (β 0 + β 2 ) β 0 = E {Y i behandeling H} E {Y i behandeling L}. Anders geformuleerd: parameter β 0 is de gemiddelde uitkomst in de lage dosis groep L. Parameter β 1 is effect van groep M t.o.v. groep L. Parameter β 2 is effect van hoge dosis groep H t.o.v. groep L. statomics, Ghent University lieven.clement@ugent.be 10/43

Anova Model We herformuleren de modellen gebruik makend van de µ-notaties: Y i dose=l = β 0 + ε i = µ 1 + ε i Y i dose=m = β 0 + β 1 + ε i = µ 2 + ε i Y i dose=h = β 0 + β 2 + ε i = µ 3 + ε i. met ε i i.i.d. N(0, σ 2 ) en met µ j = E {Y i behandelingsgroep j}. statomics, Ghent University lieven.clement@ugent.be 11/43

Anova Model De oorspronkelijk nulhypothese H 0 : µ 1 = µ 2 = µ 3 kan equivalent geformuleerd worden als H 0 : β 1 = β 2 = 0. statomics, Ghent University lieven.clement@ugent.be 12/43

Anova Model De oorspronkelijk nulhypothese H 0 : µ 1 = µ 2 = µ 3 kan equivalent geformuleerd worden als H 0 : β 1 = β 2 = 0. Gezien model (1) een lineair regressiemodel is, kunnen de methoden van lineaire regressie gebruikt worden voor het schatten van de parameters en hun varianties het opstellen van hypothesetesten en betrouwbaarheidsintervallen Testen van H 0 : β 1 = β 2 = 0 gebeurt dmv F -test. Hiermee is bijna de volledige oplossing bekomen. statomics, Ghent University lieven.clement@ugent.be 12/43

Anova Kwadratensommen en Anova Net zoals bij enkelvoudige regressie kunnen we opnieuw de kwadratensom van de regressie hiervoor gebruiken: SSR = = = = = n (Ŷ i Ȳ ) 2 i=1 n (ĝ(x i1, x i2 ) Ȳ )2 i=1 n ( ˆβ 0 + ˆβ 1 x i1 + ˆβ 2 x i2 ) Ȳ ) 2 i=1 n 1 ( ˆβ 0 Ȳ n 2 )2 + ( ˆβ 0 + ˆβ 1 Ȳ n 3 )2 + ( ˆβ 0 + ˆβ 2 Ȳ )2 i=1 i=1 i=1 n 1 n 2 n 3 (Ȳ 1 Ȳ ) 2 + (Ȳ 2 Ȳ ) 2 + (Ȳ 3 Ȳ ) 2 i=1 i=1 i=1 statomics, Ghent University lieven.clement@ugent.be 13/43

Anova Kwadratensommen en Anova SSR = n (Ŷ i Ȳ ) 2 i=1 Kwadratensom opnieuw equivalent aan vergelijken van model (1) en een gereduceerd model met enkel een intercept. Voor gereduceerd model zal intercept worden geschat door steekproefgemiddelde. Deze kwadratensom heeft dus g-1=2 vrijheidsgraden: g=3 model parameters - 1 parameter voor steekproefgemiddelde of g=3 par. van complexe model - 1 par. van gereduceerde model. statomics, Ghent University lieven.clement@ugent.be 14/43

Anova Kwadratensommen en Anova Ontbinding van de Totale Kwadratensom De conventie in een Anova setting is om de kwadratensom te noteren als SST, de kwadratensom van de behandeling (treatment) of als SSBetween. De kwadratensom van de regressie geeft voor model (1) inderdaad de variabiliteit weer tussen de groepen. (zie volgende slide) De overeenkomstige gemiddelde kwadratensom wordt dan MST = SST/2. De decompositie van SSTot wordt dan geschreven als SSTot = SST + SSE. statomics, Ghent University lieven.clement@ugent.be 15/43

Anova Kwadratensommen en Anova Interpretatie ontbinding totale kwadratensom 10 25 50 20 40 60 80 100 120 Arachidonisch zuurdosis Prostacycline (ng/ml) 40 20 0 20 40 60 Deviations y i y y j y y i y j statomics, Ghent University lieven.clement@ugent.be 16/43

Anova Kwadratensommen en Anova Interpretatie ontbinding totale kwadratensom 10 25 50 20 40 60 80 100 120 Arachidonisch zuurdosis Prostacycline (ng/ml) 40 20 0 20 40 60 Deviations y i y y j y y i y j statomics, Ghent University lieven.clement@ugent.be 16/43

Anova Kwadratensommen en Anova Interpretatie ontbinding totale kwadratensom 10 25 50 20 40 60 80 100 120 Arachidonisch zuurdosis Prostacycline (ng/ml) 40 20 0 20 40 60 Deviations y i y y j y y i y j statomics, Ghent University lieven.clement@ugent.be 16/43

Anova Kwadratensommen en Anova Interpretatie ontbinding totale kwadratensom 10 25 50 20 40 60 80 100 120 Arachidonisch zuurdosis Prostacycline (ng/ml) 40 20 0 20 40 60 Deviations y i y y j y y i y j statomics, Ghent University lieven.clement@ugent.be 16/43

Anova Kwadratensommen en Anova Anova test of Testen van H 0 : β 1 = β 2 = 0 gebeurt dmv F -test. F = MST MSE met MST = SST/(g 1) en MSE de gemiddelde residuele kwadratensom uit het niet-gereduceerde model (1); deze heeft n g vrijheidsgraden. De teststatistiek vergelijk dus variabiliteit verklaard door het model (MST) met de residuele variabiliteit (MSE) Variabiliteit tussen groepen (MST) met variabiliteit binnen groepen (MSE) Onder de nulhypothese geldt F F g 1,n g, met g=3. statomics, Ghent University lieven.clement@ugent.be 17/43

Anova Kwadratensommen en Anova Prostacycline Voorbeeld > model1=lm(prostac~dose,data=prostacyclin) > anova(model1) Analysis of Variance Table Response: prostac Df Sum Sq Mean Sq F value Pr(>F) dose 2 12658 6329.0 13.944 4.081e-05 *** Residuals 33 14979 453.9 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 statomics, Ghent University lieven.clement@ugent.be 18/43

Anova Kwadratensommen en Anova Prostacycline Voorbeeld > model1=lm(prostac~dose,data=prostacyclin) > anova(model1) Analysis of Variance Table Response: prostac Df Sum Sq Mean Sq F value Pr(>F) dose 2 12658 6329.0 13.944 4.081e-05 *** Residuals 33 14979 453.9 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<<0.001). statomics, Ghent University lieven.clement@ugent.be 18/43

Anova Kwadratensommen en Anova F-verdeling statomics, Ghent University lieven.clement@ugent.be 19/43

Anova Kwadratensommen en Anova F-verdeling statomics, Ghent University lieven.clement@ugent.be 19/43

Anova Kwadratensommen en Anova Prostacycline Voorbeeld: welke groepen zijn verschillend? > summary(model1) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 40.108 6.150 6.521 2.10e-07 *** dose25 8.258 8.698 0.949 0.349 dose50 43.258 8.698 4.974 1.99e-05 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 21.3 on 33 degrees of freedom Multiple R-squared: 0.458,Adjusted R-squared: 0.4252 F-statistic: 13.94 on 2 and 33 DF, p-value: 4.081e-05 statomics, Ghent University lieven.clement@ugent.be 20/43

Anova Kwadratensommen en Anova Prostacycline Voorbeeld: welke groepen zijn verschillend? > summary(model1) Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 40.108 6.150 6.521 2.10e-07 *** dose25 8.258 8.698 0.949 0.349 dose50 43.258 8.698 4.974 1.99e-05 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 21.3 on 33 degrees of freedom Multiple R-squared: 0.458,Adjusted R-squared: 0.4252 F-statistic: 13.94 on 2 and 33 DF, p-value: 4.081e-05 Met output van model kunnen we ook testen of de gemiddelde prostacycline concentratie verschillend is tussen de matige en lage dosis groep (β 1 : dose25) en tussen de hoge en lage dosis groep (β 2 : dose50). statomics, Ghent University lieven.clement@ugent.be 20/43

Naïve methode Post hoc Analyse: Meervoudig Vergelijken van Gemiddelden In het eerste deel van dit hoofdstuk hebben we een F -test gezien die gebruikt kan worden voor het testen van H 0 : µ 1 = = µ g versus H 1 : niet H 0. Dus als de nulhypothese verworpen wordt, dan wordt besloten dat er minstens twee gemiddelden verschillen van elkaar, maar de methode stelt ons niet in staat om te identificeren welke gemiddelden van elkaar verschillen. statomics, Ghent University lieven.clement@ugent.be 21/43

Naïve methode Een eerste, maar naïeve benadering van het probleem bestaat erin om de nulhypothese op te splitsen in partiële hypotheses H 0jk : µ j = µ k versus H 1jk : µ i µ j en deze partiële hypotheses te testen met m = g(g 1)/2 two-sample t-testen. Voor het vergelijken van groep j met groep k wordt de klassieke two-sample t-test onder de veronderstelling van homoscedasticiteit gegeven door T jk = Ȳj Ȳ k H 0 tn 2 S p 1 n j + 1 n k waarin S 2 p de gepoolde variantieschatter is, S 2 p = (n j 1)S 2 j + (n k 1)S 2 k n j + n k 2 met Sj 2 en Sk 2 de steekproefvarianties van respectievelijk de uitkomsten uit groep j en k. statomics, Ghent University lieven.clement@ugent.be 22/43

Naïve methode In een ANOVA setting wordt echter verondersteld dat in alle t groepen de variantie van de uitkomsten dezelfde is (de residuele variantie σ 2 ). Indien we dus S 2 p gebruiken, dan is dit niet de meest efficiënte schatter omdat het niet van alle data gebruik maakt. We kunnen dus efficiëntie winnen door MSE te gebruiken. Ter herinnering, MSE kan geschreven worden als MSE = g j=1 (n j 1)S 2 j n g. De t-testen voor het twee-aan-twee vergelijken van alle gemiddelden worden dus best gebaseerd op T jk = MSE Ȳ j Ȳ k 1 nj + 1 n k H 0 tn g. statomics, Ghent University lieven.clement@ugent.be 23/43

Naïve methode We zullen hier eerst demonstreren dat het werken met t-testen op het α significantieniveau een foute aanpak is die de kans op een type I fout niet onder controle kan houden. Dit zal aanleiding geven tot een meer algemene definitie van de type I fout. statomics, Ghent University lieven.clement@ugent.be 24/43

Naïve methode Prostacycline Voorbeeld Alvorens de denkfout in de naïeve aanpak te demonsteren via simulaties, tonen we hoe de naïeve benadering in zijn werk zou gaan voor het prostacycline voorbeeld. > pairwise.t.test(prostac,dose, data = prostacyclin,"none") Pairwise comparisons using t tests with pooled SD data: prostac and dose 10 25 25 0.34927-50 2e-05 0.00031 P value adjustment method: none statomics, Ghent University lieven.clement@ugent.be 25/43

Naïve methode Deze output toont de tweezijdige p-waarden voor het testen van alle partiële hypotheses. We zouden hier kunnen besluiten dat : Het gemiddelde prostacycline niveau extreem significant verschillend is tussen de hoge en de lage dosis groep Het gemiddelde prostacycline niveau extreem significant verschillend is tussen de hoge en de matige dosis groep Het gemiddelde prostacycline niveau niet significant verschillend is tussen de matige en de lage dosis groep statomics, Ghent University lieven.clement@ugent.be 26/43

Naïve methode In onderstaande R code wordt simulatiestudie opgezet (herhaalde steekproefname) Simualtie uit een ANOVA model met t = 3 groepen De gemiddelden in het ANOVA model zijn gelijk aan elkaar, zodat de nulhypothese H 0 : µ 1 = µ 2 = µ 3 opgaat. Voor iedere gesimuleerde dataset drie paarsgewijze two-sample t-testen Zodra minstens één van de p-waarden kleiner is dan het significantieniveau α = 5%, wordt de nulhypothese H 0 : µ 1 = µ 2 = µ 3 verworpen omdat er minstens twee gemiddelden verschillend zijn volgens de t-testen. Relatieve frequentie van het verwerpen van de globale nulhypothese (i.e. de kans op een type I fout van de test voor H 0 : µ 1 = µ 2 = µ 3 ) statomics, Ghent University lieven.clement@ugent.be 27/43

Naïve methode > g<-3 # aantal behandelingen (g=3) > ni<-12 # aantal herhalingen in iedere groep > n<-g*ni # totaal aantal observaties > alpha<-0.05 # significantieniveau van een individuele test > N=10000 #aantal simulaties > set.seed(302) #seed zodat resultaten exact geproduceerd kunnen > trt=factor(rep(1:g,ni)) #factor > cnt<-0 #teller voor aantal foutieve verwerpingen > for(i in 1:N) { + if (i%%1000==0) cat(i,"/",n,"\n") + y <- rnorm(n) + tests<-pairwise.t.test(y,trt,"none") + verwerp<-min(tests$p.value,na.rm=t)<alpha + if(verwerp) cnt<-cnt+1 + } 1000 / 10000... > cnt/n [1] 0.1209 statomics, Ghent University lieven.clement@ugent.be 28/43

Naïve methode Kans op een type I fout gelijk is aan 12.1%, wat meer dan dubbel zo groot is dan de vooropgestelde α E = 5%. Als we simulatiestudie herhalen met g = 5 groepen (i.e. 10 paarsgewijze t-testen) dan vinden we 28.0% in plaats van de gewenste 5%. Deze simulaties illustreren het probleem van multipliciteit (Engels: multiplicity): de klassieke p-waarden mogen enkel met het significantieniveau α vergeleken worden, indien het besluit op exact één p-waarde gebaseerd is. Hier wordt het finale besluit (aldanniet verwerpen van H 0 : µ 1 = = µ g ) gebaseerd op m = g (g 1)/2 p-waarden. We bespreken eerst een uitbreiding van het begrip van type I fout en vervolgens introduceren we enkele oplossingen. statomics, Ghent University lieven.clement@ugent.be 29/43

Family-wise error rate Family-wise error rate (FWER) Wanneer m > 1 toetsen worden aangewend om 1 beslissing te vormen, is het noodzakelijk te corrigeren voor het risico op valse vondsten. statomics, Ghent University lieven.clement@ugent.be 30/43

Family-wise error rate Family-wise error rate (FWER) Wanneer m > 1 toetsen worden aangewend om 1 beslissing te vormen, is het noodzakelijk te corrigeren voor het risico op valse vondsten. Meeste procedures voor meervoudig toetsen gaan ervan uit dat alle m nulhypotheses waar zijn. Ze proberen dan het risico op minstens 1 valse vondst te controleren op niveau α E ; typisch, α E = 0.05. (experimentgewijs significantie niveau) We noemen dit de family-wise error rate (FWER). statomics, Ghent University lieven.clement@ugent.be 30/43

Family-wise error rate Bonferroni correctie (1) Bij het uitvoeren van m onafhankelijke toetsen met elk significantieniveau α, is α E = P(minstens 1 Type I fout) = 1 (1 α) m mα statomics, Ghent University lieven.clement@ugent.be 31/43

Family-wise error rate Bonferroni correctie (1) Bij het uitvoeren van m onafhankelijke toetsen met elk significantieniveau α, is Bonferroni correctie α E = P(minstens 1 Type I fout) = 1 (1 α) m mα Als we 5 toetsen uitvoeren op het 5% significantieniveau is FWER 25%. Door ze op het 1% significantieniveau uit te voeren, bekomen we FWER 5%. statomics, Ghent University lieven.clement@ugent.be 31/43

Family-wise error rate Bonferroni correctie (2) Bonferroni correctie houdt de FWER begrensd op α E door te kiezen: of α = α E /m Toetsen op het α E /m significantieniveau aangepaste p-waarden zodat we deze met het experimentgewijze α E niveau kunnen vergelijken: p = min(m p, 1) (1 α E /m)100% betrouwbaarheidsintervallen rapporteren. statomics, Ghent University lieven.clement@ugent.be 32/43

Family-wise error rate Prostacycline Voorbeeld Onderstaande R code geeft de resultaten (gecorrigeerde p-waarden) na correctie met de methode van Bonferroni. > pairwise.t.test(prostac,dose, data = prostacyclin, + p.adjust.method="bonferroni") Pairwise comparisons using t tests with pooled SD data: prostac and dose 10 25 25 1.00000-50 6e-05 0.00094 P value adjustment method: bonferroni De conclusies zijn hetzelfde behalve dat de FWER gecontroleerd is α = 5% en de p-waarden zijn een factor 3 groter. statomics, Ghent University lieven.clement@ugent.be 33/43

Family-wise error rate Dezelfde analyse kan uitgevoerd worden met de multcomp R package. > model1.mcp<-glht(model1,linfct=mcp(dose="tukey")) > summary(model1.mcp,test=adjusted("bonferroni")) Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Tukey Contrasts Fit: lm(formula = prostac ~ dose, data = prostacyclin) Linear Hypotheses: Estimate Std. Error t value Pr(> t ) 25-10 == 0 8.258 8.698 0.949 1.000000 50-10 == 0 43.258 8.698 4.974 5.98e-05 *** 50-25 == 0 35.000 8.698 4.024 0.000943 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 (Adjusted p values reported -- bonferroni method) statomics, Ghent University lieven.clement@ugent.be 34/43

Family-wise error rate Bonferroni aangepaste betrouwbaarheidsintervallen We moeten eerst zelf functie definiëren om Bonferroni kritische waarde te bepalen. > calpha_bon_t<-function(object,level) abs(qt((1-level)/2/nrow(object$linfct), object$df)) > confint(model1.mcp,calpha=calpha_bon_t) Simultaneous Confidence Intervals Multiple Comparisons of Means: Tukey Contrasts Fit: lm(formula = prostac ~ dose, data = prostacyclin) Quantile = 2.5222 95% confidence level Linear Hypotheses: Estimate lwr upr 25-10 == 0 8.2583-13.6790 30.1957 50-10 == 0 43.2583 21.3210 65.1957 50-25 == 0 35.0000 13.0626 56.9374 statomics, Ghent University lieven.clement@ugent.be 35/43

Family-wise error rate Effect van Bonferroni correctie op FWER > g<-3 # aantal behandelingen (g=3) > ni<-12 # aantal herhalingen in iedere groep > n<-g*ni # totaal aantal observaties > alpha<-0.05 # significantieniveau van een individuele test > N=10000 #aantal simulaties > set.seed(302) #seed zodat resultaten exact geproduceerd kunnen > trt=factor(rep(1:g,ni)) #factor > cnt<-0 #teller voor aantal foutieve verwerpingen > for(i in 1:N) { + if (i%%1000==0) cat(i,"/",n,"\n") + y <- rnorm(n) + tests<-pairwise.t.test(y,trt,"bonferroni") + verwerp<-min(tests$p.value,na.rm=t)<alpha + if(verwerp) cnt<-cnt+1 + }... > cnt/n [1] 0.0457 statomics, Ghent University lieven.clement@ugent.be 36/43

Family-wise error rate We vinden dus een FWER van 4.6% (een beetje conservatief). Wanneer we de simulaties doen voor g = 5 groepen, vinden we een FWER van 4.1% (meer conservatief). statomics, Ghent University lieven.clement@ugent.be 37/43

Family-wise error rate Tukey Method De methode van Tukey is een minder conservatieve methode voor het uitvoeren van post hoc testen > model1.mcp<-glht(model1,linfct=mcp(dose="tukey")) > summary(model1.mcp) Multiple Comparisons of Means: Tukey Contrasts Fit: lm(formula = prostac ~ dose, data = prostacyclin) Linear Hypotheses: Estimate Std. Error t value Pr(> t ) 25-10 == 0 8.258 8.698 0.949 0.613373 50-10 == 0 43.258 8.698 4.974 < 1e-04 *** 50-25 == 0 35.000 8.698 4.024 0.000871 *** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 (Adjusted p values reported -- single-step method) statomics, Ghent University lieven.clement@ugent.be 38/43

Family-wise error rate > confint(model1.mcp) Simultaneous Confidence Intervals Multiple Comparisons of Means: Tukey Contrasts Fit: lm(formula = prostac ~ dose, data = prostacyclin) Quantile = 2.4552 95% family-wise confidence level Linear Hypotheses: Estimate lwr upr 25-10 == 0 8.2583-13.0964 29.6130 50-10 == 0 43.2583 21.9036 64.6130 50-25 == 0 35.0000 13.6453 56.3547 Smallere BIs en kleinere p-waarden dan Bonferroni. statomics, Ghent University lieven.clement@ugent.be 39/43

Family-wise error rate > plot(confint(model1.mcp) 95% family wise confidence level 25 10 ( ) 50 10 ( ) 50 25 ( ) 0 20 40 60 Linear Function statomics, Ghent University lieven.clement@ugent.be 40/43

Family-wise error rate Effect van Tukey correctie op FWER > g<-3 # aantal behandelingen (g=3) > ni<-12 # aantal herhalingen in iedere groep > n<-pgni # totaal aantal observaties > alpha<-0.05 # significantieniveau van een individuele test > N=10000 #aantal simulaties > set.seed(302) #seed zodat resultaten exact geproduceerd kunnen worden > trt=factor(rep(1:g,ni)) #factor > cnt<-0 #teller voor aantal foutieve verwerpingen > for(i in 1:N) { + if (i%%100==0) cat(i,"/",n,"\n") + y <- rnorm(n) + m<-lm(y~trt) + m.mcp<-glht(m,linfct=mcp(trt="tukey")) + tests<-summary(m.mcp)$test + verwerp<-min(as.numeric(tests$pvalues),na.rm=t)<alpha + if(verwerp) cnt<-cnt+1 + }... > cnt/n [1] 0.0503 statomics, Ghent University lieven.clement@ugent.be 41/43

Family-wise error rate We vinden dus een FWER van 5.03% wat heel dicht hij het nominale FWER= 5% ligt (theoretisch moet dit 5% zijn, maar we tonen slechts het resultaat gebaseerd op 10000 simulaties). Voor g = 5 groepen, vinden we een FWER van 5.2%, wat ook vrij goed is. statomics, Ghent University lieven.clement@ugent.be 42/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > anova(model1) Analysis of Variance Table Response: prostac Df Sum Sq Mean Sq F value Pr(>F) dose 2 12658 6329.0 13.944 4.081e-05 *** Residuals 33 14979 453.9 --- statomics, Ghent University lieven.clement@ugent.be 43/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > anova(model1) Analysis of Variance Table Response: prostac Df Sum Sq Mean Sq F value Pr(>F) dose 2 12658 6329.0 13.944 4.081e-05 *** Residuals 33 14979 453.9 --- Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<0.001). statomics, Ghent University lieven.clement@ugent.be 43/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > summary(model1.mcp) Multiple Comparisons of Means: Tukey Contrasts Linear Hypotheses: Estimate Std. Error t value Pr(> t ) 25-10 == 0 8.258 8.698 0.949 0.613373 50-10 == 0 43.258 8.698 4.974 < 1e-04 *** 50-25 == 0 35.000 8.698 4.024 0.000871 *** Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<0.001). statomics, Ghent University lieven.clement@ugent.be 43/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > summary(model1.mcp) Multiple Comparisons of Means: Tukey Contrasts Linear Hypotheses: Estimate Std. Error t value Pr(> t ) 25-10 == 0 8.258 8.698 0.949 0.613373 50-10 == 0 43.258 8.698 4.974 < 1e-04 *** 50-25 == 0 35.000 8.698 4.024 0.000871 *** Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<0.001). De gemiddelde prostacycline concentratie is hoger bij de hoge arachidonzuur dosisgroep dan bij de lage en matige dosisgroep (beide p < 0.001). statomics, Ghent University lieven.clement@ugent.be 43/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > confint(model1.mcp) Linear Hypotheses: Estimate lwr upr 25-10 == 0 8.2583-13.0964 29.6130 50-10 == 0 43.2583 21.9036 64.6130 50-25 == 0 35.0000 13.6453 56.3547 Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<0.001). De gemiddelde prostacycline concentratie is hoger bij de hoge arachidonzuur dosisgroep dan bij de lage en matige dosisgroep (beide p < 0.001). statomics, Ghent University lieven.clement@ugent.be 43/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > confint(model1.mcp) Linear Hypotheses: Estimate lwr upr 25-10 == 0 8.2583-13.0964 29.6130 50-10 == 0 43.2583 21.9036 64.6130 50-25 == 0 35.0000 13.6453 56.3547 Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<0.001). De gemiddelde prostacycline concentratie is hoger bij de hoge arachidonzuur dosisgroep dan bij de lage en matige dosisgroep (beide p < 0.001). De gemiddelde prostacycline concentratie in de hoge dosis groep is respectievelijk 43.3 ng/ml (95% BI [21.9,64.6]) en 35.0 ng/ml (95% BI [13.7,56.3]) hoger dan in de lage en matige dosis groep. statomics, Ghent University lieven.clement@ugent.be 43/43

Family-wise error rate Prostacycline Voorbeeld: Conclusies > confint(model1.mcp) Linear Hypotheses: Estimate lwr upr 25-10 == 0 8.2583-13.0964 29.6130 50-10 == 0 43.2583 21.9036 64.6130 50-25 == 0 35.0000 13.6453 56.3547 Er is een extreem significant effect van de arachidonzuurdosering op de gemiddelde prostacycline concentratie in het bloed bij ratten (p<0.001). De gemiddelde prostacycline concentratie is hoger bij de hoge arachidonzuur dosisgroep dan bij de lage en matige dosisgroep (beide p < 0.001). De gemiddelde prostacycline concentratie in de hoge dosis groep is respectievelijk 43.3 ng/ml (95% BI [21.9,64.6]) en 35.0 ng/ml (95% BI [13.7,56.3]) hoger dan in de lage en matige dosis groep. Het verschil in gemiddelde prostacycline concentratie tussen de matige en lage dosisgroep is niet significant (p=0.61, 95% BI op gemiddelde verschil [-13.1,29.6] ng/ml). statomics, Ghent University lieven.clement@ugent.be 43/43