mlw stroom 2.2 Biostatistiek en Epidemiologie College 9: Herhaalde metingen (2) Syllabus Afhankelijke Data Hoofdstuk 4, 5.1, 5.2 Bjorn Winkens Methodologie en Statistiek Universiteit Maastricht 21 maart 2006 Methodologie en Statistiek Universiteit Maastricht 1
Onderwerpen Cross-over design: voorbeeld tennisarm Algemene methode Vergelijking met t-toets Groeicurven: voorbeeld schoolmeisjes Random intercept model Betekenis geschatte coëfficiënten Methodologie en Statistiek Universiteit Maastricht 2
Cross-over design: 2 x 2 2 x 2 : iedere deelnemer krijgt zowel de placebo als de actieve behandeling Groep M P P M Periode 1 Motrin Placebo Periode 2 Placebo Motrin Analyse d.m.v. t-toets op verschil tussen periode 1 en periode 2 Methodologie en Statistiek Universiteit Maastricht 3
Cross-over design: 3 x 3 3 x 3 : drie perioden, drie behandelingen (A,B,C) Groep Periode 1 Periode 2 Periode 3 1 A B C 2 A C B 3 B A C 4 B C A 5 C A B 6 C B C Analyse? Methodologie en Statistiek Universiteit Maastricht 4
Cross-over: algemene methode (1) 2 x 2 cross-over design: Tennis2.sav id age sex drug-order 701 42 2 M P 706 45 1 P - M overall1 5 2 overall2 3 4 Analyse met anova: data herschikken TENNIS2-LONG.sav id age sex period treat overall 701 42 2 1 1 (M) 5 701 42 2 2 0 (P) 3 706 45 1 1 0 (P) 2 706 45 1 2 1 (M) 4 Methodologie en Statistiek Universiteit Maastricht 5
Cross-over: algemene methode (2) Gemiddelden per TREAT en PERIODE: (vgl. TENNIS2.sav) Group Statistics TREAT Placebo Motrin overall overall PERIOD eerste periode tweede periode eerste periode tweede periode Std. Error N Mean Std. Deviation Mean 42 2,86 1,160,179 42 3,76 1,574,243 42 3,83 1,188,183 42 4,21 1,353,209 OVERALL = algemene indruk van effectiviteit Analyse (negeer AGE en SEX: waarom mag dat?) NIET goed: twee-steekproeven t-toets TREAT = 1 vs. = 0 WEL goed: Mixed lineair model met fixed factoren PERIOD en TREAT, en random factor ID. Methodologie en Statistiek Universiteit Maastricht 6
Cross-over: algemene methode (3) Mixed lineair model: Y ij = α + a i + β 1 Period + β 2 Treat + e ij α = de gemiddelde placebo score van subjecten in de eerste periode, a i = in hoeverre de placebo score van subject i hier vanaf wijkt, β 1 = het periode effect, en β 2 = het verschil tussen Motrin en Placebo, a i ~ N(0, σ 2 id), e ij ~ N(0, σ 2 error); a i s en e ij s zijn onafhankelijk Methodologie en Statistiek Universiteit Maastricht 7
Cross-over: algemene methode (4) Uitschrijven geeft: Y ij = α + a i + β 2 + e ij, in periode 1, groep = M P Y ij = α + a i + β 1 + e ij, in periode 2, groep = M P Y ij = α + a i + e ij, in periode 1, groep = P M Y ij = α + a i + β 1 + β 2 + e ij, in periode 2, groep = P M Mixed lineair model: - α, β fixed effecten - a i, e ij random effecten Methodologie en Statistiek Universiteit Maastricht 8
Cross-over: algemene methode (5) SPSS: <analyze> <mixed model> <linear> <continue> - OVERALL als dependent variable; - ID, PERIOD, TREAT als factoren <fixed> PERIOD en TREAT <random> ID <statistics> parameter estimates <EM Means > <Display means for> TREAT <compare main effects> Methodologie en Statistiek Universiteit Maastricht 9
Cross-over: algemene methode (6) SPSS uitvoer: Source Intercept PERIOD TREAT Type III Tests of Fixed Effects a Denominator Numerator df df F Sig. 1 83 1006,097,000 1 82 13,400,000 1 82 16,543,000 a. Dependent Variable: algemene indruk van effectiviteit. Significantie van PERIOD? TREAT is significant. Hoe groot is het behandelingseffect (TREAT)? Methodologie en Statistiek Universiteit Maastricht 10
Cross-over: algemene methode (7) Parameter Intercept [PERIOD=1] [PERIOD=2] [TREAT=0] [TREAT=1] Estimates of Fixed Effects b 95% Confidence Interval Estimate Std. Error df t Sig. Lower Bound Upper Bound 4,3452381,1696560 164,014 25,612,000 4,0102466 4,6802296 -,6428571,1756143 82-3,661,000 -,9922099 -,2935043 0 a 0..... -,7142857,1756143 82-4,067,000-1,0636385 -,3649329 0 a 0..... a. This parameter is set to zero because it is redundant. b. Dependent Variable: algemene indruk van effectiviteit. Uitkomst precies hetzelfde als met t-toets (Rosner: 5 e editie, p. 644-645; 6 e editie, p. 702-703) Maar deze algemene methode gaat ook bij een 3x3 cross-over (en groter) Methodologie en Statistiek Universiteit Maastricht 11
Cross-over: algemene methode (8) Geschatte varianties en gemiddelden: Estimates of Covariance Parameters a Parameter Residual ID Variance Estimate Std. Error 1,2952962,2022913,4748419,2014733 a. Dependent Variable: algemene indruk van effectiviteit. De geschatte waarde van de variantie σ 2 id is 0.475 en die van de error variantie σ 2 error is 1.295. TREAT Placebo Motrin Estimates a Mean Std. Error df Lower Bound Upper Bound 3,310,145 154,386 3,023 3,596 4,024,145 154,386 3,737 4,311 a. Dependent Variable: algemene indruk van effectiviteit. 95% Confidence Interval Methodologie en Statistiek Universiteit Maastricht 12
Cross-over: algemene methode (9) Paarsgewijze vergelijking van behandelingen: Pairwise Comparisons b Mean 95% Confidence Interval for Difference Difference a (I) TREAT (J) TREAT (I-J) Std. Error df Sig. a Lower Bound Upper Bound Placebo Motrin -,714*,176 82,000-1,064 -,365 Motrin Placebo,714*,176 82,000,365 1,064 Based on estimated marginal means *. The mean difference is significant at the,05 level. a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). b. Dependent Variable: algemene indruk van effectiviteit. Resultaten identiek met eerdere analyse, maar deze methode - kan ook bij meer dan twee perioden - kan ook onvolledige data analyseren Methodologie en Statistiek Universiteit Maastricht 13
Cross-over: onvolledige data Groep Periode 1 Periode 2 Aantal M P Motrin Placebo 25 M P Motrin - 17 P M Placebo Motrin 21 P M Placebo - 21 Slechts 46 van de 84 personen hebben volledige data; 38 kunnen alleen op de eerste periode vergeleken worden Aangenomen dat het ontbreken niets te maken heeft met de uitkomsten MIXED LINEAIR MODEL met ID als random factor is geldig Methodologie en Statistiek Universiteit Maastricht 14
Groeicurven: schoolmeisjes (1) Short mother Medium mother Tall mother 160 160 160 150 150 150 140 140 140 Height 130 HEIGHT 130 HEIGHT 130 120 120 120 110 110 110 100 5 6 7 8 9 10 11 100 5 6 7 8 9 10 11 100 5 6 7 8 9 10 11 AGE AGE AGE Is groei gerelateerd aan lengte moeder? 1 kind per moeder! Bij benadering lineaire groei Meer verschil tussen dan binnen groepen Complete data & 5 vaste tijdstippen Methodologie en Statistiek Universiteit Maastricht 15
Groeicurven: schoolmeisjes (2) Analyse-methoden: Eenvoudige methoden: samenvattende maten Gemiddelde lengte over jaren 6 t/m 10 Regressiehelling per kind Etc. Geavanceerde methoden: mixed lineair model Random intercept model Random slope model (valt buiten de stof) Methodologie en Statistiek Universiteit Maastricht 16
Groeicurven: schoolmeisjes (3) Random intercept model: Veronderstel een lineair regressiemodel; voor de j-de meting per kind i (op tijdstip t j ): Y ij = α + β t j + e ij ; e ij ~ N(0,σ 2 error) Plaatjes tonen dat er verschillende intercepten en hellingen per groep zijn, dus Y ij = α 1 + β 1 t j + e ij in groep 1 Y ij = α 2 + β 2 t j + e ij in groep 2 Y ij = α 3 + β 3 t j + e ij in groep 3 Methodologie en Statistiek Universiteit Maastricht 17
Groeicurven: schoolmeisjes (4) Random intercept model (2): Vorig model veronderstelt dat binnen een groep iedereen even groot is en even hard groeit, afgezien van random error. Aan de plaatjes te zien is dit niet goed voeg random intercept a i (~ N(0, σ 2 child)) toe: Y ij = α 1 + a i + β 1 t j + e ij in groep 1 Y ij = α 2 + a i + β 2 t j + e ij in groep 2 Y ij = α 3 + a i + β 3 t j + e ij in groep 3 Random intercepten Fixed hellingen Methodologie en Statistiek Universiteit Maastricht 18
Groeicurven: schoolmeisjes (5) Random intercept model (3): In SPSS is de parametrisering net iets anders: Y ij = µ + α 1 + a i + (γ + β 1 ) t j + e ij in groep 1 Y ij = µ + α 2 + a i + (γ + β 2 ) t j + e ij in groep 2 Y ij = µ + a i + γ t j + e ij in groep 3 µ = gemiddelde intercept in groep 3 α 1 = verschil in gemiddelde intercept tussen groep 1 en groep 3, α 2 = verschil in gemiddelde intercept tussen groep 2 en groep 3, a i = random intercept, γ = gemiddelde helling in groep 3, β 1 = verschil in gemiddelde helling tussen groep 1 en groep 3, β 2 = verschil in gemiddelde helling tussen groep 2 en groep 3 Methodologie en Statistiek Universiteit Maastricht 19
Groeicurven: schoolmeisjes (6) Analyse met SPSS: Type III Tests of Fixed Effects a Source Intercept GROUP AGE GROUP * AGE a. Denominator Numerator df df F Sig. 1 37,895 9636,794,000 Dependent Variable: HEIGHT. 2 37,895,460,635 1 77,000 8385,152,000 2 77,000 21,661,000 Verschillende hellingen Estimates of Covariance Parameters a Parameter Residual Intercept [subject = CHILD] a. Dependent Variable: HEIGHT. Variance Estimate Std. Error,7695751,1240283 8,9603304 3,1262588 Geschatte varianties: σ 2 child = 8,96 en σ 2 error = 0,77 Methodologie en Statistiek Universiteit Maastricht 20
Groeicurven: schoolmeisjes (7) Geschatte waarden van de parameters Parameter Intercept [GROUP=1,00] [GROUP=2,00] [GROUP=3,00] AGE [GROUP=1,00] * AGE [GROUP=2,00] * AGE [GROUP=3,00] * AGE Estimates of Fixed Effects b Estimate Std. Error df t Sig. Lower Bound Upper Bound 83,12286 1,4162085 37,895 58,694,000 80,2556310 85,9900832-1,82286 2,0846025 37,895 -,874,387-6,0432997 2,3975854 -,1485714 2,0028213 37,895 -,074,941-4,2034415 3,9062986 0 a 0..... 6,2485714,1048519 77,000 59,594,000 6,0397845 6,4573583 -,9785714,1543379 77,000-6,340,000-1,2858974 -,6712454 -,6814286,1482830 77,000-4,595,000 -,9766978 -,3861593 a. This parameter is set to zero because it is redundant. b. Dependent Variable: HEIGHT. 95% Confidence Interval 0 a 0..... Geschatte gemiddelden per groep: Groep 1: Y = 83,12 + (-1,82) + 6,25 Age 0,98 Age Groep 2: Y = 83,12 + (-0,15) + 6,25 Age 0,68 Age Groep 3: Y = 83,12 + 6,25 Age Methodologie en Statistiek Universiteit Maastricht 21
Groeicurven: schoolmeisjes (8) Geschatte gemiddelde lengte per groep (small, medium, tall): Y = 81,30 + 5,27 Age Y = 82,97 + 5,57 Age Y = 83,12 + 6,25 Age Geschatte intercepten hebben geen fysieke betekenis! Methodologie en Statistiek Universiteit Maastricht 22
Groeicurven: schoolmeisjes (9) Geschatte gemiddelde lengte van 6 t/m 10 jaar per groep: length of mother short medium tall Estimates b 95% Confidence Interval Mean Std. Error df Lower Bound Upper Bound 123,460 a 1,232 17,000 120,860 126,060 127,511 a 1,141 17,000 125,104 129,919 133,111 a 1,141 17,000 130,704 135,519 a. Covariates appearing in the model are evaluated at the following values: AGE = 8,0000. b. Dependent Variable: HEIGHT. Pairwise Comparisons b (I) length of mother short medium tall (J) length of mother medium tall short tall short medium Based on estimated marginal means *. The mean difference is significant at the,05 level. Mean Difference a. Adjustment for multiple comparisons: Least Significant Difference (equivalent to no adjustments). b. Dependent Variable: HEIGHT. 95% Confidence Interval for Difference a (I-J) Std. Error df Sig. a Lower Bound Upper Bound -4,051* 1,680 17,000,027-7,595 -,508-9,651* 1,680 17,000,000-13,195-6,108 4,051* 1,680 17,000,027,508 7,595-5,600* 1,614 17,000,003-9,005-2,195 9,651* 1,680 17,000,000 6,108 13,195 5,600* 1,614 17,000,003 2,195 9,005 Methodologie en Statistiek Universiteit Maastricht 23
Groeicurven: schoolmeisjes (10) Controle modelveronderstellingen: 1) Lineariteit 2) Normaal verdeelde errors en random effecten 3) Met constante varianties Residuenplot geeft informatie over deze veronderstellingen Methodologie en Statistiek Universiteit Maastricht 24
Groeicurven: schoolmeisjes (11) Short mother Medium mother Tall mother 3,0 3,0 3 2,0 2,0 2 1,0 1,0 1 Residuals 0,0 Residuals 0,0 Residuals 0-1,0-1,0-1 -2,0-2,0-2 -3,0 5 6 7 8 9 10 11-3,0 5 6 7 8 9 10 11-3 5 6 7 8 9 10 11 AGE AGE AGE Residuen per kind gemiddeld nul Er lijkt wat niet-lineariteit in te zitten: de groei neemt af Residuen zijn groter voor dochters van lange moeders Er zou ook een random helling (slope) kunnen zijn. Methodologie en Statistiek Universiteit Maastricht 25
Samenvatting Cross-over design: mixed lineair model Herschik data: een waarneming per regel Persoonsidentificatie ID als random factor Groeicurve: mixed lineair model Random intercept model: SUBJECT als random factor Interpretatie coëfficiënten Controle modelveronderstellingen Methodologie en Statistiek Universiteit Maastricht 26
Volgende week: 28.03.2006 GEEN college WEL onderwijsgroepen Bespreken pen en papier opgaven (onderwijsgroep 9) Tijd om vragen te stellen over HELE STOF (inclusief OEFENTOETS 1 april 2005: www.stat.unimaas.nl) Bestudeer dus de toetsstof en bereid vragen voor!!! Methodologie en Statistiek Universiteit Maastricht 27