Help! Statistiek! Doel: Informeren over statistiek in klinisch onderzoek. Tijd: Doorlopende serie laagdrempelige lezingen, voor iedereen vrij toegankelijk. Derde woensdag in de maand, -3 uur 9 september: Survival analysis (Lokaal 35-6) 7 oktober: Over proefopzet en steekproefgrootte november: Hoe gaan we om met ontbrekende waarnemingen? Sprekers: Václav Fidler, Hans Burgerhof, Wendy Post DG Epidemiologie Survival Analyse De uitkomstvariabele is de tijdsduur ( wachttijd ) tussen - de begingebeurtenis en - de eindgebeurtenis Soms eindigt het follow-up zonder dat de eindgebeurtenis waargenomen wordt: de wachttijd is gecensureerd van rechts Survival Analyse: Overzicht Voorbeeld: Whiplash onderzoek voorbeelden Kaplan-Meier methode Logrank-toets Cox regressie - duur nekklachten (vanaf invullen vragenlijst) bij sommigen gecensureerd - score op kinesiofobie-vragenlijst - klachten (ten tijde van het invullen van de vragenlijst) 3 4 Voorbeeld: Intensive Care Unit data - overlevingsduur op de ICU (censurering bij ontslag) - bloeddruk bij opname - in coma bij opname - eerdere ICU-opname Voorbeeld: Zeeziekte simulatie - wachttijd op zeeziek worden in een simulator (censurering na uur of bij tussentijds stoppen) - frequentie van trillingen van de simulator 5 6
Voorbeeld: Niertransplantaties Voorbeeld: Overlevingsduur en proteineurie - graftoverlevingsduur, geslacht - gegevens donornier - gegevens ontvanger, matching - overlevingsduur vanaf intake (urine monster, PREVEND) - concentratie albumine in ochtendurine - roken - diabetes 7 8 Overeenkomsten van voorbeelden: Waiting time and Censoring uitkomstvariabele: wachttijd tot een bepaalde gebeurtenis censoring: death: censurering (van rechts) meerdere verklarende variabelen dit maakt het onmogelijk om standaardmethoden - zoals t-toetsen en lineaire regressie -te gebruiken 9 start of the study time end of follow-up Survival analyse: Data Voorbeeld Overlevingsfunctie Duur van nekklachten na whiplash. overlevingsduur t proportion with complaints.5.3. 3 4 total duration of complaints (days)
Beschrijving van overlevingspatroon Overlevingsfunctie Uitkomst T: wachttijd, overlevingsduur De frequentieverdeling van T is op verschillende manieren te beschrijven: - overlevingsfunctie S(t) : % nog in leven - cumulatieve verdelingsfunctie F(t) : % al dood - kansdichtheid f(t) : histogram van overlevingsduren - hazardfunctie h(t) : instantane sterftekans 3.5 t mediaan kans om langer te leven dan t overlevingsfunctie: S(t) = P ( T > t ) S(t) = F(t) F(t): cumulatieve verdelingsfunctie 4 Kansdichtheid f(t) = de kansdichtheid = F (t) = - S (t) ( histogram hele populatie ) Hazardfunctie h(t), instantane sterftekans, hazard rate: f ( t) h( t) = h(t). t is de kans op sterfte in (t,t+ t) S( t) voor iemand die op tijdstip t nog in leven was F(t) S(t) f(t) is geen kans! h(t) is geen kans! t t 5 6 Schatten van S(t) Schatten van S(t): Kaplan-Meier methode - reduced sample schatter (beperkt bruikbaar) - actuariële schatter - Kaplan-Meier schatter (Product-Limit estimate) data:,, 5, 5+, 5+, 5+,, +,, 5 tijd at risk dood cens. voorwaardelijke overlevingskans overlevingskans S(t) 8/ 8/ Veronderstelling : een gecensureerd persoon wordt beschouwd als aselect gekozen uit de op dat moment at risk zijnde personen ( niet-informatieve censurering ) 7 5 8 4... 3 7/8 3/4 7/8 * 8/ = 7/ 3/4 * 7/ = /4 (% langer dan t levenden) = (% langer dan t levenden) * (% langer dan t levenden tussen overlevenden van t) 8 3
KM-methode in SPSS data: - wachttijd - status van de wachttijd b.v. = exact (dood) = gecensureerd 9 Survival Analysis for SURVIVAL Time Status Cumulative Standard Cumulative Number Survival Error Events Remaining 3.9333 44 4 4 667 78 3 8.33 3 9 3.773 7 4 4 9 465 87 5 8 3.5657.356 6 7 4 6 6 5 74 7 5 5 7 4 7.3535 75 8 3 8 357.376 9.78 4 Number of Cases: 5 Censored: 5 ( 33.33%) Events:. Survival Function Vergelijking van of meer survival functies - op een specifiek tijdstip, b.v. twee-jaarsoverleving - op alle tijdstippen simultaan met één toets: de logrank toets - andere toetsen. 3 Survival Function Censored Voorbeeld: - Wachttijd op zeeziek worden in een simulator vergelijking van twee condities - Censurering treedt op aan het einde van het experiment (max. uur), of bij tussentijds stoppen SURVIVAL. Survival Functions. 5 5 3 4 4
Total Number Number Percent Events Censored Censored Logrank toets: EXPGROUP 5 6 76.9 EXPGROUP 8 4 4 5. Overall 49 9 3 6 Test Statistics for Equality of Survival Distributions for EXPGROUP Statistic df Significance Log Rank 3.733 - niet parametrische toets (gebaseerd op rangnummers) - optimaal in geval van proportionele hazardfuncties (model van Cox) - niet geschikt in het geval van elkaar kruisende overlevingsfuncties ( eerst tekenen, dan rekenen ) 5 6 Regressie-analyse Hoe kunnen we S(t) modeleren, d.w.z. laten afhangen van verklarende variabelen x?..9 Het model van Cox veronderstelt dat: Model van Cox (van proportionele hazardfuncties) Verklarende variabelen x,,x p bepalen S(t) via lineaire predictor LP(x): LP x x x ( ) = β +... + β p p.7.5 S ( t) = [ S ( t)] a ( ) e S( t x) = [ S ( t)] LP x.3.. < a < : S boven S a > : S onder S h( t x) h ( t) e = LP( x) proportionaliteitsfactor, hazard-ratio t.o.v. x= 4 6 8 7 8 Interpretatie van model parameters Voorbeeld: zeeziekte simulator, SPSS HR e β = is de hazardratio verbonden aan het verhogen van de variabele x met, d.w.z. de verhouding van de instantane sterftekans van een persoon met x =a+ t.o.v. een andere persoon met x =a Merk op dat er analogie is met Odds Ratio bij logistische regressie. 9 dichotome x = / (groep) EXPG ROUP Variables in the Equation B SE Wald df Sig. Exp(B) Lower Upper 96.5.956 6 5 8 69 P=,86 : geen significant verschil op 5% niveau Hazard Ratio =,5; 95% CI:,9 tot 6,8 95.% CI for Exp(B) nagenoeg hetzelfde resultaat als logrank test (dat is geen toeval) 3 5
Voorbeeld: zee-ziekte simulator, SPSS.. Survival Functions.9.7.5.3.. 4 6 8. 5 5 plotje gemaakt in Cox-regressie: dit is geen KM!!! 3 3 Voorbeeld: whiplash onderzoek - duur nekklachten (vanaf invullen vragenlijst) bij sommigen gecensureerd, geslacht - periode van het jaar - TAMPA kinesiofobie-score - klachten (ten tijde van vragenlijst) - hoofdsteun in de auto - tijd tussen het ongeval en het invullen van vragenlijst personen / 53 gecensureerd, 58 klachtenvrij RESPTIJ GESLACHT LEEFT TONG TAMP HSTEUN Variables in the Equation B SE Wald df Sig. Exp(B) -.9 56 5.979.573 7 476.34.774-45.9 5 5.783-57 5 4.3.38 84 -.76.7 9.74. 68 85 5.33 3.59 HR < betekent langere duur klachten bij toenemende x Na correctie voor lichamelijke klachten verdwijnt het effect van TAMPA To Adjust or Not To Adjust? 33 34 KM in groepen naar Tampa score kwartielen. Survival analyse: Vaak Gestelde Vragen Proportion with complaints. Q Q Q3 Q4 3 4 Hoe selecteer ik de verklarende variabelen? Hoe herken ik een confounder? Hoe vind ik een goede schaal voor een continue predictor? Wanneer gebruik ik interacties? Hoe controleer ik modelveronderstellingen? Hoe ga ik om met tijdsafhankelijke variabelen? In welke boek kan ik het nalezen? Duration of complaints after Q (days) 35 36 6
Applied Survival Analysis: Regression Modeling of Time to Event Data D.W.Hosmer, S.Lemeshow, Wiley 999 Volgende Help! Statistiek! lezing: woensdag 7 oktober 7, -3 uur in Boeringzaal Over proefopzet en steekproefgrootte Opmerking: Cox regressie kan natuurlijk ook gebruikt worden als er geen censurering is. Het is een niet-parametrische op rangnummers gebaseerde regressie-analyse methode. 37 Hand-outs van deze presentatie staan in Download Area op http://www.rug.nl/umcg/faculteit/disciplinegroepen/epidemiologie 38 7