Professionele Ontwikkeling en Wetenschap. Collegeaantekeningen GENEESKUNDE VU, JAAR 3

Transcriptie

1 Professionele Ontwikkeling en Wetenschap Collegeaantekeningen GENEESKUNDE VU, JAAR 3

2 16/05/2013 Randomized clinical trial Maarten boers De meeste onderzoeken zijn observationeel. De eenvoudigste zijn case series waarbij iemand iets opvalt aan een aantal personen die iets raars meemaken. Als je dit als eerste opschrijft en publiceert ben je de eerste. Het is een ongecontroleerde selectie want je schrijft gewoon op wat je hebt gezien en je vergelijkt het met wat je verwacht in de gewone bevolking. De case controle studie is een snelle en goedkope manier om verbanden te leggen. Hiermee ga je bijvoorbeeld mensen met ziekte vergelijken met mensen zonder ziekte en dit vergelijken met blootstelling aan iets. Je gaat dus uit van groepen die al ziek zijn. En je kijkt terug in de tijd naar de blootstelling. Dit onderzoek is dus per definitie retrospectief. Nadelen: gevoelig voor vertekening/bias. Belangrijkste problemen zijn de controlegroep. Dit moeten namelijk mensen zijn die als ze blootgesteld waren en de ziekte hadden, dan hoorde ze bij je case. Dus die moeten mensen zijn die precies de zelfde kenmerken hebben als de cases behalve de blootstelling. De controle groep is vaak anders geselecteerd dan de patiëntengroep. Hierdoor ontstaat selectiebias. Het is heel moeilijk om balans te krijgen in dingen waarvan je weet dat ze je onderzoeksresultaat kunnen vertekenen (confounders) en het is moeilijk om de uitkomst te maskeren want je selecteert juist om de uitkomst. Vaak weet je veel meer van de cases dan van de controles. Daardoor ontstaat er een informatiebias. Een cohortstudie is beter (en robuster dan case control studie) omdat de dataverzameling prospectief gebeurt. Je kunt mensen er aan houden allerlei data te verzamelen. Ook wordt het verzameld voordat de uitkomst bekend is. Je kunt beter bepalen wat je wilt meten en alvast vertekeningen vastleggen. Het begint met al of niet blootstelling waarvan je denkt dat het ziekte veroorzaakt en je vervolgt hen. Dan ga je aantallen ziekten bekijken. Een cohortstudie is dus een nauwkeurige, gestandaardiseerde studie. Meten van en selecteren (matchen) voor bekende confounders) Nadeel: duur en traag. Blootstelling is ongecontrolleerd. Je er kan dus selectiebias optreden. Met onbekende confounders kun je niets doen en maskeren de uitkomst is moeilijk. Er ontstaat informatiebias. Bias is een vertekend resultaat. Als je zeker wil weten dat groepen vergelijkbaar zijn moet je er vanuit kunnen gaan dat groepen gelijk zijn behalve dat contrast dat je wilt weten. Anders ontstaat er een selectie bias. Ook moet je informatie (kwantiteit, kwaliteit) gelijk zijn in de te vergelijken groepen, anders ontstaat er informatie-bias. Confounders zijn verstorende variabelen. Iedere factor die bias veroorzaakt zou confounder kunnen zijn. De factor is niet het onderwerp van onderzoek, maar kan wel het onderzoeksresultaat verstoren of vertekenen. De factor is een confounder als hij verband heeft met de blootstelling en met de uitkomst. Manier om het te onthouden: als je geïnteresseerd bent in alcoholgebruik en het voorkomen van hartinfarcten, dan is roken een confounder. Matig gebruik van alcohol is beschermend tegen het voorkomen van hartinfarcten. Roken is positief gecorreleerd met alcoholgebruik. Alcoholgebruikers roken over het algemeen meer dan niet c

3 alcoholgebruikers. En roken heeft een negatieve invloed op het hartinfarct. Als je meer rookt krijg je meer hartinfarcten. Als je niet informatie verzamelt en controleert voor nicotine, zal je het goede positieve verband en beschermende effect van alcohol op hart en vaatziekten niet kunnen vinden. Confounding werkt dus alleen als het verband heeft met de blootstelling en de uitwerking. Om het effect van alcohol op hartinfarcten te meten moet je stratificeren. Dan neem je bijvoorbeeld niet-rokers en rokers-groep. In de rokersgroep zou je ook nog strata kunnen aanbrengen van hoeveelheid roken. Bias betekent dus dat het studieresultaat niet waar is. - selectiebias: de onderzochte groepen zijn niet vergelijkbaar (Anders geselecteerd) wat betreft determinanten : fout resultaat kan twee kanten op - informatiebias: als informatie niet gelijk is in beide groepenis er grote kans dat je vertekening krijgt - confounding. Dit wordt appart gezet maar is eigenlijk een vorm van selectie. - Sampling bias: foute steekproef nemen. Dus onderzoeksresultaat is alleen van toepassing op onderzoeksgroep maar niet op populatie. Er is dus een gebrek aan externe validiteit. Matchen is een heel precieze vorm van stratificeren. Een toevallige fout bedreigt vooral: - validiteit (onwaar) - betrouwbaarheid (waar) er is veel ruis in de meting. als je een toevallige fout hebt, kun je dit oplossen door: - vaker meten (waar, dan krijg je vaker een goede uitkomst) - ander meetinstrument (waar, als je een nauwkeuriger instrument neemt met minder ruis krijg je minder toevallige fouten) systematische fout bedreigt vooral: - validiteit ( waar, hier is het probleem in validiteit die niet wordt opgelost door betrouwbaarder te meten want je zit er gewoon naast.) - betrouwbaarheid (onwaar) Oplossing: - vaker meten (onwaar, Er is een fout in het systeem dus je kunt 100x meten, maar helpt niet) - ander meetinstrument (waar) Een gebiast studieresultaat komt vooral door - verstorende variabelen (waar) - systematische fout (waar) - een toevallige fout (onwaar) Gerandomiseerde klinische trial (RCT) Definitie: vergelijkend onderzoek van 2 of meer ingrepen waarbij de ingrepen worden toegewezen aan proefpersonen op de grond van toeval. Het kan therapeutisch zijn, je geeft iemand een behandeling. Het kan diagnostisch zijn waarbij mensen of röntgen of petscan krijgen. Je kunt niets doen, placebo. Kenmerk: toewijzing op ingreep op de grond van toeval via loting. Verschil met cohort: blootstelling is niet gerandomiseerd. d

4 Je doet een RCT omdat het de enige manier is om erachter te komen of iets werkt of niet. Het gaat alleen goed als je de juiste doelgroep hebt, de relevante maat en een eerlijke vergelijking. Eerlijke vergelijking betekent dat je groepen met vergelijkbare diagnose probeert te maken. Je probeert maar 1 verschil te creëren, en dat is de interventie. Als dat ondanks de randomnisatie niet lukt heb je kans op vertekening. Dit doe je voor en tijdens het onderzoek. Je maakt een eerlijke meting, voldoende patiënten, eerlijke analyse en een eerlijke rapportage. De vergelijkbaarheid wordt gegeven door randomnisatie, maar het is geen garantie. Hoe groter het onderzoek hoe kleiner de kans op een vervelende disbalans. Dan moet je stratificeren. Dan maak je aparte randomnisatietabellen voor bijvoorbeeld geslacht. Tijdens het onderzoek is blindering het belangrijkste. Blindering kan op niveau van behandelaar, patiënt en uitkomstmeter. Hierdoor zorg je dat de meting en uitkomstmaat niet wordt beïnvloed door verwachting. De blindering kan een positief effect hebben, bijvoorbeeld ik denk dat ik me minder ziek voel of een negatief effect :patiënten met een chemokuur die al misselijkheid voelen als ze de infuuszak zien hangen zonder dat het middel al in het lichaam is. Co-interventie: tijdens het onderzoek krijgen mensen een andere behandeling erbij die invloed kunnen hebben op de uitkomst. Bij pijn mogen mensen met placebogroep bijvoorbeeld paracetamol erbij nemen. Als dit ongecontrolleerd gebeurt en de placebogroep slikt veel paracetamol en je weet dit niet, dan denk je dat het experimentele middel niet beter is dan niets, maar in werkelijkheid is het niet beter dan paracetamol. Contaminatie: ene groep krijgt ongecontroleerd de interventie van de andere groep. Hierdoor is er geen contrast meer. Als het goed is wordt de analyse ook geblindeerd gedaan. De eerlijkste vergelijking is de intention to treat analyse. Je moet aan het eind van het onderzoek nog ten minste weten dat de mensen nog leven. Het is ook belangrijk om ook andere analysen te doen omdat de intention to treat heel concervatief is. Idealiter komen alle analysen overeen. Als elke analyse een ander resultaat geeft is het belangrijk na te gaan hoe dit komt. Het doen van een RCT begint met het feit dat een onderzoek echt nodig is. De mensen die je includeertin je studie en die met je studie gaan meewerken. Je moet een goed geoperationlaiseerde onderzoeksvraag hebben, goed design (interne validiteit) voeldoende patiënten, onderzoekers, studiepersoneel, computers, ruimte, geld, sponsor en gastheer hebben verstand van wetenschap. Je moet een protocol schrijven, beheersplan, meerdere keren naar de medisch etische comissie, bepaalde manier van registratie, data beheer. Tijdens onderzoek gaan mensen niet pillen slikken, dokters houden zich niet aan protocol, data beveiligen, nieuwe bijwerkingen, soms nieuwe inzichten in wetenschap, medewerkers informeren. Etc. Bezwaren tegen RCT: moeilijk, traag en duur en niet generaliseerbaar want het is een sterk gelesecteerde populatie en kunstmatige interventie. Dus de resultaten zijn niet toepasbaar in de dagelijkse praktijk. Oplossing wordt gezocht in observationeel onderzoek. e

5 Goede cohortstudies zijn bijna even goed. Maar case control heeft te veel bias. Veel trials worden door de farmacotherapeutische industrie gedaan en worden betaald ten behoeve van registratie. Efficacy vs effectiveness Registratietrials gaan over de vraag: werkt het überhaupt (efficacy) en pragmatische trials gaan over de vraag werkt het (is het nuttig) in de praktijk. (effectiveness) Pragmatische trials zijn dus ingebed in de dagelijkse praktijk en zeer goed mogelijk. Het probleem is vaak de financiering. Het allergrootste probleem: veel artsen kunnen moeilijk in hun dagelijkse praktijk aan zichzelf verkopen dat hun besluiten vaak niet op goede data berusten dus kunnen dit moeilijk aan hun patiënten verkopen. Dit onvermogen wordt vervolgens geprojecteerd op het RCT design. f

6 16/05/2013 Statistiek 2 Anton de Vries Bij een T-toets onderzoek je het verschil tussen twee groepen. De effectmaat is het verschil. Als je een oneindig aantal steekproeven zou nemen met voldoende grootte en je berekent het gemiddelden neemt, is dit weer een normale verdeling. Dit is de centrale limietstelling. Met de T-toets geef je aan wat de kans is dat je een verschil vindt terwil je aan neemt dat twee groepen uit de zelfde populatie komen met dezelfde gemiddelde en zelfde standaarddeviatie. Als de kans maar heel klein is, uitgaande van de 0hypothese, bereken je die kans en zeg je dat je de kans zo klein acht dat de 0hypothese waar is dat je hem kunt verwerpen. ANOVA staat voor analysis of variances. Met een ANOVA kan je van meer dan twee groepen de gemiddelden vergelijken. Hoewel je kijkt naar variancies kun je toch iets over gemiddelden zeggen. Als je kijkt naar de binnengroep en buitengroepsvariantie en de verhouding berekent, kan je door middel van de F-toets, met 2 vrijheidsgraden. Als je een significant verschil vindt, dan weet je nog niet tussen welke groepen dit verschil zich bevindt. Regressie analyse gebruik je als je een onderzoek hebt met een verband tussen twee continue variabelen. Je maakt het kleinste kwadratenprincipe. Je kunt de richtingscoefficient uitreken. De richtingscoefficient is gelijk aan de correlatie, gecorrigeerd voor de standaarddeviatie in de X-variabele en de standaarddeviatie in de Y-variabele. De regressiecoëfficiënt is gelijk aan het verschil in uitkomstvariabele als de determinant een eenheid verschilt. De constante is de uitkomstvariabele als de determinant 0 is. Je kunt lineaire regressie gebruiken in plaats van een T-toets of ANOVA als de lineaire regressie wordt gebruikt in relatie met een andere variabele. Lineaire regressie: zowel het verschil tussen 2 groepen als het verschil tussen 3 groepen kan geanalyseerd worden met behulp van lineaire regressie analyse. Normaal gesproken wordt y=ax + b gebruikt, maar in lineaire regressie: bijvoorbeeld cholesterol = b0 + b1 x leeftijd. B1 is het verschil tussen groep 1 en groep 2 want het is de richtingscoëfficiënt. g

7 Dit zijn scatterplotten. Dit is het gemiddelde verschil dus de B1. als je groep 1 nul codeert is het gemiddelde van groep 1 je B0. het is nog steeds een continue uitkomst maar met een dichotome variant. In plaats van een T-toets wordt een regressieanalyse gedaan. Aan een regressievergelijking kan je meerdere variabelen toevoegen, bij een T-toets kan dit niet. Je kunt een continuë en dichotome variabele opnemen. Dat kan met een T-toets niet. Voorbeeld: Stel je bent geïnteresseerd in de mannen. Dit is de output van regressie op geslacht voor cholesterolgehalte is gemiddelde cholesterolgehalte in mm/l bij vrouwen.472 = B1 = verschil tussen mannen en vrouwen Beta = correlatie. Correlatie tussen cholesterol en geslacht. Het zegt: verschil van.472 mm/l kun je kijken of het significant is. Je deelt de regressiecoëfficient gedeeld door de standaardfout van de regressie, dus door.151. Dan krijg je er een T-toets uit van Eigenlijk doe je het zelfde als bij de T-toets. Je ziet weer maar nu is dit negatief. h

8 In plaats van een T-toets kun je dus ook een lineaire regressie doen waarbij je de groep definieert met een waarde 0 en 1. de vrouwen zijn 0 de mannen zijn 1. Toetsen van een regressie coëfficiënt: je kunt de regressie-coefficient delen door de standaardfout en dan krijg je er een T-waarde uit. Dan krijg je B1, dus de.472 Dit kun je ook doen voor B0 en dan kijk of het gemiddelde van de vrouwen afwijkend van 0 is. Het gaat dus om het verschil tussen mannen voor vrouwen. Je deelt de.472 door de.151 en dan heb je de T-toets voor het verschil tussen mannen en vrouwen. De T-verdeling is een soort normale verdeling met bredere staarten. Je kunt ook een betrouwbaarheidsinterval berekenen. Bij 98vrijheidsgraden is de T- waarde bijna gelijk aan de normale verdeling. De B + of twee keer de standaardfout geeft het 95% betrouwbaarheidsinterval van de regressie-coefficient, of tewel het verschil tussen mannen en vrouwen. Als 0 in het interval ligt is het niet significant. Als 0 niet in het interval ligt is er een significant verschil. Bij een 95% betrouwbaarheidsinterval wil je er maar maximaal 5% naast zitten. Als 0 niet in het interval ligt weet je dat het geen 0 kan zijn dus is het significant. Alfa is het significantieniveau van.05. Dit deel je door 2. n-2 is 98, want dit zijn de vrijheidsgraden. De vrijheidsgraden definiëren hoe de T- verdeling eruit ziet. Naarmate de vrijheidsgraden kleiner zijn, zijn de staarten dikker. i

9 B kan b0 of b1 zijn. Bij b0 meet je de vrouwen, bij b1 meet je het verschil. Alcohol consumptie is geen continue variabele maar een categoriale variabele en moet geanalyseerd worden met behulp van dummy variabelen. Als je een lineaire regressie doet krijg je geen significant getal. Bij ANOVA wel. B1 is niet significant omdat het geen continue variabele is. Je lost dit probleem op door voor elke groep een aparte variabele te maken. Dit wordt dummy coderen genoemd. Je hebt 1 groep, je maakt dummy al1 en dummy al2. je hebt niet-drinkers, 1-2 glazen en 2 en meer drinken. Dummy al1 is 1 bij matige drinkels. Dummy al2 is 1 bij zware drinkers. Je maakt een regressievergelijking van Y=B0 + B1 x dummy al1 + B2 x dummy al 2. De waarde van de niet drinkers is B0 + B1 x 0 + B2 x 0 = 0. Dus B0 geeft het gemiddelde van niet drinkers. Als je kijkt naar de Y van 1-2 drinkers: B0 + B1. B1 geeft het verschil tussen niet en matige drinkers weer. Bij zware drinkers: B0 + B2. B2 = verschil tussen niet drinkers en zware drinkers. Met dummy codering kies je 1 referentiecathegorie. Deze cathegorie is bij alle variabelen 0. en je maakt steeds een vergelijking met niet drinkers ten opzichte van matig of zwaar. Bij SPSS krijg je dan deze output De B bij dummy al 1 is het verschil tussen niet en matige drinkers. Je ziet dat de matige drinkers een lager cholesterol hebben. De dummy al2 is het verschil tussen de nietdrinkers en de zware drinkers. Daar zie je dat ze een verschil van.318 hoger is. Het verschil tussen niet-drinkers en matige drinkers is significant. Verschil tussen zware en niet drinkers is niet significant. Verschil tussen matige en zware drinkers kan hier niet uitgehaald worden, dan moet je hercoderen. Dan maak je van 1 de referentie categorie en van de andere maak je 1. De bovenste b-waarde is ten opzichte van 0. het is met een hoogte van hoger ten opzichte van 0. Dit is geen informatie van mensen zonder cholesterol leven niet. j

10 Dit is de grafische interpretatie van de groepen: Bij een regressievergelijking kun je heel gemakkelijk variabelen toevoegen. Bij anova krijg je een multipele (MANOVA) k

11 16/05/2013 Statistiek 2, College 2 Anton de Vries De Beta is niet uit de tabel te berekenen. Hiervoor heb je de standaarddeviatie van de determinant en de uitkomst nodig. Deze zie je hieronder niet staan want de relatie tussen de regressiecoëfficiënt en de beta wordt juist bepaald door de 2 standaarddeviaties. Wat je wel ziet, is dat de B in dit voorbeeld, waarbij je onderzoekt wat de relatie tussen cholesterol en BMI doet, is heel klein maar wel significant. Dit komt omdat een stapje in BMI maar heel klein is. De Beta geeft de correlatie weer. De correlatie coefficient ligt altijd tussen -1 en 1. aan een correlatie kun je zien of hij hoog is of laag want hij heeft afgebakende grenzen. Bij een regressie coëfficiënt kun je dit niet zien. Een nadeel van een correlatie is dat er geen eenheid aan verbonden is. Bij een regressiecoëfficiënt is dit er wel. Als je bovenstaand (fictieve) scatterplot bekijkt zie je dat er een regressiecoëfficiënt van 1 en constante van 6 is. Als je een lijn zou trekken zou hij door de 6 gaan op de Y-as en elk stapje naar rechts gaat 1 stapje omhoog. Verder is er een Beta, correlatie van.866 dus vrij hoog want bijna 1. l

12 Hierboven is ook een regressiecoefficient van 1 en constante van 6. maar de B, de correlatie, is veel lager. De puntjes liggen veel verder van de lijn. De correlatie zegt niets over de helling. Binnen de epidemiologie zijn we meer geïnteresseerd in de regressiecoëfficiënten en minder in correlatiecoëfficiënten omdat men zoekt naar een duidelijke eenheid. Een correlatie is gestandaardiseerd. Je kunt hem gelijk vergelijken met andere correlaties omdat het dementieloos is. De correlatie is het kleinst als hij 0 is en het grootst bij 1 of -1. Problemen bij lineaire regressie: - samenhang tussen determinant en uitkomstvariabele zijn niet-lineair - determinant en/of uitkomstvariabele niet normaal verdeeld - confounding en effect modificatie Je kunt onderzoeken of een samenhang lineair is door ax^2 + bx + c. je krijgt een parabole. Bijvoorbeeld de relatie tussen cholesterol en BMI Je kunt toetsen of B2 statistisch significant van 0 afwijkt. Als dit zo is is heeft deze betekenis en is de functie niet lineair. Als hij niet significant is, is hij vrijwel gelijk aan 0 en houd je een lineair verband aan. Dan kun je niet meer zeggen het verband tussen BMI en cholesterol is lineair Je kunt ook de determinant in groepen verdelen. Als je vier groepen maakt heb je groepen van gelijke grootte. (quartielen). Vervolgens bekijk je of de groepen constant groter worden. m

13 Het is niet lineair. Dummy 1 is het verschil tussen 1 en 2. dummy BMI 2 is verschil tussen 1 en 3. Als je groepen maakt is het niet liniair. Als je methode 1 met kwadratische term gebruikt is het wel lineair. Het verschil tussen 1 en 2 is.649 het verschil tussen 1 en 3 is.294 Als je het zou uittekenen zou groep 1 op zitten, groep 2 op dus ongeveer 6,7 Groep 3 zou zitten op dus op ongeveer 6,2 Groep 4 zou zitten op dus 6,4 Ze liggen dus niet op een lijn. Maak ATLIJD een scatterplot. Dan zie je of iets lineair is of niet. Het komt heel vaak voor dat er geen normale verdeling is van determinanten. De truck om een scheve verdeling recht te krijgen is log-tranformatie. Verschil tussen logeritmen is het logaritme van de breuk. Triglyceriden van de mannen ten opzichte van triglyceriden van de vrouwen is e^.127 hier krijg je 1.14 uit. De triglycerideconcentratie van de man is 1.14x zo hoog dan die van de vrouw. n

14 Confounding is het idee dat de relatie die je vind voor 2 variabelen wordt beïnvloed door een 3 e variabele. Bijvoorbeeld: je meet het cholesterolgehalte bij mannen en vrouwen. Mannen hebben hoger cholesterol dan vrouwen en ouderen hebben een hoger cholesterol dan jongeren. Stel in de steekproef zijn mannen ouder dan vrouwen dan krijg je een groter verschil. Stel de mannen zijn jonger dan de vrouwen dan krijg je een kleiner verschil. Als er dus een niet significant verband vind kan er toch confounding optreden. Dit kun je onderzoeken door meerdere variabelen in je regressievergelijking op te nemen. Bijvoorbeeld je vergelijkt geslacht en cholesterol en leeftijd en cholesterol. Je kijkt naar de invloed op het toevoegen van leeftijd op de regressiecoëfficient. Verschil in cholesterol bij mannen en vrouwen is.319 Als je leeftijd toevoegt is het verschil bijna niets meer, dus al het verschil wordt bijna verklaard door leeftijd. Er is geen verschil in geslacht want al het verschil is toe te schrijven aan leeftijd. Als je een 10% daling of stijging vindt is er sprake van confounding. Effectmodificatie is iets anders dan confounding. Bij confounding is het een achterliggende relatie. Bij effectmodificatie is het effect anders voor verschillende groepen. bijvoorbeeld het effect is anders voor jonge mensen dan voor oude mensen. Binnen multipele regressieanalyse kan effectmodificatie geanalyseerd worden door interactietermen. Cholesterol = b0 + b1 x geslacht + b2 x roken + b3 x geslacht x roken Geslacht (0: vrouw; 1:man) Roken ():nee; 1: ja) B1 = verschil in gemiddeld cholesterol tussen mannen env rouwen die niet roken B1 + b3 = verschil in gemiddeld cholesterol tussen mannen en vrouwen die wel roken. De mannen die niet roken, als je dit invult krijg je cholesterol is b0 + 0 Niet rokende vrouwen: B0 Vrouwen die wel roken: B0 + B2 B2 = vrouwen die roken vrouwen die niet roken Mannen die roken: b0 + b1 + b2 + b3 Verschil tussen mannen die roken en vrouwen die roken is b1 + b3 o

15 Interactieterm defineer je door twee determinanten te vermenigvuldigen in spss. Plan van aanpak als je onderzoekt op er confounding of effectmodificatie is: - counfounding: toevoegen van condounder aan regressiemodel en kijken of de regressiecoëfficiënt van de determinant verandert. Vuistregel hierbij is: als er meer dan 10% verandering is, is er confounding. Een elegante oplossing hierop is: presenteer zowel ongecorrigeerde als gecorrigeerde resultaten - effectmodificatie: toevoegen van interactieterm aan regressiemodel en kijken of de interactieterm significant is. Indien significant: aparte resultaten voor de groepen van de effecmodificator. van confounding moet je af, effectmodificatie moet je gebruiken. p

16 Systematic reviews van RCTs Riekie de Vet Vroeger schreef een expert op uitnodiging van een tijdschrift een review. Deze expert maakte een selectie van studies en beschreef de resultaten. Hij trok hier conclusies uit. De nadruk lag op autoriteit. Niet iedereen kon zomaar een review insturen. Er was ook weinig transparantie jaar geleden is daar verandering ingekomen. Toen vond met dan de reviews veel systematischer konden. Dit komt in een aantal aspecten tot uiting: - Formulering van een concrete vraagstelling (niet alles over osteoporose) - Expliciete zoekstrategie (strategie beschreven) en selectiecriteria - Beoordeling van methodologische kwaliteit van de onderzoeken - Indien mogelijk strategische pooling van resultaten = meta-analyse - Beantwoording van vraagstelling (conclusies) kan nu heel gericht Belangrijk is dat er sprake is van transparantie. Als iemand anders die systematische review zou doen, zou er weer hetzelfde uitkomen. Lezer kan precies volgen wat je gedaan hebt. Het is niet mogelijk om alle literatuur bij te houden. Er zijn ruim medische tijdschriften. Miljoenen artiekelen per jaar. In totaal >1 miljoen RCTs en >1 miljoen diagnostische studies. Daarom zijn de systematische reviews van belang. Daar is het keurig allemaal samengevat. Cochrane collaboration. Het was een schande dat artsen literatuur niet bijhouden en dat ze dus niet op de hoogte waren van de nieuwste inzichten. Dit was het begin van het initiatief om alle literatuur samen te vatten in systematische reviews. Tegenwoordig zijn er heel veel mensen bezig om de literatuur samen te vatten. De reviews worden regelmatig ge-update. Zo heb je dus altijd de meest recente informatie. Onderzoeksvraag formuleren In de onderzoeksvraag moet je PICO in voorkomen: P welke groep? I welke interventie? C welke controle-interventie? O welke gezondheidstoestand als uitkomst? Het liefst komt deze al in de titel naar voren. Dit bepaalt ook de inclusiecriteria over welke patiënten mee kunnen doen aan het onderzoek. Cochrane library - Database in UBVU - Bevat systematische reviews - Protocollen van reviews in uitvoering - Register van alle RCTs q

17 Zo kun je dus voordat je een review gaat maken checken of iemand al bezig is met wat jij zou willen doen. Methodologische kwaliteit Er wordt gekeken naar de methodologische kwaliteit van de studies. Hiervoor bestaan een hele hoop checklisten. Deze heten risk of bias criteria. Als er aan verschillende methodologische criteria niet voldaan is bestaat er kans op bias. Je hebt bijvoorbeeld de Delphi lijst. Dit gaat bijv. over randomisatie, blindering, verliezen van mensen gedurende de trial, is er een intention-to-treat-analyse gedaan, etc. Uitkomstmaten van trials Continue uitkomstmaten - Per behandelingsgroep wil je dan een mean en de SD gepresenteerd hebben - In trial: verschil in gemiddelden tussen interventie en controle groep - Nul hypothese: geen verschil = 0 (neutrale waarde) - Statisch significant als 0 niet in confidence interval ligt Dichotome uitkomstmaten - Kans of risico - In trials: relatief risico of risico verschil - Risicoverschil (RV): nul hypothese geen verschil (=0) statistisch significant als 0 niet in confidence interval zit - Relatief risico (RR of OR): nul hypothese geen verschil (=1, twee dezelfde waarde op elkaar delen krijg je 1) statistisch significant als 1 niet in confidence interval zit Breedte van betrouwbaarheidsinterval is indicatie van de precisie van de effectschatting. Alle studies waar de nul niet in het streepje ligt zijn statistische significant. Welke studies zijn de grootste studies in dit overzicht? B, D en E deze hebben het kleinste betrouwbaarheidsinterval. Hier kun je een preciezere schatting maken. r

18 Het gaat niet altijd om statistische significantie maar ook op klinische relevantie. A is niet statische significant en niet klinisch relevant B is niet statisch significant en niet klinisch relevant C is statistisch significant en klinisch relevant D is statische significant maar is niet klinisch relevant. E is statische significant en klinisch relevant Beide moet je bekijken als je de effecten van een studie beoordeeld. Integreren en poolen van resultaten Stel je hebt een aantal studies gevonden, dan moet je proberen deze zo goed mogelijk samen te vatten. Soms verschillen de studies wat van elkaar. Als ze heel erg op elkaar lijken dan kun je de studies statistisch gaan poolen. Dan kun je de resultaten optellen en dat doe je zodat de grootste studies met het kleinste betrouwbaarheidsinterval het zwaarst wegen. Er zijn drie manieren om dit samen te vatten: 1. Best evidence synthesis (als de studies heterogeen zijn) Beschrijven van de resultaten (liefst met Figuur van forest plot) Bediscussieren in relatie tot studie kenmerken, o.a. risk of bias 2. Meta-analyse: statistische pooling Als er aantal homogene studies zijn wat betreft: - Populatie, interventie, controlegroep en uitkomstmaat - Studie design - Redelijk goede studies de resultaten moeten betrouwbaar zijn - Én niet al te grote verschillen in uitkomst van de trial 3. Individual Patiënt Data (IPD) analyse De onderzoekers vragen om samen te werken en alle data bij elkaar gooien en één analyse doen. Het voordeel hiervan is is dat je alle ruwe data kunt gebruiken. Het is wel heel erg veel werk en je moet geode samenwerking hebben met alle partners. Je ziet het wel steeds meer gedaan. Wat is poolen? - Poolen is het statistisch combineren van de resultaten van afzonderlijke, vergelijkbare onderzoeken - Resultaat: één overall schatting van het effect van de behandeling - Voordelen: detecteren van kleine(re) effecten en effecten in subgroepen De gepoolde effectmaat wordt vaak als een wybertje (diamant) weergegeven) s

19 Hieronder staat een voorbeeld van een Forest plot: Links vind je de auteurs en jaartallen van de artikelen. Vervolgens zie je dat de relatieve risico s zijn gepresenteerd. Het is een dichotome effectmaat. Hieronder zie je als het risico < 1 dan de behandeling effectiever dan de controle behhandeling. Je ziet dat de meeste studies een beschermend effect laten zien. Eén studie geeft geen beschermend effect. Nu is het belangrijk om te kijken wat de neutrale waarde is in deze Forest plot? Dat is 1, want je hebt te maken met relatieve risico s. grote studies hebben een groot blokje en kleine studies heb je een klein blokje. Er is één studie statistisch significant en bij die studie ligt 1 niet in het betrouwbaarheidsinterval. Dat wybertje geeft dus een samenvatting (pooling) van alle resultaten. Als er een review s van heel heterogene studie moet je er naar kijken (eyeball test) en inschatten of je het de moeite waard vindt om daar een overall schatting van te geven. Het best is om van te voren al zeggen naar welke subgroepen je gaat kijken. Heterogeniteit: variatie tussen onderzoeken - Klinische heterogeniteit o Verschillen in klinische kenmerken: patiënten, interventies, uitkomstmaten - Methodologische heterogeniteit o Verschillen in design of uitvoering; randomisatie, blindering, uitval, etc. - Statistische heterogeniteit o Als gevolg van klinische/methodologische variatie (verwacht) (sampling error bijv) o Onbekende bronnen (onverwacht) Omgaan met heterogeniteit 1. Voorkomen van (verwachte) heterogeniteit a. Gebruik stricte insluitcriteria b. Definieer subgroepen van onderzoeken met vergelijkbare kenmerken c. Gestratificeerde analyse: effect modificatie? 2. Pas analyse methode aan: a. Geen of weinig heterogeniteit: pooling via fixed effect model b. Behoorlijk heterogeniteit: pooling via random effects model t

20 3. Hoge mate van heterogeniteit: geen meta-analyse, maar een transparante, systematische, beschrijvende synthese Alleen poolen als je je iets bij de uitkomst kunt voorstellen. Verwerken kwaliteit in review en meta-analyse - Gebruiken als inclusie criterium voor review (alleen gerandomiseerde onderzoeken bijv.) - Descriptief - Inclusie criterium voor analyse - Sensitiviteits analyse o Hoog vs laag risico op bias o Invloed van individuele items Bijvoorbeeld alle geblindeerde studies onder elkaar en alle niet geblindeerde onder elkaar, voor iedere groep apart een wybertje maken. Kijken of er verschil is. Conclusie van een systematische review - Geen inzicht in overall effect: point estimate en 95% CI - Geen aan hoe zeker je daarvan bent, gezien: o Het aantal studies o De methodologische kwaliteit van de studies o Consistentie van de resultaten o Mogelijke publicatie bias (positieve resultaten wel gepubliceerd en negatieve niet) Systematische reviews zijn nuttig voor: - Artsen en therapeuten o Toepassing in de zorg o Maken van richtlijnen (hierdoor hoeven artsen niet meer alle literatuur bij te houden) - Onderzoekers: o Genereren onderzoeksvragen o Voorkomen van methodologische tekortkomingen (geeft veel ervaring van hoe je een dergelijk onderzoek moet doen) o Schatten van sample size - Beleidsmakers: vergoeding en regelgeving - Patiënten: individuele beslissingen Voordelen systematische reviews: informatief - Inzicht in overall effect - Detecteren van kleine effecten en effecten in subgroepen - Efficiënt: kost veel tijd, maar goedkoper dan nieuw onderzoek - Preventie van overbodig onderzoek - Toegankelijkheid en periodieke actualisering (updates) is essentieel u

21 Statistiek 3 Analyse van dichotome uitkomstvariabelen Anton de Vries Continu Dichotoom Dichotoom + tijd 2 groepen Analyse T-toets Effectmaat Gem. verschil > 2 groepen Analyse ANOVA Effectmaat Gem. verschil Relatie met andere variabelen Analyse Effectmaat Lineaire regressie B, β We hebben tot nu toe de eerste kolom nu ingevuld. Met een lineaire regressive analyse kun je eigenlijk hetzelfde al seen t-toets en een ANOVA. Je kunt zelfs meer want je kunt variabelen toevoegen aan je regressiemodel. Hierdoor kun je corrigeren voor confounders en effect-modificatoren. Er zat in het SPSS practicum een vraag over R 2 maar daar is hij in het college over lineaire regressie niet aan toe gekomen. Je hebt hier twee continue variabelen. Je probeert y te voorspellen aan de hand van x. Je hebt allerlei waardes (puntjes). De verdeling van die puntjes kun je over de y-as weergeven als een soort histogram. Dat wordt idealiter een normale verdeling. Wat je ook kunt weergeven in zo n scatter is een regressielijn (y = b 0 + b 1 x). b o is eigenlijk y als x = 0 (gemiddelde leeftijd bij leeftijd 0). Die regressielijn gaat ook door het gemiddelde v

22 van x en het gemiddelde van y. Wat nu van belang is voor de interpretatie van de R 2 is dat je ziet dat al die punten een voorspelling die precies op die lijn ligt (rode puntjes). Die voorspellingen kun je in SPSS opvragen. Dit zijn de ruwe voorspelde waardes. In dit geval dus de voorspelde lengte voor al die mensen. Je zou net zo n histogram voor de voorspelde waarde kunnen maken (rode lijn). Als je deze maakt is deze altijd iets smaller. Als deze even breed is zouden alle puntjes op één lijn liggen. Voor R 2 is de SD van die voorspelling kleiner dan die eerste SD. De SD in het kwadraat is de variantie. Als je de ene variantie deelt op de andere variantie dan heb je R 2. R 2 zegt zoiets als hoeveel variantie ik in mijn uitkomst voorspel aan de hand van de x variabelen (in dit geval de leeftijd). Daarom heet R 2 ook wel verklaarde variantie. Dit geeft het percentage lengte dat kan worden verklaard door de leeftijd. Analyse van dichotome uitkomstvariabelen Voorbeeld: - Nieuw medicijn in het kader van behandeling patiënten (ofwel geneesmiddel ofwel een placebo) - Follow up tijd: 1 jaar - Uitkomstvariabele: herstel (ja/nee) Dit is de uitkomst: WEL herstel GEEN herstel Totaal Medicatie Placebo Totaal Aan dit schema kun je ook letters verbinden: WEL herstel GEEN herstel Totaal Medicatie A B A+ B Placebo C D C+D Totaal A+C B+D A+B+C+D Dan is de vraag of het geneesmiddel werkt. Het geneesmiddel levert 35% herstel op en de placebo levert 20% herstel op. - Het risicoverschil/attributief risico = 35/100 20/100 = 15% - Relatief risico op herstel: (35/100) / (20/100) = 1,75 - Relatief risico op niet herstel: (65/100) / (80/100) = 0,813 - Odds Ratio: (35x80)/(65x20) = 2,154 De odds is de (kans/1-kans). Het is dus eigenlijk de kans op herstel gedeeld door de kans op niet herstel in dit voorbeeld. Hier is de odds voor de medicatie dus (35/100)/(65/100). De odds voor placebo is (20/100)/(80/100). Als je deze odds en op elkaar deelt krijg je een odds ratio. En delen is vermenigvuldigen met het omgekeerde dus daarom zie je bij de odds ratio twee vermenigvuldigingen. 95% betrouwbaarheidsinterval van het attributief risico (AR) Als je het 95% betrouwbaarheidsinterval van het attributief risico wil berekenen dan gaat dat als volgt: Standard Error = [(AxB)/(A+B) 3 + (CxD)/(C+D) 3 ] = 0,0622 w

23 Het attributief risico doe je plus of min een Z waarde die hoort bij dat 95%- betrouwbaarheidsinterval. Hoe vind je die nou? Je moet dan naar de tabel achterin je klapper. Er zijn twee tabellen: 1a en 1b. 1a levert de omzetting van de z-waarde naar de quantiel en tabel 1b de omzetting van de quantiel naar de z-waarde. q (het quantiel) kan 0 tot 100 zijn. Bij 0 zit je op - en bij 100 zit je op +. In de linkerkolom zie je de quantielen. Horizontaal zie je derde decimaal. Je wil een bepaalde grens weten die hoort bij 0,975. Dan kijk je in de linker kolom naar 0,97 en in de eerste rij kijk je naar x,xx5. Dus het 95%-BI van het AR= AR ± Z 1-0,05/2 x SE AR = 0,150 (15%) ± 1,96 x 0,0622 = [0,150 0,122; 0, ,122] = [0,028; 0,272) Is dit nu significant? Waar het nu om gaat is of we vinden dat het verschil toe te schrijven is aan toeval of niet. Als je denkt dat het verschil toe te schrijven is aan toeval zou je verwachten dat de 0 binnen het betrouwbaarheids interval zou liggen. Want een verschil van 0 zou dan ook tot de mogelijke waarden moeten behoren, en in dit geval is dan niet zo. Je kunt nu concluderen dat dit een significant verschil. In de praktijk wordt dit meestal toch getoetst, maar in principe zou je het nu al wel kunnen zeggen. 95% betrouwbaarheidsinterval van het relatief risico (RR) Het 95%-BI van het relatief risico (RR) is iets lastiger te berekenen. Dit komt omdat de Standard Error alleen gedefinieerd is van het log van het relatief risico. Dat komt omdat RR scheef naar rechts is verdeeld. Alleen de log(rr) is normaal verdeeld. Exp is hier de e-macht. Deze gebruik je hier om het 95%-BI van het RR te geven en niet van de log van het RR. Je kunt aan het interval zien dat het scheef verdeeld is. Je ziet namelijk dat het RR (1,750) niet in het midden van het betrouwbaarheidsinterval. Dit is significant omdat de 1 niet in het interval ligt. 95% betrouwbaarheidsinterval van de Odds Ratio (OR) Voor een OR geldt hetzelfde als voor het 95%-BI van het RR. Dit is significant wat de 1 zit niet in het betrouwbaarheidsinterval. Een verhouding is 0 als de odds 1 is. Dit geldt voor zowel de odds ratio als voor het relatief risico. x

24 Chi-kwadraat toets Aan alle 95%-BI heb je kunnen zien dat alle effectmaten significant zijn. Je kunt alle drie de maten direct toetsen met de chi-kwadraat toets. Je berekent de verwachte celfrequentie: WEL herstel GEEN herstel Totaal Medicatie (55x100)/200=27,5 (145x100)/200=72,5 100 Placebo (55x100)/200=27,5 (145x100)/200=72,5 100 Totaal Je hebt 100 mensen met medicatie en 100 mensen met placebo. Je ziet dat 55 mensen die wel hersteld zijn en 145 die niet hersteld zijn. Dan kijk je op grond van die verdeling wat je verwacht als er geen verschil zou zijn. Die doet dus het kolom-totaal x het rijtotaal gedeeld door het overall-totaal. Je kunt controleren of deze verwachte frequenties kloppen omdat het horizontaal moet uitkomen op het totaal en verticaal ook. Deze verawchte celfrequentie trek je af van de geobserveerde celfreqenties. Df =1 (vrijheidsgraad) [aantal vrijheidsgraden = (aantal rijen 1) x (aantal kolommen 1)] Dan kijk je in de tabel van de chi-kwadraat verdeling. De chi-kwadraat verdeling bij 1 vrijheidsgraad is de normale verdeling in het kwadraat. De chi-kwadraat heeft dus ook maar 1 staart, want de min in het kwadraat is positief. Het is eigenlijk een schuin naar rechtse verdeling. Hoe deze verdeling er precies uitziet hangt af van het aantal vrijheidsgraden. Je doet de chi-kwadraat omdat dat de daadwerkelijke hypothesetoetsing is. In het betrouwbaarheidsinterval kunnen wat foutjes zitten. De kritieke waarde kun je nu terugvinden in tabel 3 (chi-kwadraat verdeling) in de 0,950 kolom. Bij 1 vrijheidsgraad is deze 3,841. Als je hier de wortel van neemt krijg je dus ook In SPSS staat achter de Pearson Chi-Square een significantie waaraan je kunt ziet op de chi-kwadraat significant is. Continu Dichotoom Dichotoom + tijd 2 groepen Analyse T-toets Χ 2 toets Effectmaat Gem. verschil RV (AR), RR, OR > 2 groepen Analyse ANOVA Effectmaat Gem. verschil Relatie met andere variabelen Analyse Effectmaat Lineaire regressie B, β y

25 Vorig voorbeeld uitgebreid: Er wordt een alternatief medicijn toegevoegd aan het onderzoek. Je hebt nu drie te vergelijken groepen: WEL herstel GEEN herstel Totaal Medicatie Medicatie Placebo Totaal Nu krijg je een vergelijkbare situatie als bij een ANOVA alleen heb je nu een dichotome uitkomst. Je kunt nu opnieuw een chi-kwadraat kunnen uitrekenen. Dit is nu alleen iets meer werk want je moet 6 cellen bij elkaar optellen. Het aantal vrijheidsgraden wat past bij een chi-kwadraat over zo n tabel is: (aantal rijen 1) x (aantal kolommen 1). Hier is dat dus 2. Met SPSS kun je deze chi-kwadraat doen en krijg je een significante p-waarde. Je weet nu alleen niet waar het significante verschil zit. Om hier achter te komen moet je terug naar de tabel. Hier kun je in feiten drie 2x2 tabellen van maken (medicatie 1 met placebo, medicatie 2 met placebo en medicatie 1 met medicatie 2). SPSS produceert bij een n x m tabel waarbij n > 2 of m > 2 geen OR of RR meer. Oplossing: voor gewenste vergelijkingen aparte 2 x 2 tabellen maken. Kan alleen als chikwadraattoets over de n x m tabellen significant is. Dat is hetzelfde als bij de ANOVA (Ttoets doen over alle groepen binnen de ANOVA). Logistische regressie analyse Analyse van dichotome variabelen: zowel verschillen tussen twee groepen als de verschillen tussen drie groepen zijn ook te analyseren met: logistische regressie analyse. Dit kan lastig zijn om te begrijpen. Lineaire regressie analyse Cholesterol = b o + b 1 x sekse Vrouw = 0; man = 1 B 0 = gemiddelde van vrouwen B 1 = verschil tussen mannen en vrouwen Bij een dichotome uitkomst doe je eigenlijk net zoiets. Je hebt het dan niet over de uitkomst zelf maar over iets anders. Een scatterplot van een continue met een dichotome variabele ziet er zo uit: Als je hier een rechte lijn door trekt gaat dit door de twee gemiddelden. Je maakt de verticale afstanden minimaal. Je wil niet per se iets zeggen over de uitkomst maar over de kans op die uitkomst. Die kans die neemt toe. Maar die ligt tussen 0 en 1. Dit gaat om de kans op herstel. Je hebt nu dus soort van een continue variabele. Je hebt alleen 1 z

26 probleem dat deze absoluut begrensd is door 0 en 1. De verdeling hiervan wordt een soort van S-curve. Je moet dus eigenlijk een kansmaat hebben die geen bovengrens heeft van 1. Dit is de Odds(y=1). Dus als je de odds neemt: (kans op herstel/1-kans op herstel). Als de kans 0 is op herstel is de odds 0. Als de kans een half is, dan is de odds 1. De odds als de kans 1 is oneindig. De verdeling van de odds is dus scheef naar rechts. Een scheef naar rechtse verdeling krijg je normaal door een log-transformatie. Je neemt dus de log(kans op herstel/(1-kans op herstel)). Je hebt het dus niet over herstel want dat is een 0-1 variabele. Je hebt het over de log van de odds van herstel, dit heet de log-odds. Je kunt nu nog steeds y = b o + b 1 x X gebruiken als regressie vergelijking. Hierbij is y dus de log-odds. Als je van deze gekke y-variabele een normale variabele wil maken. Odds op herstel = Vervolgens kun je ook de odds naar de kans terug transformeren: Odds = kans/(1-kans) Kans = odds/(odds+1) aa

27 Statistiek 3 Analyse van dichotome uitkomstvariabelen Anton de Vries Logistische regressie analyse met twee groepen Logistische regressieanalyse: zowel de verschillen tussen twee groepen als de verschillen tussen meer dan twee groepen. Regressie parameters bij lineaire regressie analyse - Deze zijn direct uit te rekenen - Dat gebeurt met de kleinste kwadraten methode Regressie parameters bij logistische regressie analyse - Iteratieve benaderingsmethode - Maximum Likelihood methode (ML). Dit wil zeggen dat de waarde die je vindt geeft overal in de groep de meest waarschijnlijke uitkomst. Logistische regressie met dichotome determinanten Voorbeeld: patientcontrole onderzoek naar determinant voor hartinfarct. Hierbij is de vraag of roken een determinant is voor hartinfarct. INFARCT GEEN INFARCT ROKEN JA ROKEN NEE Bij een patiënt-controleonderzoek mag je alleen de Odds-ratio gebruiken! Odds ratio = (60 x 178)/(32 x 150) = 2,225 (dat is best wel fors) Als je dit in SPSS analyseert krijg je dit: Tabel uit college Anton de Vries. bb

28 Is dit nu een significant verschil of niet? De chi-kwadraat toets levert een significant resultaat op (p=,001) bij een chi-kwadraat van 10,912. De kritieke waarde bij die chikwadraat van 1 vrijheidsgraad ligt bij 3,841 (tabel 3 achterin klapper). Die 10,9 ligt hier dus boven. Wanneer de chi-kwadraat boven de waarde uit de tabel ligt is deze significant. Als je dit als een logistische regressie benadert krijg je de volgende output: Tabel uit college Anton de Vries. Bij een logistische regressie staat de B 0 onderaan!!!! Wat je allereerst ziet is dat de chi-kwadraat anders is. Eerst was deze 10,9 en hier is deze 11,052. Wat je hier ook ziet is een andere toets (de Wald). Deze levert een waarde van 10,625. Al deze waardes liggen ongeveer rond dezelfde waarde. Ze zijn ook allemaal significant. Je ziet hier ook de regressievergelijking: Log(kans op infarct/1-kans op infarct) = -0,171 +0,800 x roken. Roken is gecodeerd als 0 of 1 DUS: de kans op een hartinfarct als je rookt is: Log-odds niet rokers = -0,171 x 0,800 x 0 = -, B 1 is dus het verschil tussen rokers en niet rokers in log-odds. Log-odds rokers= -0,171 +0,800 x 1 = 0,629 Log-odds rokers log-odds niet rokers = log (odds rokers/odds niet rokers) = B 1 (geeft dus de log-oddsratio. Als je helemaal rechts kijkt zie je dat SPSS ook de Exp van B geeft. Oftewel dat is dan de odds ratio. Die is dus e 0,800 = 2,225 cc

29 Er zijn dus drie toetsen om te kijken of het effect sifnificant is: - Wald toets - Aan de hand van het 95%-BI rond de Odds Ratio (die was hier 1,376-3,599 en 1 zit hier niet is dus is het verschil significant) - Likelihood-ratio-toets Wald toets Deze is chi-kwdraat verdeeld met één vrijheidsgraad omdat je maar één predictor hebt. (0,800/0,245) 2 =10,623 De kritieke grens ligt dus bij 3,841 (tabel 3 achterin klapper). De p-waarde is dus kleiner dan 0,05. 95%-BI van de OR Hoe komen we via de logistische regressie output aan een odds ratio en het 95%BI? De Odds ratio is in dit geval 2,225 (zie output bij Exp(B)). OR = EXP (0,800) = 2,23 95%-BI: EXP(b±1,96 x SE(b)) EXP(0,800±1,96 x 0,245) (zie output) 95%-BI: 1,38-3,60 Het 95%-BI van de Odds Ratio omvat de 1 niet Likelihood-ratio-toets Je gaat eigenlijk van iedereen de kans op de waarde vermenigvuldigen. Likelihood: product van alle kansen voor iedere persoon gegeven de waarden voor de determinanten. Dit kan berekend worden op basis van 2x2 tabel en de gescahtte kansen (gegeven de waarde van de determinant). Vier mogelijke situaties: Infarct Roken Kans , , , ,54 Wat is de kans op een hartinfarct voor een roker en voor een niet roker? Voor niet rokers: dd

30 Voor rokers: We hadden gezien dat de kans als je een hartinfarct hebt en rookt dat die kans 0,65 is. De kans om geen hartinfarct te krijgen als je rookt was 0,35. Als je niet rookt is de kans op een hartinfarct 0,46 en de kans op geen hartinfarct en niet roken is 0,54. Dit is puur gebaseerd op de volgende 2x2-tabel: INFARCT GEEN INFARCT ROKEN JA ROKEN NEE Er zijn 60 mensen die een hartinfarct hebben gehad terwijl te rookten. Kortom, die kans is dus 0,65x0,65x0,65x.. voor al die 60 mensen. Oftewel, 0, De kans op geen hartinfarct voor de rokers was 0,35. Je hebt 32 mensen die geen hartinfarct hebben gehad en wel rookten. Dus: 0, Etc. Zo krijg je de volgende formule voor de likelihood: (0,65) 60 x (0,35) 32 x (0,46) 150 x (0,54) 178 Je rekent hier de kans uit dat je voor iedereen een goede voorspelling doet. Die kans is dus extreem klein. Als de likelihood heel klein is kun je er niet goed meer mee rekenen. Dan gebruik je de -2loglikelihood. De log van 1 is nul en de log van iets kleiner dan 1 is negatief. Om deze reden wordt er een -2log transformatie gedaan van die likelihood. Je hebt niks aan een losse - 2loglikelihood. Je hebt wel wat aan een vergelijking van twee -2loglikelihoods. Likelihood-ratio toets: Als ik nu geen determinanten zou gebruiken is de kans op een hartinfarct 0,5 (50% is case). Je maakt nu geen gebruik van roken. Je hebt 210 mensen met geen infarct en 210 met wel een infarct. Doe je nu een betere voorspelling door roken te gebruiken? -2loglikelihood met roken: -2 ln [(0,65) 60 x (0,35) 32 x (0,46) 150 x (0,54) 178 ]=571,20-2loglikelihood zonder determinanten: -2 ln [(0,5) 420 = 582,24 Als je deze waarden van elkaar aftrekt heb je een chi-kwadraat verdeelde toetsingsgrootheid. Likelihood-ratio toets - Vergelijken van twee modellen met elkaar (je moet het wel hebben over dezelfde groep) - Verschil van de -2 log likelihoods - Verschil tussen die twee modeelen volgt een chi-kwadraat verdeling - Het aantal vrijheidsgraden is gelijk aan het verschil in variabelen tussen de twee modellen die met elkaar worden vergeleken (in dit geval alleen het roken (B1)) - Essentieel: ene model moet een uitbreiding zijn van het andere model. (je kunt niet een variabele toevoegen en een andere wegnemen tegelijkertijd) ee

31 - De absolute waarde van -2 log likelihood zegt niet zo veel; is alleen belangrijk in het kader van de likelihood ratio toets. Voorbeeld: 582,24-571,20 = 11,04 Chi-kwadraat verdeeld met 1 vrijheidsgraad. Conclusie? 11,04 > 3,84 dus significant Welke methode is de beste? De likelihood-ratio toets is altijd toepasbaar, ook bij ingewikkelde modellen. Logistische regressie analyse met meer dan twee groepen Voorbeeld: Is beroep een determinant voor het krijgen van een hartinfarct? In dit voorbeeld is een vergelijking gemaakt tussen een statisticus, een epidemioloog en iets anders. Frequentie Percentage Valid Cumulative Epidemioloog Statisticus Anders Totaal (Hartinfarct) ,0 29,8 34,3 100,0 Percentage 36,0 29,8 34,3 100,0 Infarct Geen infarct Epidemioloog Statisticus Anders Er is een chi-kwadraat toets gedaan: percent 36,0 65,7 100,0 Tabel uit college Anton de Vries. Er is geen significant verschil gevonden. Je hebt nu twee vrijheidsgraden want het is een 3x2 tabel. En het aantal vrijheidsgraden is (aantal rijen 1)x(aantal kolommen 1). Je zou odds-ratios kunnen berekenen voor de aparte 2x2 tabellen: Epidemioloog versus statisticus: (72x69)/(79x56)=1,12 Epideiomoloog versus anders: (72x62)/(79x82)=0,69 ff

32 Je zou ook opnieuw een logistische regressie kunnen doen. Net als bij lineaire regressie zal je nu twee beroepen om moeten zetten in dummy-codering: De regressievergelijking ziet er dan zo uit: Log(odds) = B 0 + B 1 x dummy 1 + B 2 x dummy 2 In dit geval is de epidemioloog gekozen als referentie categorie: DUMMY1 DUMMY2 Epidemioloog 0 0 Statisticus 1 0 Anders 0 1 Log(Odds epidemioloog ) = B 0 + B 1 x 0 + B 2 x 0 = B 0 Log(Odds statisticus ) = B 0 + B 1 x 1 + B 2 x 0 = B 0 + B 1 Log(Odds anders ) = B 0 + B 1 x 0 + B 2 x 1 = B 0 + B 2!!! B 0 + B 1 B 0 = B 1 = odds ratio tussen statisticus en epidemioloog B 0 + B 2 B 0 = B 2 = odds ratio tussen anders en epidemioloog Dit kun je hier in de logistische regressie output terugvinden: Tabel uit college Anton de Vries. Hier zie je een constante die niet zo interessant is, behalve dat het de log(odds) van de epidemioloog geeft. Dit is -0,093. Dit hoort bij een odds van 0,911 (Exp(B)). De meest belangrijke informatie vind je in de B1 en B2 van beroep. B1 is -0,116 (dat is je log(oddsratio) van de statisticus en epidemioloog). Als je daar de exp van neemt heb je dus een oddsrati van 0,890 en dat betekent dat als je statisticus bent je een lagere kans hebt op een hartinfarct dan wanneer je epidemioloog bent. Als je anders bent heb je een log(oddsratio) van 0,372 en de odds ratio is dan 1,451. Dus de odds ratio van anders ten opzichte van de epidemioloog is 1,451. Je kunt de betrouwbaarheids intervallen ook uit deze output halen door gebruik te maken van de SE die hier gerapporteerd staat. Betrouwbaarheidsinterval van OR voor statisticus vs epidemioloog: gg

33 - EXP (-0,116 ± 1,96 x 0,243) = [0,55 1,43] Betrouwbaarheidsinterval van OR voor anders vs epidemioloog: - EXP (0,372 ± 1,96 x 0,234) = [0,592 2,30] De verschillen zijn niet significant Logistische regressie met een continue determinant Dan is de vraag bijvoorbeeld is een hoge BMI een determinant voor het krijgen van een hartinfarct? Dit soort vragen gebruiken mensen hier een t-toets maar dan andersom. Dan wordt BMI als uitkomstvariabele gebruikt en wordt gekeken of de BMI van mensen die een hartinfarct hebben hoger is dan die van mensen die geen hartinfarct hebben gehad. Hieronder de output van de t-test: Tabel uit college Anton de Vries. Maar beter is de regressieanalyse. Waarvan hieronder de output; Tabel uit college Anton de Vries. OR voor BMI - E b1 = EXP(B) = Odds Ratio = e 0,177 =1,194 (zie ook SPSS output) Betrouwbaarheidsinterval - EXP (0,117 ± 1,96 x 0,038) = [1,11 1,29] Dit is de OR voor een verschil van 1 eenheid in BMI. Die OR is helemaal niet zo hoog, maar hij is wel significant. De BMI heeft toch een vrij grote range. Dus 1 stapje in BMI is een heel klein stapje (geldt ook voor lineaire regressie). Interessanter bijvoorbeeld de OR voor een verschil in 5 eenheden. hh

34 OR voor 5 eenheden BMI: - EXP (5 x 0,117 ± 5 x 1,96 x 0,038) = 2,43(1,67-3,53) - OR = e b = e 5 x 0,177 = 2,43 Nu is de odds ratio ineens een stuk groter. Je maakt zowel de B als de SE 5 x zo groot en dan krijg je een BI wat ook 5x zo groot wordt maar je krijg wel een beter te interpreteren waarde. Ook nu is het van belang om te kijken of er sprake is van problemen met de lineairiteit. - Toevoegen kwadraatterm - Continue determinant opdelen in groepen Als je een kwadraatterm toevoeg, ziet de output er zo uit: Tabel uit college Anton de Vries. Is er nu sprake van een lineair verband? Nee want de BMI2 verschilt (heel weinig, maar) significant van 0 (0,002). Als je het in groepen had gedeeld had het er zo uitgezien: Tabel uit college Anton de Vries. ii

Nog meer weergeven