Professionele Ontwikkeling en Wetenschap. Collegeaantekeningen GENEESKUNDE VU, JAAR 3

Maat: px
Weergave met pagina beginnen:

Download "Professionele Ontwikkeling en Wetenschap. Collegeaantekeningen GENEESKUNDE VU, JAAR 3"

Transcriptie

1 Professionele Ontwikkeling en Wetenschap Collegeaantekeningen GENEESKUNDE VU, JAAR 3

2 16/05/2013 Randomized clinical trial Maarten boers De meeste onderzoeken zijn observationeel. De eenvoudigste zijn case series waarbij iemand iets opvalt aan een aantal personen die iets raars meemaken. Als je dit als eerste opschrijft en publiceert ben je de eerste. Het is een ongecontroleerde selectie want je schrijft gewoon op wat je hebt gezien en je vergelijkt het met wat je verwacht in de gewone bevolking. De case controle studie is een snelle en goedkope manier om verbanden te leggen. Hiermee ga je bijvoorbeeld mensen met ziekte vergelijken met mensen zonder ziekte en dit vergelijken met blootstelling aan iets. Je gaat dus uit van groepen die al ziek zijn. En je kijkt terug in de tijd naar de blootstelling. Dit onderzoek is dus per definitie retrospectief. Nadelen: gevoelig voor vertekening/bias. Belangrijkste problemen zijn de controlegroep. Dit moeten namelijk mensen zijn die als ze blootgesteld waren en de ziekte hadden, dan hoorde ze bij je case. Dus die moeten mensen zijn die precies de zelfde kenmerken hebben als de cases behalve de blootstelling. De controle groep is vaak anders geselecteerd dan de patiëntengroep. Hierdoor ontstaat selectiebias. Het is heel moeilijk om balans te krijgen in dingen waarvan je weet dat ze je onderzoeksresultaat kunnen vertekenen (confounders) en het is moeilijk om de uitkomst te maskeren want je selecteert juist om de uitkomst. Vaak weet je veel meer van de cases dan van de controles. Daardoor ontstaat er een informatiebias. Een cohortstudie is beter (en robuster dan case control studie) omdat de dataverzameling prospectief gebeurt. Je kunt mensen er aan houden allerlei data te verzamelen. Ook wordt het verzameld voordat de uitkomst bekend is. Je kunt beter bepalen wat je wilt meten en alvast vertekeningen vastleggen. Het begint met al of niet blootstelling waarvan je denkt dat het ziekte veroorzaakt en je vervolgt hen. Dan ga je aantallen ziekten bekijken. Een cohortstudie is dus een nauwkeurige, gestandaardiseerde studie. Meten van en selecteren (matchen) voor bekende confounders) Nadeel: duur en traag. Blootstelling is ongecontrolleerd. Je er kan dus selectiebias optreden. Met onbekende confounders kun je niets doen en maskeren de uitkomst is moeilijk. Er ontstaat informatiebias. Bias is een vertekend resultaat. Als je zeker wil weten dat groepen vergelijkbaar zijn moet je er vanuit kunnen gaan dat groepen gelijk zijn behalve dat contrast dat je wilt weten. Anders ontstaat er een selectie bias. Ook moet je informatie (kwantiteit, kwaliteit) gelijk zijn in de te vergelijken groepen, anders ontstaat er informatie-bias. Confounders zijn verstorende variabelen. Iedere factor die bias veroorzaakt zou confounder kunnen zijn. De factor is niet het onderwerp van onderzoek, maar kan wel het onderzoeksresultaat verstoren of vertekenen. De factor is een confounder als hij verband heeft met de blootstelling en met de uitkomst. Manier om het te onthouden: als je geïnteresseerd bent in alcoholgebruik en het voorkomen van hartinfarcten, dan is roken een confounder. Matig gebruik van alcohol is beschermend tegen het voorkomen van hartinfarcten. Roken is positief gecorreleerd met alcoholgebruik. Alcoholgebruikers roken over het algemeen meer dan niet c

3 alcoholgebruikers. En roken heeft een negatieve invloed op het hartinfarct. Als je meer rookt krijg je meer hartinfarcten. Als je niet informatie verzamelt en controleert voor nicotine, zal je het goede positieve verband en beschermende effect van alcohol op hart en vaatziekten niet kunnen vinden. Confounding werkt dus alleen als het verband heeft met de blootstelling en de uitwerking. Om het effect van alcohol op hartinfarcten te meten moet je stratificeren. Dan neem je bijvoorbeeld niet-rokers en rokers-groep. In de rokersgroep zou je ook nog strata kunnen aanbrengen van hoeveelheid roken. Bias betekent dus dat het studieresultaat niet waar is. - selectiebias: de onderzochte groepen zijn niet vergelijkbaar (Anders geselecteerd) wat betreft determinanten : fout resultaat kan twee kanten op - informatiebias: als informatie niet gelijk is in beide groepenis er grote kans dat je vertekening krijgt - confounding. Dit wordt appart gezet maar is eigenlijk een vorm van selectie. - Sampling bias: foute steekproef nemen. Dus onderzoeksresultaat is alleen van toepassing op onderzoeksgroep maar niet op populatie. Er is dus een gebrek aan externe validiteit. Matchen is een heel precieze vorm van stratificeren. Een toevallige fout bedreigt vooral: - validiteit (onwaar) - betrouwbaarheid (waar) er is veel ruis in de meting. als je een toevallige fout hebt, kun je dit oplossen door: - vaker meten (waar, dan krijg je vaker een goede uitkomst) - ander meetinstrument (waar, als je een nauwkeuriger instrument neemt met minder ruis krijg je minder toevallige fouten) systematische fout bedreigt vooral: - validiteit ( waar, hier is het probleem in validiteit die niet wordt opgelost door betrouwbaarder te meten want je zit er gewoon naast.) - betrouwbaarheid (onwaar) Oplossing: - vaker meten (onwaar, Er is een fout in het systeem dus je kunt 100x meten, maar helpt niet) - ander meetinstrument (waar) Een gebiast studieresultaat komt vooral door - verstorende variabelen (waar) - systematische fout (waar) - een toevallige fout (onwaar) Gerandomiseerde klinische trial (RCT) Definitie: vergelijkend onderzoek van 2 of meer ingrepen waarbij de ingrepen worden toegewezen aan proefpersonen op de grond van toeval. Het kan therapeutisch zijn, je geeft iemand een behandeling. Het kan diagnostisch zijn waarbij mensen of röntgen of petscan krijgen. Je kunt niets doen, placebo. Kenmerk: toewijzing op ingreep op de grond van toeval via loting. Verschil met cohort: blootstelling is niet gerandomiseerd. d

4 Je doet een RCT omdat het de enige manier is om erachter te komen of iets werkt of niet. Het gaat alleen goed als je de juiste doelgroep hebt, de relevante maat en een eerlijke vergelijking. Eerlijke vergelijking betekent dat je groepen met vergelijkbare diagnose probeert te maken. Je probeert maar 1 verschil te creëren, en dat is de interventie. Als dat ondanks de randomnisatie niet lukt heb je kans op vertekening. Dit doe je voor en tijdens het onderzoek. Je maakt een eerlijke meting, voldoende patiënten, eerlijke analyse en een eerlijke rapportage. De vergelijkbaarheid wordt gegeven door randomnisatie, maar het is geen garantie. Hoe groter het onderzoek hoe kleiner de kans op een vervelende disbalans. Dan moet je stratificeren. Dan maak je aparte randomnisatietabellen voor bijvoorbeeld geslacht. Tijdens het onderzoek is blindering het belangrijkste. Blindering kan op niveau van behandelaar, patiënt en uitkomstmeter. Hierdoor zorg je dat de meting en uitkomstmaat niet wordt beïnvloed door verwachting. De blindering kan een positief effect hebben, bijvoorbeeld ik denk dat ik me minder ziek voel of een negatief effect :patiënten met een chemokuur die al misselijkheid voelen als ze de infuuszak zien hangen zonder dat het middel al in het lichaam is. Co-interventie: tijdens het onderzoek krijgen mensen een andere behandeling erbij die invloed kunnen hebben op de uitkomst. Bij pijn mogen mensen met placebogroep bijvoorbeeld paracetamol erbij nemen. Als dit ongecontrolleerd gebeurt en de placebogroep slikt veel paracetamol en je weet dit niet, dan denk je dat het experimentele middel niet beter is dan niets, maar in werkelijkheid is het niet beter dan paracetamol. Contaminatie: ene groep krijgt ongecontroleerd de interventie van de andere groep. Hierdoor is er geen contrast meer. Als het goed is wordt de analyse ook geblindeerd gedaan. De eerlijkste vergelijking is de intention to treat analyse. Je moet aan het eind van het onderzoek nog ten minste weten dat de mensen nog leven. Het is ook belangrijk om ook andere analysen te doen omdat de intention to treat heel concervatief is. Idealiter komen alle analysen overeen. Als elke analyse een ander resultaat geeft is het belangrijk na te gaan hoe dit komt. Het doen van een RCT begint met het feit dat een onderzoek echt nodig is. De mensen die je includeertin je studie en die met je studie gaan meewerken. Je moet een goed geoperationlaiseerde onderzoeksvraag hebben, goed design (interne validiteit) voeldoende patiënten, onderzoekers, studiepersoneel, computers, ruimte, geld, sponsor en gastheer hebben verstand van wetenschap. Je moet een protocol schrijven, beheersplan, meerdere keren naar de medisch etische comissie, bepaalde manier van registratie, data beheer. Tijdens onderzoek gaan mensen niet pillen slikken, dokters houden zich niet aan protocol, data beveiligen, nieuwe bijwerkingen, soms nieuwe inzichten in wetenschap, medewerkers informeren. Etc. Bezwaren tegen RCT: moeilijk, traag en duur en niet generaliseerbaar want het is een sterk gelesecteerde populatie en kunstmatige interventie. Dus de resultaten zijn niet toepasbaar in de dagelijkse praktijk. Oplossing wordt gezocht in observationeel onderzoek. e

5 Goede cohortstudies zijn bijna even goed. Maar case control heeft te veel bias. Veel trials worden door de farmacotherapeutische industrie gedaan en worden betaald ten behoeve van registratie. Efficacy vs effectiveness Registratietrials gaan over de vraag: werkt het überhaupt (efficacy) en pragmatische trials gaan over de vraag werkt het (is het nuttig) in de praktijk. (effectiveness) Pragmatische trials zijn dus ingebed in de dagelijkse praktijk en zeer goed mogelijk. Het probleem is vaak de financiering. Het allergrootste probleem: veel artsen kunnen moeilijk in hun dagelijkse praktijk aan zichzelf verkopen dat hun besluiten vaak niet op goede data berusten dus kunnen dit moeilijk aan hun patiënten verkopen. Dit onvermogen wordt vervolgens geprojecteerd op het RCT design. f

6 16/05/2013 Statistiek 2 Anton de Vries Bij een T-toets onderzoek je het verschil tussen twee groepen. De effectmaat is het verschil. Als je een oneindig aantal steekproeven zou nemen met voldoende grootte en je berekent het gemiddelden neemt, is dit weer een normale verdeling. Dit is de centrale limietstelling. Met de T-toets geef je aan wat de kans is dat je een verschil vindt terwil je aan neemt dat twee groepen uit de zelfde populatie komen met dezelfde gemiddelde en zelfde standaarddeviatie. Als de kans maar heel klein is, uitgaande van de 0hypothese, bereken je die kans en zeg je dat je de kans zo klein acht dat de 0hypothese waar is dat je hem kunt verwerpen. ANOVA staat voor analysis of variances. Met een ANOVA kan je van meer dan twee groepen de gemiddelden vergelijken. Hoewel je kijkt naar variancies kun je toch iets over gemiddelden zeggen. Als je kijkt naar de binnengroep en buitengroepsvariantie en de verhouding berekent, kan je door middel van de F-toets, met 2 vrijheidsgraden. Als je een significant verschil vindt, dan weet je nog niet tussen welke groepen dit verschil zich bevindt. Regressie analyse gebruik je als je een onderzoek hebt met een verband tussen twee continue variabelen. Je maakt het kleinste kwadratenprincipe. Je kunt de richtingscoefficient uitreken. De richtingscoefficient is gelijk aan de correlatie, gecorrigeerd voor de standaarddeviatie in de X-variabele en de standaarddeviatie in de Y-variabele. De regressiecoëfficiënt is gelijk aan het verschil in uitkomstvariabele als de determinant een eenheid verschilt. De constante is de uitkomstvariabele als de determinant 0 is. Je kunt lineaire regressie gebruiken in plaats van een T-toets of ANOVA als de lineaire regressie wordt gebruikt in relatie met een andere variabele. Lineaire regressie: zowel het verschil tussen 2 groepen als het verschil tussen 3 groepen kan geanalyseerd worden met behulp van lineaire regressie analyse. Normaal gesproken wordt y=ax + b gebruikt, maar in lineaire regressie: bijvoorbeeld cholesterol = b0 + b1 x leeftijd. B1 is het verschil tussen groep 1 en groep 2 want het is de richtingscoëfficiënt. g

7 Dit zijn scatterplotten. Dit is het gemiddelde verschil dus de B1. als je groep 1 nul codeert is het gemiddelde van groep 1 je B0. het is nog steeds een continue uitkomst maar met een dichotome variant. In plaats van een T-toets wordt een regressieanalyse gedaan. Aan een regressievergelijking kan je meerdere variabelen toevoegen, bij een T-toets kan dit niet. Je kunt een continuë en dichotome variabele opnemen. Dat kan met een T-toets niet. Voorbeeld: Stel je bent geïnteresseerd in de mannen. Dit is de output van regressie op geslacht voor cholesterolgehalte is gemiddelde cholesterolgehalte in mm/l bij vrouwen.472 = B1 = verschil tussen mannen en vrouwen Beta = correlatie. Correlatie tussen cholesterol en geslacht. Het zegt: verschil van.472 mm/l kun je kijken of het significant is. Je deelt de regressiecoëfficient gedeeld door de standaardfout van de regressie, dus door.151. Dan krijg je er een T-toets uit van Eigenlijk doe je het zelfde als bij de T-toets. Je ziet weer maar nu is dit negatief. h

8 In plaats van een T-toets kun je dus ook een lineaire regressie doen waarbij je de groep definieert met een waarde 0 en 1. de vrouwen zijn 0 de mannen zijn 1. Toetsen van een regressie coëfficiënt: je kunt de regressie-coefficient delen door de standaardfout en dan krijg je er een T-waarde uit. Dan krijg je B1, dus de.472 Dit kun je ook doen voor B0 en dan kijk of het gemiddelde van de vrouwen afwijkend van 0 is. Het gaat dus om het verschil tussen mannen voor vrouwen. Je deelt de.472 door de.151 en dan heb je de T-toets voor het verschil tussen mannen en vrouwen. De T-verdeling is een soort normale verdeling met bredere staarten. Je kunt ook een betrouwbaarheidsinterval berekenen. Bij 98vrijheidsgraden is de T- waarde bijna gelijk aan de normale verdeling. De B + of twee keer de standaardfout geeft het 95% betrouwbaarheidsinterval van de regressie-coefficient, of tewel het verschil tussen mannen en vrouwen. Als 0 in het interval ligt is het niet significant. Als 0 niet in het interval ligt is er een significant verschil. Bij een 95% betrouwbaarheidsinterval wil je er maar maximaal 5% naast zitten. Als 0 niet in het interval ligt weet je dat het geen 0 kan zijn dus is het significant. Alfa is het significantieniveau van.05. Dit deel je door 2. n-2 is 98, want dit zijn de vrijheidsgraden. De vrijheidsgraden definiëren hoe de T- verdeling eruit ziet. Naarmate de vrijheidsgraden kleiner zijn, zijn de staarten dikker. i

9 B kan b0 of b1 zijn. Bij b0 meet je de vrouwen, bij b1 meet je het verschil. Alcohol consumptie is geen continue variabele maar een categoriale variabele en moet geanalyseerd worden met behulp van dummy variabelen. Als je een lineaire regressie doet krijg je geen significant getal. Bij ANOVA wel. B1 is niet significant omdat het geen continue variabele is. Je lost dit probleem op door voor elke groep een aparte variabele te maken. Dit wordt dummy coderen genoemd. Je hebt 1 groep, je maakt dummy al1 en dummy al2. je hebt niet-drinkers, 1-2 glazen en 2 en meer drinken. Dummy al1 is 1 bij matige drinkels. Dummy al2 is 1 bij zware drinkers. Je maakt een regressievergelijking van Y=B0 + B1 x dummy al1 + B2 x dummy al 2. De waarde van de niet drinkers is B0 + B1 x 0 + B2 x 0 = 0. Dus B0 geeft het gemiddelde van niet drinkers. Als je kijkt naar de Y van 1-2 drinkers: B0 + B1. B1 geeft het verschil tussen niet en matige drinkers weer. Bij zware drinkers: B0 + B2. B2 = verschil tussen niet drinkers en zware drinkers. Met dummy codering kies je 1 referentiecathegorie. Deze cathegorie is bij alle variabelen 0. en je maakt steeds een vergelijking met niet drinkers ten opzichte van matig of zwaar. Bij SPSS krijg je dan deze output De B bij dummy al 1 is het verschil tussen niet en matige drinkers. Je ziet dat de matige drinkers een lager cholesterol hebben. De dummy al2 is het verschil tussen de nietdrinkers en de zware drinkers. Daar zie je dat ze een verschil van.318 hoger is. Het verschil tussen niet-drinkers en matige drinkers is significant. Verschil tussen zware en niet drinkers is niet significant. Verschil tussen matige en zware drinkers kan hier niet uitgehaald worden, dan moet je hercoderen. Dan maak je van 1 de referentie categorie en van de andere maak je 1. De bovenste b-waarde is ten opzichte van 0. het is met een hoogte van hoger ten opzichte van 0. Dit is geen informatie van mensen zonder cholesterol leven niet. j

10 Dit is de grafische interpretatie van de groepen: Bij een regressievergelijking kun je heel gemakkelijk variabelen toevoegen. Bij anova krijg je een multipele (MANOVA) k

11 16/05/2013 Statistiek 2, College 2 Anton de Vries De Beta is niet uit de tabel te berekenen. Hiervoor heb je de standaarddeviatie van de determinant en de uitkomst nodig. Deze zie je hieronder niet staan want de relatie tussen de regressiecoëfficiënt en de beta wordt juist bepaald door de 2 standaarddeviaties. Wat je wel ziet, is dat de B in dit voorbeeld, waarbij je onderzoekt wat de relatie tussen cholesterol en BMI doet, is heel klein maar wel significant. Dit komt omdat een stapje in BMI maar heel klein is. De Beta geeft de correlatie weer. De correlatie coefficient ligt altijd tussen -1 en 1. aan een correlatie kun je zien of hij hoog is of laag want hij heeft afgebakende grenzen. Bij een regressie coëfficiënt kun je dit niet zien. Een nadeel van een correlatie is dat er geen eenheid aan verbonden is. Bij een regressiecoëfficiënt is dit er wel. Als je bovenstaand (fictieve) scatterplot bekijkt zie je dat er een regressiecoëfficiënt van 1 en constante van 6 is. Als je een lijn zou trekken zou hij door de 6 gaan op de Y-as en elk stapje naar rechts gaat 1 stapje omhoog. Verder is er een Beta, correlatie van.866 dus vrij hoog want bijna 1. l

12 Hierboven is ook een regressiecoefficient van 1 en constante van 6. maar de B, de correlatie, is veel lager. De puntjes liggen veel verder van de lijn. De correlatie zegt niets over de helling. Binnen de epidemiologie zijn we meer geïnteresseerd in de regressiecoëfficiënten en minder in correlatiecoëfficiënten omdat men zoekt naar een duidelijke eenheid. Een correlatie is gestandaardiseerd. Je kunt hem gelijk vergelijken met andere correlaties omdat het dementieloos is. De correlatie is het kleinst als hij 0 is en het grootst bij 1 of -1. Problemen bij lineaire regressie: - samenhang tussen determinant en uitkomstvariabele zijn niet-lineair - determinant en/of uitkomstvariabele niet normaal verdeeld - confounding en effect modificatie Je kunt onderzoeken of een samenhang lineair is door ax^2 + bx + c. je krijgt een parabole. Bijvoorbeeld de relatie tussen cholesterol en BMI Je kunt toetsen of B2 statistisch significant van 0 afwijkt. Als dit zo is is heeft deze betekenis en is de functie niet lineair. Als hij niet significant is, is hij vrijwel gelijk aan 0 en houd je een lineair verband aan. Dan kun je niet meer zeggen het verband tussen BMI en cholesterol is lineair Je kunt ook de determinant in groepen verdelen. Als je vier groepen maakt heb je groepen van gelijke grootte. (quartielen). Vervolgens bekijk je of de groepen constant groter worden. m

13 Het is niet lineair. Dummy 1 is het verschil tussen 1 en 2. dummy BMI 2 is verschil tussen 1 en 3. Als je groepen maakt is het niet liniair. Als je methode 1 met kwadratische term gebruikt is het wel lineair. Het verschil tussen 1 en 2 is.649 het verschil tussen 1 en 3 is.294 Als je het zou uittekenen zou groep 1 op zitten, groep 2 op dus ongeveer 6,7 Groep 3 zou zitten op dus op ongeveer 6,2 Groep 4 zou zitten op dus 6,4 Ze liggen dus niet op een lijn. Maak ATLIJD een scatterplot. Dan zie je of iets lineair is of niet. Het komt heel vaak voor dat er geen normale verdeling is van determinanten. De truck om een scheve verdeling recht te krijgen is log-tranformatie. Verschil tussen logeritmen is het logaritme van de breuk. Triglyceriden van de mannen ten opzichte van triglyceriden van de vrouwen is e^.127 hier krijg je 1.14 uit. De triglycerideconcentratie van de man is 1.14x zo hoog dan die van de vrouw. n

14 Confounding is het idee dat de relatie die je vind voor 2 variabelen wordt beïnvloed door een 3 e variabele. Bijvoorbeeld: je meet het cholesterolgehalte bij mannen en vrouwen. Mannen hebben hoger cholesterol dan vrouwen en ouderen hebben een hoger cholesterol dan jongeren. Stel in de steekproef zijn mannen ouder dan vrouwen dan krijg je een groter verschil. Stel de mannen zijn jonger dan de vrouwen dan krijg je een kleiner verschil. Als er dus een niet significant verband vind kan er toch confounding optreden. Dit kun je onderzoeken door meerdere variabelen in je regressievergelijking op te nemen. Bijvoorbeeld je vergelijkt geslacht en cholesterol en leeftijd en cholesterol. Je kijkt naar de invloed op het toevoegen van leeftijd op de regressiecoëfficient. Verschil in cholesterol bij mannen en vrouwen is.319 Als je leeftijd toevoegt is het verschil bijna niets meer, dus al het verschil wordt bijna verklaard door leeftijd. Er is geen verschil in geslacht want al het verschil is toe te schrijven aan leeftijd. Als je een 10% daling of stijging vindt is er sprake van confounding. Effectmodificatie is iets anders dan confounding. Bij confounding is het een achterliggende relatie. Bij effectmodificatie is het effect anders voor verschillende groepen. bijvoorbeeld het effect is anders voor jonge mensen dan voor oude mensen. Binnen multipele regressieanalyse kan effectmodificatie geanalyseerd worden door interactietermen. Cholesterol = b0 + b1 x geslacht + b2 x roken + b3 x geslacht x roken Geslacht (0: vrouw; 1:man) Roken ():nee; 1: ja) B1 = verschil in gemiddeld cholesterol tussen mannen env rouwen die niet roken B1 + b3 = verschil in gemiddeld cholesterol tussen mannen en vrouwen die wel roken. De mannen die niet roken, als je dit invult krijg je cholesterol is b0 + 0 Niet rokende vrouwen: B0 Vrouwen die wel roken: B0 + B2 B2 = vrouwen die roken vrouwen die niet roken Mannen die roken: b0 + b1 + b2 + b3 Verschil tussen mannen die roken en vrouwen die roken is b1 + b3 o

15 Interactieterm defineer je door twee determinanten te vermenigvuldigen in spss. Plan van aanpak als je onderzoekt op er confounding of effectmodificatie is: - counfounding: toevoegen van condounder aan regressiemodel en kijken of de regressiecoëfficiënt van de determinant verandert. Vuistregel hierbij is: als er meer dan 10% verandering is, is er confounding. Een elegante oplossing hierop is: presenteer zowel ongecorrigeerde als gecorrigeerde resultaten - effectmodificatie: toevoegen van interactieterm aan regressiemodel en kijken of de interactieterm significant is. Indien significant: aparte resultaten voor de groepen van de effecmodificator. van confounding moet je af, effectmodificatie moet je gebruiken. p

16 Systematic reviews van RCTs Riekie de Vet Vroeger schreef een expert op uitnodiging van een tijdschrift een review. Deze expert maakte een selectie van studies en beschreef de resultaten. Hij trok hier conclusies uit. De nadruk lag op autoriteit. Niet iedereen kon zomaar een review insturen. Er was ook weinig transparantie jaar geleden is daar verandering ingekomen. Toen vond met dan de reviews veel systematischer konden. Dit komt in een aantal aspecten tot uiting: - Formulering van een concrete vraagstelling (niet alles over osteoporose) - Expliciete zoekstrategie (strategie beschreven) en selectiecriteria - Beoordeling van methodologische kwaliteit van de onderzoeken - Indien mogelijk strategische pooling van resultaten = meta-analyse - Beantwoording van vraagstelling (conclusies) kan nu heel gericht Belangrijk is dat er sprake is van transparantie. Als iemand anders die systematische review zou doen, zou er weer hetzelfde uitkomen. Lezer kan precies volgen wat je gedaan hebt. Het is niet mogelijk om alle literatuur bij te houden. Er zijn ruim medische tijdschriften. Miljoenen artiekelen per jaar. In totaal >1 miljoen RCTs en >1 miljoen diagnostische studies. Daarom zijn de systematische reviews van belang. Daar is het keurig allemaal samengevat. Cochrane collaboration. Het was een schande dat artsen literatuur niet bijhouden en dat ze dus niet op de hoogte waren van de nieuwste inzichten. Dit was het begin van het initiatief om alle literatuur samen te vatten in systematische reviews. Tegenwoordig zijn er heel veel mensen bezig om de literatuur samen te vatten. De reviews worden regelmatig ge-update. Zo heb je dus altijd de meest recente informatie. Onderzoeksvraag formuleren In de onderzoeksvraag moet je PICO in voorkomen: P welke groep? I welke interventie? C welke controle-interventie? O welke gezondheidstoestand als uitkomst? Het liefst komt deze al in de titel naar voren. Dit bepaalt ook de inclusiecriteria over welke patiënten mee kunnen doen aan het onderzoek. Cochrane library - Database in UBVU - Bevat systematische reviews - Protocollen van reviews in uitvoering - Register van alle RCTs q

17 Zo kun je dus voordat je een review gaat maken checken of iemand al bezig is met wat jij zou willen doen. Methodologische kwaliteit Er wordt gekeken naar de methodologische kwaliteit van de studies. Hiervoor bestaan een hele hoop checklisten. Deze heten risk of bias criteria. Als er aan verschillende methodologische criteria niet voldaan is bestaat er kans op bias. Je hebt bijvoorbeeld de Delphi lijst. Dit gaat bijv. over randomisatie, blindering, verliezen van mensen gedurende de trial, is er een intention-to-treat-analyse gedaan, etc. Uitkomstmaten van trials Continue uitkomstmaten - Per behandelingsgroep wil je dan een mean en de SD gepresenteerd hebben - In trial: verschil in gemiddelden tussen interventie en controle groep - Nul hypothese: geen verschil = 0 (neutrale waarde) - Statisch significant als 0 niet in confidence interval ligt Dichotome uitkomstmaten - Kans of risico - In trials: relatief risico of risico verschil - Risicoverschil (RV): nul hypothese geen verschil (=0) statistisch significant als 0 niet in confidence interval zit - Relatief risico (RR of OR): nul hypothese geen verschil (=1, twee dezelfde waarde op elkaar delen krijg je 1) statistisch significant als 1 niet in confidence interval zit Breedte van betrouwbaarheidsinterval is indicatie van de precisie van de effectschatting. Alle studies waar de nul niet in het streepje ligt zijn statistische significant. Welke studies zijn de grootste studies in dit overzicht? B, D en E deze hebben het kleinste betrouwbaarheidsinterval. Hier kun je een preciezere schatting maken. r

18 Het gaat niet altijd om statistische significantie maar ook op klinische relevantie. A is niet statische significant en niet klinisch relevant B is niet statisch significant en niet klinisch relevant C is statistisch significant en klinisch relevant D is statische significant maar is niet klinisch relevant. E is statische significant en klinisch relevant Beide moet je bekijken als je de effecten van een studie beoordeeld. Integreren en poolen van resultaten Stel je hebt een aantal studies gevonden, dan moet je proberen deze zo goed mogelijk samen te vatten. Soms verschillen de studies wat van elkaar. Als ze heel erg op elkaar lijken dan kun je de studies statistisch gaan poolen. Dan kun je de resultaten optellen en dat doe je zodat de grootste studies met het kleinste betrouwbaarheidsinterval het zwaarst wegen. Er zijn drie manieren om dit samen te vatten: 1. Best evidence synthesis (als de studies heterogeen zijn) Beschrijven van de resultaten (liefst met Figuur van forest plot) Bediscussieren in relatie tot studie kenmerken, o.a. risk of bias 2. Meta-analyse: statistische pooling Als er aantal homogene studies zijn wat betreft: - Populatie, interventie, controlegroep en uitkomstmaat - Studie design - Redelijk goede studies de resultaten moeten betrouwbaar zijn - Én niet al te grote verschillen in uitkomst van de trial 3. Individual Patiënt Data (IPD) analyse De onderzoekers vragen om samen te werken en alle data bij elkaar gooien en één analyse doen. Het voordeel hiervan is is dat je alle ruwe data kunt gebruiken. Het is wel heel erg veel werk en je moet geode samenwerking hebben met alle partners. Je ziet het wel steeds meer gedaan. Wat is poolen? - Poolen is het statistisch combineren van de resultaten van afzonderlijke, vergelijkbare onderzoeken - Resultaat: één overall schatting van het effect van de behandeling - Voordelen: detecteren van kleine(re) effecten en effecten in subgroepen De gepoolde effectmaat wordt vaak als een wybertje (diamant) weergegeven) s

19 Hieronder staat een voorbeeld van een Forest plot: Links vind je de auteurs en jaartallen van de artikelen. Vervolgens zie je dat de relatieve risico s zijn gepresenteerd. Het is een dichotome effectmaat. Hieronder zie je als het risico < 1 dan de behandeling effectiever dan de controle behhandeling. Je ziet dat de meeste studies een beschermend effect laten zien. Eén studie geeft geen beschermend effect. Nu is het belangrijk om te kijken wat de neutrale waarde is in deze Forest plot? Dat is 1, want je hebt te maken met relatieve risico s. grote studies hebben een groot blokje en kleine studies heb je een klein blokje. Er is één studie statistisch significant en bij die studie ligt 1 niet in het betrouwbaarheidsinterval. Dat wybertje geeft dus een samenvatting (pooling) van alle resultaten. Als er een review s van heel heterogene studie moet je er naar kijken (eyeball test) en inschatten of je het de moeite waard vindt om daar een overall schatting van te geven. Het best is om van te voren al zeggen naar welke subgroepen je gaat kijken. Heterogeniteit: variatie tussen onderzoeken - Klinische heterogeniteit o Verschillen in klinische kenmerken: patiënten, interventies, uitkomstmaten - Methodologische heterogeniteit o Verschillen in design of uitvoering; randomisatie, blindering, uitval, etc. - Statistische heterogeniteit o Als gevolg van klinische/methodologische variatie (verwacht) (sampling error bijv) o Onbekende bronnen (onverwacht) Omgaan met heterogeniteit 1. Voorkomen van (verwachte) heterogeniteit a. Gebruik stricte insluitcriteria b. Definieer subgroepen van onderzoeken met vergelijkbare kenmerken c. Gestratificeerde analyse: effect modificatie? 2. Pas analyse methode aan: a. Geen of weinig heterogeniteit: pooling via fixed effect model b. Behoorlijk heterogeniteit: pooling via random effects model t

20 3. Hoge mate van heterogeniteit: geen meta-analyse, maar een transparante, systematische, beschrijvende synthese Alleen poolen als je je iets bij de uitkomst kunt voorstellen. Verwerken kwaliteit in review en meta-analyse - Gebruiken als inclusie criterium voor review (alleen gerandomiseerde onderzoeken bijv.) - Descriptief - Inclusie criterium voor analyse - Sensitiviteits analyse o Hoog vs laag risico op bias o Invloed van individuele items Bijvoorbeeld alle geblindeerde studies onder elkaar en alle niet geblindeerde onder elkaar, voor iedere groep apart een wybertje maken. Kijken of er verschil is. Conclusie van een systematische review - Geen inzicht in overall effect: point estimate en 95% CI - Geen aan hoe zeker je daarvan bent, gezien: o Het aantal studies o De methodologische kwaliteit van de studies o Consistentie van de resultaten o Mogelijke publicatie bias (positieve resultaten wel gepubliceerd en negatieve niet) Systematische reviews zijn nuttig voor: - Artsen en therapeuten o Toepassing in de zorg o Maken van richtlijnen (hierdoor hoeven artsen niet meer alle literatuur bij te houden) - Onderzoekers: o Genereren onderzoeksvragen o Voorkomen van methodologische tekortkomingen (geeft veel ervaring van hoe je een dergelijk onderzoek moet doen) o Schatten van sample size - Beleidsmakers: vergoeding en regelgeving - Patiënten: individuele beslissingen Voordelen systematische reviews: informatief - Inzicht in overall effect - Detecteren van kleine effecten en effecten in subgroepen - Efficiënt: kost veel tijd, maar goedkoper dan nieuw onderzoek - Preventie van overbodig onderzoek - Toegankelijkheid en periodieke actualisering (updates) is essentieel u

21 Statistiek 3 Analyse van dichotome uitkomstvariabelen Anton de Vries Continu Dichotoom Dichotoom + tijd 2 groepen Analyse T-toets Effectmaat Gem. verschil > 2 groepen Analyse ANOVA Effectmaat Gem. verschil Relatie met andere variabelen Analyse Effectmaat Lineaire regressie B, β We hebben tot nu toe de eerste kolom nu ingevuld. Met een lineaire regressive analyse kun je eigenlijk hetzelfde al seen t-toets en een ANOVA. Je kunt zelfs meer want je kunt variabelen toevoegen aan je regressiemodel. Hierdoor kun je corrigeren voor confounders en effect-modificatoren. Er zat in het SPSS practicum een vraag over R 2 maar daar is hij in het college over lineaire regressie niet aan toe gekomen. Je hebt hier twee continue variabelen. Je probeert y te voorspellen aan de hand van x. Je hebt allerlei waardes (puntjes). De verdeling van die puntjes kun je over de y-as weergeven als een soort histogram. Dat wordt idealiter een normale verdeling. Wat je ook kunt weergeven in zo n scatter is een regressielijn (y = b 0 + b 1 x). b o is eigenlijk y als x = 0 (gemiddelde leeftijd bij leeftijd 0). Die regressielijn gaat ook door het gemiddelde v

22 van x en het gemiddelde van y. Wat nu van belang is voor de interpretatie van de R 2 is dat je ziet dat al die punten een voorspelling die precies op die lijn ligt (rode puntjes). Die voorspellingen kun je in SPSS opvragen. Dit zijn de ruwe voorspelde waardes. In dit geval dus de voorspelde lengte voor al die mensen. Je zou net zo n histogram voor de voorspelde waarde kunnen maken (rode lijn). Als je deze maakt is deze altijd iets smaller. Als deze even breed is zouden alle puntjes op één lijn liggen. Voor R 2 is de SD van die voorspelling kleiner dan die eerste SD. De SD in het kwadraat is de variantie. Als je de ene variantie deelt op de andere variantie dan heb je R 2. R 2 zegt zoiets als hoeveel variantie ik in mijn uitkomst voorspel aan de hand van de x variabelen (in dit geval de leeftijd). Daarom heet R 2 ook wel verklaarde variantie. Dit geeft het percentage lengte dat kan worden verklaard door de leeftijd. Analyse van dichotome uitkomstvariabelen Voorbeeld: - Nieuw medicijn in het kader van behandeling patiënten (ofwel geneesmiddel ofwel een placebo) - Follow up tijd: 1 jaar - Uitkomstvariabele: herstel (ja/nee) Dit is de uitkomst: WEL herstel GEEN herstel Totaal Medicatie Placebo Totaal Aan dit schema kun je ook letters verbinden: WEL herstel GEEN herstel Totaal Medicatie A B A+ B Placebo C D C+D Totaal A+C B+D A+B+C+D Dan is de vraag of het geneesmiddel werkt. Het geneesmiddel levert 35% herstel op en de placebo levert 20% herstel op. - Het risicoverschil/attributief risico = 35/100 20/100 = 15% - Relatief risico op herstel: (35/100) / (20/100) = 1,75 - Relatief risico op niet herstel: (65/100) / (80/100) = 0,813 - Odds Ratio: (35x80)/(65x20) = 2,154 De odds is de (kans/1-kans). Het is dus eigenlijk de kans op herstel gedeeld door de kans op niet herstel in dit voorbeeld. Hier is de odds voor de medicatie dus (35/100)/(65/100). De odds voor placebo is (20/100)/(80/100). Als je deze odds en op elkaar deelt krijg je een odds ratio. En delen is vermenigvuldigen met het omgekeerde dus daarom zie je bij de odds ratio twee vermenigvuldigingen. 95% betrouwbaarheidsinterval van het attributief risico (AR) Als je het 95% betrouwbaarheidsinterval van het attributief risico wil berekenen dan gaat dat als volgt: Standard Error = [(AxB)/(A+B) 3 + (CxD)/(C+D) 3 ] = 0,0622 w

23 Het attributief risico doe je plus of min een Z waarde die hoort bij dat 95%- betrouwbaarheidsinterval. Hoe vind je die nou? Je moet dan naar de tabel achterin je klapper. Er zijn twee tabellen: 1a en 1b. 1a levert de omzetting van de z-waarde naar de quantiel en tabel 1b de omzetting van de quantiel naar de z-waarde. q (het quantiel) kan 0 tot 100 zijn. Bij 0 zit je op - en bij 100 zit je op +. In de linkerkolom zie je de quantielen. Horizontaal zie je derde decimaal. Je wil een bepaalde grens weten die hoort bij 0,975. Dan kijk je in de linker kolom naar 0,97 en in de eerste rij kijk je naar x,xx5. Dus het 95%-BI van het AR= AR ± Z 1-0,05/2 x SE AR = 0,150 (15%) ± 1,96 x 0,0622 = [0,150 0,122; 0, ,122] = [0,028; 0,272) Is dit nu significant? Waar het nu om gaat is of we vinden dat het verschil toe te schrijven is aan toeval of niet. Als je denkt dat het verschil toe te schrijven is aan toeval zou je verwachten dat de 0 binnen het betrouwbaarheids interval zou liggen. Want een verschil van 0 zou dan ook tot de mogelijke waarden moeten behoren, en in dit geval is dan niet zo. Je kunt nu concluderen dat dit een significant verschil. In de praktijk wordt dit meestal toch getoetst, maar in principe zou je het nu al wel kunnen zeggen. 95% betrouwbaarheidsinterval van het relatief risico (RR) Het 95%-BI van het relatief risico (RR) is iets lastiger te berekenen. Dit komt omdat de Standard Error alleen gedefinieerd is van het log van het relatief risico. Dat komt omdat RR scheef naar rechts is verdeeld. Alleen de log(rr) is normaal verdeeld. Exp is hier de e-macht. Deze gebruik je hier om het 95%-BI van het RR te geven en niet van de log van het RR. Je kunt aan het interval zien dat het scheef verdeeld is. Je ziet namelijk dat het RR (1,750) niet in het midden van het betrouwbaarheidsinterval. Dit is significant omdat de 1 niet in het interval ligt. 95% betrouwbaarheidsinterval van de Odds Ratio (OR) Voor een OR geldt hetzelfde als voor het 95%-BI van het RR. Dit is significant wat de 1 zit niet in het betrouwbaarheidsinterval. Een verhouding is 0 als de odds 1 is. Dit geldt voor zowel de odds ratio als voor het relatief risico. x

24 Chi-kwadraat toets Aan alle 95%-BI heb je kunnen zien dat alle effectmaten significant zijn. Je kunt alle drie de maten direct toetsen met de chi-kwadraat toets. Je berekent de verwachte celfrequentie: WEL herstel GEEN herstel Totaal Medicatie (55x100)/200=27,5 (145x100)/200=72,5 100 Placebo (55x100)/200=27,5 (145x100)/200=72,5 100 Totaal Je hebt 100 mensen met medicatie en 100 mensen met placebo. Je ziet dat 55 mensen die wel hersteld zijn en 145 die niet hersteld zijn. Dan kijk je op grond van die verdeling wat je verwacht als er geen verschil zou zijn. Die doet dus het kolom-totaal x het rijtotaal gedeeld door het overall-totaal. Je kunt controleren of deze verwachte frequenties kloppen omdat het horizontaal moet uitkomen op het totaal en verticaal ook. Deze verawchte celfrequentie trek je af van de geobserveerde celfreqenties. Df =1 (vrijheidsgraad) [aantal vrijheidsgraden = (aantal rijen 1) x (aantal kolommen 1)] Dan kijk je in de tabel van de chi-kwadraat verdeling. De chi-kwadraat verdeling bij 1 vrijheidsgraad is de normale verdeling in het kwadraat. De chi-kwadraat heeft dus ook maar 1 staart, want de min in het kwadraat is positief. Het is eigenlijk een schuin naar rechtse verdeling. Hoe deze verdeling er precies uitziet hangt af van het aantal vrijheidsgraden. Je doet de chi-kwadraat omdat dat de daadwerkelijke hypothesetoetsing is. In het betrouwbaarheidsinterval kunnen wat foutjes zitten. De kritieke waarde kun je nu terugvinden in tabel 3 (chi-kwadraat verdeling) in de 0,950 kolom. Bij 1 vrijheidsgraad is deze 3,841. Als je hier de wortel van neemt krijg je dus ook In SPSS staat achter de Pearson Chi-Square een significantie waaraan je kunt ziet op de chi-kwadraat significant is. Continu Dichotoom Dichotoom + tijd 2 groepen Analyse T-toets Χ 2 toets Effectmaat Gem. verschil RV (AR), RR, OR > 2 groepen Analyse ANOVA Effectmaat Gem. verschil Relatie met andere variabelen Analyse Effectmaat Lineaire regressie B, β y

25 Vorig voorbeeld uitgebreid: Er wordt een alternatief medicijn toegevoegd aan het onderzoek. Je hebt nu drie te vergelijken groepen: WEL herstel GEEN herstel Totaal Medicatie Medicatie Placebo Totaal Nu krijg je een vergelijkbare situatie als bij een ANOVA alleen heb je nu een dichotome uitkomst. Je kunt nu opnieuw een chi-kwadraat kunnen uitrekenen. Dit is nu alleen iets meer werk want je moet 6 cellen bij elkaar optellen. Het aantal vrijheidsgraden wat past bij een chi-kwadraat over zo n tabel is: (aantal rijen 1) x (aantal kolommen 1). Hier is dat dus 2. Met SPSS kun je deze chi-kwadraat doen en krijg je een significante p-waarde. Je weet nu alleen niet waar het significante verschil zit. Om hier achter te komen moet je terug naar de tabel. Hier kun je in feiten drie 2x2 tabellen van maken (medicatie 1 met placebo, medicatie 2 met placebo en medicatie 1 met medicatie 2). SPSS produceert bij een n x m tabel waarbij n > 2 of m > 2 geen OR of RR meer. Oplossing: voor gewenste vergelijkingen aparte 2 x 2 tabellen maken. Kan alleen als chikwadraattoets over de n x m tabellen significant is. Dat is hetzelfde als bij de ANOVA (Ttoets doen over alle groepen binnen de ANOVA). Logistische regressie analyse Analyse van dichotome variabelen: zowel verschillen tussen twee groepen als de verschillen tussen drie groepen zijn ook te analyseren met: logistische regressie analyse. Dit kan lastig zijn om te begrijpen. Lineaire regressie analyse Cholesterol = b o + b 1 x sekse Vrouw = 0; man = 1 B 0 = gemiddelde van vrouwen B 1 = verschil tussen mannen en vrouwen Bij een dichotome uitkomst doe je eigenlijk net zoiets. Je hebt het dan niet over de uitkomst zelf maar over iets anders. Een scatterplot van een continue met een dichotome variabele ziet er zo uit: Als je hier een rechte lijn door trekt gaat dit door de twee gemiddelden. Je maakt de verticale afstanden minimaal. Je wil niet per se iets zeggen over de uitkomst maar over de kans op die uitkomst. Die kans die neemt toe. Maar die ligt tussen 0 en 1. Dit gaat om de kans op herstel. Je hebt nu dus soort van een continue variabele. Je hebt alleen 1 z

26 probleem dat deze absoluut begrensd is door 0 en 1. De verdeling hiervan wordt een soort van S-curve. Je moet dus eigenlijk een kansmaat hebben die geen bovengrens heeft van 1. Dit is de Odds(y=1). Dus als je de odds neemt: (kans op herstel/1-kans op herstel). Als de kans 0 is op herstel is de odds 0. Als de kans een half is, dan is de odds 1. De odds als de kans 1 is oneindig. De verdeling van de odds is dus scheef naar rechts. Een scheef naar rechtse verdeling krijg je normaal door een log-transformatie. Je neemt dus de log(kans op herstel/(1-kans op herstel)). Je hebt het dus niet over herstel want dat is een 0-1 variabele. Je hebt het over de log van de odds van herstel, dit heet de log-odds. Je kunt nu nog steeds y = b o + b 1 x X gebruiken als regressie vergelijking. Hierbij is y dus de log-odds. Als je van deze gekke y-variabele een normale variabele wil maken. Odds op herstel = Vervolgens kun je ook de odds naar de kans terug transformeren: Odds = kans/(1-kans) Kans = odds/(odds+1) aa

27 Statistiek 3 Analyse van dichotome uitkomstvariabelen Anton de Vries Logistische regressie analyse met twee groepen Logistische regressieanalyse: zowel de verschillen tussen twee groepen als de verschillen tussen meer dan twee groepen. Regressie parameters bij lineaire regressie analyse - Deze zijn direct uit te rekenen - Dat gebeurt met de kleinste kwadraten methode Regressie parameters bij logistische regressie analyse - Iteratieve benaderingsmethode - Maximum Likelihood methode (ML). Dit wil zeggen dat de waarde die je vindt geeft overal in de groep de meest waarschijnlijke uitkomst. Logistische regressie met dichotome determinanten Voorbeeld: patientcontrole onderzoek naar determinant voor hartinfarct. Hierbij is de vraag of roken een determinant is voor hartinfarct. INFARCT GEEN INFARCT ROKEN JA ROKEN NEE Bij een patiënt-controleonderzoek mag je alleen de Odds-ratio gebruiken! Odds ratio = (60 x 178)/(32 x 150) = 2,225 (dat is best wel fors) Als je dit in SPSS analyseert krijg je dit: Tabel uit college Anton de Vries. bb

28 Is dit nu een significant verschil of niet? De chi-kwadraat toets levert een significant resultaat op (p=,001) bij een chi-kwadraat van 10,912. De kritieke waarde bij die chikwadraat van 1 vrijheidsgraad ligt bij 3,841 (tabel 3 achterin klapper). Die 10,9 ligt hier dus boven. Wanneer de chi-kwadraat boven de waarde uit de tabel ligt is deze significant. Als je dit als een logistische regressie benadert krijg je de volgende output: Tabel uit college Anton de Vries. Bij een logistische regressie staat de B 0 onderaan!!!! Wat je allereerst ziet is dat de chi-kwadraat anders is. Eerst was deze 10,9 en hier is deze 11,052. Wat je hier ook ziet is een andere toets (de Wald). Deze levert een waarde van 10,625. Al deze waardes liggen ongeveer rond dezelfde waarde. Ze zijn ook allemaal significant. Je ziet hier ook de regressievergelijking: Log(kans op infarct/1-kans op infarct) = -0,171 +0,800 x roken. Roken is gecodeerd als 0 of 1 DUS: de kans op een hartinfarct als je rookt is: Log-odds niet rokers = -0,171 x 0,800 x 0 = -, B 1 is dus het verschil tussen rokers en niet rokers in log-odds. Log-odds rokers= -0,171 +0,800 x 1 = 0,629 Log-odds rokers log-odds niet rokers = log (odds rokers/odds niet rokers) = B 1 (geeft dus de log-oddsratio. Als je helemaal rechts kijkt zie je dat SPSS ook de Exp van B geeft. Oftewel dat is dan de odds ratio. Die is dus e 0,800 = 2,225 cc

29 Er zijn dus drie toetsen om te kijken of het effect sifnificant is: - Wald toets - Aan de hand van het 95%-BI rond de Odds Ratio (die was hier 1,376-3,599 en 1 zit hier niet is dus is het verschil significant) - Likelihood-ratio-toets Wald toets Deze is chi-kwdraat verdeeld met één vrijheidsgraad omdat je maar één predictor hebt. (0,800/0,245) 2 =10,623 De kritieke grens ligt dus bij 3,841 (tabel 3 achterin klapper). De p-waarde is dus kleiner dan 0,05. 95%-BI van de OR Hoe komen we via de logistische regressie output aan een odds ratio en het 95%BI? De Odds ratio is in dit geval 2,225 (zie output bij Exp(B)). OR = EXP (0,800) = 2,23 95%-BI: EXP(b±1,96 x SE(b)) EXP(0,800±1,96 x 0,245) (zie output) 95%-BI: 1,38-3,60 Het 95%-BI van de Odds Ratio omvat de 1 niet Likelihood-ratio-toets Je gaat eigenlijk van iedereen de kans op de waarde vermenigvuldigen. Likelihood: product van alle kansen voor iedere persoon gegeven de waarden voor de determinanten. Dit kan berekend worden op basis van 2x2 tabel en de gescahtte kansen (gegeven de waarde van de determinant). Vier mogelijke situaties: Infarct Roken Kans , , , ,54 Wat is de kans op een hartinfarct voor een roker en voor een niet roker? Voor niet rokers: dd

30 Voor rokers: We hadden gezien dat de kans als je een hartinfarct hebt en rookt dat die kans 0,65 is. De kans om geen hartinfarct te krijgen als je rookt was 0,35. Als je niet rookt is de kans op een hartinfarct 0,46 en de kans op geen hartinfarct en niet roken is 0,54. Dit is puur gebaseerd op de volgende 2x2-tabel: INFARCT GEEN INFARCT ROKEN JA ROKEN NEE Er zijn 60 mensen die een hartinfarct hebben gehad terwijl te rookten. Kortom, die kans is dus 0,65x0,65x0,65x.. voor al die 60 mensen. Oftewel, 0, De kans op geen hartinfarct voor de rokers was 0,35. Je hebt 32 mensen die geen hartinfarct hebben gehad en wel rookten. Dus: 0, Etc. Zo krijg je de volgende formule voor de likelihood: (0,65) 60 x (0,35) 32 x (0,46) 150 x (0,54) 178 Je rekent hier de kans uit dat je voor iedereen een goede voorspelling doet. Die kans is dus extreem klein. Als de likelihood heel klein is kun je er niet goed meer mee rekenen. Dan gebruik je de -2loglikelihood. De log van 1 is nul en de log van iets kleiner dan 1 is negatief. Om deze reden wordt er een -2log transformatie gedaan van die likelihood. Je hebt niks aan een losse - 2loglikelihood. Je hebt wel wat aan een vergelijking van twee -2loglikelihoods. Likelihood-ratio toets: Als ik nu geen determinanten zou gebruiken is de kans op een hartinfarct 0,5 (50% is case). Je maakt nu geen gebruik van roken. Je hebt 210 mensen met geen infarct en 210 met wel een infarct. Doe je nu een betere voorspelling door roken te gebruiken? -2loglikelihood met roken: -2 ln [(0,65) 60 x (0,35) 32 x (0,46) 150 x (0,54) 178 ]=571,20-2loglikelihood zonder determinanten: -2 ln [(0,5) 420 = 582,24 Als je deze waarden van elkaar aftrekt heb je een chi-kwadraat verdeelde toetsingsgrootheid. Likelihood-ratio toets - Vergelijken van twee modellen met elkaar (je moet het wel hebben over dezelfde groep) - Verschil van de -2 log likelihoods - Verschil tussen die twee modeelen volgt een chi-kwadraat verdeling - Het aantal vrijheidsgraden is gelijk aan het verschil in variabelen tussen de twee modellen die met elkaar worden vergeleken (in dit geval alleen het roken (B1)) - Essentieel: ene model moet een uitbreiding zijn van het andere model. (je kunt niet een variabele toevoegen en een andere wegnemen tegelijkertijd) ee

31 - De absolute waarde van -2 log likelihood zegt niet zo veel; is alleen belangrijk in het kader van de likelihood ratio toets. Voorbeeld: 582,24-571,20 = 11,04 Chi-kwadraat verdeeld met 1 vrijheidsgraad. Conclusie? 11,04 > 3,84 dus significant Welke methode is de beste? De likelihood-ratio toets is altijd toepasbaar, ook bij ingewikkelde modellen. Logistische regressie analyse met meer dan twee groepen Voorbeeld: Is beroep een determinant voor het krijgen van een hartinfarct? In dit voorbeeld is een vergelijking gemaakt tussen een statisticus, een epidemioloog en iets anders. Frequentie Percentage Valid Cumulative Epidemioloog Statisticus Anders Totaal (Hartinfarct) ,0 29,8 34,3 100,0 Percentage 36,0 29,8 34,3 100,0 Infarct Geen infarct Epidemioloog Statisticus Anders Er is een chi-kwadraat toets gedaan: percent 36,0 65,7 100,0 Tabel uit college Anton de Vries. Er is geen significant verschil gevonden. Je hebt nu twee vrijheidsgraden want het is een 3x2 tabel. En het aantal vrijheidsgraden is (aantal rijen 1)x(aantal kolommen 1). Je zou odds-ratios kunnen berekenen voor de aparte 2x2 tabellen: Epidemioloog versus statisticus: (72x69)/(79x56)=1,12 Epideiomoloog versus anders: (72x62)/(79x82)=0,69 ff

32 Je zou ook opnieuw een logistische regressie kunnen doen. Net als bij lineaire regressie zal je nu twee beroepen om moeten zetten in dummy-codering: De regressievergelijking ziet er dan zo uit: Log(odds) = B 0 + B 1 x dummy 1 + B 2 x dummy 2 In dit geval is de epidemioloog gekozen als referentie categorie: DUMMY1 DUMMY2 Epidemioloog 0 0 Statisticus 1 0 Anders 0 1 Log(Odds epidemioloog ) = B 0 + B 1 x 0 + B 2 x 0 = B 0 Log(Odds statisticus ) = B 0 + B 1 x 1 + B 2 x 0 = B 0 + B 1 Log(Odds anders ) = B 0 + B 1 x 0 + B 2 x 1 = B 0 + B 2!!! B 0 + B 1 B 0 = B 1 = odds ratio tussen statisticus en epidemioloog B 0 + B 2 B 0 = B 2 = odds ratio tussen anders en epidemioloog Dit kun je hier in de logistische regressie output terugvinden: Tabel uit college Anton de Vries. Hier zie je een constante die niet zo interessant is, behalve dat het de log(odds) van de epidemioloog geeft. Dit is -0,093. Dit hoort bij een odds van 0,911 (Exp(B)). De meest belangrijke informatie vind je in de B1 en B2 van beroep. B1 is -0,116 (dat is je log(oddsratio) van de statisticus en epidemioloog). Als je daar de exp van neemt heb je dus een oddsrati van 0,890 en dat betekent dat als je statisticus bent je een lagere kans hebt op een hartinfarct dan wanneer je epidemioloog bent. Als je anders bent heb je een log(oddsratio) van 0,372 en de odds ratio is dan 1,451. Dus de odds ratio van anders ten opzichte van de epidemioloog is 1,451. Je kunt de betrouwbaarheids intervallen ook uit deze output halen door gebruik te maken van de SE die hier gerapporteerd staat. Betrouwbaarheidsinterval van OR voor statisticus vs epidemioloog: gg

33 - EXP (-0,116 ± 1,96 x 0,243) = [0,55 1,43] Betrouwbaarheidsinterval van OR voor anders vs epidemioloog: - EXP (0,372 ± 1,96 x 0,234) = [0,592 2,30] De verschillen zijn niet significant Logistische regressie met een continue determinant Dan is de vraag bijvoorbeeld is een hoge BMI een determinant voor het krijgen van een hartinfarct? Dit soort vragen gebruiken mensen hier een t-toets maar dan andersom. Dan wordt BMI als uitkomstvariabele gebruikt en wordt gekeken of de BMI van mensen die een hartinfarct hebben hoger is dan die van mensen die geen hartinfarct hebben gehad. Hieronder de output van de t-test: Tabel uit college Anton de Vries. Maar beter is de regressieanalyse. Waarvan hieronder de output; Tabel uit college Anton de Vries. OR voor BMI - E b1 = EXP(B) = Odds Ratio = e 0,177 =1,194 (zie ook SPSS output) Betrouwbaarheidsinterval - EXP (0,117 ± 1,96 x 0,038) = [1,11 1,29] Dit is de OR voor een verschil van 1 eenheid in BMI. Die OR is helemaal niet zo hoog, maar hij is wel significant. De BMI heeft toch een vrij grote range. Dus 1 stapje in BMI is een heel klein stapje (geldt ook voor lineaire regressie). Interessanter bijvoorbeeld de OR voor een verschil in 5 eenheden. hh

34 OR voor 5 eenheden BMI: - EXP (5 x 0,117 ± 5 x 1,96 x 0,038) = 2,43(1,67-3,53) - OR = e b = e 5 x 0,177 = 2,43 Nu is de odds ratio ineens een stuk groter. Je maakt zowel de B als de SE 5 x zo groot en dan krijg je een BI wat ook 5x zo groot wordt maar je krijg wel een beter te interpreteren waarde. Ook nu is het van belang om te kijken of er sprake is van problemen met de lineairiteit. - Toevoegen kwadraatterm - Continue determinant opdelen in groepen Als je een kwadraatterm toevoeg, ziet de output er zo uit: Tabel uit college Anton de Vries. Is er nu sprake van een lineair verband? Nee want de BMI2 verschilt (heel weinig, maar) significant van 0 (0,002). Als je het in groepen had gedeeld had het er zo uitgezien: Tabel uit college Anton de Vries. ii

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 1314 Figuren en formules

Nadere informatie

11. Multipele Regressie en Correlatie

11. Multipele Regressie en Correlatie 11. Multipele Regressie en Correlatie Meervoudig regressie model Nu gaan we kijken naar een relatie tussen een responsvariabele en meerdere verklarende variabelen. Een bivariate regressielijn ziet er in

Nadere informatie

9. Lineaire Regressie en Correlatie

9. Lineaire Regressie en Correlatie 9. Lineaire Regressie en Correlatie Lineaire verbanden In dit hoofdstuk worden methoden gepresenteerd waarmee je kwantitatieve respons variabelen (afhankelijk) en verklarende variabelen (onafhankelijk)

Nadere informatie

Formulier voor het beoordelen van de kwaliteit van een systematische review. Behorend bij: Evidence-based logopedie, hoofdstuk 2

Formulier voor het beoordelen van de kwaliteit van een systematische review. Behorend bij: Evidence-based logopedie, hoofdstuk 2 Formulier voor het beoordelen van de kwaliteit van een systematische review Behorend bij: Evidence-based logopedie, hoofdstuk 2 Toelichting bij de criteria voor het beoordelen van de kwaliteit van een

Nadere informatie

Literatuuronderzoek. Systematische Review Meta-Analyse. KEMTA Andrea Peeters

Literatuuronderzoek. Systematische Review Meta-Analyse. KEMTA Andrea Peeters Literatuuronderzoek Systematische Review Meta-Analyse KEMTA Andrea Peeters Waarom doen? Presentatie 1. Begrippen systematische review en meta-analyse 2. Hoe te werk gaan bij het opzetten van een review

Nadere informatie

8. Analyseren van samenhang tussen categorische variabelen

8. Analyseren van samenhang tussen categorische variabelen 8. Analyseren van samenhang tussen categorische variabelen Er bestaat een samenhang tussen twee variabelen als de verdeling van de respons (afhankelijke) variabele verandert op het moment dat de waarde

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op dinsdag , uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek voor TeMa (S95) op dinsdag 3-03-00, 9- uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en

Nadere informatie

Algemene methodologie (onderdeel van CAT)

Algemene methodologie (onderdeel van CAT) Oefentoets Algemene methodologie (onderdeel van CAT) Cursus Wetenschappelijk Focus Onderwijs: Algemene methodologie Cursuscoördinator dr. A.L. de Vries 30 oefenvragen ZONDER antwoorden 1 In een onderzoeksprotocol

Nadere informatie

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y

Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y 1 Regressie analyse Zowel correlatie als regressie meten statistische samenhang Correlatie: geen oorzakelijk verband verondersteld: X Y Regressie: wel een oorzakelijk verband verondersteld: X Y Voorbeeld

Nadere informatie

mlw stroom 2.2: Biostatistiek en Epidemiologie

mlw stroom 2.2: Biostatistiek en Epidemiologie mlw stroom 2.2: Biostatistiek en Epidemiologie Hoorcollege 1: Onderzoeksopzet en risikomaten Rosner 13.1-13.4 Capaciteitsgroep Methodologie en Statistiek tul / UM 10 januari 2006 Methodologie en Statistiek

Nadere informatie

mlw stroom 2.1: Statistisch modelleren

mlw stroom 2.1: Statistisch modelleren mlw stroom 2.1: Statistisch modelleren College 5: Regressie en correlatie (2) Rosner 11.5-11.8 Arnold Kester Capaciteitsgroep Methodologie en Statistiek Universiteit Maastricht Postbus 616, 6200 MD Maastricht

Nadere informatie

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Oefentoets 1 1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse. Conditie = experimenteel Conditie = controle Sekse = Vrouw 23 33 Sekse = Man 20 36 Van

Nadere informatie

HOOFDSTUK VII REGRESSIE ANALYSE

HOOFDSTUK VII REGRESSIE ANALYSE HOOFDSTUK VII REGRESSIE ANALYSE 1 DOEL VAN REGRESSIE ANALYSE De relatie te bestuderen tussen een response variabele en een verzameling verklarende variabelen 1. LINEAIRE REGRESSIE Veronderstel dat gegevens

Nadere informatie

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN Inleiding Statistische gevolgtrekkingen (statistical inference) gaan over het trekken van conclusies over een populatie op basis van steekproefdata.

Nadere informatie

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Ton Kuijpers, Epidemioloog

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Ton Kuijpers, Epidemioloog Evidence based richtlijnontwikkeling (EBRO) training voor patiënten Ton Kuijpers, Epidemioloog Guru based medicine Inhoud Voorbeeld van een wetenschappelijk onderzoeksdesign (RCT) Mate van bewijs Conclusies

Nadere informatie

Formulier voor het beoordelen van de kwaliteit van een artikel over een interventieonderzoek (bij voorkeur een RCT)

Formulier voor het beoordelen van de kwaliteit van een artikel over een interventieonderzoek (bij voorkeur een RCT) Formulier voor het beoordelen van de kwaliteit van een artikel over een interventieonderzoek (bij voorkeur een RCT) Behorend bij: Evidence-based logopedie, hoofdstuk 4 1 Toelichting bij de criteria voor

Nadere informatie

Hoofdstuk 10: Regressie

Hoofdstuk 10: Regressie Hoofdstuk 10: Regressie Inleiding In dit deel zal uitgelegd worden hoe we statistische berekeningen kunnen maken als sprake is van één kwantitatieve responsvariabele en één kwantitatieve verklarende variabele.

Nadere informatie

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009

EIND TOETS TOEGEPASTE BIOSTATISTIEK I. 30 januari 2009 EIND TOETS TOEGEPASTE BIOSTATISTIEK I 30 januari 2009 - Dit tentamen bestaat uit vier opgaven onderverdeeld in totaal 2 subvragen. - Geef bij het beantwoorden van de vragen een zo volledig mogelijk antwoord.

Nadere informatie

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Onderzoeksdesigns. Ellen Tromp, epidemioloog St Antonius ziekenhuis

Onderzoeksdesigns. Ellen Tromp, epidemioloog St Antonius ziekenhuis Onderzoeksdesigns Ellen Tromp, epidemioloog St Antonius ziekenhuis Inhoud Inleiding Wetenschappelijk bewijs Opdracht Verschillende onderzoekdesigns De drie componenten van evidence-based practice Wetenschappelijk

Nadere informatie

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses Vandaag Onderzoeksmethoden: Statistiek 3 Peter de Waal (gebaseerd op slides Peter de Waal, Marjan van den Akker) Departement Informatica Beta-faculteit, Universiteit Utrecht Recap Centrale limietstelling

Nadere informatie

Hoofdstuk 5 Een populatie: parametrische toetsen

Hoofdstuk 5 Een populatie: parametrische toetsen Hoofdstuk 5 Een populatie: parametrische toetsen 5.1 Gemiddelde, variantie, standaardafwijking: De variantie is als het ware de gemiddelde gekwadrateerde afwijking van het gemiddelde. Hoe groter de variantie

Nadere informatie

Hoofdstuk 3 Statistiek: het toetsen

Hoofdstuk 3 Statistiek: het toetsen Hoofdstuk 3 Statistiek: het toetsen 3.1 Schatten: Er moet een verbinding worden gelegd tussen de steekproefgrootheden en populatieparameters, willen we op basis van de een iets kunnen zeggen over de ander.

Nadere informatie

FORMULIER IV voor het beoordelen van een PATIËNT-CONTROLEONDERZOEK Versie oktober 2002, geldig t/m december 2005 Evidence-Based RichtlijnOntwikkeling Formulier IV: beoordeling patiënt-controleonderzoek

Nadere informatie

i ltj i i ;t!t i t' Jiil!!1 l1 I!--

i ltj i i ;t!t i t' Jiil!!1 l1 I!-- l ti aaaa I l 1 ~ ~~{~:~~ i' lji~~!"il~ il'l ~~~ i ltj i i ;t!t i t' Jiil!!1 l1 I!-- -I.. I 8 I i IJ I ~ i c ~ J'l f ~ ~!1.. 'I IJ 1 t I I h hl I I I " I t! fl 1 1 lc:c: IJ 11.:... I ~ i c I i tt( t I

Nadere informatie

STATISTIEK. Basiscursus Regelgeving en Organisatie Klinisch onderzoek. Dr. ir. Peter van de Ven Epidemiologie & Biostatistiek p.vandeven@vumc.

STATISTIEK. Basiscursus Regelgeving en Organisatie Klinisch onderzoek. Dr. ir. Peter van de Ven Epidemiologie & Biostatistiek p.vandeven@vumc. STATISTIEK Basiscursus Regelgeving en Organisatie Klinisch onderzoek Dr. ir. Peter van de Ven Epidemiologie & Biostatistiek p.vandeven@vumc.nl Slide 1 Inhoud Methodologie voor klinische studies Onderzoeksvraagstelling

Nadere informatie

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015

Cursus TEO: Theorie en Empirisch Onderzoek. Practicum 2: Herhaling BIS 11 februari 2015 Cursus TEO: Theorie en Empirisch Onderzoek Practicum 2: Herhaling BIS 11 februari 2015 Centrale tendentie Centrale tendentie wordt meestal afgemeten aan twee maten: Mediaan: de middelste waarneming, 50%

Nadere informatie

College 2 Enkelvoudige Lineaire Regressie

College 2 Enkelvoudige Lineaire Regressie College Enkelvoudige Lineaire Regressie - Leary: Hoofdstuk 7 tot p. 170 (Advanced Correlational Strategies) - MM&C: Hoofdstuk 10 (Inference for Regression) - Aanvullende tekst 3 Jolien Pas ECO 011-01 Correlatie:

Nadere informatie

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte

b) Het spreidingsdiagram ziet er als volgt uit (de getrokken lijn is de later uit te rekenen lineaire regressie-lijn): hoogte Classroom Exercises GEO2-4208 Opgave 7.1 a) Regressie-analyse dicteert hier geen stricte regels voor. Wanneer we echter naar causaliteit kijken (wat wordt door wat bepaald), dan is het duidelijk dat hoogte

Nadere informatie

Bij gebrek aan bewijs

Bij gebrek aan bewijs Bij gebrek aan bewijs kennis is macht! internet in de spreekkamer P.A. Flach Bedrijfsarts Arbo- en milieudienst RuG 09-10-2006 1 3 onderdelen 1. Wat is EBM 2. Zoeken in PubMed 3. Beoordelen van de resultaten

Nadere informatie

17/04/2013. 1. Epidemiologische studies. Children should not be treated as miniature men and women Abraham Jacobi

17/04/2013. 1. Epidemiologische studies. Children should not be treated as miniature men and women Abraham Jacobi Aanpak en interpretatie van een epidemiologische studie Aanpak en interpretatie van een epidemiologische studie Katia Verhamme, MD, PhD Epidemioloog OLV Ziekenhuis-Aalst Erasmus MC Rotterdam 20 april 2013

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen

Nadere informatie

Hoofdstuk 8 Het toetsen van nonparametrische variabelen

Hoofdstuk 8 Het toetsen van nonparametrische variabelen Hoofdstuk 8 Het toetsen van nonparametrische variabelen 8.1 Non-parametrische toetsen: deze toetsen zijn toetsen waarbij de aannamen van normaliteit en intervalniveau niet nodig zijn. De aannamen zijn

Nadere informatie

Hoofdstuk 12: Eenweg ANOVA

Hoofdstuk 12: Eenweg ANOVA Hoofdstuk 12: Eenweg ANOVA 12.1 Eenweg analyse van variantie Eenweg en tweeweg ANOVA Wanneer we verschillende populaties of behandelingen met elkaar vergelijken, dan zal er binnen de data altijd sprake

Nadere informatie

Oplossingen hoofdstuk XI

Oplossingen hoofdstuk XI Oplossingen hoofdstuk XI. Hierbij vind je de resultaten van het onderzoek naar de relatie tussen een leestest en een schoolrapport voor lezen. Deze gegevens hebben betrekking op een regressieanalyse bij

Nadere informatie

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling Kwantitatieve Data Analyse (KDA) Onderzoekspracticum Sessie 2 11 Aanpassingen takenboek! Check studienet om eventuele verbeteringen te downloaden! Huidige versie takenboek: 09 Gjalt-Jorn Peters gjp@ou.nl

Nadere informatie

1 Basisbegrippen, W / O voor waar/onwaar

1 Basisbegrippen, W / O voor waar/onwaar Naam - Toetsende Statistiek Rijksuniversiteit Groningen Lente Docent: John Nerbonne Tentamen di. 22 juni om 14 uur tentamenhal Belangrijke instructies 1. Schrijf uw naam & studentnummer hierboven, schrijf

Nadere informatie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen SPSS Introductiecursus Sanne Hoeks Mattie Lenzen Statistiek, waarom? Doel van het onderzoek om nieuwe feiten van de werkelijkheid vast te stellen door middel van systematisch onderzoek en empirische verzamelen

Nadere informatie

Data analyse Inleiding statistiek

Data analyse Inleiding statistiek Data analyse Inleiding statistiek 1 Terugblik - Inductieve statistiek Afleiden van eigenschappen van een populatie op basis van een beperkt aantal metingen (steekproef) Kennis gemaakt met kans & kansverdelingen»

Nadere informatie

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor

Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor Frequentiematen voor ziekte: Hoe vaak komt de ziekte voor 4 juni 2012 Het voorkomen van ziekte kan op drie manieren worden weergegeven: - Prevalentie - Cumulatieve incidentie - Incidentiedichtheid In de

Nadere informatie

College 3 Meervoudige Lineaire Regressie

College 3 Meervoudige Lineaire Regressie College 3 Meervoudige Lineaire Regressie - Leary: Hoofdstuk 8 p. 165-169 - MM&C: Hoofdstuk 11 - Aanvullende tekst 3 (alinea 2) Jolien Pas ECO 2012-2013 'Computerprogramma voorspelt Top 40-hits Bron: http://www.nu.nl/internet/2696133/computerprogramma-voorspelt-top-40-hits.html

Nadere informatie

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16 modulus strepen: uitkomst > 0 Hiermee rekenen we de testwaarde van t uit: n 10 ttest ( x ) 105 101 3,16 n-1 4 t test > t kritisch want 3,16 >,6, dus 105 valt buiten het BI. De cola bevat niet significant

Nadere informatie

Voorbeeldtentamen Statistiek voor Psychologie

Voorbeeldtentamen Statistiek voor Psychologie Voorbeeldtentamen Statistiek voor Psychologie 1) Vul de volgende uitspraak aan, zodat er een juiste bewering ontstaat: De verdeling van een variabele geeft een opsomming van de categorieën en geeft daarbij

Nadere informatie

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES 7.1 Het gemiddelde van een populatie Standaarddeviatie van de populatie en de steekproef In het vorige deel is bij de significantietoets uitgegaan

Nadere informatie

Kritisch lezen Hoe lees ik een artikel?

Kritisch lezen Hoe lees ik een artikel? Kritisch lezen Hoe lees ik een artikel? Prof. Dr. Lieve Peremans 2/5/15 Herhaling titel van presentatie 1 Evalueer kritisch de kwaliteit Heb ik nu een goed artikel? 1.Soorten onderzoeksdesigns 2.Regels

Nadere informatie

Populaties beschrijven met kansmodellen

Populaties beschrijven met kansmodellen Populaties beschrijven met kansmodellen Prof. dr. Herman Callaert Deze tekst probeert, met voorbeelden, inzicht te geven in de manier waarop je in de statistiek populaties bestudeert. Dat doe je met kansmodellen.

Nadere informatie

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018

Statistiek in de alfa en gamma studies. Aansluiting wiskunde VWO-WO 16 april 2018 Statistiek in de alfa en gamma studies Aansluiting wiskunde VWO-WO 16 april 2018 Wie ben ik? Marieke Westeneng Docent bij afdeling Methoden en Statistiek Faculteit Sociale Wetenschappen Universiteit Utrecht

Nadere informatie

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk:

Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 13. Factor ANOVA De theorie achter factor ANOVA (tussengroep) Bij factor ANOVA is er een tweede onafhankelijke variabele in de analyse bij gekomen. Er zijn drie soorten designs mogelijk: 1. Onafhankelijke

Nadere informatie

1. Reductie van error variantie en dus verhogen van power op F-test

1. Reductie van error variantie en dus verhogen van power op F-test Werkboek 2013-2014 ANCOVA Covariantie analyse bestaat uit regressieanalyse en variantieanalyse. Er wordt een afhankelijke variabele (intervalniveau) voorspeld uit meerdere onafhankelijke variabelen. De

Nadere informatie

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur

Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, uur Faculteit der Wiskunde en Informatica Tentamen Biostatistiek 1 voor BMT (2DM40) woensdag 2 november 2011, 9.00-12.00 uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine en van een onbeschreven

Nadere informatie

Inleiding in de toegepaste biostatistiek 4. Continue uitkomstvariabelen analyseren

Inleiding in de toegepaste biostatistiek 4. Continue uitkomstvariabelen analyseren Inleiding in de toegepaste biostatistiek 4. Continue uitkomstvariabelen analyseren Twee aspecten van het onderzoek spelen een rol bij het kwantificeren van onzekerheid, namelijk de grootte van de steekproef

Nadere informatie

Hoofdstuk 6 Twee populaties: parametrische toetsen

Hoofdstuk 6 Twee populaties: parametrische toetsen Hoofdstuk 6 Twee populaties: parametrische toetsen 6.1 De t-toets voor het verschil tussen twee gemiddelden: In veel onderzoekssituaties zijn we vooral in de verschillen tussen twee populaties geïnteresseerd.

Nadere informatie

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox

Inhoud. Data. Analyse van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox van tijd tot event data: van Edward Kaplan & Paul Meier tot David Cox Bram Ramaekers Bianca de Greef KEMTA Masterclass Inhoud Data Kaplan-Meier curve Hazard rate Log-rank test Hazard ratio Cox regressie

Nadere informatie

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R

Bij herhaalde metingen ANOVA komt het effect van het experiment naar voren bij de variantie binnen participanten. Bij de gewone ANOVA is dit de SS R 14. Herhaalde metingen Introductie Bij herhaalde metingen worden er bij verschillende condities in een experiment dezelfde proefpersonen gebruikt of waarbij dezelfde proefpersonen op verschillende momenten

Nadere informatie

10. Moderatie, mediatie en nog meer regressie

10. Moderatie, mediatie en nog meer regressie 10. Moderatie, mediatie en nog meer regressie Voordat je moderatie en mediatie analyses gaat uitvoeren in, kun je het best een extra dialog box installeren, PROCESS. Volg hiervoor de stappen op pagina

Nadere informatie

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets toetsende statistiek week 1: kansen en random variabelen week : de steekproevenverdeling week 3: schatten en toetsen: de z-toets week : het toetsen van gemiddelden: de t-toets week 5: het toetsen van varianties:

Nadere informatie

WORKSHOP WETENSCHAP DIE WERKT VOOR DE BEDRIJFSARTS SGBO EN NSPOH, BG-DAGEN, 31 MEI 2018

WORKSHOP WETENSCHAP DIE WERKT VOOR DE BEDRIJFSARTS SGBO EN NSPOH, BG-DAGEN, 31 MEI 2018 WORKSHOP WETENSCHAP DIE WERKT VOOR DE BEDRIJFSARTS SGBO EN NSPOH, BG-DAGEN, 31 MEI 2018 DOEL WORKSHOP Wetenschap die werkt voor de bedrijfsarts Meer enthousiasme voor onderzoek Handvatten bieden 1 e deel

Nadere informatie

11. Meerdere gemiddelden vergelijken, ANOVA

11. Meerdere gemiddelden vergelijken, ANOVA 11. Meerdere gemiddelden vergelijken, ANOVA Analyse van variantie (ANOVA) wordt gebruikt wanneer er situaties zijn waarbij er meer dan twee condities vergeleken worden. In dit hoofdstuk wordt de onafhankelijke

Nadere informatie

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1 1 Onderwerpen van de lessenserie: De Normale Verdeling Nul- en Alternatieve-hypothese ( - en -fout) Steekproeven Statistisch toetsen Grafisch

Nadere informatie

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen.

Herkansing Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 508 Dit is geen open boek tentamen. Herkansing Inleiding Intelligente Data Analyse Datum: 3-3-2003 Tijd: 14.00-17.00, BBL 508 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

TOETS OMB1 ONDERZOEKSMETHODOLOGIE I. december 2010

TOETS OMB1 ONDERZOEKSMETHODOLOGIE I. december 2010 TOETS OMB1 ONDERZOEKSMETHODOLOGIE I december 2010 Deze toets bestaat uit 23 vragen, waarvan 15 meerkeuzevragen (maximaal 15 punten) en 8 open vragen (maximaal 28 punten); In totaal zijn er dus 43 punten

Nadere informatie

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek

Hoofdstuk 19. Voorspellende analyse bij marktonderzoek Hoofdstuk 19 Voorspellende analyse bij marktonderzoek Voorspellen begrijpen Voorspelling: een uitspraak over wat er naar verwachting in de toekomst zal gebeuren op basis van ervaringen uit het verleden

Nadere informatie

20. Multilevel lineaire modellen

20. Multilevel lineaire modellen 20. Multilevel lineaire modellen Hiërarchische gegevens Veel fenomenen zijn ingebed in een bredere context. Variabelen kunnen dus ook hiërarchisch zijn, ingebed zijn in variabelen op hogere niveaus. Deze

Nadere informatie

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing

G0N11a Statistiek en data-analyse: project Eerste zittijd Modeloplossing G0N11a Statistiek en data-analyse: project Eerste zittijd 2007-2008 Modeloplossing Opmerking vooraf: Deze modeloplossing is een heel volledig antwoord op de gestelde vragen. Om de maximumscore op een vraag

Nadere informatie

Beschrijvende statistiek

Beschrijvende statistiek Beschrijvende statistiek Beschrijvende en toetsende statistiek Beschrijvend Samenvatting van gegevens in de steekproef van onderzochte personen (gemiddelde, de standaarddeviatie, tabel, grafiek) Toetsend

Nadere informatie

Systematische reviews op het gebied van complementaire en alternatieve geneeskunde: belang, methoden en voorbeelden uit de acupunctuur

Systematische reviews op het gebied van complementaire en alternatieve geneeskunde: belang, methoden en voorbeelden uit de acupunctuur Samenvatting Systematische reviews op het gebied van complementaire en alternatieve geneeskunde: belang, methoden en voorbeelden uit de acupunctuur Dit proefschrift heeft ten doel bij te dragen aan het

Nadere informatie

hercat B3.2 / Cursusafhankelijke toets

hercat B3.2 / Cursusafhankelijke toets A VUmc-compas Toetsing Toets hercat B3.2 / Cursusafhankelijke toets Cursus Professionele ontwikkeling en wetenschap: Alg.meth. collegejaar 2012-2013 Cursuscoördinator dr. A.L.M. de Vries Gelegenheid 2

Nadere informatie

Evidence piramide. Gecontroleerde studies. Welk studie type? 19/02/2013. 3 me ta.eu. Niet dezelfde piramide voor elke vraag. me ta.eu. me ta.

Evidence piramide. Gecontroleerde studies. Welk studie type? 19/02/2013. 3 me ta.eu. Niet dezelfde piramide voor elke vraag. me ta.eu. me ta. Niet dezelfde piramide voor elke vraag Evidence piramide Gecontroleerde studies Welk studie type? 3 1 Effect van roken op longkaner Richard Doll 1951: prospectieve studie 2/3 mannelijke Britse artsen Goede

Nadere informatie

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding.

Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Het gebruik van Excel 2007 voor statistische analyses. Een beknopte handleiding. Bij Excel denken de meesten niet direct aan een statistisch programma. Toch biedt Excel veel mogelijkheden tot statistische

Nadere informatie

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Masterclass: advanced statistics. Bianca de Greef Sander van Kuijk Afdeling KEMTA Masterclass: advanced statistics Bianca de Greef Sander van Kuijk Afdeling KEMTA Inhoud Masterclass Deel 1 (theorie): Achtergrond regressie Deel 2 (voorbeeld): Keuzes Output Model Model Dependent variable

Nadere informatie

College 6 Eenweg Variantie-Analyse

College 6 Eenweg Variantie-Analyse College 6 Eenweg Variantie-Analyse - Leary: Hoofdstuk 11, 1 (t/m p. 55) - MM&C: Hoofdstuk 1 (t/m p. 617), p. 63 t/m p. 66 - Aanvullende tekst 6, 7 en 8 Jolien Pas ECO 01-013 Het Experiment: een voorbeeld

Nadere informatie

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013

Deel 1: Voorbeeld van beschrijvende analyses in een onderzoeksrapport. Beschrijving van het rookgedrag in Vlaanderen anno 2013 7.2.4 Voorbeeld van een kwantitatieve analyse (fictief voorbeeld) In onderstaand voorbeeld werken we met fictieve data. Doel van dit voorbeeld is dat je inzicht krijgt in hoe een onderzoeksrapport van

Nadere informatie

Biostatistiek en epidemiologie (4sp)

Biostatistiek en epidemiologie (4sp) Biostatistiek en epidemiologie (4sp) ECTS-fiche 13/1/2017 Statistiek 1. voorbeeldvraag van Statistiek over randomisatie a. 1:1 verdeling is meestal beste voor vergelijken b. 2:1 randomisatie is een vereiste

Nadere informatie

Wiskunde B - Tentamen 2

Wiskunde B - Tentamen 2 Wiskunde B - Tentamen Tentamen van Wiskunde B voor CiT (57) Donderdag 4 april 005 van 900 tot 00 uur Dit tentamen bestaat uit 8 opgaven, 3 tabellen en formulebladen Vermeld ook je studentnummer op je werk

Nadere informatie

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden

toetsende statistiek deze week: wat hebben we al geleerd? Frank Busing, Universiteit Leiden toetsende statistiek week 1: kansen en random variabelen week 2: de steekproevenverdeling week 3: schatten en toetsen: de z-toets week 4: het toetsen van gemiddelden: de t-toets Moore, McCabe, and Craig.

Nadere informatie

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN

INLEIDING EEN OVERZICHT VAN CORRECTIEMETHODEN INLEIDING Als je geïnteresseerd bent in de vraag welke van twee behandelingen of geneesmiddelen het beste werkt, zijn er grofweg twee manieren om dat te onderzoeken: experimenteel en observationeel. Bij

Nadere informatie

Statistiek ( ) eindtentamen

Statistiek ( ) eindtentamen Statistiek (200300427) eindtentamen studiejaar 2010-11, blok 4; Taalwetenschap, Universiteit Utrecht. woensdag 29 juni 2011, 17:15-19:00u, Educatorium, zaal Gamma. Schrijf je naam en student-nummer op

Nadere informatie

2016_1. Studie design - Patiënt-controle of cohort: wanneer doe ik wat, hoe kies ik en waar moet ik aan denken

2016_1. Studie design - Patiënt-controle of cohort: wanneer doe ik wat, hoe kies ik en waar moet ik aan denken Tele-ARENA (Telefonisch Aangenaam Refereren En Netwerken AMPHI) 2016_1. Studie design - Patiënt-controle of cohort: wanneer doe ik wat, hoe kies ik en waar moet ik aan denken Host: Ellen van Jaarsveld

Nadere informatie

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i

Formuleblad. Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Formuleblad Hoofdstuk 1: Gemiddelde berekenen: = x 1 + x 2 + x 3 + +x n / n Of: = 1/n Σ x i Plaats van de median berekenen: Oneven aantal observaties: (n+1)/2 Even aantal observaties: gemiddelde van de

Nadere informatie

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Meervoudige ANOVA Onderzoeksvraag Voorwaarden Er is onderzoek gedaan naar rouw na het overlijden van een huisdier (contactpersoon: Karolijne van der Houwen (Klinische Psychologie)). Mensen konden op internet een vragenlijst invullen. Daarin werd gevraagd

Nadere informatie

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages. MARGES EN SIGNIFICANTIE BIJ STEEKPROEFRESULTATEN. De marges van percentages Metingen via een steekproef leveren een schatting van de werkelijkheid. Het toevalskarakter van de steekproef heeft als consequentie,

Nadere informatie

SPSS. Statistiek : SPSS

SPSS. Statistiek : SPSS SPSS - hoofdstuk 1 : 1.4. fase 4 : verrichten van metingen en / of verzamelen van gegevens Gegevens gevonden bij een onderzoek worden systematisch weergegeven in een datamatrix bij SPSS De datamatrix Gebruik

Nadere informatie

Oefenvragen bij Statistics for Business and Economics van Newbold

Oefenvragen bij Statistics for Business and Economics van Newbold Oefenvragen bij Statistics for Business and Economics van Newbold Hoofdstuk 1 1. Wat is het verschil tussen populatie en sample? De populatie is de complete set van items waar de onderzoeker in geïnteresseerd

Nadere informatie

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016:

Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: Toets deel 2 Data-analyse en retrieval Vrijdag 1 Juli 2016: 11.00-13.00 Algemene aanwijzingen 1. Het is toegestaan een aan beide zijden beschreven A4 met aantekeningen te raadplegen. 2. Het is toegestaan

Nadere informatie

FYSIOTHERAPIE en het behandelen van patiënten met SCHOUDERKLACHTEN. Januari 2014, blok 3, Gerard Koel.

FYSIOTHERAPIE en het behandelen van patiënten met SCHOUDERKLACHTEN. Januari 2014, blok 3, Gerard Koel. FYSIOTHERAPIE en het behandelen van patiënten met SCHOUDERKLACHTEN. Januari 2014, blok 3, Gerard Koel. INHOUD : 1. Enige statistische begrippen omtrent studies naar diagnostische middelen. 2. Diagnostische

Nadere informatie

Samenvatting Nederlands

Samenvatting Nederlands Samenvatting Nederlands 178 Samenvatting Mis het niet! Incomplete data kan waardevolle informatie bevatten In epidemiologisch onderzoek wordt veel gebruik gemaakt van vragenlijsten om data te verzamelen.

Nadere informatie

Examen Statistiek II: Project

Examen Statistiek II: Project Examen Statistiek II: Project S. Vansteelandt Academiejaar 2014-2015 U krijgt 2 uur 30 minuten voor het examen, inclusief het mondelinge examen dat maximaal 15 min duurt. Het examen is relatief lang omdat,

Nadere informatie

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2

Methoden van Onderzoek en Statistiek, Deeltentamen 2, 29 maart 2012 Versie 2 Vraag 1. Voor welk van de onderstaande variabelen zal een placebo effect waarschijnlijk het grootst zijn? 1. Haarlengte. 2. Lichaamstemperatuur. 3. Mate van tevredenheid met de behandeling. 4. Hemoglobinegehalte

Nadere informatie

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur.

TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica. Tentamen Statistiek 2 voor TeMa (2S195) op vrijdag , 9-12 uur. TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Statistiek 2 voor TeMa (2S95) op vrijdag 29-04-2004, 9-2 uur. Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

MISSING DATA van gatenkaas naar valide uitkomsten

MISSING DATA van gatenkaas naar valide uitkomsten MISSING DATA van gatenkaas naar valide uitkomsten Sander M.J. van Kuijk Afdeling Klinische Epidemiologie en Medical Technology Assessment sander.van.kuijk@mumc.nl Inhoud Masterclass Theorie over missing

Nadere informatie

Examen G0N34 Statistiek

Examen G0N34 Statistiek Naam: Richting: Examen G0N34 Statistiek 8 september 2010 Enkele richtlijnen : Wie de vragen aanneemt en bekijkt, moet minstens 1 uur blijven zitten. Je mag gebruik maken van een rekenmachine, het formularium

Nadere informatie

Systematic Reviews Dr. Hester Vermeulen

Systematic Reviews Dr. Hester Vermeulen Systematic Reviews Dr. Hester Vermeulen Amsterdam School of Health Professionals / HvA Amsterdam Kwaliteit en Proces Innovatie / AMC Amsterdam Systematisch literatuur onderzoek RCT s worden gemaakt om

Nadere informatie

Voorbeeld regressie-analyse

Voorbeeld regressie-analyse Voorbeeld regressie-analyse In dit voorbeeld wordt gebruik gemaakt van het SPSS data-bestand vb_regr.sav (dit bestand kan gedownload worden via de on-line helpdesk). We schatten een model waarin de afhankelijke

Nadere informatie

Samenvatting. geweest als de gemaakte keuzes, namelijk opereren. Het model had daarom voor deze patiënten weinig toegevoegde waarde.

Samenvatting. geweest als de gemaakte keuzes, namelijk opereren. Het model had daarom voor deze patiënten weinig toegevoegde waarde. Klinische predictiemodellen combineren patiëntgegevens om de kans te voorspellen dat een ziekte aanwezig is (diagnose) of dat een bepaalde ziekte status zich zal voordoen (prognose). De voorspelde kans

Nadere informatie

Verschillendedesigns beantwoorden verschillende vragen

Verschillendedesigns beantwoorden verschillende vragen Verschillendedesigns beantwoorden verschillende vragen Zelf echo s uitvoeren bij IVF Hoe betrouwbaar zijn de beelden? Hoe vaak worden vrouwen zwanger? Hoe voelende koppelszicherbij? Watkosthet? 1 Hoe betrouwbaar

Nadere informatie

FORMULIER III. voor het beoordelen van een COHORTONDERZOEK. Evidence-Based RichtlijnOntwikkeling

FORMULIER III. voor het beoordelen van een COHORTONDERZOEK. Evidence-Based RichtlijnOntwikkeling FORMULIER III voor het beoordelen van een COHORTONDERZOEK Evidence-Based RichtlijnOntwikkeling Formulier III: beoordeling cohortonderzoek Dit formulier is bestemd voor het beoordelen van cohortonderzoek.

Nadere informatie

VOOR HET SECUNDAIR ONDERWIJS

VOOR HET SECUNDAIR ONDERWIJS VOOR HET SECUNDAIR ONDERWIJS Steekproefmodellen en normaal verdeelde steekproefgrootheden 5. Werktekst voor de leerling Prof. dr. Herman Callaert Hans Bekaert Cecile Goethals Lies Provoost Marc Vancaudenberg

Nadere informatie

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen. Tentamen Inleiding Intelligente Data Analyse Datum: 19-12-2002 Tijd: 9.00-12.00, BBL 420 Dit is geen open boek tentamen. Algemene aanwijzingen 1. U mag ten hoogste één A4 met aantekeningen raadplegen.

Nadere informatie

Opgave 1: (zowel 2DM40 als 2S390)

Opgave 1: (zowel 2DM40 als 2S390) TECHNISCHE UNIVERSITEIT EINDHOVEN Faculteit Wiskunde en Informatica Tentamen Biostatistiek voor BMT (DM4 en S39) op donderdag, 4.-7. uur Bij het tentamen mag gebruik worden gemaakt van een zakrekenmachine

Nadere informatie

De zin en onzin van sample size berekeningen. Jos Twisk

De zin en onzin van sample size berekeningen. Jos Twisk De zin en onzin van sample size berekeningen Jos Twisk Sample size berekeningen Nodig voor subsidiegevers Nodig voor medisch etische commissies Nodig in verband met consort statement Sample size berekening

Nadere informatie