De zin en onzin van sample size berekeningen. Jos Twisk

Vergelijkbare documenten
Bijlage Figuren en formules voor de stof van Professionele Ontwikkeling en Wetenschap, 13-14

Data analyse Inleiding statistiek

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Ton Kuijpers, Epidemioloog

Toetsende Statistiek Week 5. De F-toets & Onderscheidend Vermogen

Aanpassingen takenboek! Statistische toetsen. Deze persoon in een verdeling. Iedereen in een verdeling

9. Lineaire Regressie en Correlatie

werkcollege 6 - D&P10: Hypothesis testing using a single sample

werkcollege 7 - D&P10: Hypothesis testing using a single sample

STATISTIEK. Basiscursus Regelgeving en Organisatie Klinisch onderzoek. Dr. ir. Peter van de Ven Epidemiologie & Biostatistiek p.vandeven@vumc.

Beschrijvende statistiek

toetskeuze schema verschillen in gemiddelden

OUDERE WERKNEMERS. Inhoudsopgave

HOOFDSTUK IV TOETSEN VAN STATISTISCHE HYPOTHESEN

Statistiek voor A.I. College 14. Dinsdag 30 Oktober

Hoofdstuk 3 Statistiek: het toetsen

Pieter Bolderman Albert Schweitzer ziekenhuis MGPT Intern begeleider Maarten Gijssel

Hoofdstuk 5 Een populatie: parametrische toetsen

Literatuuronderzoek. Systematische Review Meta-Analyse. KEMTA Andrea Peeters

Statistiek ( ) eindtentamen

Voorbeeldtentamen Statistiek voor Psychologie

SPSS Introductiecursus. Sanne Hoeks Mattie Lenzen

werkcollege 6 - D&P9: Estimation Using a Single Sample

introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets introductie Wilcoxon s rank sum toets Wilcoxon s signed rank toets

Vandaag. Onderzoeksmethoden: Statistiek 3. Recap 2. Recap 1. Recap Centrale limietstelling T-verdeling Toetsen van hypotheses

Theorie en Empirisch Onderzoek. Werkcollege 4.3 Experimenteel onderzoek Rijken & Merz. 2014

Berekenen en gebruik van Cohen s d Cohen s d is een veelgebruikte manier om de effectgrootte te berekenen en wordt

WERKT DE WEBCARE INTERVENTIE?

Onderzoeksdesigns. Ellen Tromp, epidemioloog St Antonius ziekenhuis

Systematische reviews op het gebied van complementaire en alternatieve geneeskunde: belang, methoden en voorbeelden uit de acupunctuur

Effectieve zorg bestaat uit effectieve methodieken, maar hoe effectief is effectief? Jan Willem Veerman Ede, 28 september 2005

Formulier voor het beoordelen van de kwaliteit van een artikel over een interventieonderzoek (bij voorkeur een RCT)

Tentamen Inleiding Intelligente Data Analyse Datum: Tijd: , BBL 420 Dit is geen open boek tentamen.

11. Multipele Regressie en Correlatie

Nederlandse samenvatting

Algemene methodologie (onderdeel van CAT)

Hoofdstuk 8: Het Toetsen van Hypothesen (Extra Oefeningen)

Oefenvragen bij Statistics for Business and Economics van Newbold

Masterclass: statistical analysis 101. Bianca de Greef Sander van Kuijk Afdeling KEMTA

Evidence-based werken in de verzekeringsgeneeskunde. Muntendam symposium Amsterdam,

Data analyse Inleiding statistiek

Bij gebrek aan bewijs

c Voorbeeldvragen, Methoden & Technieken, Universiteit Leiden TS: versie 1 1 van 6

Meervoudige ANOVA Onderzoeksvraag Voorwaarden

Formulier voor het beoordelen van de kwaliteit van een systematische review. Behorend bij: Evidence-based logopedie, hoofdstuk 2

Evidence Based Practise versus Practice Based Evidence

1. Reductie van error variantie en dus verhogen van power op F-test

Data analyse Inleiding statistiek

10. Moderatie, mediatie en nog meer regressie

IBOM-2. Het effect van Medicatiereview en begeleiding van patiënten na verblijf in het ziekenhuis

Waarom studies voortijdig stoppen. Job van der Palen METC Twente

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Margriet Moret - Hartman, methodoloog

Ene variabele. Nonparametrische toetsen. Kolmogorov-Smirnov. Kolmogorov-Smirnov. Andere variabele. Onderzoekspracticum.

Antwoordvel Versie A

Figuur 1: Voorbeelden van 95%-betrouwbaarheidsmarges van gemeten percentages.

Lessen in kwantitatief onderzoek. Ruud Hoevenagel Leids OnderzoeksKollectief

Kansverdelingen Inductieve statistiek met Geogebra 4.2

Studie type Populatie Patiënten kenmerken Interventie Controle Dataverzameling

College 6: Responsiecollege (wijzigingen in rood) Cursus Bachelor Project 2 B&O College 6 Harry B.G. Ganzeboom

De praktijk van deferred consent bij spoedeisend onderzoek

Evidence Based Practice

Toetsende Statistiek, Week 2. Van Steekproef naar Populatie: De Steekproevenverdeling

Hiermee rekenen we de testwaarde van t uit: n. 10 ( x ) ,16

LECTORAAT ZORG & INNOVATIE IN PSYCHIATRIE. Risicofactoren, leefstijl en de mondzorg bij jong volwassenen na vroege psychose

Kansrekening en Statistiek

Toetsende Statistiek Week 3. Statistische Betrouwbaarheid & Significantie Toetsing

Kansrekening en Statistiek

Hoofdstuk 10: Regressie

Voorwoord 1 0. Inleiding 1 1

Cover Page. The handle holds various files of this Leiden University dissertation.

Hoe schrijf ik een onderzoeksprotocol?

1. Inleiding. 2. De analyses. 2.1 Afspraken over kinderopvang versus m/v-verdeling

introductie populatie- steekproef- steekproevenverdeling pauze parameters aannames ten slotte

Toegepaste data-analyse: oefensessie 2

Hoofdstuk 5: Steekproevendistributies

Examen G0N34 Statistiek

1. De volgende gemiddelden zijn gevonden in een experiment met de factor Conditie en de factor Sekse.

HOOFDSTUK 7: STATISTISCHE GEVOLGTREKKINGEN VOOR DISTRIBUTIES

TECHNISCHE UNIVERSITEIT EINDHOVEN

De beantwoordbare vraag (PICO)

Hoofdstuk 7: Statistische gevolgtrekkingen voor distributies

Protocoladherentie van ambulancezorgverleners

Hoeveel vertrouwen heb ik in mijn onderzoek en conclusie? Les 1

Enkelvoudige ANOVA Onderzoeksvraag Voorwaarden

Substantial Clinical Important Benefit van de CMS en SST!! Toepassing van schoudervragenlijsten bij patiënten van het Schoudernetwerk Twente

Bijlage bij Meesterlijk gedrag. Leren van compareren., Rechtstreeks 2009/3

Executief Functioneren en Agressie. bij Forensisch Psychiatrische Patiënten in PPC Den Haag. Executive Functioning and Aggression

Acetylcysteine bij ouderen met COPD. Reduceert acetylsteine exacerbaties?

Uitwerkingen voortoets/oefentoets E3 maart/april 2009 MLN

Hoofdvraag. Hoe kan interne en externe data gebruikt worden voor ziektepreventie bij klanten van DFZ?

Onderzoek 1 ANP opleiding 2011

Toetsen van hypothesen

Hierbij is het steekproefgemiddelde x_gemiddeld= en de steekproefstandaardafwijking

Les 5: ANOVA. Elke Debrie 1 Statistiek 2 e Bachelor in de Biochemie en Biotechnologie. 28 november 2018

Correlatie = statistische samenhang Meest gebruikt = Spearman s rang correlatie Ordinaal geschaalde variabelen -1 <= r s <= +1 waarbij:

Cursus Statistiek 2. Fellowonderwijs Opleiding Intensive Care. UMC St Radboud, Nijmegen

HET LIPIDENSPECTRUM VAN PATIËNTEN

Leidraad beoordelingen behandelingen tot verzekerde pakket door Kenniscentrum GGZ van Zorgverzekeraars Nederland

Evidence Based Practice in de alledaagse praktijk. Definitie EBP

Tabellenboek bij factsheet panel Psychisch Gezien: Werk, eenzaamheid en stigma. Caroline Place Lex Hulsbosch Harry Michon

Transcriptie:

De zin en onzin van sample size berekeningen Jos Twisk

Sample size berekeningen Nodig voor subsidiegevers Nodig voor medisch etische commissies Nodig in verband met consort statement

Sample size berekening Te verwachten effect (klinisch relevant effect) Standaard deviatie van de uitkomstvariabele Power en significantie

Voor continue variabelen N = ( Z ( 1 α / 2) + Z ( 1 β )) v 2 r 2 σ 2 ( +1r N = steekproefgrootte Z (1-α/2) = (1- α/2) percentiel van standaard normale verdeling Z (1-β) = (1- β) percentiel van standaard normale verdeling Σ = standaard deviatie van de uitkomst variabele r = verhouding tussen de aantallen in de groepen v = verschil tussen de groepen

Voorbeeld Experimenteel onderzoek naar de werking van een nieuwe medicatie ter verlaging van de bloeddruk

Voorbeeld α = 5% power = 90% SD = 15 klinisch relevant verschil = 3 N 1 = N 2 = 10.51 * (15) 2 * 2 / (3) 2 = 526

Voorbeeld α = 5% power = 80% SD = 15 klinisch relevant verschil = 3 N 1 = N 2 = 7.85 * (15) 2 * 2 / (3) 2 = 393

Voorbeeld α = 5% power = 80% SD = 15 klinisch relevant verschil = 5 N 1 = N 2 = 7.85 * (15) 2 * 2 / (5) 2 = 141

Voorbeeld α = 5% power = 80% SD = 10 klinisch relevant verschil = 5 N 1 = N 2 = 7.85 * (10) 2 * 2 / (5) 2 = 62

Conclusie Door een paar kleine (realistische) aanpassingen van de sample size berekening kan de benodigde sample size sterk variëren! 526 62 in iedere groep

Dichotome uitkomsten Minder mogelijkheden Standaard deviatie direct afhankelijk van het klinisch relevante effect

Voor dichotome variabelen N 1 = N 2 (Z = ( ) +Z ( ) ( )) p 1 p 1 α /2 1 β ( p p ) 1 2 2 2 2

Voorbeeld Experimenteel onderzoek naar de werking van een nieuwe interventie voor patiënten met lage rugklachten Uitkomstvariabele: Herstel

Voorbeeld α = 5% power = 90% p 0 = 20% klinisch relevant verschil = 10% N 1 = N 2 = 10.51*0.25*0.75*2 / (0.10) 2 = 394

Voorbeeld α = 5% power = 80% p 0 = 20% klinisch relevant verschil = 10% N 1 = N 2 = 7.85*0.25*0.75*2 / (0.10) 2 = 294

Voorbeeld α = 5% power = 80% p 0 = 20% klinisch relevant verschil = 15% N 1 = N 2 = 7.85*0.275*0.725*2 / (0.15) 2 = 139

Hoe gaat het nu in de praktijk?

Stel: we doen een mooie sample size berekening en het blijkt dat we 80 patiënten nodig hebben. Nu blijkt dat we maar maximaal 60 patiënten in iedere groep kunnen includeren. Wat te doen? Onderzoek niet uitvoeren

Evidence based medicine Beleid gebasseerd op de resultaten van 1 RCT?

Evidence based medicine Meta analyses Vergroting sample size Ook kleine onderzoeken kunnen een wezenlijke bijdrage leveren

Stel: we doen een mooie sample size berekening en het blijkt dat we 80 patiënten nodig hebben. Nu blijkt dat we zonder problemen 200 patiënten in iedere groep kunnen includeren. Wat te doen? Onderzoek uitvoeren bij maar 80 mensen?

1 uitkomst uit de sample size berekening: Zo groot mogelijk!

Sample size berekeningen hechten te veel belang aan significantie en power Sample size berekeningen zijn te veel afhankelijk van aanames en schattingen Kleinschalig onderzoek nauwelijks mogelijk

Andere overwegingen zouden de grootte van de onderzoekspopulatie moeten bepalen

Overwegingen Logistieke overwegingen Financiële overwegingen Ethische overwegingen

Sample size berekeningen zijn heel erg gerelateerd aan de toetsingstheorie Wat is eigenlijk het belang van de toetsingstheorie?

Moeten we wel uitspraken doen of een bepaald resultaat significant is of niet?

Significantie is afhankelijk van sample size Number of obs = 50 --------------------------------------------------------------------------- Weight Coef. Std. Err. t P> t [95% Conf. Interval] -------------+------------------------------------------------------------- intervention -5.722 3.103-1.844 0.072-11.804 0.360 _cons 94.238 4.906 19.210 0.000 84.526 103.960 ---------------------------------------------------------------------------

Number of obs = 50 --------------------------------------------------------------------------- Weight Coef. Std. Err. t P> t [95% Conf. Interval] -------------+------------------------------------------------------------- intervention -5.722 3.103-1.844 0.072-11.804 0.360 _cons 94.238 4.906 19.210 0.000 84.526 103.960 --------------------------------------------------------------------------- Number of obs = 60 ----------------------------------------------------------------------------- Weight Coef. Std. Err. t P> t [95% Conf. Interval] -------------+--------------------------------------------------------------- intervention -5.722 2.822-2.027 0.047-11.253-0.191 _cons 94.238 4.462 21.120 0.000 85.492 102.984 -----------------------------------------------------------------------------

Moeten we wel uitspraken doen of een bepaald resultaat significant is of niet? Nee!

Waarom nee? Significantie zegt niets over het belang van het gevonden effect Significantie is heel erg afhankelijk van de grootte van de onderzoekspopulatie Significantie wordt door bijna iedereen verkeerd geïnterpreteerd!

Significantie belangrijk. Psychologie Geneeskunde (Farmaceutische) industrie Reviewers

Significantie belangrijk. Het is makkelijk

Conclusie Sample size berekeningen zijn eigenlijk onzinnig. Statistisch toetsen is (binnen ons vakgebied) eigenlijk onzinnig.