Inhoudsopgave. Hoofdstuk 1 Zoekstrategie blz 4 tm 6. Hoofdstuk 2: Criterialijsten blz 7tm 10. Hoofdstuk 3 Resultaten blz 11 tm 25

Vergelijkbare documenten

FYSIOTHERAPIE en het behandelen van patiënten met SCHOUDERKLACHTEN. Januari 2015, blok 3, Gerard Koel.

FYSIOTHERAPIE en het behandelen van patiënten met SCHOUDERKLACHTEN. Januari 2014, blok 3, Gerard Koel.

Formulier voor het beoordelen van de kwaliteit van een systematische review. Behorend bij: Evidence-based logopedie, hoofdstuk 2

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument.

Kennis Quiz. SNN congres 2015

De 7 stappen van een CAT

DIAGNOSTIEK. Shandra Bipat, klinisch epidemioloog Afd. Radiologie Academisch Medisch Centrum

De Knie. diagnostische testen. Mark Vongehr Fysiotherapeut/manueeltherapeut. presentatie knie medisch centrum aarveld

CHAPTER 8. Samenvatting

Literatuuronderzoek. Systematische Review Meta-Analyse. KEMTA Andrea Peeters

DIAGNOSTIEK. Hans Reitsma, arts-epidemioloog Afd. Klinische Epidemiologie, Biostatistiek & Bioinformatica Academisch Medisch Centrum

Echografie in de schouderdiagnostiek.

VAN KLINISCHE ONZEKERHEID NAAR EEN ZOEKSTRATEGIE

- Geplaatst in VISUS EBM IN DE OPTOMETRIE: HOE PAS JE HET TOE?

Bijlage 1 Omschrijving van de provocatietesten: Knieregio

De knie van diagnostiek naar behandeling

EBM. Domein arts. Overwegingen bij domein arts

Formulier voor het beoordelen van de kwaliteit van een artikel over een interventieonderzoek (bij voorkeur een RCT)

Observationeel onderzoek Patiënt-controleonderzoek Cohortonderzoek Cross-sectioneel Systematisch review

SCHOUDER PROTHESIOLOGIE

Systematic Reviews Dr. Hester Vermeulen

DIAGNOSTICEREN VAN KNIE KLACHTEN; EEN EVIDENCE BASED OVERZICHT

FORMULIER I. voor het beoordelen van een artikel over de waarde van een DIAGNOSTISCHE TEST. Evidence-Based RichtlijnOntwikkeling

hoofdstuk 3 Hoofdstuk 4 Hoofdstuk 5

Critical Appraisal of a Topic De 7 stappen van de CAT Bachelor geneeskunde 3de jaar AWV

Comparison: Kinderen zonder deze risicofactor.

Systematic Reviews Dr. Hester Vermeulen

Evidence based richtlijnontwikkeling (EBRO) training voor patiënten. Ton Kuijpers, Epidemioloog

CRITICALLY APPRAISED TOPIC

De meest waardevolle. van klinische schoudertesten. Een literatuuroverzicht. Literatuuroverzicht

Bij gebrek aan bewijs

t AC: wat doe je ermee? Marieke Struijk-Mulder orthopedisch chirurg

Eerste bijeenkomst 2014 van het Schouder Netwerk Twente. 3 Juni 2014, Saxion Hogeschool Enschede.

Inhoud. inleiding de schouder 1 9. Redactie 1 0. Auteurs 1 1. Voorwoord 1 6

Dirk Ubbink. Evidence Based Surgery Workshop 2010

Substantial Clinical Important Benefit van de CMS en SST!! Toepassing van schoudervragenlijsten bij patiënten van het Schoudernetwerk Twente

Impingement Protocol

Inhoud. Voorwoord prof. dr. P.H. Dejonckere bij de eerste druk 10. Woord vooraf bij de tweede, geheel herziene druk 12

Wetenschappelijke vorming in de huisartsopleiding

Systematische reviews op het gebied van complementaire en alternatieve geneeskunde: belang, methoden en voorbeelden uit de acupunctuur

De beantwoordbare vraag (PICO)

Samenvatting. Samenvatting

Schouderinstabiliteit

De postoperatieve stijve schouder. Toegevoegde waarde van het Deventer Schoudernetwerk. Rinco Koorevaar. Orthopedisch chirurg Deventer Ziekenhuis

Voorwoord 1 0. Inleiding 1 1

Cervicale wervelkolom vs. schouderklachten. Dr. T. De Vroey Fysische geneeskunde en revalidatie 20 oktober 2018

Samenvatting Beloop van beperkingen in activiteiten bij oudere patiënten met artrose van heup of knie

Evidence Based Practice in de alledaagse praktijk. Definitie EBP

Hardell: mobiel bellen en hersentumoren aan de belzijde

SYSTEMATISCHE REVIEW VAN DIAGNOSTISCH ONDERZOEK

Nederlandse samenvatting

NEDERLANDSE SAMENVATTING

Andere kijk op validiteit

Evidence Based Practice

behandeling volgens de KNGF-richtlijn bij mensen met artrose aan de heup en/of knie.

POSTKLINISCH FYSIOTHERAPEUTISCH REVALIDATIE PROTOCOL NA ARTHROSCOPISCH HECHTEN SLAP-LAESIE SCHOUDER

Leeswijzer evidence summaries logopedische behandeling

Hoofdstuk 2 beschrijft een systematisch literatuuroverzicht waarin studies worden samengevat die de effectiviteit, op bewegingsuitslag, hebben

Samenvatting. Effectiviteit van ergotherapie: stand van zaken

Schouderpathologie voorde huisarts

SUMMARY. Samenvatting

De waarde van echografisch diagnostisch onderzoek. Marc Weyts, huisarts-echografist April 2018

Inleiding Methodologie Master MBRT Hogeschool INHOLLAND 27 november Prof.dr. Rob A.B. Oostendorp

CRITICAL APPRAISED TOPIC Schouderluxatie. Merel Trijzelaar Onderwijsdag 6 mei 2014

Classificeren en meten. Overzicht van de officiële definities van de meter sinds Raymond Ostelo, PhD. Klinimetrie

Samenvatting 21580_rietdijk F.indd :09

Opvolgrapport Aanbeveling voor goede medische praktijkvoering actieve opsporing van chlamydia trachomatis-infecties in de huisartspraktijk

Vroeginterventie via het internet voor depressie en angst

Nederlandse samenvatting

Samenvatting Samenvatting

Formulier Beoordeling Critical Appraisal of a Topic (CAT)

Cover Page. The handle holds various files of this Leiden University dissertation

Fysiotherapie Klinimetrie. Klinimetrie, klinisch redeneren en verslagleggen. klinisch redeneren met behulp van klinimetrie

Cover Page. The handle holds various files of this Leiden University dissertation.

Hoofdstuk 1: introductie van het proefschrift

SNT KLINISCHE TESTS. Dia 1 / 64

Les cinq mots (5W) Meetinstrument Les cinq mots Afkorting. Beoordeling van de cognitieve functies

hoofdstuk 2 hoofdstuk 3

Summery. Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers

WAARDE VAN DE PSA-BEPALING EN HET RECTAAL TOUCHER

Conclusies Orthopedie

Onderwijsmateriaal voor toetsgroepen

Schouder instabiliteit

Handleiding Critically Appraised Topic (CAT) OLVG

DE PATHOLOGISCH SCHOUDER ZIEN WE DE BOMEN NOG DOOR HET BOS? TOM CLAES

Overzicht. Help! Statistiek! Stelling van Bayes. Hoe goed is leverscan ( test T ) voor het diagnostiseren van leverpathologie ( ziekte Z )?

DIRECTE TOEGANKELIJKHEID MANUELE THERAPIE VANUIT WETENSCHAPPELIJK PERSPECTIEF

Factsheet Manuele therapie en therapeutische mogelijkheden bij zuigelingen (0-1 jaar)

Diagnostic accuracy of FEV 1 /FEV 6 -based microspirometry to assess airflow obstruction in primary care. A systematic literature review

Prof. dr. M.W. van Tulder Prof. dr. B.W. Koes. Evidence-based handelen bij lage rugpijn

MINDFULNESS EN ACT INTERVENTIES ALS E-HEALTH: EEN META-ANALYSE

Beoordelingsformulier MW Literatuurstudie

Hoofdstuk 1 Hoofdstuk 2

Addendum. Nederlandse Samenvatting

Samenvatting. Duizeligheid bij ouderen in de huisartsenpraktijk: een diagnostische uitdaging

Nederlandse samenvatting

Samenvatting. Doelstelling:

Transcriptie:

Inhoudsopgave Voorwoord blz 2 Inleiding blz 3 Hoofdstuk 1 Zoekstrategie blz 4 tm 6 Hoofdstuk 2: Criterialijsten blz 7tm 10 Hoofdstuk 3 Resultaten blz 11 tm 25 Hoofdstuk 4 Discussie blz 26 Hoofdstuk 5 Conclusies blz 27 tm 28 Literatuurlijst blz 29 tm 30 Bijlagen: - Bijlage 1: Omschrijving van de provocatietesten: blz 1 tm 9 - Bijlage 2: Gebruikte artikelen: schouder blz 10 tm 12 - Bijlage 3A: Grove criterialijst blz 13 tm 14 - Bijlage 3B.1: criterialijst meta analyse blz 15 tm 17 - Bijlage 3B.2: criterialijst onderzoekstudies blz 18 tm 21 - Bijlage 4: Begrippenlijst blz 22 tm 24 1

Voorwoord Deze scriptie is tot stand gekomen naar aanleiding van onze afstudeerfase fysiotherapie aan de Hogeschool van Amsterdam. De opdracht die in dit kader aan ons gesteld is, is de volgende onderzoek de evidentie van manuele provocatie testen van de knie en de schouder bij mannen en vrouwen van 20 tot 50 jaar binnen de eerstelijns fysiotherapiepraktijk. Vanwege de grootte en complexiteit van deze opdracht zijn wij tegen verscheidene zaken aangelopen. Verschillende mensen zijn we daarom dankbaar voor hun hulp aan onze beroepsopdracht. Ten eerste willen we Claar Hinlopen bedanken. Voor haar kalmerende en bemoedigende woorden. Daarnaast willen Bob van de Berg bedanken voor zijn tijd en expertise Mede door zijn raad en advies hebben we de beroepsopdracht kunnen verwerken en concretiseren. Verder willen we onze opdrachtgever Robert Klazema en onze begeleider vanuit de opleiding Jorn Hogeweg bedanken voor hun begeleiding en de ondersteuning tijdens het proces. We hebben deze scriptie in goede samenwerking volbracht. Er is geen specifieke taakverdeling geweest daar we elkaar direct konden aanvullen wanneer dat nodig was. De afgelopen periode hebben wij als zeer leerzaam ervaren, zowel wat het onderzoeksonderwerp betreft, als het samenwerken. 2

Inleiding: Diagnostiek vormt een van de basiselementen van het (para)medisch handelen. Diagnostische verrichtingen vormen de grondslag voor de classificatie van personen in bepaalde subgroepen op grond van hun gezondheidstoestand. Het diagnostisch proces is bedoeld om onderscheid te maken tussen personen met normale respectievelijk abnormale (afwijkende) waarden voor bepaalde kenmerken. Diagnostiek is van cruciaal belang voor het nemen van (para)medische beslissingen over de aard en de ernst van een aandoening, de herkomst van de aandoening, de selectie van veranderde diagnostische hulpmiddelen, de vermoedelijke prognose, de therapie keuze en de effectiviteit van therapeutische interventies. Vanwege het feit dat diagnostische fouten ingrijpende consequenties kunnen hebben, dient de nodige zorg te worden besteed aan de kwaliteit van het diagnostisch proces. Vanwege het belang van de kwaliteit van het diagnostisch proces hebben wij in onze beroepsopdracht daar onderzoek naar gedaan. Om uitspraken te doen over de kwaliteit van het diagnostisch proces, moet er gefundeerd (evidence-based) onderzoek gedaan zijn naar deze kwaliteit. De kwaliteit van het diagnostisch proces is afhankelijk van vele factoren. Bovendien kan het diagnostisch proces veel zaken omvatten namelijk: vroegdiagnostiek, klinische diagnostiek, anamnese, lichamelijk onderzoek enz. enz. Vanwege het feit dat het diagnostisch proces en de kwaliteit van deze zo uitgebreid is, was deze door onze opdrachtgever afgebakend tot de manuele provocatietesten. Vandaar dat de beroepsopdracht ons in de eerste instantie aansprak. De regio s ( knie en schouder), de interventie ( manuele provocatietesten) en de setting ( de eerstelijn) is tevens bepaald door onze opdrachtgever. We hebben de volgende vraagstelling geformuleerd: Wat zijn de meest evidence based manuele provocatie testen van de schouder en de knie bij mannen en vrouwen van 20 tot en met 50 jaar in de eerstelijns fysiotherapie praktijk? Er zijn vele provocatietesten voor de knie en de schouder. Met betrekking tot deze testen is een breed scala aan literatuur aanwezig. Ons is de opdracht gesteld om van deze literatuur een samenvatting te maken m.b.t de diagnostiek van deze manuele provocatie testen. Begripsdefinitie vraagstelling: Evidence based: Literatuur die periodiek wordt bijgesteld op basis van wetenschappelijk nieuwe bewijsvoering. Wetenschappelijke literatuur ten behoeve van de optimale keuze van de patiënt. Gekeken wordt naar structuur van de literatuur, methologie, statistiek, validiteit ( externe-, interne- en ecologische validiteit) en betrouwbaarheid. Manuele provocatie testen: Specifieke met de hand uitgevoerde provocatietesten die zowel diagnostisch als therapeutisch worden gebruikt. Deze lijst is toegevoegd als bijlage nr 2. Eerstelijns fysiotherapie praktijk: Fysiotherapeuten werkzaam als binnen de eerstelijns gezondheidszorg. Deze groep bestaat uit vrijgevestigde fysiotherapeuten dwz praktijkeigenaar in een solopraktijk of maatschap maar ook fysiotherapeuten die werkzaam zijn in gezondheidscentra etc. Mannen en vrouwen van 20 t/m50 jaar: Multicultureel, bestaande uit alle lagen van de bevolking met op de voorgrond knie- of schouderproblematiek zonder nevenpathologie die invloed hebben op de uitslag op de manuele provocatie testen van de schouder en de knie. Voor een toelichting van verdere begrippen verwijzen wij naar bijlage 4. 3

Hoofdstuk 1 Zoekstrategie Inleiding: Het vinden van artikelen is cruciaal voor het bepalen van de evidentie. Het is van belang dat de artikelen ook relevant zijn voor het onderwerp. In dit geval is het onderwerp, de evidentie bepalen van de manuele provocatie testen van de schouder en de knie in de eerstelijns fysiotherapie. Voordat er gezocht wordt naar artikelen moet er rekening worden gehouden met de te raadplegen zoekmachines, de zoektermen en het zoektermijn. Hoe onze zoekstrategie heeft plaatsgevonden zal in dit hoofdstuk worden toegelicht. Zoekmachines Om uitspraak te kunnen doen over de evidentie van manuele provocatie testen van de schouder en de knie is het van belang om relevante artikelen te vinden. Met behulp van de zoekmachines pubmed en gateway werd er gezocht naar de artikelen. Van onze opdrachtgever hadden we een lijst gekregen met de meest gebruikte manuele provocatie testen van de schouder en de knie in de eerstelijns fysiotherapie praktijk. In totaal waren dit 18 testen voor de knie en 24 testen voor de schouder die betrekking hadden op verschillende pathologieën. De testen die genoemd waren voor de knie hadden betrekking op de volgende pathologieën; - Voorste kruisband laesies - Achterste kruisband laesies - Leasies van de mediale/ laterale collaterale ligament - Meniscuslaesies - Patellofemorale pijnsyndroom - Artrose van het kniegewricht. De testen die genoemd waren voor de schouder hadden betrekking op de volgende pathologieën; - Impingement - Labrumlaesies, - Ruptuur van de bicepspees - Cuff problematiek - Artrose van het schoudergewricht. Zoektermijn Vanwege de grote hoeveelheid aan testen hebben we in het jaartal een grens gesteld. Via de zoekmachines pubmed en gateway werd er gezocht naar artikelen die verschenen waren tussen 1998 en 2004. Als er van bepaalde testen geen artikelen te vinden waren, werd het jaartal van 1998 naar 1996 verlaagd. Eerst werd er gezocht naar meta-analyses en systematische reviews, omdat daarin een gestructureerde samenvatting van resultaten van afzonderlijke onderzoeken worden weergegeven (Aufdemkampe, 2000). Een meta-analyse of een systematische review heeft bepaalde in- en exclusiecriteria, die bepalen of een onderzoeksstudie uiteindelijk wel of niet wordt verwerkt. 4

Wanneer er geen meta-analyses/ systematische reviews aanwezig waren, werd er naar onderzoeksstudies gezocht. In pubmed hebben we gezocht onder clinical queries en daaraan toegevoegd systematic reviews. De zoekmachine gaat dan automatisch op zoek naar systematische reviews en naar meta analyses. Wanneer er geen meta-analyses en systematische reviews waren maakten we de combinatie clinical queries en diagnosis en specific search of diagnosis en sensitive search. Hiermee zoekt de zoekmachine naar onderzoeksstudies. Zoektermen De volgende stap was het toevoegen van zoektermen. De volgende termen zijn gebruikt. De zoektermen voor de schouder: neer test, hawkins test, kennedy test, external rotation lag sign, palpatory rent test, drop, arm test, gerber s internal-rotation lift-off test, proxomal biceps tendon rupture test, sulcus sign, fulcrum test, posterior drawer test,relocation test, apprehension test, yergason test, speed test, crank test,clunk test, o brien test, active compression test, empty can test, bicepsloadtestii,crossoveradductiontest,capsularpatern,shoulderjoint/*injuries/*diagnosis. De zoektermen van de knie: anterior drawer test, lachman test, pivot shift test, posterior sag sign, posterior drawer test gravity sign,quadriceps active test, valgus stress test.varus stress test, patellofemoral grinding test, patellofemoral compression test, apprehension test, joint line tenderness, steinman test, mcmurray test, apley grind test, bounce home test, capsular patern, knee joint/*injuries/*diagnosis. Uitkomst In totaal hebben we 26 bruikbare titels gevonden voor de schouder en de knie. We hebben twee meta-analyses gevonden, twee systematische reviews en de rest waren onderzoeksstudies. De samenvattingen van de 26 artikelen werden getoetst aan de hand van een grove criterialijst. De volgende criteria werden onder andere genoemd: - Dat een of meerdere manuele provocatie testen voor de schouder of de knie werden genoemd, - De sensitiviteit en de specificiteit ( zie ook begrippenlijst, bijlage 4) werden gegeven, - Gebruik worden gemaakt van een gouden standaard of referentie test, om de waarden van de manuele testen te kunnen vergelijken. Na het toetsen van de samenvattingen bleven er tien artikelen over. Van de 26 artikelen waren er zeven artikelen waarvan het jaartal te laag was, namelijk onder het jaartal 1996. Bij vijf artikelen werd de sensitiviteit en de specificiteit niet gegeven en bij één artikel werd er geen gebruik gemaakt van een referentie test. Drie artikelen waren niet aanwezig in het AMC, VU of in het NIWI. Het NIWI had alleen tijdschriften tot en met het jaartal 2001 en in het AMC en in het VU waren bepaalde tijdschriften niet aanwezig. ( zie voor de titels van deze artikelen het hoofdstuk discussiepunten). 5

Van de tien artikelen die wij over hielden hebben wij een overzicht gemaakt( zie bijlage 2). De artikelen zijn genummerd en de testen die beschreven worden in dat artikel zijn op een overzichtelijke wijze uitgewerkt.( zie bijlage 1). Vervolgens zijn deze artikelen door ons alle drie onafhankelijk gescreend door middel van de volgende twee criterialijsten. Kritische noot Het wel of niet meenemen van een artikel is dus bepaald aan de hand van onze grove criterialijst ( onze in- en exclusie criteria). We stuitte daarbij echter op het volgende probleem. Zoals bij elke literatuurstudie heb je een zoektermijn. Op gegeven moment moet men stoppen met zoeken omdat vanwege de constante impuls van nieuwe literatuur geen conclusies kunnen worden getrokken. Er waren een drietal artikelen die door onze grove screening (grove criterialijst toepassen op de abstract) heen kwamen. Deze vonden we aan het eind van onze zoektermijn. Deze artikelen waren zeer moeilijk te bemachtigen. We hebben vele instanties geraadpleegd. We hebben uiteindelijk besloten vanwege tijdsgebrek om niet verder op zoek te gaan naar deze artikelen. We zijn er van bewust dat deze zeker afbreuk doet aan onze evidentie. Echter onze opdracht was te omvangrijk om deze artikelen alsnog te verwerken. De titels van deze drie artikelen zijn: - Jackson JL, O'Malley PG, Kroenke K. Evaluation of acute knee pain in primary care. Ann Intern Med. 2003 Oct 7;139(7):575-88. - Lo IK, Nonweiler B, Woolfrey M, Litchfield R, Kirkley A.An evaluation of the apprehension, relocation, and surprise tests for anterior shoulder instability. Am J Sports Med. 2004 Mar;32(2):301-7. - Chronopoulos E, Kim TK, Park HB, Ashenbrenner D, McFarland EG, Diagnostic Value of Physical Tests for Isolated Chronic Acromioclavicular Lesions. Am J Sports Med. 2004 Apr-May;32(3):655-661. 6

Hoofdstuk 2: Criterialijsten Inleiding: Om een uitspraak te doen over de evidentie van een bepaalde manuele provocatietest, zal men eerst deze evidentie moeten definieren en afbakenen. Dit is geen gemakkelijke taak mede door het feit de evidentie geen eenduidig begrip is. Wetenschappers worstelen reeds jaren om deze evidentie eenduidig te omschrijven. Om antwoord te kunnen geven op onze vraagstelling moesten wij ons bezig houden met deze definitie. Een manier om evidentie te definieren is een criterialijst. Er zijn verscheidene criterialijsten in omloop die dit als taak hebben. Echter er is een hevige discussie gaande welke criterialijst het beste de definitie van evidentie dekt. Een belangrijke vraag is uiteraard welke criteria men in een scorelijst dient op te nemen en welke gewichten (waarden) men aan dient toe tekennen. Daarover is internationaal veel discussie. In dit hoofdstuk zult u een beschrijving vinden van de weg die wij bewandeld hebben om een criterialijst op te stellen. Grove criterialijst Om van de enorme hoeveelheid artikelen het kaf van de koren te scheiden hebben wij eerst een grove criterialijst opgesteld. Deze criterialijst moesten inhoudelijk een aantal punten bevatten die tevens in een evidence based artikel te vinden zijn. Bij de zoekstrategieen is de grove criterialijst reeds uitgelegd. (Zie bijlage 3 A) De punten( critieria) uit de grove criterialijst zijn gebruikt om een indicatie te krijgen van de evidentie van een artikel. De artikelen moesten minstens deze criteriapunten bevatten om door ons gelezen en gescreent te worden. In de fijnere screening zijn deze criteria verder uitgewerkt en toegelicht. Fijne criterialijst Wij hebben een lijst van punten gemaakt waaraan volgens ons een evidence-based artikel moet voldoen. Deze hebben we vergeleken met criterialijsten die afkomstig waren van gerenommeerde instanties (zie artikel van scholten nr. 9, 10). Een combinatie van deze criteriapunten vormden onze eerste criterialijst. Deze eerste criterialijst was erg groot. De totale score van deze criterialijst 371 punten ( zie bijlag 3 B). Een grote criterialijst heeft veel nadelen. De hoeveelheid punten die er in zo een omvangrijke criterialijst zijn opgenomen zorgt ervoor dat er een grote overlap van punten is. Punten zullen dus dubbel scoren binnen deze criterialijst. Bovendien zorgt de grote hoeveelheid punten ervoor dat de waarde van belangrijke punten ten opzichte van het geheel minder wordt. Tevens kwamen we na de eerste proef screeningen erachter dat het moeilijk werd om 1 citerialijst te hanteren voor de meta-analyses/systematic reviews en de onderzoeksartikelen. Om deze reden hebben wij dus 2 criterialijsten opgesteld. Eentje voor de systematic reviews/meta-analyses en eentje voor de onderzoeksstudies. De volgende punten scoorden bij ons erg hoog omdat deze naar ons idee de wetenschappelijkheid het meest omhoog halen. 7

Meta: In- en exclusie criteria worden genoemd De gehanteerde crtieria worden consequent gehanteerd De referentie standaard wordt genoemd De resultaten worden afzonderlijk genoemd en eventuele variatie is worden besproken De auteurs bespreken eventuele voor- en nadelen of beperkingen van hun studie. Onderzoeksstudies Het onderzoek is geblindeerd Het onderzoek is reproduceerbaar Er wordt gebruik gemaakt van een erkende referentietest De test is gestandaardiseerd De resultaten worden benoemd ( sensitiviteit en specificiteit in het bijzonder) De interbeoordelingsbetrouwbaarheid wordt genoemd. De auteurs bespreken eventuele voor- en nadelen of beperkingen van hun studie. In de toelichting bij de criterialijst worden begrippen eenduidig beschreven zodat deze de verwaring of dubbelzinnigheden weg halen. De toelichting van de criterialijsten zitten bij de bijlagen. Verantwoording voor deze punten De waarde van de evidentie hangt direct samen met de term generaliseerbaarheid. Een evidence-based artikel houdt rekening met deze generaliseerbaarheid en draagt er zorg voor dat deze generaliseerbaarheid zo groot mogelijk is. Generaliseerbaarheid houdt in dat de onderzoeksresultaten vanuit het onderzoek representatief zijn voor de totale populatie. De onderzoekspopulatie zijn de individuen waarbij men het onderzoek verricht. Deze onderzoekspopulatie dient idealiter zo specifiek mogelijk omschreven te zijn zodat men specifieke uitspraken kan doen over de totale populatie. Vandaar dat wij veel waarde hechten aan termen die deze generalisatie vergroten. Alle termen die hierboven genoemd worden zorgen er indirect voor de vergroting van de generalisatie. Een goede afbakening van de onderzoekspopulatie door specifieke en kritische in- en exclusie criteria is een voorwaarde voor een generalisatie. De overige eisen die aan een onderzoek gesteld worden zorgen er voor dat de onderzoeksresultaten betrouwbaar en valide zijn. Indien de onderzoeksresultaten betrouwbaar en valide doen deze resultaten een uitspraak over de onderzochte onderzoekspopulatie. Meta-analyse In- en exclusiecriteria worden genoemd Dit zorgt ervoor dat de onderzoekspopulatie wordt afgebakend waardoor de onderzoeksresultaten generaliseerbaar worden. De gehanteerde critieria worden consequent gehanteerd (zie bijlage 3B) Indien de criteria consequent worden gehanteerd verhoogt dit de methodologische waarde van het artikel. Bovendien zorgt het consequent toepassen van de criteria ervoor dat de meetresultaten meer betrouwbaar en valide zijn. De referentiestandaard wordt genoemd In diagnostisch onderzoek wordt vaak geen gebruik gemaakt van een controlegroep. Vandaar dat een referentiestandaard erg belangrijk is. Het liefst zou men zien dat er gebruik gemaakt 8

wordt van een gouden standaard echter in de praktijk is deze echter vaak niet voorhanden. Vandaar dat er vaak genoegen wordt genomen met de meest valide en meest betrouwbare referentietest die er op dit moment voorhanden is. Er is voor de schouder geen gouden standaard, voor de knie is die er wel namelijk arthroscopie. De resultaten worden afzonderlijk genoemd en eventuele variatie wordt besproken Indien de resultaten afzonderlijk genoemd worden, kunnen er uitspraken worden gedaan van individuele testen. De reden voor variatie zou moeten worden aangeven. We vinden het de evidentie omhoog halen indien de reden voor de variatie niet aan de interpretatie van de lezer wordt overgelaten maar genoemd en beredeneerd wordt door de auteur van de artikelen. De auteurs bespreken eventuele voor- en nadelen of beperkingen van hun studie Indien de auteurs de voor- en nadelen of beperkingen van hun studie noemen, kan men daaruit afleiden in hoeverre de resultaten vertroebeld zijn. Onderzoeksstudies Het onderzoek is geblindeerd Indien het onderzoek geblindeerd is. Dat betekent dat de onderzoeker van te voren geen voorkennis heeft over de aanwezigheid/afwezigheid van de aandoening. Dit voorkomt onbewuste/bewuste manipulatie van de test door de uitvoerder. Het onderzoek is reproduceerbaar We hebben deze term als volgt gedefineerd. Het onderzoek kan zonder dat men bij het onderzoek betrokken is toch volledig worden uitgevoerd door een extern persoon. Er wordt gebruik gemaakt van een erkende referentietest Dit een standaard die momenteel het meest valide meetinstrument is voor het meten van de aan- of afwezigheid van een bepaalde aandoening. De sensitiviteit en specificiteit zijn direct gekoppeld aan de validiteit en betrouwbaarheid van deze standaard. Vandaar is het noemen en het toepassen van deze referentiestandaard een belangrijk punt in onze criterialijst. De test is gestandaardiseerd Een test dient gestandaardiseerd te zijn om uitspraken erover te doen. Indien men niet een gedetaileerde standaardisatie noemt kan men niet weten over welke test (preciese omschrijving) men uitspraken doet. Indien dus een test niet omschreven wordt of naar een bepaalde standaardisatie wordt verwezen is de generalisatie van de testuitslagen gering. De resultaten worden benoemd ( sensitiviteit en specificiteit in het bijzonder) Om uitspraken te doen over de testen. Dient men minstens deze waarden te geven. Omdat we uiteindelijk toch uitspraken willen doen over de meest gebruikte manuele provocatietesten De interbeoordelingsbetrouwbaarheid wordt genoemd. Indien een onderzoek door meerdere onderzoekers wordt beoordeeld dan vergroot dit de betrouwbaarheid van de onderzoeksgegevens. De auteurs bespreken eventuele voor- en nadelen of beperkingen van hun studie. Zie meta-analyses. 9

Kritische noot: Tijdens de screening van onze artikelen merkte we dat onze criterialijsten niet ideaal zijn. We hebben tijdens het proces de criterialijsten verscheidene malen aangepast. Op een gegeven moment hebben we ons erbij neergelegd dat wij ook niet de ideale criterialijst konden opstellen. Vandaar deze kritische noot naar ons zelf toe. Dubbel scoren van punten. In onze criterialijst worden sensitiviteit, specificiteit, ppv en npv enz onder resultaten genoemd. Echter deze punten te berekenen aan de hand van de sensitiviteit en specificiteit. We hebben uiteindelijk besloten deze punten toch te laten staan omdat we vinden dat het apart beschrijven en geven van deze extra waarde wel de evidentie omhoog haalt. De waardes van punten Achteraf hadden de waarden van sommige criteria wel hoger of lager gekund. We vonden sommige criteria belangrijker dan de hoeveelheid punten die we er aan toekenden. Een voorbeeld hierbij zijn de inclusie/exclusie criteria. Wij vinden deze punten erg belangrijk. Echter ze scoorden misschien achteraf te laag. Interpretatie Sommige punten waren ondanks de bijlage toch moeilijk te interpreteren. Reproduceerbaarheid was daar een voorbeeld van. 10

Hoofdstuk 3 Resultaten Inleiding: Naar aanleiding van de door ons opgestelde criterialijsten hebben we de volgende artikelen beoordeeld. In dit hoofdstuk bespreken we de uitkomst van die artikelen. Artikel 1: The effectiveness of diagnostic tests for the assessement of schoulder pain due to soft tissue disorders: a systematic review. Health technology assessement 2003 J. Dinnes, E. Loveman, L. Mcintyre, N Waugh. Inleiding: Doel: Het onderzoeken van het effect van diagnostische testen voor schouderpijn veroorzaakt door weke delen aandoeningen : In deze systematische review hebben de auteurs getracht een overzicht te geven van onderzoeken over manuele provocatietesten van de schouder. De onderzoekers hebben uiteindelijk een uitspraak gedaan over die testen die zij waardevol achten voor het aantonen van schouder pathologieën. Soort artikel: een systematische review. Deze review is op basis van 10 prospectieve cohort studies. Naar aanleiding van deze studies werden de volgende testen besproken. Impingement Neer test Hawkins test Supraspinatus pees totale ruptuur ( cuff aandoening). External rotation lag sign (drop test) Internal rotation lag sign Palpatory rent test Drop arm test Jobe test Instabiliteit Sulcus sign Relocation test Apprehension test Biceps pees Yergason Speed Labrum laesie Clunk Empty can 11

Over de volgende testen kon men uitspraak doen die enigszins van waarde zijn voor de praktische uitvoering: - De external rotation lag sign, Drop test, lift of test, Internal rotation lag sign, Rent test, Internal rotation strength test, Neer test, Hawkins test, Horizontal Adduction test, Jobe test, Impingement sign, pain full arc, Drop arm test, Yergason test, Speed test, Passive external rotation test. Wetenschappelijke waarde van het artikel bepaald op basis van onze criteria lijst Score van de criterialijst: 45-45 De auteurs hebben het volgende commentaar geleverd op de geincludeerde studies. Deze punten hebben wij mee genomen in het interpreteren van de resultaten. De prevalentie van rotator cuff aandoeningen was het hoogst in de meeste studies(meer dan 50% van alle testen). Niet alle artikelen gaven de setting weer. In de studies waar ze de setting wel gaven was het in schouder klinieken of orthopedische centra s. De onderzoekspopulatie was vrij eentonig ( athleten uit werpsporten). Niet alle patiënten hebben voorafgaand de referentietest ondergaan. De grootte van de onderzoekspopulatie was over het algemeen erg klein. Deze was gemiddeld minder dan 100. De referentie testen die in de onderzoeks studie gebruikt waren, waren vaak zelf niet sensitief of specifiek. Een voorbeeld daarvan zijn ultrasound en arthrografie die gebruikt werden als referentietest ondanks hun lage sensitiviteit. Sommige onderzoeksstudies gebruikte meer dan 1 referentie test. De onderzoekers gaven hierbij duidelijk aan dat de gebruikte test gebaseerd was op de resultaten van de index test. De uitvoerder van de test was in niet alle gevallen een medisch specialist. Voordelen Literatuur was uitgezocht door het combineren van zoektermen dit met betrekking tot schouderpijn met een methodologische filter. De onderzoekers zijn erg kritisch geweest bij de keuze van de gebruikte artikelen (studies) Er werd kritisch gekeken naar: - De referentietest - De grote van onderzoeksgroep - Er werden eisen gesteld aan de aandoening - Patiënten gegevens van de verschillende studies moesten compleet zijn. Alle studies zijn door twee reviewers beoordeeld. Onduidelijkheden werden opgelost door consensus. In het geval dat dit niet lukte werd er een derde beoordelaar bijgehaald. Indien de studies niet compleet waren werd dit genoemd in de bespreking en eventuele vertekening van de resultaten werden toegelicht. De gebruikte artikelen waren vrij recent. ( 1996-2001) 12

Nadelen Niet alle testen waren gestandaardiseerd waardoor een uitspraak over deze testen moeilijk werd. Inclusiecriteria : ze hebben gebruik gemaakt van studies die op basis van een heel selecte steekproef een uitspraak doen over een test. Dit zorgt voor een vaak hoge sensitiviteit en specificiteit, maar de generaliseerbaarheid is daardoor erg laag. ( Een nadeel is dat onze criterialijst niet op deze items kan score waardoor het artikel toch erg goed naar voren kan komen ondanks de beperkte generaliseerbaarheid.) Zie kritische noot auteurs. Resultaten Test Sensitiviteit Specificiteit Positieve Likelihood ratio Neer 0.55-0.96 0.19-0.47 1.0-3.2 0.2-1.1 Hawkins 0.64-0.98 0.13-0.76 1.1-3.3 0.0-0.9 Horizontal 0.72-0.88 0.17-0.45 0.9-1.4 0.3-1.2 adduction test Painfull arc 0.59-0.99 0.06-0.70 1.0-2.3 0.1-0.9 Drop arm 0.27-0.47 0.73-0.94 1.2-6.6 0.6-0.9 Yergason 0.23-0.43 0.67-0.91 0.8-3.6 0.7-1.0 Speed 0.04-0.16 0.87-1.00 0.4-24 0.9-1.0 Passive external 0.15-0.24 0.77-0.89 0.8-1.8 0.9-1.1 rotation test Jobe 0.46-0.95 0.39-0.76 1.0-3.3 0.1-1.1 External rotation 0.58-0.80 0.86-1.00 2.2-543.1 0.2-0.4 lag sign Drop test 0.12-0.32 0.86-1.00 0.7-170.8 0.7-0.9 Lift-off 0.44-0.77 0.86-1.00 2.0-486.4 0.2-0.6 Internal rotation 0.83-0.99 0.80-0.99 3.4-158.1 0.0-0.2 lag sign Impingement 0.95-0.99 0.05-0.15 1.0-1.1 0.1-0.7 sign Rent test 0.85-0.99 0.89-0.99 7.7-118.0 0.0-0.2 Internal rotation 0.71-0.96 0.90-0.99 8.1-75.9 0.0-0.3 resitance srength test Negatieve likelihood ratio De geëvalueerde testen bleken hoog sensitief of hoog specifiek te zijn. Weinig testen waren hoog sensitief en hoog specifiek Als resultaat bleken een paar testen overtuigend bewijs te leveren over de aanwezigheid of afwezigheid van de aandoening in de setting waar deze testen waren toegepast. In een studie kwamen de individueel uitgevoerde testen er goed uit. 13

De External rotation lag sign, Drop test, Lift- off and Internal rotation lag sign hadden allemaal een positieve liklihood ratio van groter dan 10 De onderzoeksgroep was echter erg klein en het CIs was erg breed De Internal rotation lag sign had een erg lage negatieve liklihood ratio van 0.0(95% CI 0.0 tot0.2) Andere testen toonden een hoge positieve en negatieve liklihood ratio zoals de Rent test de Internal rotation stregth test Van de overige testen hadden sommige een sensitiviteit van meer dan 80% voor het opsporen van een impingement of rotator cuff rupturen dit waren de volgende testen: Neer test, Hawkins test. Horizontale adductie test, jobe test, Impingement sign en Pain full arc De testen die een specificiteit van meer dan 80 % hadden waren: Drop arm test, yergason test,speed test, passive external rotation test In het kort zijn individuele testen of erg goed in het uitsluiten van RC aandoeningen wanneer deze negatief scoren of erg goed in het aantonen van RC aandoeningen wanneer deze positief scoren. Vanwege de kleine onderzoeksgroepen is er geen doorslaggevend bewijs dat ook maar een test met zekerheid een RC aandoening kan aantonen. Conclusie auteur De resultaten uit dit artikel zijn niet generaliseerbaar naar de eerstelijns fysiotherapie praktijk. Dit onderzoek is uitgevoerd in gespecialiseerde schouderklinieken en orthopedische centra. Waardoor de prevalentie van ernst van de schouderklachten hoger is. De uitkomst van de onderzoeken geeft een andere uitslag dan wanneer deze uitgevoerd zouden zijn in de eerstelijns fysiotherapiepraktijk. Binnen deze klinieken wordt er minder rekening gehouden met het verloop van eerdere stadia s van de aandoening en de ziektegeschiedenis van de patiënt. Dit is binnen de eerstelijns fysiotherapie van groter belang. De onderzoekspopulatie had overall een hoge gemiddelde leeftijd. Deze was namelijk 46 jaar. Door dit gegeven moet rekening gehouden worden met de aard van de schouderklachten bij deze leeftijdscategorie. De kans dat deze aandoening wordt veroorzaakt door degeneratieve processen is aanzienlijk hoger. Conclusie vraagstelling De resultaten uit dit artikel kunnen we niet vertalen naar de eerstelijns fysiotherapie. Wanneer de testen onderzocht zouden worden in de eerstelijns fysiotherapie zouden we hier een uitspraak over kunnen doen. Nu kunnen we alleen een uitspraak doen over de setting waarbinnen deze testen zijn onderzocht. In dit geval orthopedische en gespecialiseerde schouderklinieken. Omdat er weinig tot geen eisen worden gesteld aan de onderzoekspopulatie is de generaliseerbaarheid over het algemeen al erg laag en moet je als fysiotherapeut de resultaten van dit artikel voorzichtig interpreteren 14

Artikel 4: Biceps Load test 2: A clinical test for slap lesions of the schoulder Seung-ho Kim, M.D., Ph.D, Kwon-Ick Ha, M.D., Ph.D., Jin-Hwan Ahn, M.D., Ph.D, Sang-hyun Kim, M.D., And Hee-Joon Choi, M.D. Arthrocopy: The Journal of Arthroscopic and related surgery, Vol 17, No 2 ( February), 2001. Inleiding: Doel: Het beschrijven van het effect van de biceps load test 2 voor het diagnosticeren van Slap laesies. Study design: Prospective study-design bij 127 patiënten. De manuele provocatietest die besproken was: Biceps Load test 2 Wetenschappelijke waarde op basis van onze criterialijst. Score van dit artikel op de criterialijst: 35 punten van de 82 punten. Voordelen De positieve punten kwamen al in de grove criterialijst naar voren, echter zijn er geen andere voordelen die de wetenschappelijkheid omhoog haalt, zie score. Nadelen De prevalentie wordt niet genoemd. Het onderzoek is niet reproduceerbaar. De auteurs geven geen voor-/ nadelen over hun onderzoek. De auteur is de bedenker van de test, gezien de resultaten kan er sprake zijn van manipulatie van het onderzoek. Er wordt gebruik gemaakt van een zeer selecte steekproef, dit beïnvloed de generaliseerbaarheid. Er wordt geen betrouwbaarheidsinterval gegeven. De referentie standaard test wordt niet kritisch bekeken. Resultaten Waarden % Sensitiviteit 89.7 Specificiteit 96.6 PPV 92.1 NPV 95.5 Conclusie auteur: De biceps Load test 2 is een effectieve diagnostische test voor het diagnosticeren van Slap laesies. Dit is in dit onderzoek vastgesteld met arthroscopie als referentie standaard Conclusie vraagstelling De resultaten uit dit artikel kunnen we niet vertalen naar de eerstelijns fysiotherapie. Wanneer de testen onderzocht zouden worden in de eerstelijns fysiotherapie zouden we hier een uitspraak over kunnen doen. Nu kunnen we alleen een uitspraak doen over de setting waarbinnen deze testen zijn onderzocht. In dit geval een orthopedische kliniek. De testen werden uitgevoerd op sporters vanuit de werpsport, dit betekent dat het alleen generaliseerbaar is voor deze patiëntengroep. 15

Artikel 5: A prospective evaluating of a new physical examination in predicting glenoid labral tears Stephen H. liu, MD, Mark H. Henry, MD, and Stephen L. Nuccion. The american Journal of sports medicine, Vol 24, No 6, 1996. Inleiding: Doel: Het onderzoeken van de cranktest op sensitiviteit en specificiteit als nieuwe manuele provocatie test voor het opsporen van een glenoid labrum ruptuur. Study design: Prospective study bij 62 patiënten. Wetenschappelijke waarde op basis van onze criterialijst. De score van dit artikel op onze criterialijst is: 50 punten van de 82 punten. Voordelen Het onderzoek is reproduceerbaar Het onderzoek is methodologisch goed opgezet Nadelen De grootte van de onderzoekgroep is klein. Er wordt gebruik gemaakt van een zeer selecte steekproef waardoor de generalisatie erg beperkt is De prevalentie wordt niet weergeven. De auteur geven geen voor-/ nadelen over hun onderzoek. De auteur is de bedenker van de test, gezien de resultaten kan er sprake zijn van manipulatie van het onderzoek.(selecte groep) Resultaten Waarden % Sensitiviteit 91 Specificiteit 93 PPV 94 NPV 90 Conclusie auteur Door de hoge waarden van sensitiviteit, specificiteit, PPV en NPV is de crank een zeer bruikbare en betrouwbare test voor het diagnosticeren van labrum rupturen. Conclusie vraagstelling De resultaten uit dit artikel kunnen we niet vertalen naar de eerstelijns fysiotherapie. In dit artikel wordt de setting niet gegeven, daarom kunnen we geen uitspraak geven over de bruikbaarheid van deze test in de eerstelijns fysiotherapie. Eenentachtig procent van de onderzochte patiënten waren atleten, dit betekent dat het voor grotendeels alleen generaliseerbaar is voor deze patiëntengroep. Daarnaast zorgden de in en exclusie criteria voor een zeer selecte onderzoekspopulatie echter de resultaten van deze test zouden in een andere onderzoeksgroep waarschijnlijk veel lager uitkomen. 16

Artikel 6: The active compression test: A New and effective test for diagnosing labral tears and acromioclavicular joint abnormality. Stephen j. O brien, MD, Micheal J. Pagnani, M.D., Stephen Fealy, MD, MD, Scott R. Mcglynn and Joseph B. Wilson. The American Journal of sports medicine, Vol 26, no 5, 1998 Inleiding: Het onderzoeken van de active compression test voor het diagnosticeren van labrum rupturen en abnormaliteiten van het AC-gewricht Study design: Prospective study bij 318 patienten Wetenschappelijke waarde op basis van onze criterialijst. De score van dit artikel op onze criterialijst is 28 punten van de 82 punten. Voordelen De positieve punten kwamen al in de grove criterialijst naar voren, echter zijn er geen andere voordelen die de wetenschappelijkheid omhoog haalt, zie score. Nadelen De inclusie en exclusiecriteria worden niet genoemd. Er worden geen patiëntenvariabelen weergegeven.( geen generaliseerbaarheid ) Niet alle patiënten ondergingen dezelfde referentiestandaard test, waardoor de waarden van de resultaten omlaag gaan. De prevalentie wordt niet gegeven. De auteur geven geen voor-/ nadelen over hun onderzoek. Resultaten Active compression test bij : Labrum laesies Waarden % Sensitiviteit 100.0 Specificiteit 98.5 PPV 94.6 NPV 100.0 AC-gewricht abnormaliteiten Waarden % Sensitiviteit 100.0 Specificiteit 96.6 PPV 88.7 NPV 100.0 17

Combinatie van AC-abnormaliteiten en Labrum laesies Waarden % Sensitiviteit 100.0 Specificiteit 95.2 PPV 91.5 NPV 100.0 Conclusie artikel: De active compression test is een effectieve test voor het opsporen van abnormaliteiten in het AC-gewricht en in het labrum. Met behulp van deze test kan men meer perspectief krijgen wat de veroorzaker is van de labrum aandoeningen. Het is ook een waardevolle postoperatieve test om de resultaten te zien van het AC gewricht en van het labrum. Conclusie vraagstelling Dit artikel is niet generaliseerbaar voor onze vraagstelling. De patiëntenvariabelen ontbreken, dus weten we niet voor welke patiëntengroep de generaliseerbaarheid geldt. Nu kunnen we alleen een uitspraak doen over de setting waarbinnen deze test is onderzocht. In dit geval een gespecialiseerde schouderkliniek. 18

Artikel 7: Clinical Assessment of Three Common Tests for Superior Labral Anterior- Posterior Lesions Edward G. McFarland, MD, Tae Kyun Kim, MD, PhD, and Richard M. Savino, MD. The American Journal of Sports Medivine, Vol. 30, No.6, 2002. Inleiding: Doel: De klinische waarde van de volgende drie testen achterhalen: Anterior slide test, active compression test, compression rotation test. Specifiek voor SLAP laesies. Study design: case-control study, 426 patienten. Achtergrond van deze studie: Volgens de onderzoekers is de accuraatheid, sensitiviteit en specificiteit van deze testen lager dan in eerder gerapporteerde studies naar voren is gekomen. Daarnaast hebben de onderzoekers de verwachting dat een klik tijdens de manipulatie niet specifiek is voor een SLAP laesie. Bovendien is de pijn die gevoeld dient te worden tijdens de manipulatie zeer subjectief. De pijnsensatie dient diep in het gewricht aangegeven worden, in praktijk blijkt het moeilijk te zijn voor de patiënt om de pijn op deze specifieke plaats aan te geven. Al deze hypothesen zorgen ervoor dat de validiteit van de testen in twijfel kan worden getrokken. Wetenschappelijke waarde op basis van onze criterialijst Aantal punten: 54 punten- 82 punten Voordelen De onderzoekers waren erg kritisch naar het onderzoek toe. De onderzoekers gaven de velen moeilijkheden aan bij het onderzoeken van SLAP laesies. Vervolgens geven de auteurs de redenen aan voor de verschillen in resultaten met de andere gerapporteerde publicaties over dit onderwerp.dit waren de volgende: Zij maakte gebruik van een grote controle groep. Een hoog cijfer van negatieve onderzoeken kan er voor zorgen dat de sensitiviteit en PPV en specificiteit en NPV daalt. De controlegroep bevatte tevens de type 1 SLAP laesies. Dit om de volgende redenen: - de meeste studies sloten type 1 laesies geheel uit. - type 1 laesies verschillen van andere laesies, dit vanwege het anatomisch verloop van deze laesies. - De prevalentie van type 1 was zeer groot. Het includeren van van dit type in de controlegroep deed de klinische en statische relevantie van het onderzoek stijgen. - Andere onderzoeken hebben de SLAP laesie op verschillende wijze gediagnosticeerd. Ze hebben vaak van een combinatie van verschillende referentie standaarden gebruik gemaakt. Bovendien hebben ze geen gebruik gemaakt eenduidige populatie als controle groep. In dit onderzoek is de diagnose van een SLAP laesie gesteld op basis van het oordeel van een chirurg. Het onderzoek was zeer doorzichtig. De auteurs belichtte alle achtergronden en stappen van hun onderzoek. Ze hebben zelfs de informatie die hun eigen bevindingen omlaag haalt omschreven. Ze hebben kritisch gekeken naar andere publicaties. Deze punten hebben ze meegenomen in het opnieuw uitvoeren van hun onderzoek. 19

Nadelen De volgende punten rapporteerden de auteurs zelf (m.b.t de wetenschappelijkheid is dit tevens een voordeel) SLAP-laesies werden vaak in combinatie met andere aandoeningen gevonden. Pijn veroorzaakt door andere laesies kunnen de resultaten van de onderzoekers hebben beïnvloed. De lokalisatie van de pijn is moeilijk te achterhalen. Er waren maar weinig gevallen waarbij de patiënten de pijn diep in de schouder konden aangeven. Meer patiënten gaven pijn anterior en posterior van de schouder aan. Het provoceren van pijn maakt de diagnose van SLAP laesie moeilijk en haalt de accuraatheid van deze testen omlaag. Het derde punt betreft het includeren van een klik als diagnostisch criteria. Alle testen in deze studie hadden als criteria een klik om de test als positief te beschouwen bij het aantonen van SLAP laesies. Echter is het nooit aangetoond dat een klik uitsluitend op een SLAP laesie duidt. Het selecteren van een toepasselijke controle groep is in praktijk moeilijk. Het is vrijwel onmogelijk om een controle groep samenstellen die identiek is aan die in de studiegroep. Wat idealiter het geval is. Het is echter niet mogelijk om zo n controle groep samen te stellen omdat het uit ethische en praktische redenen niet verantwoord is om gezonde mensen aan operatieve ingrepen bloot te stellen. Vanwege dit feit is er een controle groep samengesteld met schouderklachten die er voor kunnen zorgen dat de resultaten vertroebeld worden. Resultaten De auteurs kwamen er achter dat deze testen een lage sensitiveit en voorspellende waarde hadden. In de SLAP laesie groep waren de testen niet accuraat in het lokaliseren van pijn en was het vinden van een klik maar bij een kleine groep patiënten aanwezig. De testen waren bijna even vaak positief zowel als in de controle groep als in de SLAP laesie groep. De positieve voorspellende waarde -die misschien wel belangrijker is voor de uitvoerder dan de sensitiviteit en specificiteit- in populaties met een lage prevalentie van de aandoening was extreem laag. Minder dan 10 % in alle drie de testen. Gebruik van meerdere testen verhoogde in dit geval niet de diagnostische accuraatheid. Deze gegevens zorgen ervoor dat je de klinische waarde van deze drie testen voor de diagnose van SLAP laesie in twijfel moet trekken. Uit de arthroscopie hadden 39 patiënten type 2, 3,4 laesies ( studiegroep). De overigen 387 patiënten had type 1 laesie of geen laesie ( controle groep). Het voorkomen van positieve resultaten was niet statisch anders tussen twee groepen. (P>0.05) De bevindingen van de auteurs waren als volgt: Meest sensitieve test: active compression test 47% Meest specifieke test: anterior slide 84% Hoogste PPV: active compression test 10% Hoogtste accuraatheid: anterior slide test : 47% Laagste accuraatheid: active compression test 54% Test Contr.N% SL N% Sens.% Spec.% PPV% NPV% DA% CRT 25 24 24 76 9 90 71 AST 16 8 8 84 5 90 77 20

ACT 45 47 47 55 10 91 54 De conclusie van het artikel: De algemene conclusie die gesteld wordt: De drie testen die tijdens deze studie zijn onderzocht voor de diagnose van SLAP laesie zijn minder accuraat dan eerder gerapporteerd. Tevens een klik tijdens de manipulatie blijkt geen betrouwbaar teken voor slap laesie te zijn en de lokalisatie van pijn bij deze uitvoering onderbouwt niet hun diagnostisch accuraatheid. Conclusie op de vraagstelling: De resultaten uit dit artikel kunnen we niet vertalen naar de eerstelijns fysiotherapie. Het onderzoek werd weer niet uitgevoerd in de eerstelijns setting. Bovendien werden de testen uitgevoerd door een orthopeed. Een orthopeed heeft meer routine in het uitvoeren van manuele testen dan een fysiotherapeut. Deze punten en de punten die staan bij de nadelen zorgen ervoor dat er een zeer beperkte vertaling voor onze vraagselling. 21

Artikel 2 Accuracy of physical diagnostic tests for assessing ruptures of the anterior cruciate ligament: a meta-analysis. Rob J.P.M Scholten, MD, phd, Wim Opstelten, MD, Cees G. van der Plas, MD, Dick Bijl, MD, Walter L.J.M Deville, MD, PhD, and Lex M. Bouter, PhD. The journal of family practice, september 2003, vol 52 n. 9 Inleiding: Doel: De evidentie samenvatten voor de diagnostische accuraatheid voor manuele diagnostische testen voor het onderzoeken van ACL-ruptures in de knie. Een systematische review/meta-analyse, 17 studies geincludeerd. Fysiotherapeuten maken veelal gebruik van een drietal testen: namelijk de Lachman, pivot shift, anterior drawer test. De uitkomsten van deze testen in combinatie met de lichamlijke gesteldheid en de hulpvraag van de patient helpt de therapeut in het maken van zijn keuze voor eventueel vervolgonderzoek. Zoals arthroscopie en MRI. Testen: Anterior drawer test Lachman test Pivot shift test. Wetenschappelijke waarde op basis van onze criterialijst: Het artikel scoorde 39 punten van de 45 punten. Voordelen: De wijze waarop de gegevens zijn verzameld wordt op een duidelijke manier weergegeven waardoor het onderzoek reproduceerbaar is. Ze hebben gebruik gemaakt van een erkende criterialijst en hebben deze tevens als bijlage toegevoegd. Er waren twee reviewers bij het onderzoek betrokken die de studies onafhankelijk van elkaar hebben beoordeeld. De resultaten zijn op een overzichtelijke manier weergegeven in tabellen en grafieken. Er wordt kritisch gekeken naar het onderzoek. De vertroebeling van de resultaten door bepaalde factoren worden door de auteurs zelf aangegeven en benoemd. Er worden suggesties gedaan voor vervolgonderzoek naar individuele testen en de combinatie hiervan. Nadelen: De kritiek van de auteurs zelf is terecht en absoluut een voordeel van de meta-analyse dat deze auteurs deze beschreven, echter deze kritische noot haalt de betrouwbaarheid van de gegevens omlaag. Patiënten variabelen en de grote van onderzoeksgroep wordt niet toegelicht hierdoor is er door ons geen concrete uitspraak te doen over de generaliseerbaarheid van de gegevens. 22

Resultaten N Prevalentie LR+ LR- Anterior 52-300 0.17-0.77 1.7-87.9 0.1-0.7 drawer sign Lachman test 32-300 0.17-0.81 2.0-102.1 0.1-0.4 Pivot test shift 52-300 0.17-0.78 8.2-26.9 0.5-0.8 De waardes liggen hiertussen voor verschillende onderzoeken voor de gehele tabel verwijzen we naar het desbetreffende artikel. Sensitiviteit Specifiteit Anterior drawer sign 0.18-0.92 0.78-0.99 Lachman test 0.63-0.91 0.55-0.99 Pivot shift test 0.18-0.93 0.97-0.99 De pivot shift test heeft de hoogste positief voorspellende waarde. De Lachman heeft de hoogste negatief voorspellende waarde. Pivot shift is de meest sensitieve test Lachman is de meest specifieke test. Conclusie auteur: Betrouwbare literatuur met betrekking tot de accuraatheid van fysieke diagnostische testen voor ACL zijn schaars. Vooral artikelen waarbij het onderzoek is gedaan in de eerstelijn setting. Momenteel zou op basis van de medische geschiedenis, het lichamelijk onderzoek en de hulpvraag de diagnose bij een patiënt gesteld kunnen worden. Deze diagnose zou niet gesteld kunnen worden op basis van een test uitslag alleen. Conclusie op de vraagstelling: De conclusie van de auteur geeft al antwoord onze vraagstelling. Geen enkel artikel heeft het onderzoek uitgevoerd in een eerstelijns setting waardoor deze niet generaliseerbaar is naar de patiënten categorie genoemd in onze vraagstelling. Bovendien zijn de onderzoekers genoodzaakt (vanwege het beperkte aanbod aan artikelen) onderzoeken te includeren die van methodologisch slechtere kwaliteit zijn. Daardoor zijn de onderzoeksresultaten sowieso al vertroebeld waardoor een generalisatie zo mogelijk nog lager wordt. 23

Artikel 3: The Accuracy of Diagnostic Tests for Assesing Meniscal Lesions of the knee: A Meta-Analysis Rob J.P.M. Scholten, MD. PhD; Walter L.J.M. Deville, MD, PhD; Wom Opstelten, MD; Dick Bijl, MD; Cees G. van der Plas, MD; and Lex M. Bouter, PhD. The Journal of Family Practice, Vol. 50, No. 11, 2001. Inleiding: Doel: een samenvatting geven over de aanwezige evidentie van de diagnostische accuraatheid van manuele provocatie testen voor het diagnosticeren van meniscus laesies van de knie. Veel testen voor de meniscus zijn niet makkelijk uitvoerbaar en worden vaak verkeerd beoordeeld. Ook wordt er getwijfeld aan de diagnostische accuraatheid van vele testen voor de meniscus. Daarnaast zijn er veel tegenstrijdige gerapporteerde resultaten met betrekking tot de betrouwbaarheid van deze testen. Soort artikel: Meta-analyse, deze meta analyse bespreekt de volgende testen op basis van 14 artikelen:assessment of joint effusion, Joint line tenderness, McMurray test, Apley compression test Wetenschappelijke waarde op basis van onze criterialijst. Score van de criterialijst: 36 punten van de 45 punten. Voordelen Literatuur was uitgezocht door het combineren van zoektermen dit met betrekking tot meniscuslaesies met een methodologische filter. Alle studies zijn door twee reviewers beoordeeld. Onduidelijkheden werden opgelost door consensus. In het geval dat dit niet lukte werd er een derde beoordelaar bijgehaald. Een erkende criterialijst werd gehanteerd voor het beoordelen van de verschillende studies. De opzet van de meta-analyse is reproduceerbaar. Tijdens het includeren van de studies is er gelet op de gouden standaard. De resultaten van de studies worden afzonderlijk van elkaar in een tabel weergegeven en besproken. Er zijn erkende criteria ( methodologisch en inhoudelijk) gebruikt om een studie wel of niet mee te nemen. De vertroebeling van de resultaten door bepaalde factoren worden door de auteurs zelf aangegeven en benoemd. Nadelen De setting wordt niet vermeld. Er wordt wel vermeld dat geen enkele studie gebruik heeft gemaakt van een eerstelijns setting. Maar twee van de 13 studies waren enkel geblindeerd. In alle studies was een bias aanwezig ( echter een voordeel is dat de onderzoekers dit aangeven). De kritiek van de auteurs zelf is terecht en absoluut een voordeel van de metaanalyse, echter deze kritische noot haalt de betrouwbaarheid van de gegevens omlaag. Het gaat om de volgende gegevens: - De methodologische kwaliteit van de verschillende studies is erg laag/slecht en de resultaten erg heterogeen. 24

- Alle methodologische tekortkomingen en de weinig beschikbare literatuur, zorgen ervoor dat een juiste conclusie omtrent de diagnostische betrouwbaarheid voor meniscus testen niet te maken is. Resultaten Test prevalentie Sensitiviteit Specificiteit Positieve likelihood ratio Negatieve likelihood ratio Joint Effusion 0.13-0.84 0.20-0.53 0.54-1.00 0.8-1.5 0.7-1.1 McMurray 0.13-0.73 0.10-0.66 0.57-0.98 1.5-9.5 0.4-0.9 Joint Line 0.26-0.84 0.28-0.95 0.05-0.91 0.8-14.9 0.2-2.2 Tenderness Apley Compression 0.13-0.65 0.16-0.58 0.80-0.99 0.8-19.5 0.5-1.1 Alle drie tonen een laag discriminatief vermogen. De McMurray test heeft een gunstige positief voorspellende waarde. Conclusie artikel - Er is weinig bewijs dat de diagnose voor meniscus leasie van de knie verbeterd kan worden door het toepassen van de joint effusion, McMurray, joint line tenderness en de apley compression. Fysiotherapeuten moeten op de hoogte zijn van de gelimiteerde waarde van deze testen - Het eventueel toepassen van geavanceerde diagnostische methoden of chirurgische ingrepen kan enkel gebaseerd worden op de ernst van de patiënt zijn klachten, deze zijn misschien wel waardevoller dan de testen zelf. - Waarschijnlijk zal het combineren van de test resultaten en daarnaast de verdere patiënt gegevens ( eg, elements of history taking) de diagnose verbeteren en zal dit van meer diagnostische waarde zijn dan de testen zelf. De accuraatheid van de menicus testen is erg laag en alleen een positieve McMurray test uitslag heeft een wat hogere waarde in de diagnostische significantie. Door de lage methodologische kwaliteit van de studies moeten de resultaten van deze meta-analyse met een waarschuwing worden geïnterpreteerd. Er kan geen conclusie worden getrokken met betrekking tot de diagnostische accuraatheid van de verschillende meniscus testen. Conclusie vraagstelling Dit artikel is niet generaliseerbaar voor onze vraagstelling. Ten eerste omdat er te weinig evidentie is om een goed antwoord te geven op de onderzoeksvraag van dit artikel. Doordat deze onderzoeksvraag niet beantwoordt wordt kunnen we dus geen uitspraken doen over onze vraagstelling. Bovendien is er weinig tot geen onderzoek gedaan in de eerstelijns settingen, dit zorgt er mogelijk voor dat de generalisatie voor onze vraagstelling nog lager wordt. 25