Auteur(s): J.W. Elkhuizen Titel: Spurieuse correlaties Jaargang: 12 Jaartal: 1994 Nummer: 6 Oorspronkelijke paginanummers: 290-300 Deze online uitgave mag, onder duidelijke bronvermelding, vrij gebruikt worden voor (para-) medische, informatieve en educatieve doeleinden en ander niet-commercieel gebruik. Zonder kosten te downloaden van: www.versus.nl
SPURIEUSE CORRELATIES J.W. Elkhuizen Jan Willcm Elkhuizen fysio-/manueeltherapeut, bewegingswetenschapper, Leeuwarden In dit artikel wordt ingegaan op de interpretatie van onderzoeksgegevens, en met name van die gegevens die sterk aan elkaar gecorreleerd zijn. Uiteengezet wordt waarom misinterpretaties in de praktijk eenvoudig kunnen optreden, hetgeen bepalend kan zijn voor de te geven behandeling. Ten slotte wordt een aantal oplossingen aangedragen waarmee het trekken van onjuiste conclusies zoveel mogelijk kan worden voorkomen. Correlaties Het bepalen van correlaties tussen verschillende variabelen is in de wetenschap een alledaagse bezigheid. Men wil graag weten of bepaalde variabelen met elkaar samenhangen en, zo ja, in welke mate dat het geval is. Dit vergroot de kennis over het te bestuderen onderwerp en kan een beter inzicht verschaffen. De mate waarin twee variabelen met elkaar samenhangen kan worden uitgedrukt in de correlatiecoëfficiënt p (rho). In de praktijk beschikken we meestal niet over een dermate groot aantal waarnemingsparen dat we de waarde van p exact kunnen vaststellen. In de onderzoekssituatie wordt vaak gebruik gemaakt van de Pearson-correlatiecoëfficient r (de streekproefcorrelatiecoëfficient voor lineaire correlaties). Indien r=l, dan is er sprake van een maximale samenhang, en indien de ene variabele (bijvoorbeeld A) optreedt, treedt ook de andere (B) op. Het omgekeerde is dan eveneens het geval. Indien r negatief is, dan is er een omgekeerde samenhang aanwezig: bij een toename van A neemt B af, of omgekeerd. De Pearson's correlatiecoëfficiënt kan ook 0 zijn: er bestaat dan in het geheel geen lineaire samenhang tussen de variabelen. R kan dus de volgende waarden aannemen: - 1 r 0 (negatieve correlatie) of O r 1 (positieve correlatie). In figuur 1 staan enkele voorbeelden van een scatterdiagram weergegeven. Of een correlatie wel of niet werkelijk bestaat, of dat deze op toeval gebaseerd kan zijn, laat zich eenvoudig statistisch toetsen. Hierbij is het aantal waarnemingen (n) van belang. Hoe groter de steekproef des te betrouwbaarder de resultaten. Een correlatiecoëfficiënt kan in een bepaald geval hoog zijn, maar indien deze is berekend aan de hand van slechts een beperkt aantal waarnemingen dan kan deze toch onbetrouwbaar zijn. Een lage correlatie, maar vastgesteld met behulp van een groot aantal waarnemingen, kan daarentegen betrouwbare en zinvolle informatie opleveren. Stel dat de correlatie tussen twee variabelen hoog is en bovendien statistisch significant, wat voor conclusies kunnen daar dan uit getrokken worden? Niet meer en niet minder dan dat er kennelijk een bepaald verband bestaat tussen de betreffende variabelen. Over een eventuele causale relatie zegt dit evenwel...niets! Een voorbeeld. Bij het bestuderen van de uitslagen van een rekentoets op een basisschool valt het op dat er een opmerkelijk verband bestaat tussen het lichaamsgewicht van de betrokken leerlingen en hun rekenvaardigheid. In figuur 2 staan de resultaten van deze toets weergegeven, afgezet tegen het lichaamsgewicht. In figuur 2.zijn de resultaten van een rekentoets afgezet tegen het lichaamsgewicht In dit voorbeeld zal het duidelijk zijn dat er sprake is van een schijnverband. Er is bij kinderen wel degelijk een relatie tussen lichaamsgewicht en rekenvaardigheid -figuur 2 spreekt voor zich- maar van een oorzakelijk verband is in het geheel geen sprake. Door een derde variabele, de leeftijd van de leerlingen, kunnen de resultaten eenvoudig worden verklaard. Met het ouder worden van de leerlingen neemt namelijk zowel de rekenvaardigheid als het lichaamsgewicht toe. Indien gecorrigeerd wordt voor leeftijd, blijkt er geen correlatie meer te bestaan tussen rekenvaardigheid en lichaamsgewicht. Een dergelijke correlatie, waarbij geen causaal verband bestaat tussen de variabelen, wordt spurieus genoemd (1,2).
Figuur 1 Enkele voorbeelden van een scatterdiagram met daarbij vermeld de pearson correlatie-coëfficiënt r. Figuur 2 De resultaten van een rekentoets afgezet tegen het lichaamsgewicht.
Het probleem bij spurieuze correlaties Het probleem bij spurieuze correlaties is dat niet altijd direct doorzien wordt dat een bepaalde correlatie spurieus is. Het gevolg daarvan kan zijn dat vrij voor de hand liggende, maar onjuiste conclusies worden getrokken. Indien men het bovenstaande voorbeeld bestudeert en daarbij niet doorziet wat de werkelijke oorzaak van de correlatie is, zou men geneigd kunnen zijn de leerlingen die slecht rekenen maar wat extra eten te geven. Dat verkeerde conclusies gemakkelijk getrokken kunnen worden blijkt onder meer uit de publikaties van Burk en Yiamouyiannis in 1965 waarin de auteurs stelden dat fluoridering van drinkwater kankerverwekkend is (3). Dit gaf destijds aanleiding voor nogal wat onrust. Zij baseerden zich op het feit dat de sterftecijfers ten gevolge van kanker in steden met gefluorideerd drinkwater groter was dan in steden met ontgefluorideerd drinkwater. Later bleek dat de gemiddelde leeftijd in de steden met gefluorideerd drinkwater toevalligerwijs hoger was dan in de andere steden. Toen gecorrigeerd werd voor deze verstorende variabele (confounder) bleek er in het geheel geen verband te bestaan tussen fluoridering en de sterfte aan kanker. Oorzakelijke samenhang Zoals het bovenstaande illustreert, moet bij het interpreteren van onderzoeksgegevens de nodige voorzichtigheid in acht worden genomen. Allereerst dient een onderzoek betrouwbaar en valide te zijn. Indien aan deze criteria is voldaan, zijn er een aantal bevindingen die steun geven aan het veronderstelde oorzakelijke karakter van een gevonden correlatie (3) - sterkte van de correlatie Hoe groter de r, des te groter is in het algemeen het argument van causaliteit. - interne consistentie Indien een expositie-respons relatie bestaat, dan is dat een aanwijzing voor causaliteit. Datzelfde geldt indien hetzelfde effect wordt teruggevonden in verschillende sub-groepen. - externe consistentie Als bij verschillende onderzoekingen in de verschillende delen van de wereld de resultaten in dezelfde richting wijzen dan kan dit een aanwijzing voor causaliteit zijn. - geloofwaardigheid De hypothese van causaliteit kan ondersteund worden door kennis van een bepaald mechanisme dat de associatie redelijk maakt. Het is frappant dat bij het bovengenoemde voorbeeld van de rekenvaardigheid en het lichaamsgewicht bij kinderen, wordt voldaan aan bovengenoemde criteria! De r is hoog en statistisch significant; de gevonden correlatie is intern consistent: hoe zwaarder de kinderen (lees ouder) des te beter rekenen ze, en dit geldt zowel voor jongens als meisjes; ook is er sprake van externe consistentie: in Japan en Mexico zal hetzelfde gevonden worden; een geloofwaardige hypothese is eveneens aanwezig: met de groei van het lichaam groeien ook de hersenen waardoor zij tot betere prestaties kunnen komen. Duidelijk is dat bovengenoemde criteria bepaald niet uitsluiten dat er verkeerde conclusies worden getrokken. Het is interessant eens na te gaan of een en ander ook in de fysiotherapie een rol kan spelen. Spurieuse correlaties en fysiotherapie Laten we eens een veel voorkomend euvel als voorbeeld nemen. Een ambtenaar spit op zaterdag zijn tuintje om. Op een gegeven moment krijgt hij een hevige pijn in de rug en kan hij het karwei niet afmaken. Stel dat een aantal collagene vezels in de anulus fibrosis het heeft begeven (pre-hnp fase). Met een pijnlijke stijve rug meldt de patiënt zich de volgende dag bij de huisarts. "Spit"! zegt deze en schrijft spierverslappende en pijnstillende medicatie voor. Gelukkig zakken de klachten af, maar aangezien de man toch nog last blijft houden wordt hij naar de dichtstbijzijnde fysiotherapeut verwezen. Op het verwijsbriefje prijkt de veelzeggende diagnose: acute lumbago. Uit het onderzoek concludeert de fysiotherapeut dat de spieren hypertoon zijn, dat de gehele lumbale regio pijnlijk is en dat de bewegingen zijn beperkt. Als behandeling wordt gekozen voor een sederende massage en interferentie als pijnstilling. Later kan dan aan mobilisatie en een oefenschema gedacht worden Het denk- en beslissingsproces van zowel de huisarts als de fysiotherapeut laten zich in een syllogisme samenvatten: Huisarts premisse major: premisse minor: conclusie: Fysiotherapeut: premisse major: premisse minor: conclusie: Ik wil de pijn en de hypertonie verminderen. Pijnstillende en spierverslappende medicatie verminderen de pijn en de tonus. Ik schrijf pijnstillende en spierverslappende middelen voor. Ik wil de pijn en de hypertonie verminderen Sederende massage en interferentie verminderen de pijn en de tonus. Ik geef een sederende massage en interferentie Is er iets mis met deze zogenaamde praktische redeneringen? Ja en nee!
Op zich zijn de redeneringen wel sluitend. Toch is het van belang in te zien dat de conclusies niet dwingend uit de premissen volgen (4). Zowel de huisarts als de fysiotherapeut hadden ook andere therapieën kunnen toepassen om hun doel te bereiken. Belangrijker is echter dat voorbij lijkt te worden gegaan aan de vraag waarom de spieren hypertoon zijn en waarom er pijn aanwezig is. Dat pijn en hypertonie aan elkaar gecorreleerd zijn, is in dit voorbeeld wel waarschijnlijk, maar het gaat nu weer om de vraag of er een causaal verband tussen beiden bestaat. Indien men er vanuit gaat dat de hypertone spieren verantwoordelijk zijn voor de pijn dan lijken bovenstaande redeneringen gerechtvaardigd te zijn. Op het moment dat men zich realiseert dat er een derde variabele meespeelt (de oorzaak, in dit geval de discuslaesie) die de twee andere factoren (pijn en hypertonie) veroorzaakt, komt de situatie wezenlijk anders te liggen. Dan wordt duidelijk dat de correlatie tussen hypertonie en pijn spurieus is, hetgeen aanleiding kan zijn een andere behandeling in te stellen. Zowel de pijn als de hypertonie kunnen dan begrepen worden als een functionele aanpassing waarmee nog meer weefselschade wordt voorkomen. Het laatste wat in deze situatie in aanmerking lijkt te komen is het voorschrijven van spierverslappende middelen of het willen detoniseren van spieren op zich. Normalisatie van de tonus kan wel een uiteindelijk doel blijven, maar zou gerealiseerd moeten worden door de oorzaak ervan (in dit geval de discusirritatie) zoveel mogelijk weg te nemen. De behandeling zou dan bijvoorbeeld kunnen bestaan uit het geven van adequate, discusontlastende (houdings-) adviezen en ADL-instructies om verdere irritatie van de discus te voorkomen. Tevens zou een oefenschema opgesteld kunnen worden waarbij de discus na verloop van tijd op geleide van de pijn meer functioneel belast wordt. Kanttekening Helaas is de exacte oorzaak van een bepaalde klacht niet altijd eenvoudig vast te stellen. Het is niet uitgesloten dat de ambtenaar uit ons voorbeeld het zelfde klinische beeld vertoont waarbij dit wel primair berust op een musculaire aandoening. Het gaat er in dit voorbeeld ook alleen maar om, aan te geven dat de vooronderstellingen van een behandelaar onjuist kunnen zijn en dat als gevolg daarvan een minder optimale of zelfs averechtse behandeling kan worden gegeven. Correlaties die gedeeltelijk spurieus zijn Het is bekend dat lokale, zeer drukpijnlijke, circumscripte verhardingen in spieren (triggerpoints) bij palpatie pijn kunnen veroorzaken in een buiten de spier gelegen gebied (5). Deze TPs worden wel verantwoordelijk gehouden voor de pijn van patiënten en de behandeling kan hier dan ook op geënt zijn (5). Door deze lokale spierverhardingen te behandelen kan de pijn van de patiënt verdwijnen. Elke praktiserende fysiotherapeut zal echter kunnen beamen dat dit niet altijd het geval is. Soms verbetert de spierverharding wel (tijdelijk), maar persisteert de pijn. Men kan zich dan afvragen of er een derde variabele in het spel is. Een functiestoornis in de cervicale wervelkolom bijvoorbeeld, die leidt tot chronisch verhoogde spieractiviteit en tot pijn. De TPs zouden dan kunnen ontstaan door de chronisch verhoogde spanning. Het is evenwel niet ondenkbaar dat dergelijke secundaire TPs een eigen leven gaan leiden en op hun beurt voor de nodige klachten zorgen. De correlatie tussen de pijn van de patiënt en de gevonden afwijking (het triggerpoint) kan in zo'n geval dus gedeeltelijk causaal zijn (het TP is de oorzaak van een deel van de pijn) en gedeeltelijk spurieus (de pijn wordt voor een deel door de functiestoornis veroorzaakt). Analoge redenaties kunnen worden geformuleerd tussen de variabelen pijn en arthrosis deformans, met als derde variabele een functiestoornis in gewrichten. Deze functiestoornis kan soms ook in een ander gewricht zijn gelokaliseerd dan dat waarin de pijn en de AD zich voordoen. Een voorbeeld hiervan is eerder in dit tijdschrift beschreven bij chondromalacie patellae en veranderingen in onder meer het Sl-gewricht of de voetwortel (6). Indekken tegen spurieuse correlaties Met de bewustwording van het feit dat de interpretatie van de onderzoeksgegevens moeilijk is en dat misinterpretaties eenvoudig kunnen optreden, dringt de vraag zich op wat je hier nu tegen kunt doen. 1. Allereerst lijkt het verstandig om de klinische gegevens van de patiënt zoveel mogelijk oorspronkelijk te houden, dus deze te noteren in de terminologie van de patiënt zelf. Indien een patiënt aanwijst dat hij bij het maken van een bepaalde beweging ergens iets voelt trekken dan is dat op zich een gegeven. Door dit gelijk te vertalen in een bepaalde naam (bijvoorbeeld "de hamstrings"), omdat dat waarschijnlijk de spier is die wordt aangewezen, wordt al een eerste stap gezet in een niet eenvoudig om te keren denkrichting. Het zou immers kunnen zijn dat bij nader onderzoek blijkt dat het bewuste gevoel van de patiënt voortkomt uit een andere spier of mogelijk zelfs uit andere weefsels. Een directe vertaling van een uitlating van de patiënt in bekend medisch jargon maakt de kans op ontdekking van een onjuiste vertaling er niet groter op.
2. Indien alle onderzoeksgegevens op een rijtje zijn gezet rolt daar een waarschijnlijkheidsdiagnose uit en een behandelplan. Het succesvol verlopen van de behandeling is evenwel geen bewijs dat de aannamen juist zijn geweest, maar kan hooguit een aanwijzing daarvoor zijn. Omgekeerd is het niet succesvol verlopen van een behandeling (de patiënt houdt klachten) niet een bewijs dat de aannamen van de fysiotherapeut onjuist zijn geweest. Toch is dit wel een reden een en ander nog eens te heroverwegen waardoor eventuele andere, niet direct verwachte, oorzaak-gevolg relaties naar voren kunnen komen. Juist daar waar de reacties van de patiënt afwijken van datgene wat de fysiotherapeut zou venvachten, is bezinning op zijn plaats. 3. Uit het voorgaande blijkt dat de reacties van de patiënt heel waardevol kunnen zijn. Een actieve interactie tussen fysiotherapeut en patiënt, waarbij de patiënt goed let op zijn verschillende lichaamssignalen en deze informatie frequent terugkoppelt naar de fysiotherapeut, kan er toe bijdragen dat de behandeling waar nodig op tijd kan worden bijgestuurd en dat gaandeweg meer inzicht in het probleem wordt verkregen. 4. Ten slotte kunnen fysiotherapeuten door het lezen van een tijdschrift als " Versus' op nieuwe inzichten en andere oorzaak- gevolg relaties geattendeerd worden, waardoor meer causaal-gerichte behandelmethoden in het vizier komen. Een abonnement op een dergelijk tijdschrift is dan ook aanbevelenswaardig, hoewel een mogelijke positieve correlatie tussen de abonnees op Versus en de kwaliteit van de behandeling weleens gedeeltelijk spurieus zou kunnen zijn! Literatuur 1. Drenth, PJ.D. Inleiding in dc testtheorie. 1985, Van Loghum Slaterus, Deventer. 2. Winkler, R.L. & W.L. Hays. Statistics, 1975, Holt, Winston 3. Sallé,H. et al Beknopte epidemiologie m.b.t. niet-infectieuze ziekten, 1987, UvA, Amsterdam 4. Beld, A. v.d. Filosofle van het menselijk handelen, 1982, Van Gorcum, Assen 5. Travell, J.G., D.G. Simons Myofascial Pain and Dysfunction-The Triggerpoint manual. Williams and Wilkins, 1983, Baltimore 6. Lagerberg, A. en R. Lulofs Chondromalacie Patellae. Haags tijdschrift voor fysiotherapie, 1983-1.