De Korte WaagSchaal: een risicotaxatie-instrument voor de ambulante forensische psychiatrie

Vergelijkbare documenten

Onderzoek met de SAPROF

Samenvatting (Summary in Dutch)

Verschillen tussen onderzoekers en behandelaars in het inschatten van het risico van gewelddadig gedrag

Innovatie in gestructureerde risicotaxatievan geweld: De HCR:V3 en SAPROF. Donderdag 6 december 2012 Kevin Douglas, Michiel de Vries Robbé

Risicotaxatie- en risicomanagementmethoden

EINDVERSLAG PILOT PRAKTISCHE BRUIKBAARHEID FORENSISCH AMBULANTE RISICO EVALUATIE - FARE

WaagSchaal jeugd: de psychometrische kwaliteit van een gestructureerd klinisch risicotaxatie-instrument voor de ambulante forensische psychiatrie

Beschermende factoren bij seksuele delinquenten

Risicotaxatie bij (huiselijk) geweldplegers

Samenvatting, conclusies en discussie

Het inschatten van agressie van patienten van de ggz crisisdienst

INHOUD PRESENTATIE FARE EERSTE RESULTATEN FARE IN ROM-SYSTEMEN EN EPD IMPLEMENTATIE TRAININGEN FARE VERVOLG

ANALYSE PATIËNTERVARINGEN ELZ HAAKSBERGEN

S a m e n v a t t i n g 149. Samenvatting

Antisociaal gedrag en problematisch middelengebruik. KFZ call

Cover Page. The handle holds various files of this Leiden University dissertation

Dynamische risicotaxatie

Joop Hoekman Training, Advies, Onderzoek Intake van jongeren in instellingen voor J-SGLVB: de ontwikkeling en het gebruik van een checklist

Actuarieel Risicotaxatie Instrument voor Jeugdbescherming (ARIJ)

Meetinstrumenten voor een landelijk onderzoek bij seksueel geweldplegers in een. forensisch psychiatrische instelling

Leidraad in de keten. Landelijk Instrumentarium Jeugdstrafrechtketen (LIJ) Contactgegevens

FORENSISCH AMBULANTE RISICO EVALUATIE FARE

LPFS SR NL. Instructies: Lees de volgende stellingen aandachtig en omcirkel in welke mate elke uitspraak op u van toepassing is:

Fort van de Democratie

begrippen bevatten evenals een heldere afbakening van taken en verantwoordelijkheden. Daarnaast kunnen in het protocol acute risicofactoren

het laagste niveau van psychologisch functioneren direct voordat de eerste bestraling begint. Zowel angstgevoelens als depressieve symptomen en

Prestatie-indicatoren forensische psychiatrie verslagjaar 2013

De FAM als aanvulling op de HCR-20 V3

Beschermende factoren voor (seksueel) gewelddadige recidive bij seksueel delinquenten

Overige (Overig, ongespecificeerd)

KLANTTEVREDENHEID 2018

Polikliniek. Forensische Psychiatrie

De psychometrische eigenschappen van de HKT-R Michelle Willems

CGt binnen de ambulante forensische GGz: nieuwe ontwikkelingen

Tijdschrift voor Seksuologie (2006) 30,

Factsheet Risicofactoren voor kindermishandeling

Antwoordsleutel vraag 2 t/m 9 IOF al la carte Pediatric Balance Scale

Geven en ontvangen van steun in de context van een chronische ziekte.

Beschermende factoren als moderator

Onderscheid door Kwaliteit

Nederlandse samenvatting

onderdeel van Mondriaan Patiëntenfolder Polikliniek

Rapport 834 Oud, W., & Emmelot, Y. (2010). De visitatieprocedure cultuurprofielscholen. Amsterdam: Kohnstamm Instituut.

Sex Offender Risk Assessment in the Netherlands: Towards a Risk Need Responsivity Oriented Approach W.J. Smid

Scholierenonderzoek Kindermishandeling 2016

richtlijnen opstellen, al dan niet voor specifieke dadertype/doelgroepen

Summery. Effectiviteit van een interventieprogramma op arm-, schouder- en nekklachten bij beeldschermwerkers

Principes bij de behandeling in de forensische psychiatrie

KLANTTEVREDENHEID Faas Psychologie

Rapportage Cliëntraadpleging. Novadic-Kentron

praktijk Risicotaxatie van geweld in de forensische psychiatrie

CarePower Cliënttevredenheidsonderzoek CarePower 2013/14

Samenvatting. The Disability Assessment Structured Interview, Its reliability and validity in work disability assessment, 2010

Risicotaxatie bij verslaafde justitiabelen Naar een (aanvullend)instrument

Hoofdstuk 1. Inleiding.

Ambulante forensische expertise voor een veiliger samenleving. Gespecialiseerde, ambulante forensische zorg

Forensische Herstelsetting

Team Mirror. Handleiding Team Mirror Rapport. Vertrouwelijk document uitgegeven door

Recente ontwikkelingen op het gebied van risicotaxatie van geweld: Naar meer balans en verfijning

Een beoordeling ter beoordeling

Forensisch Psychiatrische Afdeling

Beschrijving resultaten onderzoek biseksualiteit AmsterdamPinkPanel Oktober 2014 Joris Blaauw

NEDERLANDSE SAMENVATTING

Recidive bij volwassen mannelijke geweldplegers met een psychische aandoening

Instrument voor Forensische Behandel Evaluatie

No part of this book may be reproduced in any way whatsoever without the written permission of the publisher.

hoofdstuk 1 doelstellingen hoofdstuk 2 diagnosen

Een onderzoek naar visuele en verbale denkvoorkeuren en vaardigheden bij leerlingen van groep 6 en 7

Opdrachten speciaal herontworpen voor eerstejaars studenten

Substantial Clinical Important Benefit van de CMS en SST!! Toepassing van schoudervragenlijsten bij patiënten van het Schoudernetwerk Twente

Risicotaxatie bij forensisch psychiatrische patiënten met een lichte verstandelijke handicap: hoe bruikbaar zijn risicotaxatieinstrumenten?

We berekenen nog de effectgrootte aan de hand van formule 4.2 en rapporteren:

Patient reported Outcomes in Cognitive Impairement (PROCOG)

Samenvatting Nederlands

Lopende titel: RISICOPERCEPTIE BIJ TAXATIE VAN GEWELDSRISICO. Masterthese

Psychometrische stand van zaken van risicotaxatie-instrumenten voor volwassenen in Nederland

In Beweging! Lizette Wattel Universitair Netwerk Ouderenzorg UNO-VUmc

Samenvatting (Dutch summary)

De sociale psychologie van waargenomen rechtvaardigheid en de rol van onzekerheid

ROM met de OQ-45. Kim la Croix, sheets: Kim de Jong. Discover the world at Leiden University

Verdiepingssessie SCIL:

Wij zijn er. voor mensen die grensoverschrijdend. of strafbaar gedrag vertonen en. daardoor met justitie in aanraking. (dreigen) te komen.

No part of this book may be reproduced in any way whatsoever without the written permission of the publisher.

Wachttijden. in ggz-instellingen. GGZ Nederland Amersfoort Publicatienummer: juli 2010

EFFECTIVITEIT VAN DE GEEF ME DE 5 BASISCURSUS

De structuur van de Sexual Violence Risk-20 (SVR-20) in seksueel. gewelddadige terbeschikkinggestelden

Risicotaxatie bij jeugdige zeden- en geweldplegers in een ambulante setting. J.E. van Horn, A. Scholing, & J. Mulder

Tevredenheidsnormering HBO-monitor

Cover Page. The handle holds various files of this Leiden University dissertation.

hoofdstuk 3 Hoofdstuk 4 Hoofdstuk 5

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Gezinshuis Elin. Toets Nieuwe Toetreders Jeugdhulp. Gezond vertrouwen

Het voorspellen van recidive na de tbs-behandeling. Een vergelijkend onderzoek naar de predictieve validiteit van de HKT-EX en HCR-20

Management Summary. Auteur Tessa Puijk. Organisatie Van Diemen Communicatiemakelaars

Vitamine B12 deficiëntie

Hoofdstuk 1 Hoofdstuk 2

Predictieve validiteit van Cebirtests. Studie 1: criteriumvaliditeit in de bewakingsector

SAMENVATTING. Samenvatting

Module Veilig Verder. Een psycho-educatieve module over risicotaxatie voor patiënten in een forensische setting

Transcriptie:

De Korte WaagSchaal: een risicotaxatie-instrument voor de ambulante forensische psychiatrie Een onderzoek naar de interbeoordelaarsbetrouwbaarheid tussen behandelaars, basispsychologen en masterstudenten Auteur: Martijn Bond - 6124569 Datum: Augustus 2011 Master Klinisch Forensische Psychologie Begeleiding: UvA: Dr. Agnes Scholing De Waag: Dr. Joan van Horn

Samenvatting De Waag - centrum voor ambulante forensische psychiatrie - maakt bij de afsluiting van de behandeling van een cliënt gebruik van de gestructureerd klinisch risicotaxatie-instrument de Korte WaagSchaal (KWS). In dit onderzoek stonden drie doelen centraal: het vaststellen van de interbeoordelaarsbetrouwbaarheid tussen drie beoordelaarsgroepen (behandelaars, basispsychologen en masterstudenten); het in kaart brengen van verschillen in de beoordeling van de KWS; en binnen de groep behandelaars de samenhang onderzoeken tussen de beoordeling op de KWS en het contact met de cliënt en een aantal behandelaarskenmerken zoals jaren ervaring. De drie beoordelaarsgroepen kwamen over het algemeen matig overeen in hun oordeel van het functioneren van de cliënten.40 ICC<.60. Het viel hierbij op dat de beoordeling van zowel de basispsychologen als de masterstudenten in vergelijking tot de behandelaars gematigder, vaker in het midden van spectrum lag. Een verklaring hiervoor zou kunnen zijn doordat de behandelaars meer informatie over de cliënt tot zich hebben kunnen nemen. Een andere verklaring is dat behandelaars door hun ruimere ervaring meer vergelijkingsmateriaal hebben en zo kunnen inschatten hoe de cliënten zich tot elkaar verhouden. De drie groepen kwamen onderling slecht overeen op de beoordeling of een probleemgebied een risico was ICC<.40. Met een ANOVA werd berekend dat behandelaars in vergelijking tot basispsychologen en masterstudenten significant vaker het probleemgebied als een risico beoordeelden. Er was over het algemeen echter een goede overeenstemming op de beoordeling van het recidiverisico.60 ICC<.75. Er werden geen verbanden gevonden tussen de beschrijving van het contact dat de behandelaar met de cliënt had gehad en de beoordeling van de drie niveaus van de KWS. Daarnaast gaven jonge behandelaars bij een aantal domeinen verhoudingsgewijs vaker aan dat het probleemgebied een risico vormde voor de cliënt en de oudste behandelaars gaven vaker het omgekeerde aan. De oorzaak en betekenis hiervan is echter onbekend. Er werd geen verband gevonden tussen jaren ervaring van de behandelaar en de beoordelingen op de niveaus van de KWS. Uit dit onderzoek komen geen aanwijzingen naar voren dat het contact tussen de beoordelaar en de cliënt van invloed is geweest op de beoordeling van de risicotaxatie. Het blijkt eerder dat verschil in beschikbaarheid van informatie een rol heeft gespeeld bij een aantal gevonden verschillen tussen de drie beoordelaarsgroepen. 2

Inleiding Het uitvoeren van risicotaxaties is een belangrijke taak van professionals werkzaam in de forensische psychiatrie (De Ruiter, 1999). Bij het maken van een risicotaxatie worden alle gebieden uit het verleden en het heden van delinquenten die samenhangen met delictgedrag zo nauwkeurig mogelijk bekeken. Vervolgens wordt een inschatting gemaakt van de kans dat delictgedrag herhaald wordt. Risicotaxaties zijn van essentieel belang bij het opstellen van behandeldoelen en het nemen van beslissingen over het behandelbeleid, bijvoorbeeld het verlagen of verhogen van de intensiteit en duur van de behandeling (Van Horn, 2007). De meest gebruikte methode om risicotaxaties te verrichten is met gestructureerde klinische risicotaxatie-instrumenten. Deze instrumenten bestaan uit risicofactoren waarvan in empirisch wetenschappelijk onderzoek is aangetoond dat ze met delictgedrag samenhangen en waarbij het recidiverisico gebaseerd is op een klinische weging van deze factoren (De Ruiter, 1999). Veelgebruikte klinische risicotaxatie-instrumenten in Nederland zijn de Historical Clinical Riskmanagement-20 (HCR-20: Webster, Douglas, Eaves & Hart, 1997. Nederlandse bewerking: Philipse, De Ruiter, Hildebrand & Bouman, 2000), de Sexual Violence Risk-20 (SVR-20: Boer, Hart, Kropp & Webster, 1997. Nederlandse bewerking: Hildebrand, De Ruiter & Van Beek, 2001) en de Static-99 (Hanson & Thornton, 1999. Nederlandse bewerking: Van Beek, De Doncker & De Ruiter, 2001). Deze instrumenten hebben een goede validiteit en betrouwbaarheid laten zien in residentiële forensisch psychiatrische instellingen (De Vogel, De Ruiter, Van Beek & Mead, 2004). In forensische poliklinieken was dit echter niet het geval. Uit een onderzoek dat binnen De Waag - centrum voor ambulante forensische psychiatrie - werd uitgevoerd, kwam naar voren dat geen van de instrumenten psychometrisch goede resultaten behaalden bij ambulant behandelde cliënten. Ook inhoudelijk bleken de instrumenten niet aan te sluiten op een ambulante populatie. Er werd daarom binnen De Waag besloten om zelf een nieuw risicotaxatie-instrument te ontwikkelen. De subschalen die in de studie van Van Horn et al. (2005) een goede betrouwbaarheid lieten zien, werden hiervoor overgenomen. Ter aanvulling werd een aantal nieuwe schalen en items gecreëerd en een aantal bestaande schalen anders geformuleerd. Dit resulteerde uiteindelijk in de Volledige WaagSchaal (VWS). Ten behoeve van het periodiek evalueren van de behandeling en voor het gebruik bij de afsluiting van een behandeling werd in een latere fase een verkorte versie van de VWS ontwikkeld, genaamd de Korte WaagSchaal (KWS). De risicotaxatie procedure in beide instrumenten verloopt in overeenkomstige stappen: allereerst worden het functioneren van de cliënt op twaalf domeinen beoordeeld vervolgens wordt ingeschat of het disfunctioneren van cliënt op een 3

domein samenhangt met diens delictgedrag (risicodomein) en als laatste wordt het recidiverisico ingeschat. Bij De Waag wordt de risicotaxatie doorgaans verricht door de (hoofd)behandelaar. Het is echter de vraag of de behandelaar de aangewezen persoon is om de risicotaxatie te verrichten (Dernevik, Falkheim, Holmqvist & Sandell, 2001). Zijn behandelaars in staat om hun persoonlijke gevoelens buiten beschouwing te laten bij het uitvoeren van een risicotaxatie van een cliënt die ze goed kennen en waar ze veel tijd in hebben geïnvesteerd? Diverse auteurs menen dat dit contact zeker van invloed is op de taxatie en de beoordeling minder objectief maakt (Ackerman, 1999; Greenberg & Schuman, 1997; Litwack & Schlesinger, 1999). Zij adviseren daarom om risicotaxaties uit te laten voeren door een persoon die wat verder van de cliënt afstaat. Het is mogelijk dat een beoordelaar die lange tijd betrokken is bij de behandeling van een cliënt, gedurende het proces bepaalde denkfouten gaat maken. Een voorbeeld hiervan is de confirmatory bias; dit is de neiging van mensen om vast te houden aan hun reeds gevormde oordeel (De Ruiter, 1999). Een behandelaar zal zich in het begin van de behandeling een mening vormen over het gevaar van recidive van een cliënt. In de loop van de behandeling kan hij, bewust of onbewust, zoeken naar bevestiging voor zijn reeds gevormde oordeel en soms zelfs tegenstrijdige informatie terzijde schuiven. Door deze tunnelvisie neemt de kans toe dat er in de uiteindelijke risicotaxatie niet goed naar alle factoren wordt gekeken en dat het recidiverisico verkeerd wordt ingeschat. Een onafhankelijk persoon zal ook zijn eigen strategie gebruiken om de grote hoeveelheid informatie die voor een taxatie gebruikt moet worden, te simplificeren. Een beoordelaar die voorafgaand aan de beoordeling geen contact heeft gehad met de cliënt zal echter met een neutrale houding aan de taxatie beginnen en met een meer open blik naar de cliënt kijken waardoor de confirmatory bias bij hem niet (of minder) zal optreden (Spengler & Strohmer, 1994). Anderzijds zou het langdurige contact ook voordelen op kunnen leveren, doordat de behandelaar zich een veel uitgebreider beeld heeft kunnen vormen van de cliënt. Iemand die de taxatie uitvoert zonder daadwerkelijk contact te hebben gehad met de cliënt heeft weliswaar de informatie uit het dossier en de therapieverslagen, maar het is best mogelijk dat bepaalde nuances in het dossier ontbreken. Het is ook mogelijk dat het langdurige contact weinig invloed heeft op een beoordeling, omdat gevoelens van tegenoverdracht minder ruimte krijgen door de gestructureerde wijze van risico inschatten (De Vogel & De Ruiter, 2003). In een onderzoek van De Vogel en De Ruiter (2003) werd de samenhang van het contact met het inschatten van het risico van gewelddadig gedrag onderzocht. Aan de hand van 4

taxaties van de HCR-20 werden er drie beoordelaargroepen vergeleken: onderzoekers, hoofden behandeling en groepsleiders. De onderzoekers waren psychologen getraind in diagnostiek, zij hadden geen dagelijks contact met de patiënten en scoorden de risicotaxatie aan de hand van informatie uit het dossier. De hoofden behandeling waren ervaren clinici, zij hadden regelmatig contact met de patiënten en waren verantwoordelijk voor het uitzetten van de grote lijnen in de behandeling. De groepsleiders hadden dagelijks contact met de patiënten. De achtergrond van deze groep varieerde sterk, maar de meesten hadden een HBO of universitaire opleiding afgerond. De gemiddelde interbeoordelaarsbetrouwbaarheid was zeer hoog voor de historische items, hoog voor de klinische items en matig voor de items op de risicohanteringsschaal. Er waren echter ook een aantal individuele items die een lage betrouwbaarheid lieten zien. Hiervoor werden drie verklaringen gegeven: onervarenheid van een aantal codeurs met de HCR-20, verschillen in klinische ervaring tussen de codeurs en onduidelijke of te globale definitie van een aantal items (De Vogel & De Ruiter, 2003). Daarnaast werden er een aantal significante verschillen gevonden tussen de drie groepen. Ten eerste gaven de groepsleiders ten opzichte van de onderzoekers significant lagere scores op de historische items, risicohanteringsitems en totaalscore en - hoewel niet significant - ook met de hoofden behandeling. Een mogelijke oorzaak hiervoor zou kunnen zijn dat groepsleiders dagelijks omgaan met patiënten en hierdoor ook de menselijke, leuke kanten van de patiënten zien. De grotere emotionele betrokkenheid van de onderzochte groepsleiding kan meegewogen zijn in hun taxatie, waardoor deze lager is uitgevallen. Ten tweede was er tussen de hoofden behandeling en de onderzoekers een verschil in de interpretatie van de HCR-20 scores. In hun eindoordeel kwamen de hoofden behandeling significant vaker tot een laag recidiverisico. Dit zou er volgens De Vogel en De Ruiter (2003) op kunnen wijzen dat de hoofden behandeling sterker dan de onderzoekers, de druk voelden om de patiënten (zo snel mogelijk) te laten doorstromen naar een volgende - transmurale - fase. Het (onbewust) meenemen van zulke organisatorische en beleidsbeslissingen in de risicotaxatie kan ook worden opgevat als een vorm van cognitieve vertekening. De onderzoekers kunnen weliswaar ook bekend zijn met dit beleid, maar zij hebben er zelf niet direct mee te maken. Het is daarom mogelijk dat zij minder vatbaar waren om dit mee te nemen in hun oordeel. Een andere verklaring zou kunnen zijn dat meer ervaren behandelaars, met name de hoofden behandeling, vaker geneigd waren om bepaalde problematiek als minder ernstig op te vatten, omdat zij de desbetreffende patiënt gingen vergelijken met patiënten die ze eerder hadden behandeld (De Vogel & De Ruiter, 2003). 5

Er werd in het onderzoek van De Vogel en De Ruiter (2003) ook gekeken of de gevoelens van de behandelaars ten opzichte van hun patiënten samenhingen met de uitkomsten van de risicotaxatie. Er werd gevonden dat negatieve schalen als negatief, afstandelijk, afwijzend en overheerst van de Feeling Word Checklist (FWC: ontwikkeld door Whyte, Constantopoulus & Bevans, 1982 en bewerkt door Holmqvist & Fogelstan, 1996 en Holmqvist & Armelius, 1994) samen hingen met hoge HCR-20 totaalscores en inschattingen van het recidiverisico. Dit betekent dat behandelaars die het contact met de patiënt negatiever beoordeelden, de risicotaxatie negatiever invulden. De subschalen positief en accepterend, dus positievere beoordelingen van het contact, hingen daarentegen samen met lage HCR-20 totaalscores en eindoordelen (De Vogel & De Ruiter, 2003). De bevinding dat gevoelens van behandelaars ten opzichte van de patiënten die ze behandelden samenhingen met hun risicotaxaties, werd eerder aangetoond in het onderzoek van Dernevik et al. (2001). De vraag of behandelaars in staat zijn om hun persoonlijke gevoelens buiten beschouwing te laten bij het uitvoeren van een risicotaxatie van een cliënt die ze goed kennen en waar ze veel tijd in hebben geïnvesteerd, is vooralsnog nog niet volledig te beantwoorden. Uit het onderzoek van De Vogel en De Ruiter (2003) blijkt dat de gevoelens van behandelaars ten opzichte van de patiënten die ze behandelden, samenhingen met de beoordeling van de risicotaxaties. Daarbij zouden bepaalde verschillen tussen beoordelaargroepen verklaard kunnen worden door cognitieve vertekeningen, bijvoorbeeld doordat de ene groep vaker contact had met patiënten of doordat een andere groep zich meer zou hebben laten leiden door organisatorisch beleid. Anderzijds is het ook mogelijk dat ruimere klinische ervaring van de ene groep of minder ervaring in het gebruik van het taxatie-instrument van de andere groep, heeft bijgedragen aan verschillen tussen de groepen (De Vogel & De Ruiter, 2003). De bevindingen zijn dus verdeeld. Verschil in ervaring werd door De Vogel en De Ruiter (2003) aangedragen als mogelijke verklaring voor groepsverschillen, maar over het algemeen gaat men er in de literatuur van uit dat er geen samenhang is tussen ervaring en kwaliteit van de beoordeling. Ook andere kenmerken als leeftijd, sekse en expertise zijn bekeken en leverden inconsistente en tegenstrijdige resultaten op (Garb, 1989). In een recent onderzoek van Noordzij (2010) naar de beoordeling op de Volledige WaagSchaal (VWS) van onderzoekers in opleiding en ervaren behandelaars werden er ook geen significante groepsverschillen gevonden. Sommige auteurs menen dat er wel degelijk verschillen bestaan tussen beoordelaargroepen, maar dat het niet door verschil in ervaring verklaard kan worden (Spengler & Strohmer, 1994). Bieri, Atkins, Briar, Leaman, Miller en Tripodi (1966) stelden dat cognitieve complexiteit van groter belang is. Zij definiëren dit als 6

individuele verschillen in de capaciteit om sociaal gedrag op een multi-dimensionale manier uit te leggen. Beoordelaars met meer cognitieve complexiteit zouden vooraf aan de beoordeling naar meer informatie zoeken en bij de beoordeling meer informatie meenemen en ook inconsistente informatie gebruiken (Spengler & Strohmer, 1994). Met andere woorden, meer cognitief complexe individuen zouden minder kans hebben op tunnelvisie en hierdoor een beter oordeel afleveren. Een beperking van het onderzoek van De Vogel en De Ruiter (2003) is dat er nog niet bekend is welke groep de risicotaxatie het beste heeft uitgevoerd. Deze vraag zal ook met het voorliggend onderzoek niet beantwoord kunnen worden. Het huidige onderzoek zal echter wel meer informatie opleveren over de verschillen tussen diverse beoordelaargroepen en over de mogelijke samenhang van het contact dat de beoordelaar met de cliënt heeft gehad op de beoordeling van de risicotaxatie. Onderzoeksvragen en hypothesen Het hoofddoel van het voorliggende onderzoek was om de overeenkomsten en verschillen op de beoordeling van de drie niveaus van de KWS (Algemeen klinisch oordeel van de domeinscore, genaamd functioneren ; het bestempelen van probleemgebieden als risico, genaamd risicodomein en de inschatting van het recidiverisico, genaamd recidiverisico ) tussen drie groepen beoordelaars (behandelaars, basispsychologen en masterstudenten) in kaart te brengen. Daarnaast werd er binnen de groep van behandelaars gekeken naar de samenhang tussen de uitkomst van de risicotaxatie met zowel kenmerken van de behandelaar, als het ervaren contact van de behandelaar met de cliënt. Ten behoeve van de bovenstaande doelen werden de volgende onderzoeksvragen en hypotheses geformuleerd: 1. Wat is de interbeoordelaarsbetrouwbaarheid tussen de drie beoordelaarsgroepen? De interbeoordelaarsbetrouwbaarheid werd berekend met betrekking tot het functioneren, het risicodomein en het recidiverisico. Er werd een hoge interbeoordelaarsbetrouwbaarheid verwacht tussen de masterstudenten en basispsychologen omdat zij de cliënt niet hebben gezien en over dezelfde gegevens uit het dossier beschikten. Een lagere interbeoordelaarsbetrouwbaarheid werd verwacht tussen de behandelaars en de twee andere groepen. De reden hiervoor was dat de behandelaars als enige van de drie groepen contact hadden met de cliënt en dit van invloed kan zijn geweest op hun oordeel. 2. Zijn er verschillen tussen de drie beoordelaarsgroepen in het coderen van de KWS op de drie niveaus? De verwachting was dat de behandelaars in vergelijking met de masterstudenten en basispsychologen op de drie niveaus minder streng zouden scoren. Met andere woorden, de behandelaars zouden de domeinscore lager inschatten dan de andere 7

twee groepen, minder vaak een domein als risico bestempelen en ook het recidiverisico lager inschatten. Tussen de basispsychologen en masterstudenten werden geen structurele verschillen verwacht. 3. Is er een samenhang tussen de beschrijving van het contact dat behandelaars met hun cliënten hadden en het coderen van de KWS op de drie beoordelingsniveaus? Verwacht werd dat een negatieve beschrijving van het contact samen zou hangen met hogere scores op de KWS. Dat wil zeggen hogere inschatting van de domeinscores, meer domeinen als risico bestempelen en een hogere inschatting van het recidiverisico. 4. Is er binnen de beoordelaarsgroep van behandelaars een samenhang in het beoordelen van de drie niveaus van de Korte WaagSchaal, met een aantal kenmerken als leeftijd en jaren ervaring als behandelaar? Er werd op dit gebied geen samenhang verwacht. Methode In dit retrospectief onderzoek, uitgevoerd in De Waag tussen november 2010 en juli 2011 werden beoordelingen op de KWS vergeleken tussen drie groepen beoordelaars (behandelaars, basispsychologen en masterstudenten). Instelling De Waag behandelt personen vanaf 12 jaar met (dreigend) strafbaar gedrag. Het doel van een behandeling is het voorkomen van terugval in strafbaar gedrag. Cliënten kunnen zichzelf aanmelden of doorverwezen worden via de huisarts of een andere GGZ-instelling. Daarnaast wordt ongeveer een derde van de cliënten door justitie verplicht gesteld om aan de behandeling deel te nemen. Het merendeel van de cliënten wordt aangemeld voor een van de volgende problemen: agressie, huiselijk geweld, vermogen en seksueel probleemgedrag. Na de aanmelding volgt de intake en daarna wordt met de VWS een risicotaxatie uitgevoerd. Aan de hand van de problemen die uit de taxatie naar voren komen, wordt het behandelplan opgesteld. Het behandelplan wordt ten uitvoer gebracht in de fase behandeling. Aan het eind van de behandeling wordt er een afsluitende risicotaxatie gemaakt met behulp van de KWS. In dit onderzoek stond deze laatste fase, de afsluiting, centraal. Instrumenten In dit onderzoek werd gebruik gemaakt van de Korte WaagSchaal (KWS). Deze korte versie van de Volledige WaagSchaal (VWS) werd ontwikkeld omdat de VWS als evaluatie- 8

instrument veel tijd in beslag neemt. De KWS bestaat uit dezelfde twaalf domeinen als de VWS, namelijk: eerdere en huidige delicten, opleiding/werk, financiën, woonomgeving, gezin/partner, sociaal netwerk, vrije tijd, middelen, emotioneel/persoonlijk, houding, risicomanagement en seksuele problematiek. Het bevat echter niet de individuele items. De taxatie verloopt in drie fasen. Allereerst wordt bij ieder domein een algemeen klinisch oordeel gegeven over het functioneren van de cliënt, lopend van 0 bevredigend tot 5 onbevredigend. Een oordeel van 3 of hoger betekent dat cliënt onbevredigend functioneert op het betreffende gebied. Van de domeinen waarop de cliënt onbevredigend op functioneert wordt een inschatting gemaakt van de samenhang met delictgedrag (risicodomein). Ter afsluiting wordt het klinisch eindoordeel gevormd over het recidiverisico in termen van laag, laag-matig, matig, matig-hoog of hoog (Van Horn & Scholing, 2010). Om meer informatie te verkrijgen over de behandelaars, werd er een behandelaarslijst meegestuurd die de behandelaars in moesten vullen. Het bevatte zes vragen: over hun sekse, leeftijd, functieomschrijving, jaren ervaring als behandelaar, jaren ervaring als behandelaar in een forensische setting en jaren ervaring met de KWS. Beoordelaarsgroepen De vestigingsmanagers van De Waag hadden in totaal 50 behandelaars geselecteerd uit de totale groep van 176 behandelaars, die in 2010 cliënten met een verplicht behandelkader hebben afgesloten. Deze 50 behandelaars werden gekozen, omdat zij ervaring hebben met het verrichten van risicotaxatie met de KWS, positief stonden tegenover onderzoek en daar ook tijd voor vrij konden maken. Het waren psychologen met diverse achtergronden: psycholoog, GZ-psycholoog, klinisch psycholoog en psychotherapeut. De groep basispsychologen bestond uit drie afgestudeerde psychologen met minimaal een jaar ervaring in het verrichten van risicotaxaties met de VWS en KWS. De twee masterstudenten liepen stage bij de Waag ter afsluiting van de master klinische forensische psychologie aan de Universiteit van Amsterdam. Exclusiecriteria dossiers De 50 behandelaars die door de vestigingsmanagers werden geselecteerd, hadden in totaal 340 cliënten afgesloten in 2010. Aan de hand van een aantal exclusiecriteria werd deze dataset teruggebracht naar 101 cliënten. Cliënten werden uitgesloten als: - er geen VWS beschikbaar was (78 cliënten); 9

- er minder dan vijf therapieverslagen beschikbaar waren (36 cliënten); - ze zich in detentie bevonden ten tijde van de risicotaxatie (30 cliënten); - ze waren gerecidiveerd of opnieuw werden aangemeld (30 cliënten); - ze het vrouwelijke geslacht hadden (22 cliënten). Van de 340 cliënten bleven 144 over. Door bovenstaande exclusiecriteria waren er vijf behandelaars die geen cliënten meer over hielden voor het onderzoek. Tijdens het onderzoek waren er zeven behandelaars, met in totaal 43 cliënten, die aangaven dat ze toch niet mee konden werken. Uiteindelijk deden 38 behandelaars mee aan het onderzoek. Categorisering variabelen Bij onderzoeksvraag 1 werd met de formule: ICC : 11 de gemiddelde interbeoordelaarsbetrouwbaarheid tussen de drie groepen berekend. De gemiddelde scores op de domeinen werden als volgt berekend: de masterstudenten scoorden op domein 1: 0-0 keer, 1-0 keer, 2-12 keer, 3-55 keer, 4-28 keer en 5-6 keer. De som bij vermenigvuldiging van deze twee getallen is 331. Dit getal gedeeld door 101 beoordelingen geeft een gemiddelde score van 3,28. Voor het beantwoorden van onderzoeksvraag 3 en 4 werd een deel van de beoordelingen niet meegenomen. Het aantal cliënten per behandelaar verschilde namelijk enorm tussen de behandelaars. Deze diversiteit zou ervoor kunnen zorgen dat de persoonlijke mening van een behandelaar met zeven cliënten te veel invloed heeft op de resultaten, ten opzichte van de behandelaars met maar één cliënt. Er werd daarom voor gekozen om alleen de behandelaars mee te nemen met drie of meer cliënten. Dit resulteerde in een groep van 18 behandelaars met in totaal 72 cliënten (negen behandelaars met drie cliënten, vijf behandelaars met vier cliënten, drie behandelaars met zes cliënten en een behandelaar met zeven cliënten). De antwoorden op de vraag naar het contact werden beoordeeld op een vijfpuntsschaal: (1) negatief, (2) enigszins negatief, (3) neutraal, (4) enigszins positief, (5) positief. Enigszins negatief werd gescoord als de behandelaar dit zelf zo omschreef, bijvoorbeeld: Ik kon geen echt contact met hem krijgen. Enigszins positief werd regelmatig gescoord bij een omschrijving van contactgroei, bijvoorbeeld: Gesloten in het begin, maar langzaamaan groeide er meer contact. Voor onderzoeksvraag 4 werden er vier leeftijdsgroepen van behandelaars gemaakt met een evenredige verdeling per groep: jonger dan 34 jaar, tussen 35 en 39 jaar, tussen 40 en 44 jaar en ouder dan 45 jaar. Dit werd gedaan om te voldoen aan de assumptie dat er in niet minder dan 20% van de cellen een expected cell count mag zijn dat kleiner was dan 5. Om dezelfde reden werden de beoordelingen op de domeinscore samengevoegd naar twee 10

groepen, waarin de eerste groep het domein geen probleem vond (score 0, 1 of 2) en de tweede groep het domein wel een probleem vond (score 3, 4, of 5). Procedure Van alle cliënten die in 2010 waren afgesloten werd door de basispsychologen in het Elektronisch Patiënten Dossier (EPD) op basis van dossierinformatie een KWS gescoord. De behandelaars die door de vestigingsmanagers waren voorgedragen, ontvingen een lijst met cliënten van wie zij zelf de hoofdbehandelaar waren geweest, uitleg over het onderzoek en een behandelaarlijst. De KWS kon digitaal of op papier worden ingevuld en daarna via de e- mail of interne post teruggestuurd. Ze deden dit op basis van wat zij nog wisten van hun gesprekken met de cliënt, aangevuld met dossierinformatie. Hierbij werd uitdrukkelijk vermeld dat ze de ingevulde KWS in het EPD niet mochten inzien en gebruiken. Op het formulier van de KWS moesten de behandelaars ook aangeven hoe ze het contact met de cliënt ervaren hadden. De vraag die aan hen werd gesteld, was: Kun je een korte beschrijving maken van het contact dat je hebt gehad met deze cliënt, denk bijvoorbeeld aan termen als open of gesloten, vriendelijk of onvriendelijk, etc. De meeste behandelaars hadden de vraag naar het contact met de cliënt goed beantwoord. Sommigen gaven echter een beschrijving van de cliënt (bijvoorbeeld: het was een vriendelijke man ), in plaats van een beschrijving van het contact tussen hen en de cliënt. Deze twee beschrijvingen zijn niet hetzelfde. Het is namelijk mogelijk dat een op zich vriendelijke man in het contact heel gesloten of onvriendelijk wordt, bijvoorbeeld wanneer er dieper wordt ingegaan op zijn delicten. Er is daarom voor gekozen om de beschrijvingen waarin de cliënt zelf wordt besproken, niet mee te nemen. De risicotaxaties van de cliënten die werden geretourneerd, werden ingevoerd in SPSS en ook door de masterstudenten gescoord. De masterstudenten hadden een eendaagse cursus gehad in het verrichten van risicotaxaties met de VWS. Voorafgaand aan het onderzoek hadden ze onafhankelijk van elkaar ieder vijf risicotaxaties gescoord, waarbij voor iedere casus de consensus tussen beide studenten werd besproken. Bij de punten waar ze niet hetzelfde hadden gescoord, werd, in lijn met de handleiding, bediscussieerd en besloten op welke wijze de beoordeling meer in overeenstemming zou kunnen worden gebracht. De studenten scoorden de KWS op papier op basis van dossierinformatie. 11

Data-analyse Analyse bij hypothese 1: De interbeoordelaarsbetrouwbaarheid tussen de drie beoordelaarsgroepen (behandelaars, basispsychologen en masterstudenten) werd in dit onderzoek onderzocht met behulp van de intraklasse correlatie coëfficiënt (ICC; McGraw & Wong, 1996) met de beoordelaargroepen als onafhankelijke variabele en de drie beoordelingsniveaus (domeinscore, risico en recidiverisico) als afhankelijke variabelen. Hiervoor werden single measures ICC s berekend volgens het two way effect model, met absolute overeenstemming als criterium (Shrout & Fleisch, 1979). De richtlijn - ICC<.40 staat voor een slechte overeenkomst,.40 ICC<.60 geldt als een matige overeenkomst,.60 ICC<.75 geldt als een goede overeenkomst en ICC.75 geldt als uitstekende overeenkomst - werd hierbij gehanteerd (Landis & Koch, 1977). Domein 12 werd door het kleine aantal cliënten met seksuele problematiek, niet meegenomen. Bij de berekening van de onderlinge verschillen tussen de drie groepen in de beoordeling van een domein als risico op herhaald delictgedrag werden alleen die beoordelingen meegenomen, waarbij twee groepen allebei het domein als probleem hadden beoordeeld. Hierdoor werden beoordelingen waarbij de ene groep het domein niet als een probleem zag, terwijl de andere groep aangaf dat dit domein een risico was, niet meegenomen. Analyse bij hypothese 2: Om te onderzoeken of er verschillen waren tussen de drie beoordelaarsgroepen in de domeinscores werd een ANOVA gebruikt met de groepen als onafhankelijke en de domeinscores als afhankelijke variabelen. Voor de inschatting van het recidiverisico, werden de drie groepen paarsgewijs vergeleken met een Mann-Whitney test. De inschatting van het recidiverisico van de drie groepen werd met een ANOVA onderzocht. Analyse bij hypothese 3: Binnen de groep van behandelaars werd er gekeken of de beschrijving van het contact tussen behandelaar en cliënt, samenhing met de beoordeling van de diverse domeinen en de inschatting van het recidiverisico. Dit werd met de Pearson product-moment correlation coefficient berekend. De samenhang tussen de beschrijving van het contact tussen behandelaar en de inschatting van het recidiverisico werd met een chikwadraat toets berekend. Analyse bij hypothese 4: Binnen de groep van behandelaars werd er gekeken naar de samenhang tussen de beoordeling van de drie niveaus en een aantal kenmerken van de behandelaar, waaronder leeftijd en jaren ervaring als behandelaar. Dit werd met een chikwadraat toets berekend. 12

Resultaten Onderzoeksvraag 1 De drie beoordelaargroepen stemden gemiddeld matig overeen in hun oordeel op de diverse domeinen (.40 ICC<.60). Er werd een matige gemiddelde overeenstemming gevonden tussen zowel de behandelaars en de basispsychologen als tussen de masterstudenten en de basispsychologen. Tussen de behandelaars en de masterstudenten werd er een goede overeenstemming gevonden (.60 ICC<.75). Tussen de verschillende domeinen werd er een grote diversiteit aan betrouwbaarheid waargenomen. Op domein 8 was dit voor de drie groepen uitstekend (ICC.75), op domeinen 2, 3, 7, 9.1 en 11 was dit goed (.60 ICC<.75) en op de domeinen 1, 4, 5, 6, 9.2, 9.3 en 10 was dit matig (.40 ICC<.60). De interbeoordelaarsbetrouwbaarheid tussen de behandelaars, basispsychologen en masterstudenten zijn te lezen in tabel 1. Tabel 1. Single measures Intraklasse Correlatie Coëfficiënten (ICC) voor de Beoordeling van de Domeinen van Behandelaars (1), Basispsychologen (2) en Masterstudenten (3). ICC - 1, 2, 3 ICC - 1, 2 ICC - 1, 3 ICC - 2, 3 1. Eerdere en huidige delicten,477,427,497,524 2. Opleiding/werk,641,611,709,581 3. Financiën,730,694,689,817 4. Woonomgeving,554,545,580,551 5. Gezin/partner,408,322,464,432 6. Sociaal netwerk,549,505,539,603 7. Vrije tijd,613,597,620,628 8. Middelen,812,771,822,852 9.1. Slachtofferschap,628,637,666,574 9.2. Persoonlijkheidskenmerken,421,359,507,376 9.3. Actueel psychisch functioneren,435,330,577,353 10. Houding,474,440,498,457 11. Risicomanagement,646,602,662,660 Gemiddeld,568,526,602,570 De drie groepen kwamen onderling slecht overeen in hun beoordeling of een probleemgebied wel of niet een risico was (ICC<.40). Zie tabel 2 voor de interbeoordelaarsbetrouwbaarheid tussen behandelaars en basispsychologen, tabel 3 voor behandelaars en masterstudenten en tabel 4 voor basispsychologen en masterstudenten. 13

Tabel 2. Interbeoordelaarsbetrouwbaarheid (Cohen s kappa) tussen Behandelaars en Basispsychologen voor de Beoordeling van een Probleemgebied als een Risico. N Aantal overeenkomst Aantal geen overeenkomst Cohen s Domein risico risico kappa 1. Eerdere en huidige delicten 78 45 33,211 2. Opleiding/werk 33 19 14 -,027 3. Financiën 35 19 16,130 4. Woonomgeving 21 18 3,577 5. Gezin/partner 56 33 23,179 6. Sociaal netwerk 33 23 10,348 7. Vrije tijd 27 19 8,294 8. Middelen 36 18 18,027 9.1. Slachtofferschap 21 9 12 -,050 9.2. Persoonlijkheidskenmerken 71 51 20,240 9.3. Actueel psychisch functioneren 26 14 12,077 10. Houding 28 14 14,152 11. Risicomanagement 26 15 11,263 Tabel 3. Interbeoordelaarsbetrouwbaarheid (Cohen s kappa) tussen Behandelaars en Masterstudenten voor de Beoordeling van een Probleemgebied als een Risico. N Aantal overeenkomst Aantal geen overeenkomst Cohen s kappa Domein risico risico 1. Eerdere en huidige delicten 75 44 31,248 2. Opleiding/werk 37 26 11,253 3. Financiën 50 35 15,268 4. Woonomgeving 20 13 7 -,094 5. Gezin/partner 48 27 21,259 6. Sociaal netwerk 45 33 12,211 7. Vrije tijd 23 17 6,266 8. Middelen 35 22 13,263 9.1. Slachtofferschap 31 17 14,152 9.2. Persoonlijkheidskenmerken 63 36 27,094 9.3. Actueel psychisch functioneren 40 23 17,150 10. Houding 42 25 17,208 11. Risicomanagement 41 24 17,192 14

Tabel 4. Interbeoordelaarsbetrouwbaarheid (Cohen s kappa) tussen Basispsychologen en Masterstudenten voor de Beoordeling van een Probleemgebied als een Risico. N Aantal overeenkomst Aantal geen overeenkomst Cohen s Domein risico risico kappa 1. Eerdere en huidige delicten 81 54 27,272 2. Opleiding/werk 30 23 7 -,105 3. Financiën 42 35 7,432 4. Woonomgeving 20 15 5 -,087 5. Gezin/partner 57 34 23,188 6. Sociaal netwerk 33 23 10,340 7. Vrije tijd 20 14 6,077 8. Middelen 42 21 21 -,028 9.1. Slachtofferschap 24 19 5,318 9.2. Persoonlijkheidskenmerken 65 42 23,286 9.3. Actueel psychisch functioneren 22 17 5,553 10. Houding 34 18 16 -,038 11. Risicomanagement 30 18 12,189 Tabel 5 wijst uit dat de drie groepen bij hun inschatting van het recidiverisico van de delicttypen zeden, geweld, huiselijk geweld en vermogen een goede interbeoordelaarsbetrouwbaarheid lieten zien (.60 ICC<.75). De overeenkomst op de inschatting van geweld en vermogen was daarentegen matig (.40 ICC<.60). Tabel 5. Single measures Intraklasse Correlatie Coëfficiënten (ICC) voor de Inschatting van het Recidiverisico op Diverse Delicttypen van Behandelaars (1), Basispsychologen 2) en Masterstudenten (3). ICC - 1, 2, 3 ICC - 1, 2 ICC - 1, 3 ICC - 2, 3 Recidiverisico Zeden,707,618,892,604 Geweld,639,595,638,678 Huiselijk Geweld,748,717,735,789 Vermogen,681,644,723,681 Geweld en Vermogen,439,451,508,389 Kort samengevat stemden de drie beoordelaarsgroepen over het algemeen matig overeen in hun oordeel op de diverse domeinen en kwamen de groepen onderling slecht overeen op de 15

beoordeling of een probleemgebied een risico was. Er was over het algemeen echter wel een goede overeenstemming op de beoordeling van het recidiverisico. Onderzoeksvraag 2 Om te onderzoeken hoe het kwam dat bepaalde domeinen onbetrouwbaar werden gescoord, werd er allereerst gekeken naar de verschillen tussen de drie groepen op de domeinscore. Alle gemiddelde scores en standaarddeviaties zijn te vinden in tabel 6. Tabel 6. Gemiddelde Domeinscores op de KWS van Behandelaar, Basispsycholoog en Masterstudent Behandelaar Basispsycholoog Masterstudent F-score M (SD) M (SD) M (SD) 1. Eerdere en huidige delicten 3,35 (1,23) 3,71 (,90) 3,28 (,75) 5,322** 2. Opleiding/werk 2,15 (1,57) 2,28 (1,23) 2,21 (1,17),255 3. Financiën 2,26 (1,62) 2,17 (1,53) 2,29 (1,37),157 4. Woonomgeving 1,43 (1,55) 1,48 (1,44) 1,70 (1,29) 1,053 5. Gezin/partner 2,97 (1,49) 3,32 (1,02) 2,76 (,98) 5,517** 6. Sociaal netwerk 2,26 (1,45) 2,19 (1,35) 2,25 (1,21),063 7. Vrije tijd 2,10 (1,35) 1,97 (1,31) 1,90 (1,06),662 8. Middelen 2,02 (1,61) 2,28 (1,65) 2,03 (1,50),837 9.1. Slachtofferschap 1,92 (1,58) 1,60 (1,46) 2,12 (1,43) 3,072* 9.2. Persoonlijkheidskenmerken 3,29 (1,22) 3,51 (,74) 2,98 (,84) 7,730** 9.3. Actueel psychisch functioneren 2,58 (1,48) 2,28 (1,23) 2,46 (1,12) 1,280 10. Houding 2,33 (1,48) 2,32 (1,28) 2,74 (1,09) 3,501* 11. Risicomanagement 2,25 (1,53) 2,35 (1,40) 2,42 (1,39),341 * p<.05, ** p<.01 De verschillen tussen de drie groepen in gemiddelde domeinscore op de KWS waren significant voor domein 1, 5, 9.1, 9.2 en 10. Bij de onderlinge vergelijking van de groepen werd gevonden dat de behandelaars en de basispsychologen alleen bij de beoordeling op eerdere en huidige delicten significant van elkaar verschilden. De behandelaars lieten op dit domein lagere scores zien, waardoor de basispsychologen op een hoger gemiddelde uitkwamen. De matige overeenkomst op de andere domeinen (4, 5, 6, 9.2, 9.3 en 10) konden niet verklaard worden door significante verschillen tussen de groepen. De behandelaars en de masterstudenten verschilden op domein 9.2 en domein 10 significant van elkaar. De behandelaars beoordeelden de persoonlijkheidskenmerken van de cliënt negatiever en de houding positiever. Bij de verdeling van de beoordelingen viel tussen deze twee groepen wel een patroon te herkennen. De behandelaars beoordeelden de domeinen 16

vaker met een zeer lage score (0) of een zeer hoge score (5), wat wil zeggen dat ze uitgesprokener waren in hun oordeel. De masterstudenten beoordeelden gematigder, vaker in het midden van spectrum. Dit patroon werd ook gevonden, zij het minder uitgesproken, op de domeinen 2, 3, 9.1 en 11, waar er een goede interbeoordelaarsbetrouwbaarheid tussen de twee groepen was. De masterstudenten beoordeelden de domeinen 1, 4, 5, 9.2 en 9.3 over het algemeen lager dan de basispsychologen, wat op domein 1, 5 en 9.2 significante verschillen opleverde tussen de twee groepen. Het slachtofferschap en de houding werden door de masterstudenten echter negatiever beoordeeld. De drie groepen kwamen onderling slecht overeen op de beoordeling of een probleemgebied een risico was. Dit werd veroorzaakt doordat de behandelaars, in de vergelijking met de andere twee groepen bij alle domeinen behalve domein waar het ging om het beoordelen van middelenproblematiek en actueel psychisch functioneren, significant vaker een probleemgebied als een risico bestempelden. Tussen de basispsychologen en masterstudenten werd geen specifiek patroon gevonden. Bij sommige domeinen gaven de basispsychologen vaker aan dat het probleemgebied een risico was en bij een aantal domeinen waren het de masterstudenten die het vaker als risico bestempelden. Tabel 7 laat de gemiddelde beoordelingen van het recidiverisico zien van de drie groepen. Tussen de drie beoordelaarsgroepen werden er geen significante verschillen gevonden op hun beoordeling van het recidiverisico. Tabel 7. Beoordeling van het Recidiverisico op de KWS Behandelaar Basispsycholoog Masterstudent F-score M (SD) M (SD) M (SD) Zeden 2,18 (1,33) 2,46 (1,51) 2,50 (1,17),545 Geweld 2,85 (1,28) 2,80 (1,29) 2,60 (1,06),673 Huiselijk geweld 2,65 (1,26) 2,57 (1,16) 2,37 (1,15),392 Vermogen 2,38 (1,31) 2,61 (1,48) 2,25 (1,30),705 17

Onderzoeksvraag 3 Binnen de groep van behandelaars werd er gekeken of de beschrijving van het contact dat de behandelaar met de cliënt heeft gehad, samenhing met de domeinscore, de beoordeling of een probleemgebied een risico was en de inschatting van het recidiverisico. De correlatie tussen de beschrijving van het contact en de domeinscore staat te lezen in tabel 8. Tabel 8 Correlatie tussen de Beoordeling op het Domein van de KWS en de Beschrijving van het Contact dat de Behandelaar met de Cliënt heeft gehad. Domein Correlatiecoëfficiënt p-waarde 1. Eerdere en huidige delicten -,300,032 2. Opleiding/werk -,134,350 3. Financiën -,282,045 4. Woonomgeving -,287,041 5. Gezin/partner -,160,263 6. Sociaal netwerk,063,660 7. Vrije tijd -,182,201 8. Middelen -,085,553 9.1. Slachtofferschap -,171,230 9.2. Persoonlijkheidskenmerken -,336,016 9.3. Actueel psychisch functioneren -,323,021 10. Houding -,352,011 11. Risicomanagement -,427,002 De negatieve correlatiecoëfficiënt betekent dat een positief beschreven contact samenhing met lagere domeinscores (beter functioneren) en dat negatieve beschrijvingen van het contact samenhingen met hogere domeinscores (slechter functioneren). Voor een aantal domeinen bleek deze samenhang significant te zijn. Het is echter informatiever om te kijken naar de kracht van het verband en dat was in dit geval zwak. Als er een perfect negatief verband zou zijn, waarbij een negatief beschreven contact volledig samen zou hangen met hogere domeinscores en een positief contact altijd met lage scores, dan zou er een correlatiecoëfficiënt van -1 zijn. Nu ligt het getal veel dichter bij de 0, wat betekent dat er weinig lineaire samenhang was. Er blijkt geen samenhang te zijn tussen het bestempelen van probleemgebieden als risico en de beschrijving van het ervaren contact tussen behandelaar en cliënt. Uit tabel 9 blijkt de inschatting van het recidiverisico niet samen te hangen met de beoordeling van de behandelaar over de kwaliteit van het contact met de cliënt. 18

Tabel 9 Correlatie tussen de Beoordeling van het Recidiverisico en de Beschrijving van het Contact dat de Behandelaar met de Cliënt heeft gehad. Correlatiecoëfficiënt p-waarde Zeden,029,842 Geweld,034,814 Huiselijk geweld -,163,252 Vermogen -,091,527 Geweld en vermogen -,157,271 Onderzoeksvraag 4 Binnen de groep van behandelaars werd er gekeken naar de samenhang tussen een aantal kenmerken van de behandelaar en de beoordelingen op drie niveaus van de KWS. Er werd geen samenhang gevonden tussen leeftijd van de behandelaar en de beoordeling van het functioneren van de cliënt of tussen leeftijd en de beoordeling van het recidiverisico. De beoordeling van het risicodomein bleek significant samen te hangen met de domeinen 5, 6, 6, 10 en 11. De jonge behandelaars gaven hier verhoudingsgewijs vaker aan dat het probleemgebied een risico vormde voor de cliënt en de oudste behandelaars gaven vaker het omgekeerde aan. De andere twee groepen gaven, behalve bij domein 5 ook vaker aan dat het domein wel een probleem was (zie tabel 10). Tabel 10 De Verdeling van de Beoordelingen van het Domein over de Leeftijdscategorieën. Jonger dan 34 35-39 40-44 Ouder dan 45 Domein 5 Domein 6 Domein 7 Domein 10 Domein 11 Geen probleem 16 14 10 3 Wel probleem 3 7 8 7 Geen probleem 14 5 6 1 Wel probleem 5 16 12 9 Geen probleem 12 5 6 1 Wel probleem 7 16 12 9 Geen probleem 16 8 8 3 Wel probleem 3 13 10 7 Geen probleem 14 10 6 2 Wel probleem 5 10 12 8 19

Er bleek geen samenhang te zijn tussen de ervaring van de behandelaar en de beoordeling van het functioneren van een cliënt, het bepalen van het risicodomein of de beoordeling van het recidiverisico. Discussie In dit onderzoek werden behandelaars, basispsychologen en masterstudenten vergeleken op hun oordeel van drie niveaus van de KWS. Er werd gemiddeld een matige overeenkomst gevonden op de beoordeling van het functioneren van de cliënt. Een verklaring hiervoor zou gezocht kunnen worden in het verschil aan beschikbare informatie. De behandelaars hadden als enige groep de cliënt gezien en dit zou met zich mee kunnen brengen dat zij meer nuances kunnen aanbrengen. Vooral de persoonlijke en emotionele items zouden hierdoor anders kunnen worden ingeschat door de andere twee groepen. het kan ook zijn dat bepaalde domeinen, zoals woonomgeving en sociaal netwerk aan het eind van de behandeling niet meer zo aan bod komen en hierdoor niet meer in het dossier komen te staan. Het wordt dan moeilijker voor de basispsychologen en masterstudenten om zich er een oordeel over te vormen. Problemen rondom alcohol en drugs komen wel regelmatig terug in de behandeling en worden goed weergegeven in het dossier. Dit zou kunnen verklaren waarom middelenproblematiek het meest betrouwbaar werd beoordeeld. Men zou verwachten dat het domein als eerdere en huidige delicten dan een betere betrouwbaarheid zou laten zien. Er bleek echter een matige overeenkomst te zijn op dit domein. De hypothese dat beschikbaarheid van informatie een verschil kan opleveren, werd ondersteund door de bevinding dat behandelaars meer uitgesproken waren in hun oordeel. De basispsychologen en masterstudenten scoorden de domeinen wat veiliger in het midden van het spectrum. Een andere reden zou kunnen zijn dat de behandelaars door hun ruimere ervaring de cliënten kunnen vergelijken met andere cliënten en zo kunnen inschatten hoe ze tot elkaar verhouden. De andere twee groepen hebben minder vergelijkingsmateriaal, wat het moeilijker maakt om de cliënt op het uiteinde van de schaal te plaatsen. Er werd een slechte overeenkomst gevonden op het bestempelen van een probleemgebeid als een risico. Dit werd voornamelijk veroorzaakt doordat de behandelaars, veel vaker een risico constateerden dan de twee andere groepen. De behandelaars waren dus veel strenger. Dit was tegenovergesteld van wat er verwacht werd. Het kan zijn dan de ruimere ervaring van de behandelaars hier wederom de oorzaak van is geweest. Uit de resultaten komt naar voren dat ondanks de matige tot slechte overeenkomst op de eerste twee niveaus, de drie groepen wel goed overeen kwamen op hun beoordeling van het recidiverisico. 20

Terugkijkend naar de onderzoeksvragen en hypotheses kunnen de volgende conclusies getrokken worden. De verwachting dat tussen de masterstudenten en basispsychologen een hogere interbeoordelaarsbetrouwbaarheid gevonden zou worden dan tussen beide groepen en de behandelaars, is niet uitgekomen. De masterstudenten en basispsychologen lieten zelfs meer significante verschillen zien dan beide groepen onderling met behandelaars. De hypothese dat behandelaars in vergelijking met masterstudenten en basispsychologen minder streng zouden scoren, werd bij het bepalen van de risicodomeinen tegengesproken door de bevinding dat behandelaars juist strenger waren in hun oordeel. Binnen de groep van behandelaars werd er geen samenhang gevonden tussen de beschrijving van het contact dat de behandelaar met de cliënt heeft gehad en hun beoordeling van de cliënt op de KWS. Een verklaring hiervoor zou kunnen zijn dat de behandelaars objectief zijn gebleven in hun oordeel. Een andere verklaring is dat het contact wel degelijk van invloed is op de beoordeling van de cliënt, maar dat de open vraag die gesteld is aan de behandelaars niet toereikend is om dit goed naar boven te krijgen. Sommige behandelaars hebben uitgebreid geantwoord op de vraag die hen gesteld werd, anderen schreven echter alleen: gesloten, onvriendelijk. In het onderzoek van De Vogel en De Ruiter werd de beschrijving van het contact d.m.v. een specifieke vragenlijst (Feeling Word Checklist) onderzocht. Dit was ten eerste kwantitatief en ten tweede veel uitgebreider, doordat de FWC onder te verdelen valt in acht subschalen over vier dimensies. Men zou in dit geval ook een groter verband verwacht hebben tussen domein 11 en de beschrijving van het contact. Het zal namelijk vaak samen gaan dat een gemotiveerde cliënt die zich wil inzetten om de behandeling succesvol af te ronden, vriendelijk en open in het contact is. Of dat een cliënt die geen motivatie heeft, meer gesloten zal zijn. Hier zijn de gevonden resultaten echter te laag om te spreken van een betekenisvol verband. Binnen de groep van behandelaars werd er een significant verband gevonden tussen de beoordeling op een aantal domeinen en de leeftijd van de behandelaars. De jonge behandelaars gaven hier verhoudingsgewijs vaker aan dat het probleemgebied een risico vormde voor de cliënt en de oudste behandelaars gaven vaker het omgekeerde aan. De conclusie dat jongere behandelaars strenger scoorden dan oudere behandelaars kan echter alleen met zeer veel voorzichtigheid gesteld worden. Het geldt namelijk maar voor een paar domeinen en het betrof hier een kleine groep behandelaars uit de gehele groep. Daarnaast is er geen logische verklaring beschikbaar waarom de jongere behandelaars juist op deze domeinen strenger zouden scoren. 21

Beperkingen en suggesties voor nieuw onderzoek Een beperking aan dit onderzoek is dat de drie groepen die met elkaar vergeleken zijn, op meerdere punten van elkaar verschillen. De behandelaars hebben bijvoorbeeld als enige groep contact gehad met de cliënten en daarnaast hebben zij over het algemeen ook meer ervaring dan de andere twee groepen. Het wordt hierdoor lastig om de resultaten te duiden. Een suggestie voor nieuw onderzoek is om beoordelingen van behandelaars onderling te vergelijken, waarbij de ene behandelaar de cliënt wel heeft gezien en de andere niet. Of om beide beoordelaars (bijvoorbeeld de behandelaar en de masterstudent) bij een aantal zittingen en de afsluiting aanwezig te laten zijn en dan onafhankelijk van elkaar de KWS te scoren. Een andere beperking is dat de behandelaars niet at random zijn gekozen, maar zijn geselecteerd door de vestigingsmanagers. Het kan zijn dat de geselecteerde behandelaars de KWS heel anders invullen dan de behandelaars die niet mee hebben gewerkt aan dit onderzoek. In een volgend onderzoek is het goed om een random selectie te gebruiken, aangezien alle behandelaars de KWS in de praktijk gebruiken. Een beperking is ook dat de behandelaars een KWS scoort van een cliënt die hij in 2010 heeft afgesloten. Hierdoor kan het zijn dat bij een aantal beoordelingen de invloed van het contact is afgenomen. Het is inmiddels een standaardprocedure om de KWS direct na afsluiting af te nemen. Voor de beoordelaarsgroepen die op basis van het dossier de KWS scoren is dat het moeilijk is om de situatie van de cliënt ten tijde van de afsluiting in te schatten. Er is vaak over alle domeinen informatie beschikbaar, maar bepaalde domeinen komen minder aan bod bij de laatste besprekingen voor de afsluiting. Een belangrijke beperking aan het huidige onderzoek is dat er geen consensusbesprekingen waren tussen de groepen. Uit onderzoek van De Vogel en De Ruiter (2003) blijkt dat consensus van groot belang is en de groepen meestal dichter bij elkaar brengt. Het is hierdoor ook niet mogelijk om iets te zeggen over de betrouwbaarheid binnen de groepen, aangezien de beoordelaars allemaal andere cliënten beoordelen. Voor een vervolgonderzoek wordt dan ook aangeraden om een consensusbespreking mee te nemen in de procedure. 22

Referentielijst Andrews, D.A. & Bonta, J. (1995). The Level of Service Inventory-revised. Toronto, Canada: Multihealth Systems. Beek, D. van, Doncker, D. de & Ruiter, C. de (2001). Static-99. Nederlandse geautoriseerde vertaling. Utrecht: Dr. H. van der Hoeven Stichting. Boer, D.P., Hart, S.D., Kropp, P.R. & Webster, C.D. (1997). Manual for the Sexual Violence Risk-20: Professional guidelines for assessing risk of sexual violence. Vancouver: Simon Fraser University. Dernevik, M., Falkheim, M., Holmqvist, R., Sandell, R. (2001). Implementing risk assessment procedures in a forensic psychiatric setting; Clinical judgement revisited. In D.P. Farrington, C.R. Hollin & M. McMurran (Eds.), Sex and violence: the psychology of crime and risk assessment (pp. 83-101). Londen: Routledge. Hanson, R.K. & Thornton, D. (1999). Static-99: Improving actuarial risk assessment for sex offenders. User report 99-02. Ottawa: Department of Solicitor General of Canada. Hildebrand, M., Ruiter, C. de, & Beek, D. van (2001). Handleiding van de Nederlandse Sexual Violence Risk-20. Professionele richtlijnen ter beoordeling van risico op seksueel gewelddadig gedrag. Utrecht: Uitgave Forum Educatief, Dr. H. van der Hoevenkliniek Utrecht. Holmqvist, R. & Armelius, B.A. (1994). Emotional reactions to psychiatric patients. Acta Psychiatrica Scandinavica, 90, 204-209. Holmqvist, R. & Fogelstam, H. (1996). Psychological climate and countertransference in psychiatric treatment homes. Acta Psychiatrica Scandinavica, 93, 288-295. Horn, J.E. van, Scholing, A & Mulder, J. (2005). Risicotaxatie bij volwassen zeden- en geweldplegers in een ambulante setting. Diagnostiek-wijzer, 8 (2), 42-53. Horn, J.E. van, Wilpert, J., Scholing, A., & Mulder, J. (2008). De WaagSchaal Volwassenen. Risicotaxatie-instrument voor de Ambulante Forensische Psychiatrie. Utrecht: Dr. Henri van der Hoeven Stichting. 23