Morele ontwikkeling: het valideren van een vragenlijst

Maat: px
Weergave met pagina beginnen:

Download "Morele ontwikkeling: het valideren van een vragenlijst"

Transcriptie

1 Morele ontwikkeling: het valideren van een vragenlijst Verslag Bacheloronderzoek Universiteit van Utrecht, Faculteit Psychologie Begeleidend docent: Dr. J. Boom Heleen van Huijkelom Josine Maschhaupt Jeannette Pals Juni 2006

2 Voorwoord Het multicomponenten peerhulp programma EQUIP is een preventieve interventie die gericht is op het verminderen van antisociaal gedrag bij jongeren, door cognitieve vertekeningen te corrigeren, sociale vaardigheden te verbeteren, morele ontwikkeling te stimuleren, en een positievere morele schoolcultuur te scheppen (Brugman, Boom & Koops, 2005). In het promotieonderzoek door Floor van de Velden aan de Universiteit van Utrecht wordt gekeken of dit programma jongeren in de vroege adolescentie kan helpen op het rechte pad te blijven. Verwacht wordt dat er een afname in antisociaal gedrag wordt gevonden na toepassing van het programma. EQUIP is eerder succesvol in de VS toegepast, en wordt ook in Nederland in een justitiële jeugdinrichting gebruikt. In recent onderzoek wordt EQUIP als een preventief programma gebruikt bij (I)VMBO scholieren. Deze doelgroep is gekozen omdat dit de belangrijkste risicogroep vormt voor crimineel gedrag binnen de Nederlandse samenleving (Brugman et al, 2005). Als onderdeel van het programma EQUIP wordt een vragenlijst gebruikt die morele ontwikkeling beoogt te meten. In dit onderzoek wordt verder gewerkt met en aan deze vragenlijst. 2

3 Abstract In dit onderzoek is de bestaande vragenlijst de Moral Judgement Rating Task veranderd en vervolgens getoetst op validiteit. Onder ruim 700 Nederlandse scholieren van verschillende leeftijden en schooltypes is de vragenlijst afgenomen. Er is getoetst met de Rasch-analyse, een niet eerder uitgevoerde analyse op het gebied van vragenlijsten voor morele ontwikkeling. Hieruit blijkt dat de vragenlijst op groepsniveau bruikbaar is om morele ontwikkeling te meten, maar nog niet op individueel niveau. Verder werd een positieve correlatie met leeftijd en leerjaar gevonden. Ook blijkt -volgens verwachting- uit de resultaten geen correlatie met sociale wenselijkheid, maar tegengesteld aan de verwachting ook niet met intelligentie. Dit betekent dat de vragenlijst nog niet voldoende valide is. Echter, dit valt met wat aanpassingen in de toekomst nog te verbeteren. Keywords: Morele ontwikkeling,adolescenten, vragenlijst,validiteit. Inleiding Morele ontwikkeling houdt het niveau van verfijning in dat een individu bereikt heeft met betrekking tot morele oordeelsvorming (Boom & Brugman, 2005). Morele ontwikkeling is tegenwoordig een populair onderwerp in de sociale wetenschappen, omdat het in de huidige Nederlandse maatschappij relevant is. Dit komt door het veronderstelde verband tussen morele ontwikkeling en moreel gedrag, en doordat er de laatste jaren een toename is in antisociaal gedrag en criminaliteit (CBS, 2005). Bovendien is er de laatste jaren in de media veel aandacht voor criminaliteit en de stijging ervan. Er wordt hevig gespeculeerd naar de oorzaak hiervan. Het zijn vaker jongeren die in crimineel en/of antisociaal gedrag vervallen. Daarnaast zijn het vooral mannen. Andere risicofactoren zijn een lager opleidingsniveau, vroege schooluitval en afkomst uit een gezin met een lage Sociaal Economische Status (SES). Ook wordt er de laatste tijd gespeculeerd of etniciteit een voorspeller is voor crimineel gedrag. Een verklaring hiervoor zou kunnen zijn dat allochtone jongeren veel van de hierboven genoemde risicofactoren met zich meedragen (CBS, 2005). Door de maatschappelijke relevantie van het onderwerp worden er vanuit de regering en vanuit de wetenschap veel programma s gemaakt die criminaliteit proberen te 3

4 voorkomen en te bestrijden. De kwaliteit van de programma s varieert nogal en de programma s zijn soms te weinig gebaseerd op wetenschappelijke theorie. Onderzoek naar morele ontwikkeling kan zijn steentje aan bijdragen aan het creëren van goede interventieprogramma s. De correlatie tussen morele oordeelsvorming en moreel gedrag is zwak. Er is bijvoorbeeld gevonden dat delinquenten maar 1/3 stadium op hun leeftijdsgenoten achter lopen met betrekking tot morele ontwikkeling. Daarom is het belangrijk niet alleen naar morele ontwikkeling maar ook naar morele competentie en morele atmosfeer te kijken, die mogelijk een grote rol spelen bij moreel gedrag (Boom & Brugman, 2005). Omdat er geen direct verband te vinden is tussen moreel oordeelsvermogen en moreel gedrag bestaat er momenteel een discussie of moreel oordeelsvermogen wel moet worden gemeten. Echter, als men moreel gedrag zo goed mogelijk probeert te voorspellen is morele oordeelsvorming toch een factor die onmisbaar is in het voorspellen van de totale variantie. Het onderwerp morele ontwikkeling is onder andere door Jean Piaget en Lawrence Kohlberg bekend geworden. Piaget interviewde kinderen tussen 5 en 13 jaar over hun begrip van regels bij knikkeren en legde hen verhaaltjes voor waarin wisselende intenties voor goed of fout gedrag en de gevolgen van dat gedrag door de kinderen beoordeeld moesten worden. Een voorbeeld hiervan is: wie is stouter: John die 15 kopjes breekt bij het tafel dekken of Henry die 1 kopje breekt terwijl hij van de jam snoept. Op basis van de antwoorden die kinderen gaven, onderscheidde Piaget twee algemene stadia van moreel begrip. Het eerste is het stadium van heteronome moraliteit: regels komen van boven (van God, van ouders), zijn onveranderlijk en eisen strikte gehoorzaamheid. Het tweede stadium, dat vanaf een jaar of 10 bij kinderen gezien wordt, is dat van de autonome moraliteit. Wanneer kinderen hebben ontdekt dat perspectieven van mensen kunnen verschillen, zal meer aandacht gegeven worden aan intenties dan aan de concrete gevolgen van bepaald gedrag (Berk, 2003). Geïnspireerd door Piaget ontwikkelde Lawrence Kohlberg zijn theorie van de morele ontwikkeling. Hij interviewde onder anderen jongens tussen 10 en 16 jaar, maar waar Piaget kinderen vroeg om een oordeel over een keuze die een persoon gemaakt had, 4

5 confronteerde Kohlberg zijn respondenten met dilemma s waarbij zij moesten zeggen wat de hoofdpersoon zou moeten doen en waarom. De antwoorden groepeerde hij in zes categorieën, die elkaar in ontwikkeling van denken opvolgen (Boom en Olthof, 1994) en gegroepeerd kunnen worden in drie niveaus van moreel denken. Het eerste niveau is het preconventionele niveau, bestaand uit: stadium 1, waarin het kind georiënteerd is op straf en gehoorzaamheid. Moraal is gedefinieerd in termen van het vermijden van het overtreden van regels, die in stand gehouden worden door straf, gehoorzaamheid alleen maar om de gehoorzaamheid en het vermijden van schade aanbrengen aan personen of goederen. stadium 2, waarin er sprake is van instrumenteel hedonistische reciprociteit. Dit stadium kenmerkt zich een definitie van moraal als uitwisseling, als je doet wat je wilt en laat anderen doen wat zij willen, het sluiten van overeenkomsten, waarbij een evenwichtige uitwisseling plaatsvindt (Colby & Kohlberg, 1987 in Krebs en Denton, 2005). Het volgende niveau is het conventionele niveau en bestaat ook uit twee stadia: stadium 3: de oriëntatie op interpersoonlijke overeenstemming. Moraal wordt gedefinieerd in termen van wederzijdse relaties, het voldoen aan rolverwachtingen, als een goed persoon beschouwd willen worden, bezorgdheid voor anderen tonen en voor anderen zorgen. Belangrijke waarden zijn: vertrouwen, trouw, respect en dankbaarheid. stadium 4: de oriëntatie op tucht en orde. Moraal is gedefinieerd als het handhaven van, het je voegen naar het sociale systeem, waarvan je deel uitmaakt en waardoor je beschermd wordt (Colby & Kohlberg, 1987 in Krebs en Denton, 2005). Kohlberg breidde vervolgens Piagets model uit met een derde niveau: het postconventionele, autonome of principiële niveau. Ook in dit niveau zijn twee stadia te onderscheiden: stadium 5: de oriëntatie op het tijd- en ruimtegebonden sociaal contract en individuele rechten. Moraal is gedefinieerd in termen van het nakomen van sociale verplichtingen die in de sociale structuur zijn ingebed en waarmee in vrijheid is ingestemd. Goed is dat wat rationeel besloten is het algemeen nut te dienen, het beste voor het grootste aantal (Colby & Kohlberg, 1987 in Krebs en Denton, 2005). 5

6 stadium 6: de oriëntatie op universeel ethische principes, een stadium dat in empirisch onderzoek niet is aangetoond (Berk, 2003; Boom en Olthof, 1994). Volgens zowel Piaget als Kohlberg is morele ontwikkeling gekenmerkt door kwalitatieve hiërarchische stadia. Elk kind doorloopt in zijn eigen tempo de diverse stadia in vaste volgorde. Elk volgend stadium bestaat uit integratie van vroegere stadia en nieuwe inzichten. (Verhofstadt-Denève et al. 2003). Tijdens zijn leven heeft Kohlberg doorlopend veranderingen aangebracht in zijn theorie: hij ging er van uit dat deze een theorie in ontwikkeling was (Rest, Narvaez en Thoma, 2000). Neo-Kohbergianen voelen zich dan ook vrij om aanvullingen en verbeteringen in de theorie aanbrengen. Zo is er kritiek op de universaliteit van Kohlberg s theorie: de morele stadia zijn niet toe te passen op andere culturen en gewoonten dan de westerse. Vanuit feministische hoek is er kritiek op de nadruk die Kohlberg legt op recht en rechtvaardigheid, terwijl vrouwen over het algemeen meer redeneren vanuit zorg en warmte. Verder wordt aangevoerd dat de invloed van de rede op het moreel functioneren door Kohlberg werd overschat; andere factoren hebben minstens zoveel invloed, zoals emotie, karakter of gewoonten. Tenslotte wordt gezegd dat de mens die Kohlberg s hoogste stadium bereikt een koud en berekenend persoon is, die los staat van het leven van alledag (Arnold, 2000). Behalve deze kritiek zijn onderzoekers het ook niet allemaal eens over de stadia die Kohlberg hanteert, over de hardheid van deze stadia, en over de methodes die hij gebruikte om morele ontwikkeling in kaart te brengen (Rest, Narvaez en Thoma, 2000). Rest en collega s (1999) gaan er van uit dat mensen niet consequent vanuit één stadium redeneren, maar een voorkeur hebben voor een bepaald stadium. Echter, ondanks de kritiek op de stadia van Kohlberg, is het tegenwoordig nog steeds het meeste gebruikte model. Kohlberg creëerde naast zijn theorie ook een instrument om morele ontwikkeling te meten. Dit instrument, de Moral Judgment Interview (MJI) bestaat uit een taak waarbij proefpersonen morele dilemma s voorgelegd krijgen. De proefpersonen moeten vertellen welke keuze zij zouden maken in een dergelijke situatie. De redeneringen achter hun 6

7 keuzes worden gescoord aan de hand van een handleiding met voorbeelduitspraken, die Kohlberg heeft samengesteld op basis van uitspraken van personen. De handleiding is ruim 20 jaar oud, maar wordt nog steeds beschouwd als de gouden standaard op het gebied van moreel oordeelsvermogen. Het is aan de hand van de MJI mogelijk iemands huidige stadium van moreel oordelen vast te stellen. Nadeel is dat het interview veel tijd in beslag neemt en bij iedere deelnemer individueel af moet worden genomen. Om deze praktische moeilijkheden te omzeilen zijn er verschillende kortere varianten ontwikkeld die als vragenlijst kunnen worden afgenomen en daardoor ook bij meerdere mensen tegelijkertijd. De belangrijkste vragenlijsten op dit gebied zijn de Defining Issues Test (DIT) van Rest (1979), de Sociomoral Reflection Measure (SRM) van Gibbs (Gibbs, Arnold, Morgan, Schwartz, Gavaghan & Tappan, 1984) en de Sociomoral Reflection Objective Measure (SROM) van Gibbs (Basinger & Gibbs, 1987). Van beide laatstgenoemde vragenlijsten heeft Gibbs ook een korte variant ontwikkeld. Bij vragenlijsten die het morele oordeelsvermogen meten bestaat er een onderscheid tussen productietaken en herkenningstaken. De MJI van Kohlberg is een productietaak, omdat proefpersonen wordt gevraagd het antwoord zelf te produceren. Ook bij de SRM van Gibbs wordt de proefpersonen gevraagd om zelf uitspraken te doen over morele dilemma s. De DIT van Rest en de SROM van Gibbs zijn herkenningstaken: proefpersonen krijgen een aantal uitspraken voorgelegd en moeten aangeven in hoeverre zij het met die uitspraken eens zijn of de uitspraken sorteren op belangrijkheid, logische volgorde of een ander criterium. Beide vragenlijsten zijn echter redelijk gedateerd: de DIT is ontworpen in 1979 en de SRM is uitgebracht in Om deze reden en omdat er nog geen goede Nederlandse test bestond, is een nieuw instrument ontwikkeld dat morele ontwikkeling beoogt te meten: de Moral Judgement Rating Task (MJRT) (zie Brugman, Boom & Koops, 2005). Uitgangspunt voor het instrument is dat een belangrijk element van morele oordeelsvorming het vermogen is om uitspraken van anderen te evalueren (Boom & Brugman, 2005). Deze vragenlijst wordt in het hier gepresenteerde onderzoek gebruikt. Een probleem bij de DIT en de SROM is de lage betrouwbaarheid en daardoor ook lage validiteit. Op individueel niveau wordt onnauwkeurig gemeten en hoewel op 7

8 groepsniveau de onnauwkeurigheden elkaar redelijk uitmiddelen, zijn de vragenlijsten voor individuele toetsing slecht bruikbaar. Ook zijn daardoor correlaties met andere maten lager dan verwacht. Een tweede probleem bij de DIT en de SROM zijn de scoringssystemen die vrij arbitrair zijn. Hieronder zullen kort de manier van werken en de tekortkomingen van beide vragenlijsten worden behandeld. De SROM (korte versie) (Basinger & Gibbs, 1987) gebruikt twee dilemma s uit Kohlberg s handboek (Colby & Kohlberg, 1987): het verhaal van Heinz en zijn zieke vrouw en het verhaal van Jan die spaart voor een kamp, maar niet mag gaan omdat zijn vader het geld zelf wil gebruiken. Over het eerste verhaal worden negen vragen gesteld en over het tweede verhaal worden drie vragen gesteld. Een voorbeeld van zo n vraag is: Stel dat de stervende persoon niet de vrouw van Heinz is maar een vriend van hem (en die vriend heeft niemand anders om hulp aan te vragen). Wat zou Heinz moeten doen? Kruis één antwoord aan: Stelen/ Niet stelen/ Ik weet het niet. Met dit antwoord wordt niets gedaan, maar het fungeert als introductie op deel twee van de vraag: stel dat je een reden moet geven waarom het voor jou belangrijk is om het leven van een vriend te redden, zelfs als dat betekent dat je de wet overtreedt. Welke reden zou jij geven? Vervolgens worden vier redenen A, B, C en D gegeven en moet de proefpersoon bij elke reden een antwoord aankruisen van de drie mogelijkheden: komt overeen met een reden die ik zou geven / komt niet overeen met een reden die ik zou geven / ik weet het niet. Hierna volgt deel drie van de vraag: Welke van de vier genoemde redenen komt het meest overeen met de reden die je zelf zou geven?. De proefpersoon moet A, B, C of D omcirkelen. Elke reden representeert één van de stadia 1 t/m 4. Er wordt een gemiddelde score uitgerekend van de komt overeen -antwoorden en er wordt een gemiddelde score uitgerekend van de komt het meest overeen -antwoorden. Iemands eindscore wordt berekend door de komt overeen -score eenmaal en de komt het meest overeen -score tweemaal te nemen, bij elkaar op te tellen, te delen door drie en dan te vermenigvuldigen met honderd. Een positief punt van de SROM is dat alle gebruikte stadia bij elk verhaaltje door één item worden gerepresenteerd. Een negatief punt is dat stadium 5 en 6 niet voorkomen. Een ander negatief punt is dat er geen uitleg en verantwoording wordt gegeven waarom 8

9 de komt het meest overeen -antwoorden dubbel tellen ten opzichte van de komt overeen met -antwoorden. (Basinger & Gibbs, 1987). Bij de DIT (Rest, 1979) worden zes verhaaltjes gebruikt. Naar aanleiding van elk verhaaltje wordt een introducerende vraag gesteld. Een voorbeeld van zo n vraag is: Zou Heinz het medicijn moeten stelen? Kruis één antwoord aan: Stelen/ ik weet het niet/ niet stelen. Vervolgens worden er twaalf redenen gegeven die belangrijk kunnen zijn bij de beslissing hiertoe. Van elke reden moet de proefpersoon op een vijfpuntschaal aangeven in welke mate hij deze belangrijk vindt. Daarna wordt op volgorde gevraagd welke vier redenen hiervan hij het meest belangrijk vindt. Elke reden representeert een ander stadium, maar de verdeling van de stadia over de items is ongelijk. Van stadium 2 zijn er bijvoorbeeld vier items verdeeld over de hele vragenlijst en van stadium 3 zeventien. Bij de DIT wordt de principled morality score gehanteerd, die bestaat uit het relatieve belang dat proefpersonen hechten aan stadium 5 en 6 uitspraken. Er bestaat ook een score die het gewogen gemiddelde van alle stadia geeft (de D-score), en dus kan worden gezien als het huidige stadium van waaruit een persoon redeneert, maar deze wordt nauwelijks gebruikt. Dit is zeer waarschijnlijk geen betrouwbare score, aangezien het aantal items per stadium zo drastisch varieert. De reden die de auteurs geven voor het gebruik van de principled morality score is dat deze maat het beter doet in de praktijk. Wellicht is dit een gevolg van de onbetrouwbaarheid van de D-score. Een positief punt van de DIT is de mogelijkheid om personen te checken op betrouwbaarheid. Dit kan op twee manieren. Ten eerste bestaat er de M-score die weergeeft welk belang proefpersonen hechten aan pretentieuze maar betekenisloze items. Ten tweede bestaat er de consistentie-check, die weergeeft of personen bij het waarderen en sorteren dezelfde items invullen als belangrijk. Een negatief punt van de DIT is dat stadium 1 niet gebruikt wordt. Een ander negatief punt is het feit dat de score die een persoon haalt, gebaseerd is op het belang dat wordt gehecht aan stadium 5 en 6 antwoorden. Hierdoor kan geen onderscheid worden gemaakt tussen mensen die vanuit stadium 2, 3 of 4 redeneren, temeer omdat het aantal items per stadium erg varieert. Maar ook de verhouding tussen P-items (stadium 5 en 6) en niet-p-items is niet gelijk. Er zijn namelijk 20 P-items en 47 niet-p-items, die ook nog eens aangevuld zijn uit A-items 9

10 (deze meten een anti-establishment oriëntatie) en M-items. Verantwoording hiervoor wordt niet gegeven. (Rest, 1979) Geprobeerd wordt deze problemen bij de MJRT te vermijden. Het doel van dit onderzoek is het valideren van de MJRT aan de hand van de Rasch-analyse, een methode die bij andere vragenlijsten die de morele ontwikkeling meten nog nooit is gebruikt. Met de Rasch-analyse zal worden gekeken of er sprake is van één onderliggende dimensie die oploopt in stadia van morele ontwikkeling. De vraag is of deze schaal kan gaan functioneren als meetlat voor moreel oordeelsvermogen, met afstanden tussen de items die interpreteerbaar zijn. Deze meetlat zal dan een objectiever scoringssysteem vormen dan nu bij de DIT en de SROM het geval is. De Rasch-methode biedt een aantal statistische gereedschappen om te bepalen of een test betrouwbaar en valide is en om deze zo nodig betrouwbaarder en meer valide te maken. De verwachting is dat deze methode van valideren het verschil gaat uitmaken door een betrouwbare en valide test op te leveren. De MJRT zal hieronder kort worden toegelicht. De vragenlijst bestaat uit twee verhaaltjes gebaseerd op de Kohlberg s handboek (Colby & Kohlberg, 1987) met vragen daarbij. Het eerste gaat over Henk en zijn zieke vrouw, het tweede gaat over Julia die naar het popconcert wil, maar van het door haarzelf gespaarde geld een jas moet kopen van haar moeder. Per dilemma zijn er 2 sets van zeven uitspraken. De eerste set pleit voor de ene kant van het dilemma, bijvoorbeeld dat Henk het medicijn niet zou moeten stelen. De tweede set pleit voor de andere kant van het dilemma, bijvoorbeeld dat Henk het leven van zijn vrouw moet redden. Binnen elke set zijn de vier eerste stadia van Kohlberg opgenomen met de bijbehorende tussenstadia. Respondenten moeten vervolgens per uitspraak aangeven of ze de uitspraak dommer, even wijs, of wijzer vinden dan hoe zij zelf denken. De keuze om alleen de eerste vier stadia van Kohlberg op te nemen in de vragenlijst is gemaakt omdat de vragenlijst vooral in lagere vmbo-klassen zal worden toegepast. Hogere stadia dan stadia 4 komen daar nog niet voor. In dit onderzoek is ter validering wél bij oudere kinderen en kinderen uit hogere schooltypen de vragenlijst afgenomen. 10

11 De methode van scoring is als volgt: Er worden twee punten gegeven voor de dommer -antwoorden en 1 punt voor de even wijs -antwoorden. Zo krijgt elke persoon een totaalscore. De software schat eerst de item moeilijkheid van elk item, gegeven de antwoordpatronen. Vervolgens wordt geschat wat de meest waarschijnlijke persoonlijke vaardigheid is gegeven die totaalscore. Dit wordt de logit-score genoemd en de schaal wordt de logit-schaal genoemd. Eerst zal een pilot worden uitgevoerd om de knelpunten in de vragenlijst op te sporen. Daarna wordt vragenlijst bij een grote groep scholieren afgenomen. Met behulp van de Rasch-analyse zal ten eerste worden gekeken of de veronderstelde volgorde van de stadia terug te vinden is in de data. Beoordelen jongeren de hogere stadia ook inderdaad als wijzer en lagere stadia als dommer dan zij zelf denken? De eerste hypothese is dat deze volgorde aanwezig is. Vervolgens zal er worden bepaald of er sprake is van unidimensionaliteit: meten alle uitspraken hetzelfde onderliggende construct? De tweede hypothese is dat er sprake is van unidimensionaliteit. Dit zal worden bekeken met de Rasch-analyse en met SPSS-analyses. Methoden Pilot De eerste variant van de vragenlijst werd door de onderzoekers in drie versies (bijlage A) afgenomen bij 17 VMBO-2 leerlingen van 13 en 14 jaar. In de vragenlijst worden de leerlingen geconfronteerd met twee situaties die een moreel dilemma schetsen. Over beide kanten van het dilemma volgen zeven uitspraken die corresponderen met een stadium of tussenstadium in de morele ontwikkeling volgens de theorie van Kohlberg (Colby en Kohlberg, 1987). Dit zijn stadia 1 tot en met 4 en de bijbehorende tussenstadia. De participanten moeten per uitspraak aangeven of ze deze gedachte dommer, even wijs of wijzer vinden dan hoe ze zelf denken. In de verschillende versies werden de tekstlengten van de dilemma s en de moeilijkheidsgraad van de zinnen gevarieerd. Het 11

12 belangrijkste verschil zat in de manier waarop geïnstrueerd werd (langer of korter) en de bewoording van de antwoordmogelijkheden. Na het afnemen van de lijst volgde een kort interview door de onderzoekers waarin de leerlingen werd gevraagd of ze alle woorden en alle zinnen hadden begrepen, of ze het verhaal en de instructies duidelijk vonden, of ze de dilemma s begrepen hadden en of ze de vragen konden beantwoorden. Deze opmerkingen werden per versie geïnventariseerd. Op grond van de opmerkingen van de leerlingen werd de vragenlijst uiteindelijk aangepast tot de hier gebruikte MJRT (bijlage B). Deze versie bleek het meeste te worden begrepen door kinderen zoals de onderzoekers dat bedoeld hadden. Rasch Model De vragenlijst zal worden gevalideerd aan de hand van Rasch-analyse. Deze methode is ontwikkeld door George Rasch in de jaren 60 van de vorige eeuw. (Bond & Fox, 2001) Hij stuitte op het probleem dat bij instrumenten in de menswetenschappen de schaalverdelingen vaak niet losstonden van de spreidingen in de gemeten populaties. Hij stelde een logitschaal voor die als basis kon worden gebruikt voor het construeren van objectievere maten. Ruwe data worden hiermee getransformeerd in een schaal met gelijke, betekenisvolle intervallen. De intervallen worden bepaald door item- en persoonprestaties en zijn niet van tevoren door de onderzoeker verondersteld. Door de logittransformatie en door de item- en persoonsschattingen die bepalend zijn voor de intervalmaten, onderscheidt de Rasch-methode zich van andere methoden als het enige model dat een objectieve schaalverdeling heeft. De logittransformatie bestaat erin (in het eenvoudigste voorbeeld) dat de kans op succes gedeeld wordt door de kans op falen (in het Engels: odds) en dat van deze ratio de natuurlijke logaritme wordt genomen. De oorspronkelijke kansschaal met een waarde tussen 0 en 1 wordt daardoor als het ware uitgerekt tot een schaal die loopt van min oneindig tot plus oneindig (in de praktijk bijvoorbeeld tussen -6 en +6). (Bond & Fox, 2001) 12

13 De procedure bij de Rasch-analyse is als volgt. Zowel de items als de personen worden langs eenzelfde schaal gezet. Bij de items is het aantal personen dat het item goed of positief heeft beantwoord bepalend voor zijn locatie op deze schaal. Deze locatie is de itemmoeilijkheid. Bij personen is het aantal items dat hij of zij goed of positief heeft beantwoord bepalend voor zijn of haar locatie. Deze locatie is de vaardigheid van de persoon op de latente eigenschap. Items en personen hebben een gelijke positie als de persoon 50% kans heeft dit item goed of positief te beantwoorden. Vervolgens kan er naar verschillende zaken worden gekeken. In dit onderzoek zal er naar de volgende zaken worden gekeken: Ten eerste zal worden gekeken of items consistent beantwoord zijn. Als item x door personen met een hoge score fout is beantwoord, maar door personen met een lage score goed is beantwoord, dan klopt er iets niet en meet het item niet hetzelfde als het veronderstelde onderliggende construct. Een belangrijk begrip binnen de Rasch-methode is unidimensionaliteit. Unidimensionaliteit is de belangrijkste aanname van het model en wil zeggen dat er slechts één latente eigenschap wordt gemeten. Er is sprake van unidimensionaliteit als de items allemaal consistent zijn beantwoord. Om te bepalen hoe consistent een item is beantwoord zijn er t-scores voor elk item opgesteld, waarbij -2 en 2 de grenzen van het 95% betrouwbaarheidsgebied vormen. Ten tweede zal worden gekeken naar de volgorde van de items. Bij de meeste vragenlijsten zijn vooraf aan de hand van theorie items met verschillende veronderstelde moeilijkheidsgraden bedacht en met de Rasch-analyse kan worden gekeken of deze volgorde inderdaad terugkomt in de gevonden data. In dit onderzoek zal worden gekeken of de volgorde uit Kohlbergs theorie (Colby & Kohlberg, 1987) terug te vinden is in de data. (Bond & Fox, 2001). 13

14 Onderzoek Participanten Om participanten voor het onderzoek te werven is contact gezocht met diverse grote middelbare scholen in Soest en Amersfoort, waarbij de voorkeur uitging naar scholen met in ieder geval havo- en vwo-niveau. Dit omdat een voorloper van de MJRT al was afgenomen bij grote aantallen vmbo-leerlingen en er van dat schooltype dus al aardig wat gegevens waren. Uiteindelijk waren drie scholen middelbare scholen uit Amersfoort bereid aan ons onderzoek mee te werken. In totaal hebben 713 leerlingen de vragenlijst ingevuld. Van deze 713 proefpersonen moesten 90 verwijderd worden wegens het niet invullen van naam of leerlingnummer, het missen van scores op een van de vragenlijsten of een variantie van 0 bij het invullen van de vragenlijst, hetgeen wijst op het niet differentiëren tussen de verschillende items naar dommer, even wijs of wijzer, waardoor de gegevens niet geïnterpreteerd konden worden. Uiteindelijk bleven 623 proefpersonen over. Van 31 van deze leerlingen zijn geen leeftijdgegevens bekend, deze zijn niet uit de steekproef verwijderd, maar worden niet meegenomen in analyses met als variabele leeftijd. Tabel 1. Het aantal leerlingen per school naar geslacht school geslacht N Corderius jongen 44 meisje 56 Totaal 100 Farel jongen 42 meisje 41 Totaal 83 Guido jongen 172 meisje 236 Totaal 408 Het Corderius college is een christelijke middelbare school, met afdelingen vmbo-t, havo, atheneum en gymnasium. Het Guido de Brès is een gereformeerde middelbare 14

15 school, met aparte locaties voor de eerste en tweede fase. Het Farel College is een christelijke middelbare school, met de afdelingen VMBO-t, HAVO en VWO. Leerlingen van het Guido de Brès zijn voornamelijk autochtone leerlingen. Op het Farel en het Corderius zijn de leerlingen meer divers van afkomst, er zijn hier echter geen cijfers van. De leerlingen varieerden in leeftijd van 12 tot 18 jaar. De gemiddelde leeftijd van de proefpersonen was 14,91 jaar, met een standaarddeviatie van 1,19. De verschillende verdelingen over school, schooltype en leerjaar zijn te vinden in tabel 1, 2 en 3. Tabel 2. Verdeling over schooltype naar geslacht schooltype N vmbo jongen 42 meisje 41 Totaal 83 havo jongen 125 meisje 167 Totaal vwo jongen 113 meisje 134 Totaal 247 Tabel 3. Verdeling over leeftijd en leerjaar naar schooltype. schooltype leeftijd N vmbo leerjaar Totaal havo leerjaar Totaal vwo leerjaar Totaal

16 Materiaal 1. MJRT De MJRT is een vragenlijst die is ontwikkeld op basis van de morele ontwikkelingstheorie van Kohlberg (zie inleiding). In de vragenlijst worden participanten geconfronteerd met twee morele dilemma s, en beoordelen zij veertien uitspraken per dilemma. Het eerste dilemma is het probleem van Henk, wiens zieke vrouw genezen kan worden met een bepaald medicijn, dat echter te duur is voor hem. Leerlingen moeten hun oordeel geven over zeven uitspraken over waarom Henk het medicijn niet zou mogen stelen en zeven uitspraken over waarom Henk het leven van zijn vrouw moet redden. De uitspraken corresponderen met de eerste vier stadia uit de morele ontwikkeling en drie tussenstadia, zoals gedefinieerd door Kohlberg (Colby & Kohlberg, 1987). Een van de uitspraken is: Henk moet het leven van zijn vrouw redden want als je iemand laat doodgaan kom je in de gevangenis. Deze uitspraak correspondeert met stadium 1 in de morele ontwikkeling volgens Kohlberg. De complete vragenlijst is opgenomen als bijlage (bijlage B). Participanten kruisen per uitspraak een vakje aan, op grond van de volgende instructie: Vul het eerste vakje in als je vindt dat wat de leerling zegt kinderachtig of dom is. Vul het tweede vakje in als je vindt dat de leerling net zo denkt als jij of even wijs is. Vul het derde vakje in als je vindt dat wat de leerling zegt wijzer of volwassener is dan wat jezelf denkt. Het andere dilemma is het probleem van Julia, die van haar moeder naar een concert mag als zij het geld ervoor zelf spaart, maar op het moment dat zij het geld bij elkaar heeft, van haar moeder de opdracht krijgt het geld te gebruiken voor een nieuwe jas. Leerlingen moeten hun mening geven over uitspraken die stellen dat Julia s moeder haar belofte moet houden en uitspraken die stellen dat Julia haar moeder moet gehoorzamen. Een van de uitspraken is: Julia moet haar moeder gehoorzamen want haar moeder houdt veel van haar en heeft het beste met haar voor. Ook bij deze dilemma s moeten 16

17 participanten aangeven wat zijn van elke mening vinden: dommer, even wijs of wijzer dan zij zelf denken. In totaal bestaat de MJRT uit 28 items. 2. Grade point average (GPA) Er is een relatie tussen moreel oordeel en verbale intelligentie. Afhankelijk van het instrument waarmee verbale intelligentie gemeten is, worden correlaties tot 0.49 gevonden (Boom, Brugman en van der Heijden, 2001). Binnen dit onderzoek was het niet mogelijk het verbale IQ van alle participanten te meten. Wel konden van een groot deel van de participanten rapportcijfers voor Engels en Nederlands verkregen worden. Vandaar dat gekozen is het gemiddelde van de laatste rapportcijfers op Engels en Nederlands (GPA) te nemen als een indicatie voor verbale intelligentie, namelijk een gemiddelde maat voor taalvaardigheid. Er wordt verwacht dat er de correlatie tussen GPA en de logitscore op morele ontwikkeling niet hoger zal zijn dan bovengenoemde 0, Vragenlijst sociale wenselijkheid. Om te testen of leerlingen een neiging hadden tot sociaal wenselijk antwoorden is een vragenlijst sociale wenselijkheid afgenomen (bijlage C). Deze lijst is een verkorte versie van de Marlowe-Crowne vragenlijst voor sociale wenselijkheid. De lijst is door Nederhof gevalideerd voor een Nederlandse populatie. De vragenlijst bestaat uit 11 stellingen over houdingen en kenmerken van participanten waarin de woorden altijd of nooit voorkomen. Een voorbeeld daarvan is opscheppen doe ik nooit. Per stelling kunnen participanten aangeven of ze het er mee eens of niet mee eens zijn. Bij de scoring worden de items bij elkaar opgeteld. Uit eerdere studies is gebleken dat de interne consistentie van de items voldoende is. Cronbach s alpha is Verder wordt verwacht dat er een lage correlatie is tussen morele ontwikkeling en sociale wenselijkheid (Brugman & Aleva, 2004). 17

18 Resultaten Rasch-analyse Allereerst is er een Rasch-analyse uitgevoerd met de scores van de personen op de items. Deze scores zijn in twee modellen met elkaar vergeleken:het rating scale model, waarbij de aanname is dat de afstand tussen de verschillende categorieën binnen items gelijk is, en het partial credit model, dat aanneemt dat er tussen verschillende categorieën binnen items ongelijke afstanden kunnen liggen. Om te kijken welk model het beste bij de data past is gekeken naar de deviantie. Hoe kleiner deze deviantie, hoe beter de modelfit. Hieruit bleek dat het rating scale model (D = 29388) beter paste dan het partial credit model (D =33249), ook na correctie voor het verschil in aantal parameters van het model. In de eerste analyse met het rating scale model (zie bijlage D, figuur 1) is te zien dat de items in de verwachte volgorde oplopen, op items 5 en 6 na: de items die antwoorden van stadium 3 en 3½ weergeven. Verder is de spreiding van de items niet perfect. Item 1 en 2 (overeenkomend met stadium 1 en 1½) zijn nauwelijks van elkaar te onderscheiden en de rest van de items is niet evenwichtig verdeeld over de logitschaal. Aan de t-scores (zie tabel 4), die idealiter tussen de -2 en 2 moeten vallen, is te zien dat de items niet erg consistent zijn beantwoord. Dit betekent dat personen van eenzelfde stadium van morele ontwikkeling niet altijd hetzelfde antwoord op de items geven. Tabel 4. T-scores eerste Rasch-analyse Item Estimate t-waarde ongewogen t-waarde gewogen

19 Na analyse van de verschillende dilemma s (figuur 1) bleek dat de items behorend bij dilemma 1 het minst duidelijk differentieerden. Bij dilemma 2, 3 en 4 lopen alle stadia redelijk in de verwachte volgorde op. Deze trend is bij dilemma 1 niet te zien. Hierom is besloten een Rasch-analyse uit te voeren zonder de data van dilemma 1. Ook hier is zowel een partial credit als rating scale analyse uitgevoerd en opnieuw bleek het rating scale model (D=20155) een lagere deviantie te hebben dan het partial credit model (D=23868). Om deze reden is gekozen voor het rating scale model dilemma 1 dilemma 2 dilemma 3 dilemma 4 Figuur 1. Gemiddelde ruwe score per item, gegroepeerd naar dilemma. De uitkomst van deze Rasch-analyse (bijlage D, figuur 2) is al beter. Item 5 en 6 staan nu in de goede volgorde. Ook de spreiding van de items over de schaal is beter. Echter, de items 1 en 2 zijn nog steeds niet van elkaar te differentiëren. Ook de t-scores vallen nog niet binnen het [-2,2] interval; dit geeft aan dat de items nog niet volledig consistent beantwoord worden (zie tabel 5). 19

20 Tabel 5 T-scores tweede Rasch-analyse, zonder dilemma 1 Item Estimate t-waarde ongewogen t-waarde gewogen SPSS-analyse De logitscores die uit de Rasch-analyse zijn gekomen zijn vervolgens gebruikt voor verdere statistische analyses. Een hoge logitscore betekent idealiter een hoge morele ontwikkeling. Met deze scores zijn Anova s en Ancova s uitgevoerd met de variabelen leerjaar, leeftijd, sekse, schooltype, grade point average en sociale wenselijkheidscore. De resultaten worden hieronder weergegeven Estimated Marginal Means geslacht jongen meisje leeftijd Non-estimable means are not plotted Figuur 2. Anova met logitscore en leeftijd uitgesplitst naar geslacht. 20

21 In figuur 2 zien we dat geldt dat een hogere leeftijd correspondeert met een hogere logitscore, dus een hogere morele ontwikkeling. Dit geldt voor zowel jongens als meisjes. Er was een significant verband tussen leeftijd en logitscore met een correlatie van 0.34 (F(6, 578)= 13.49, p=0.00). Er werd geen significant verband gevonden tussen geslacht en logitscore (F(1, 578)=0.018, p=0.89) Estimated Marginal Means schooltype vmbo havo vw o leeftijd Non-estimable means are not plotted Figuur 3. Anova met logitscore en leeftijd uitgesplitst naar schooltype. In figuur 3 is de uitkomst van een volgende Anova weergegeven, opnieuw met logitscore en leeftijd, maar nu uitgesplitst op schooltype. Er bleek een significant effect voor schooltype (F(2, 576)= 9.983, p=0.00) hetgeen betekent dat leerlingen op het vwo vaker een hogere logitscore hebben dan leerlingen op het havo en het vmbo in hetzelfde leerjaar. 21

22 Uit figuur 4 blijkt een duidelijk positief verband tussen logitscore en leerjaar voor zowel meisjes en jongens. Dit effect was significant (F(3, 613)= , p=0.00), met een correlatie van Estimated Marginal Means 1,20 1,00 0,80 0,60 0,40 geslacht jongen meisje 0, leerjaar Figuur 4. Anova met logitscore en leerjaar, uitgesplitst naar geslacht. Estimated Marginal Means of Logit score Estimated Marginal Means 1,20 1,00 0,80 0,60 e 0,40 schooltype vmbo havo vw o leerjaar Non-estimable means are not plotted Figuur 5. Anova met logitscore en leerjaar, uitgesplitst naar schooltype. 22

23 Ook in figuur 5 is te zien dat er een positief en significant verband is tussen leerjaar en logitscore, waarbij nu wordt uitgesplitst naar schooltype. Hoewel er verschil te zien is tussen de schooltypen, blijkt dit verschil niet significant (F(2, 613)= 2.878, p=0.057). Een mogelijke verklaring hiervoor is dat er maar twee leerjaren vmbo zijn, terwijl van het vwo vier leerjaren zijn meegenomen in het onderzoek. Opvallend is dat er voor schooltype een significant verschil in logitscores wordt gevonden wanneer gekeken wordt naar leeftijd, maar niet wanneer gekeken wordt naar leerjaar. Verwacht werd dat leeftijd en leerjaar redelijk met elkaar samenhangen, maar dit blijkt niet zo te zijn. Dit kan veroorzaakt worden door het lage aantal vmbo-leerlingen van 16 jaar in verhouding met die van havo en vwo. Er werd een correlatie verwacht tussen de.20 en.49 tussen GPA en logitscore, omdat uit onderzoeken blijkt dat morele ontwikkeling en verbale intelligentie in die mate samenhangen. Om dit te toetsen zijn er twee regressieanalyses uitgevoerd, één waarbij is gekeken naar GPA per leerjaar en één waarbij is gekeken naar GPA per schooltype. Leerjaar bleek niet significant, evenmin als schooltype (zie tabel 6 en 7 voor toetsgegevens). Tabel 6. Toetsgegevens regressieanalyse logitscore-leerjaar Leerjaar df Residu F Sig Beta Tabel 7. Toetsgegevens regressieanalyse logitscore-schooltype Schooltype df Residu F Sig Beta vmbo havo vwo

24 GPA blijkt in dit onderzoek niet samen te hangen met logitscore. Dit kan betekenen dat er werkelijk geen correlatie bestaat in deze onderzoeksdata. Meer voor de handliggend is echter dat het GPA onvoldoende betrouwbaar is als maat voor verbale intelligentie. Als laatste is gekeken naar de relatie tussen logitscore en sociale wenselijkheid. Er is geen significante samenhang gevonden tussen sociale wenselijkheid en morele ontwikkeling (F(11, 552)= 1.210, p= 0.28). Dit klopt met de verwachtingen. Conclusie Het doel van dit onderzoek was het valideren van de vragenlijst Moral Judgment Rating Task, een vragenlijst die morele ontwikkeling beoogt te meten bij kinderen en adolescenten. Allereerst is een pilot uitgevoerd, waarin knelpunten in de vragenlijst werden opgespoord. De vragenlijst is aangepast en bij ruim 700 leerlingen van het middelbaar onderwijs afgenomen. Daarnaast is een vragenlijst sociale wenselijkheid afgenomen en is het GPA van alle leerlingen gevraagd. Na verwijdering van nietbruikbare lijsten, bleven 623 proefpersonen over, van wie de gegevens werden geanalyseerd met behulp van Rasch en SPSS. Uit de Rasch-analyse bleek dat de opeenvolgende stadia van morele ontwikkeling in de vragenlijst zijn terug te vinden, wanneer dilemma 1 wordt verwijderd. De spreiding van de items over de logitschaal is niet perfect. Zo liggen item 1 en 2 dicht bij elkaar op de schaal. Dit kan verklaard worden doordat geen van de respondenten zich in stadium 1 of 1½ bevindt, waardoor er geen onderscheid gemaakt kan worden tussen deze items. Een reden waarom de andere items niet evenwichtig zijn verdeeld over de logitschaal moet nog onderzocht worden. Uit de vervolganalyses bleek een positief verband tussen leeftijd en morele ontwikkeling en tussen leerjaar en morele ontwikkeling. Dit was volgens verwachting; ook in andere onderzoeken is een dergelijk verband gevonden. Een verband tussen schooltype en morele ontwikkeling is, tegengesteld aan de verwachting, in dit onderzoek niet aangetoond: gemeten naar leeftijd is dit verband er wel, maar naar leerjaar niet. In de 24

25 data was niet voldoende spreiding van de schooltypes over de leerjaren om hierover duidelijke uitspraken te kunnen doen. Ook is in dit onderzoek geen verband gevonden tussen GPA en logitscore, waar de verwachting was dit verband wel te vinden. Een verband tussen morele ontwikkeling en sociale wenselijkheid is, zoals werd verwacht, niet gevonden. Kortom, de MJRT is momenteel bruikbaar op groepsniveau. De itemvolgorde werd immers teruggevonden in de analyses. Op individueel niveau is hij echter minder bruikbaar, omdat de items nog niet voldoende consistent worden beantwoord. Discussie In de data is de verwachte oplopende volgorde van de items duidelijk terug te vinden. Daarnaast geven andere maten, zoals de correlaties met schooltype en leeftijd, positieve aanwijzingen voor de validiteit van de MJRT. Een aspect dat nog niet als voldoende kan worden beoordeeld is de maat voor de consistentie (t-waarden). Hoewel, zoals eerder genoemd, de verwachte oplopende trend in de items wordt teruggevonden, kan nog niet worden vastgesteld dat de vragenlijst op individueel niveau voldoende betrouwbaar is vanwege deze t-waarden. Opvallend is dat deze uitkomst overeen komt met de DIT en de SROM, welke op individueel niveau eveneens niet betrouwbaar zijn. Hieronder zullen een aantal mogelijke verklaringen voor deze uitkomst worden besproken. Ten eerste is morele ontwikkeling een moeilijk meetbaar construct. Beoogd wordt het niveau van de redeneren te meten dat ten grondslag ligt aan een moreel oordeel. Het is moeilijk een vragenlijst te construeren die antwoorden uitlokt waaruit direct iemands niveau van redeneren blijkt. In de MJRT, maar ook in de DIT en de SROM wordt het niveau afgeleid door middel van een omweg. In de MJRT wordt gevraagd om een mening over een persoon die een mening heeft over een moreel dilemma. In de SROM wordt gevraagd naar het wel of niet eens zijn met een gegeven reden die iemand zou kunnen geven voor de beslissing over een moreel dilemma. In de DIT wordt gevraagd naar het belang dat iemand hecht aan een gegeven reden die een rol kan spelen bij de 25

26 beslissing over een moreel dilemma. Al deze manieren om iemands huidige niveau van moreel oordelen in te schatten zijn indirect en daardoor kan men er minder zeker van zijn dat men precies meet wat men wil meten dan wanneer de manier van meten direct zou zijn geweest. Bovendien moet de proefpersoon bij het invullen van de vragenlijst een aantal denkstappen zetten, waarvoor een minimaal niveau van cognitieve ontwikkeling vereist is, zoals het nemen van perspectief en het beschikken over voldoende werkgeheugencapaciteit om de genomen stappen in gedachten te houden. Daarnaast maakt de complexiteit van de opdracht de kans groter dat er onnauwkeurigheden voorkomen bij het invullen van de vragenlijst. Ten tweede is het door de complexiteit van de vragenlijst niet ondenkbaar dat de MJRT te moeilijk is voor de jongeren die in dit onderzoek zijn gebruikt, met name voor de lagere klassen. Ervaringen bij het afnemen van de vragenlijst bevestigen dit: er werden veel vragen gesteld en er moest vaak opnieuw worden uitgelegd wat de bedoeling van de vragenlijst was. Daarnaast bleek dat de lagere klassen meer tijd nodig hadden dan de hogere klassen. Een derde verklaring voor de onvoldoende mate van betrouwbaarheid op individueel niveau zou kunnen liggen in de manier waarop de persoonlijke totaalscores worden geconstrueerd in de MJRT. Elk stadium krijgt hetzelfde gewicht mee, waardoor deze score pas een betekenis krijgt zodra men er zeker van kan zijn dat de oplopende volgorde van de items terugkomt in de data en dat de items consistent zijn beantwoord. Het eerste is het geval, het tweede niet. Daardoor hebben de totaalscores wel betekenis, maar niet zoveel als gewenst zou zijn. Een oplossing hiervoor zou zijn om elk stadium een gewicht mee te geven, zoals bij de SROM het geval is. De eindscore zou dan een gemiddeld stadiumniveau aangeven in plaats van het aantal keer dat iemand dommer of even wijs heeft aangekruist. Een nuancerende noot is echter op zijn plaats: de Rasch-analyse is een erg streng criterium. Het is nog niet eerder toegepast op vragenlijsten die morele ontwikkeling meten. Het is dan ook de vraag of gevalideerde vragenlijsten zoals de SROM en de DIT betere uitkomsten zouden opleveren bij een validering met de Rasch-analyse. 26

27 Bij de resultaten valt op dat dilemma 1 het meest inconsistent is beantwoord van alle dilemma s. De verwachte oplopende volgorde komt niet terug in de items en dit vertekent de uitkomst van gehele vragenlijst zodanig dat besloten werd dit dilemma niet te gebruiken bij de analyses. De slechte prestatie van dilemma 1 zou kunnen komen door het volgorde-effect: bij het eerste dilemma weten de proefpersonen nog niet precies wat van hen verwacht wordt en daardoor beantwoorden ze de vragen niet zoals de bedoeling is. Een mogelijk oplossing om dit probleem te ondervangen is het plaatsen van een aantal voorbeelditems in de instructie van de vragenlijst, zodat deelnemers vanaf het eerste officiële item weten wat van hen verwacht wordt. Een andere verklaring voor de slechte prestatie van dilemma 1 is dat het dilemma zelf niet duidelijk is of dat de items onduidelijk geformuleerd zijn. In vervolgonderzoek moet dit worden uitgezocht. Daarnaast valt bij de resultaten op dat de verwachte correlatie van persoonsscore met het grade point average niet is gevonden. Het is gebruikt omdat er geen manier beschikbaar was om de verbale intelligentie direct te meten. Hoewel dit grade point average een indicatie is voor verbale intelligentie, is het niet hetzelfde construct, omdat het bestaat uit rapportcijfers Engels en Nederlands. Hierin wordt niet alleen verbale intelligentie gereflecteerd, maar bijvoorbeeld ook de mate waarin iemand zijn best doet voor school en hoe goed iemand een proefwerk heeft geleerd. Daarnaast moet worden opgemerkt dat van sommige leerlingen enkel het rapportcijfer Nederlands beschikbaar was en dat alle leerlingen van het Farel College hun cijfer zelf hebben ingevuld in plaats van dat de schoolleiding het doorgaf. Hierdoor is het mogelijk dat deze leerlingen hebben gelogen over hun cijfer of het zich niet goed herinnerden. Een aantal van hen hebben ook daadwerkelijk bij hun cijfers geschreven: dit is een schatting. Deze onbetrouwbaarheid van het grade point average en het feit dat het slechts gedeeltelijk verbale intelligentie meet, zouden verklarend kunnen zijn voor de afwezige correlatie tussen persoonsscore en grade point average. Het huidige onderzoek heeft een aantal sterke punten en zwakke punten die hieronder zullen worden toegelicht. 27

28 Een sterk punt is de steekproef die erg gevarieerd is over leeftijd, leerjaar en schooltype. Een zwakker punt van de steekproef is het feit dat bijna alle deelnemende jongeren blank waren en christelijk. Hierdoor kan niet zonder meer gegeneraliseerd worden naar allochtone en niet-christelijke jongeren. Het bleek dat de meeste jongeren rond stadium 3 zaten in hun morele ontwikkeling en stadium 1 en 1.5 kwamen zo weinig voor dat zowel deze stadia als deze personen niet goed in te schatten waren op de logitschaal. Hier zou meer onderzoek naar moeten komen bij jongere kinderen. De vraag is echter of dat wel mogelijk is, aangezien de taak voor jongeren kinderen waarschijnlijk te complex is. Een ander zwak punt van het onderzoek was de afwezigheid van een valide andere vragenlijst over morele ontwikkeling om de convergente validiteit te meten. Vanwege praktische bezwaren zoals tijdsdruk is besloten dit niet te doen. Hierdoor zijn geen gegevens beschikbaar over convergente validiteit. Als sterk punt kan worden genoemd dat voor validering gebruik is gemaakt van de Rasch-analyse, die een strenge test is voor de interne validiteit van vragenlijsten. Ook de divergente validiteit is gemeten door het afnemen van een sociale wenselijkheidvragenlijst en het grade point average. In vervolgonderzoek zal meer onderzoek moeten komen naar de convergente validiteit. Een ander zwak punt is de vragenlijst zelf, die onduidelijkheden bevat en gebaseerd is op de ouderwetse dilemma s van Kohlberg. In de bijlage E: aanbevelingen voor verbetering van de vragenlijst worden de verbeterpunten wat uitgebreider behandeld. 28

29 Referenties Arnold, L.M. (2000). Stage, sequence and sequels: changing conceptions of morality, Post-Kohlberg. Educational Psychology Review 12 (4), Basinger, K.S., Gibbs, J.C. (1987). Validation of the sociomoral reflection objective measure-short form. Psychological reports, 61, Berk, L.E. (2003). Child Development. Boston: Allyn & Bacon. Blom,M., Oudhof J., Bijl R.V.(2005). Verdacht van Criminaliteit, allochtonen en autochtonen nader bekeken. Centraal Bureau voor de Statistiek in Nederland. Gevonden op Bond, T.G., & Fox, C.M. (2001). Applying the Rasch model: Fundamental measurement in the human sciences. Mahwah, NJ: Lawrence Erlbaum. Boom, J., Brugman, D. (2005) Measuring Moral Development in Adolescents. Uit Haaften, W. van, Wren, T. en Tellings, A. (eds): Moral sensibilities and education III: The adolescent. London: Concorde Publishing House. Boom, J., Brugman, D.,Van der Heijden, P.G.M. (2001). Hierarchical structure of moral stages assessed by a sorting task. Child development,72, Brugman, D., Aleva, A.E. (2004) Developmental delay or regression in moral reasoning by juvenile delinquents. Journal of moral education, 33,3. Brugman, D., Boom, J., Koops, W. (2005). De preventieve effecten van Equip - een multicomponenten wederzijdse hulp benadering - op externaliserend probleemgedrag bij VMBO scholieren: een multi-level interventie studie. (onderzoeksaanvraag: niet gepubliceerd) Colby, A., Kohlberg, L. (1987). The measurement of moral development. Cambridge University Press. Gibbs, J.C., Arnold, K.D., Morgan, R.L., Schwartz, E.S., Gavaghan, M.P., Tappan, M.B. (1984). Construction and Validation of a Multiple-Choice Measure of Moral Reasoning. Child Development, 55, Krebs, D.L., Denton, K. (2005). Toward a more pragmatic approach to morality: a critical evaluation of Kohlberg s model. Psychological Revies, 112,

Normbesef en externaliserend probleemgedrag onder adolescenten: De mediërende functie van empathie

Normbesef en externaliserend probleemgedrag onder adolescenten: De mediërende functie van empathie Normbesef en externaliserend probleemgedrag onder adolescenten: De mediërende functie van empathie Een onderzoek naar de mediërende functie van empathie op de relatie tussen normbesef en externaliserend

Nadere informatie

Arbeidsinhoud en Arbeidsverhoudingen bij Mensen Werkzaam binnen een Sociale Werkvoorziening

Arbeidsinhoud en Arbeidsverhoudingen bij Mensen Werkzaam binnen een Sociale Werkvoorziening Arbeidsinhoud en Arbeidsverhoudingen bij Mensen Werkzaam binnen een Sociale Werkvoorziening Hester van t Blik ANR: 681717 Universiteit van Tilburg Faculteit Sociale Wetenschappen Departement van Psychologie

Nadere informatie

Het ouderschapsplan en de effecten voor de kinderen

Het ouderschapsplan en de effecten voor de kinderen Het ouderschapsplan en de effecten voor de kinderen Inge van der Valk en Ed Spruijt Jeugd & Gezin, Departement Pedagogische Wetenschappen, Universiteit Utrecht Gereviseerde versie; 10 oktober 2013 1 Inleiding

Nadere informatie

Handleiding bij de CW-N en CW-I

Handleiding bij de CW-N en CW-I Handleiding bij de CW-N en CW-I (Carrièrewaardenvragenlijst normatief en ipsatief) Ixly 2008 Auteurs Drs. Heleanne Rusthoven Drs. Diddo van Zand Drs. Ilse Beemsterboer Ixly Alle rechten voorbehouden. Voorwoord

Nadere informatie

De ervaringen van kinderen bij het minderjarigenverhoor bij rechtbanken in civiele zaken

De ervaringen van kinderen bij het minderjarigenverhoor bij rechtbanken in civiele zaken De ervaringen van kinderen bij het minderjarigenverhoor bij rechtbanken in civiele zaken Masterscriptie Forensische Orthopedagogiek Pedagogische en Onderwijskundige wetenschappen Universiteit van Amsterdam

Nadere informatie

Hoofdstuk vier. Methode van onderzoek

Hoofdstuk vier. Methode van onderzoek Hoofdstuk vier Methode van onderzoek 4.1 Inleiding In dit hoofdstuk wordt de methode van onderzoek beschreven. Voor het onderzoek is gebruik gemaakt van twee databronnen. De eerste bron is het Voortgezet

Nadere informatie

qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq

qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq qwertyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyuiopasd fghjklzxcvbnmqwertyuiopasdfghjklzx cvbnmqwertyuiopasdfghjklzxcvbnmq Ik heb mijn polisvoorwaarden eigenlijk nog nooit gelezen, veel te

Nadere informatie

Het ontdekken van interacties met behulp van een analogie en een uitleg over experimenteren

Het ontdekken van interacties met behulp van een analogie en een uitleg over experimenteren Het ontdekken van interacties met behulp van een analogie en een uitleg over experimenteren Bachelorthese Carla Weisink, s1227084 Faculteit Gedragswetenschappen Psychologie Instructie Leren en Ontwikkeling

Nadere informatie

Centrale Huisartsenposten: Patiëntentevredenheid

Centrale Huisartsenposten: Patiëntentevredenheid Centrale Huisartsenposten: Patiëntentevredenheid Een kwantitatief en kwalitatief onderzoek Hanneke Janssens Marjon Reumkens Begeleiders: Drs. P.Giesen Dr. H. Mokkink Drs. E. Moll van Charante Afdeling:

Nadere informatie

ADVIESNOTA KRIDATIE ELS VAN NOORDUYN. Datum: 21-05-2013. Human Resource Management

ADVIESNOTA KRIDATIE ELS VAN NOORDUYN. Datum: 21-05-2013. Human Resource Management ADVIESNOTA KRIDATIE ELS VAN NOORDUYN Datum: 21-05-2013 Organisatie: Opleiding: Klas: Hogeschool Utrecht Human Resource Management P2B Studenten: Esther de Bruin 1609348 Marlieke Leermakers 1597541 Denise

Nadere informatie

[PROFESSIONEEL HANDELEN & ONDERZOEK]

[PROFESSIONEEL HANDELEN & ONDERZOEK] 2012-2013 Hogeschool Arnhem en Nijmegen Robert-jan Greup [PROFESSIONEEL HANDELEN & ONDERZOEK] Samenvatting van onderzoeksmethode voor sportstudies. Inhoud Wat is onderzoek?... 2 De definitie van onderzoek...

Nadere informatie

Voorwoord. Lisa Bastiaans,

Voorwoord. Lisa Bastiaans, Samenvatting Pensioenen voor sommigen een onderwerp waar veel over bekend is, voor anderen een onderwerp waar veel meer over bekend zou moeten zijn. Het is zo dat pensioencommunicatie vaak veel beter kan.

Nadere informatie

Behoefte aan hulp van een derde partij bij echtscheidingsconflicten. De rol van conflictasymmetrie en escalatie

Behoefte aan hulp van een derde partij bij echtscheidingsconflicten. De rol van conflictasymmetrie en escalatie De rol van conflictasymmetrie en escalatie Student: Louise te Brummelstroete Studentnummer: s1136720 Datum: 15-07-2013 Vakgroep: Conflict, Risico en Veiligheid 1 e Begeleider: M.A.J. van Dijk 2 e Begeleider:

Nadere informatie

Competenties, professionalisering, schoolklimaat en Leraar24. Een panelonderzoek onder leraren 2010

Competenties, professionalisering, schoolklimaat en Leraar24. Een panelonderzoek onder leraren 2010 Competenties,, schoolklimaat en Leraar24 Een panelonderzoek onder leraren 2010 Competenties,, schoolklimaat en Leraar24 Een panelonderzoek onder leraren 2010 Kees de Brabander Henk Vinken Bibi van Wolput

Nadere informatie

Kwaliteit van toetsen binnen handbereik

Kwaliteit van toetsen binnen handbereik Rapportage Kwaliteit van toetsen binnen handbereik Een reviewstudie van onderzoek en onderzoeksresultaten naar de kwaliteit van toetsen Nathalie Maassen, Dorien den Otter, Saskia Wools, Bas Hemker, Gerard

Nadere informatie

Usability Evaluatie Esther van der Drift

Usability Evaluatie Esther van der Drift Usability Evaluatie Esther van der Drift Usability Evaluatie Nano Trivia Bachelorscriptie Esther van der Drift Studentnummer: 329569 Universiteit Utrecht Informatiekunde Scriptiebegeleider: Joske Houtkamp

Nadere informatie

Pedagogische kwaliteit 82

Pedagogische kwaliteit 82 KORTLOPEND ONDERWIJSONDERZOEK Pedagogische kwaliteit 82 Doorstroom in het ROC Een kwestie van goed kiezen en doorzetten? Mechtild Derriks Margaretha Vergeer Doorstroom in het ROC Een kwestie van goed kiezen

Nadere informatie

Nu wat (lees)werk doen, geeft dat later een goed pensioen?

Nu wat (lees)werk doen, geeft dat later een goed pensioen? Nu wat (lees)werk doen, geeft dat later een goed pensioen? Een onderzoek naar de invloed van leesvaardigheid bij het vinden en begrijpen van informatie in een startbrief Xynthia de Graaff 3788903 Communicatie-

Nadere informatie

Anticiperen op variatie in wiskundekennis bij hbo-instroom

Anticiperen op variatie in wiskundekennis bij hbo-instroom Anticiperen op variatie in wiskundekennis bij hbo-instroom Een verkennend (voor)onderzoek naar de mogelijke benadering van variatie in het niveau van de wiskundige kennis bij technische, eerstejaars hboleerlingen

Nadere informatie

(H)echte sociale bindingen?

(H)echte sociale bindingen? (H)echte sociale bindingen? Een onderzoek naar de sociale bindingen van migrantenjongeren en hun gedrag in het licht van de sociale controle theorie van Hirschi Bachelorscriptie Bestuurskunde Begeleider:

Nadere informatie

Afwijzen van sollicitanten

Afwijzen van sollicitanten Afwijzen van sollicitanten Een experimenteel onderzoek naar het effect van mediumkeuze en structuur op de waardering van slecht nieuws. Madelief van Esch 3106314 Eindwerkstuk Communicatie Januari 2011

Nadere informatie

U-dialogen in het onderwijs - vergroten gevoel van welbevinden en veiligheid bij leerlingen - Tussenrapportage 2011-2012

U-dialogen in het onderwijs - vergroten gevoel van welbevinden en veiligheid bij leerlingen - Tussenrapportage 2011-2012 U-dialogen in het onderwijs - vergroten gevoel van welbevinden en veiligheid bij leerlingen - Tussenrapportage 2011-2012 APS: Monique Sanders, Alice Vlottes, Rosa Njoo en Ada van der Hoeven RUG: Femke

Nadere informatie

De WISC-RN als presenteerblaadje?

De WISC-RN als presenteerblaadje? De WISC-RN als presenteerblaadje? Een onderzoek naar het vaststellen van schoolproblemen bij kinderen op basis van het verschil tussen hun verbaal en performaal IQ Doctoraalscriptie Opleiding Pedagogische

Nadere informatie

Angst en vertrouwen. Het effect van positieve en negatieve factoren op veiligheidsbeleving. drs. Josca Boers

Angst en vertrouwen. Het effect van positieve en negatieve factoren op veiligheidsbeleving. drs. Josca Boers Angst en vertrouwen Het effect van positieve en negatieve factoren op veiligheidsbeleving Samenwerking tussen Dienst Onderzoek en Statistiek van de gemeente Amsterdam en de Vrije Universiteit van Amsterdam

Nadere informatie

DE VERTROUWENSRELATIE TUSSEN ADVOCATEN EN JEUGDIGE VERDACHTEN. De vertrouwensrelatie tussen jeugdstrafrechtadvocaten en diens jeugdige cliënt

DE VERTROUWENSRELATIE TUSSEN ADVOCATEN EN JEUGDIGE VERDACHTEN. De vertrouwensrelatie tussen jeugdstrafrechtadvocaten en diens jeugdige cliënt De vertrouwensrelatie tussen jeugdstrafrechtadvocaten en diens jeugdige cliënt Master thesis Universiteit Utrecht Masteropleiding Pedagogische Wetenschappen Masterprogramma Orthopedagogiek Giaffa de Wolff

Nadere informatie

Bevlogen leiden in de zorg

Bevlogen leiden in de zorg Bevlogen leiden in de zorg Naar aanleiding van de masterthesis Engaging leadership in health care organizations: the mediating role of work engagement ZorgpleinNoord Koos van der Kleij Haren, februari

Nadere informatie

Universiteit Utrecht. Master Arbeids- en Organisatiepsychologie

Universiteit Utrecht. Master Arbeids- en Organisatiepsychologie Universiteit Utrecht Master Arbeids- en Organisatiepsychologie Onderzoek naar twee antecedenten van de eigeneffectiviteit van de arbeidsgerelateerde coach: voorbeeldervaringen en verbale overtuiging Naam:

Nadere informatie

Persoonlijkheid en motivatie van de kandidaat als voorspellers van individueel succes in reïntegratie:

Persoonlijkheid en motivatie van de kandidaat als voorspellers van individueel succes in reïntegratie: Persoonlijkheid en motivatie van de kandidaat als voorspellers van individueel succes in reïntegratie: Een onderzoek naar de predictieve validiteit van drie online vragenlijsten die zijn opgenomen in de

Nadere informatie

Differentiëren in de klas wat doe ik eigenlijk?

Differentiëren in de klas wat doe ik eigenlijk? Differentiëren in de klas wat doe ik eigenlijk? Bas de Koning Profielproduct Ontwikkelaar Instituut voor de Lerarenopleiding, UvA Open Schoolgemeenschap Bijlmer Begeleiders: Tanja Janssen (ILO) Jos van

Nadere informatie

De betrouwbaarheid van de Student Behavior Observation Form

De betrouwbaarheid van de Student Behavior Observation Form Masterscriptie Orthopedagogiek De betrouwbaarheid van de Student Behavior Observation Form Onderzoek naar het betrouwbaar meten van het leergedrag van leerlingen in het voortgezet onderwijs Universiteit

Nadere informatie