University of Groningen

Vergelijkbare documenten
Van 'gastarbeider' tot 'Nederlander' Prins, Karin Simone

Improving the properties of polymer blends by reactive compounding van der Wal, Douwe Jurjen

De betrouwbaarheid van kleinschalige methoden voor waterzuivering Kaaij, Rachel van der

University of Groningen

University of Groningen. De afkoelingsperiode in faillissement Aa, Maria Josepha van der

University of Groningen. Up2U Harder, Annemiek T.; Eenshuistra, Annika

Laat maar zitten Janssen, Janine Hubertina Lambertha Joseph

Citation for published version (APA): Mazzola, P. (2016). Phenylketonuria: From body to brain [Groningen]: Rijksuniversiteit Groningen

University of Groningen. Zorgvermijding en zorgverlamming Schout, Hendrik Gerrit

Draagvlak migratiebeleid Postmes, Thomas; Gordijn, Ernestine; Kuppens, T.; Gootjes, Frank; Albada, Katja

Citation for published version (APA): Verbakel, N. J. (2007). Het Chronische Vermoeidheidssyndroom, Fibromyalgie & Reuma.

Schoolsucces van Friese leerlingen in het voortgezet onderwijs de Boer, Hester

Neuroanatomical changes in patients with loss of visual function Prins, Doety

Understanding the role of health literacy in self-management and health behaviors among older adults Geboers, Bas

Een model voor personeelsbesturing van Donk, Dirk

Multiple sclerose Zwanikken, Cornelis Petrus

University of Groningen

Citation for published version (APA): Scheepstra, A. J. M. (1998). Leerlingen met Downs syndroom in de basisschool Groningen: s.n.

Mensen met een verstandelijke handicap en sexueel misbruik Kooij, D.G.

University of Groningen. Vrije en reguliere scholen vergeleken Steenbergen, Hilligje

University of Groningen. Eerste Hulp vaker ter plaatse Verhage, Vera

Citation for published version (APA): Veeze, P. (1968). Rationale and methods of early detection in lung cancer. [S.n.].

University of Groningen. Enabling knowledge sharing Smit - Bakker, Marloes

Zorgen rondom IVF Boekaar, J.; Riemersma, M.

Procesevaluatie van het Navigator project Jager, John Mike

Dynamics of inner ear pressure change with emphasis on the cochlear aqueduct Laurens-Thalen, Elisabeth Othilde

Multiple sclerose Zwanikken, Cornelis Petrus

University of Groningen

Interactie als gereedschap Koole, Tom

University of Groningen. Inferior or superior Carmona Rodriguez, Carmen

University of Groningen. De besmettelijkheid van de ftisis Groenhuis, Dirk Johan Jacob

Intrapersonal factors, social context and health-related behavior in adolescence Veselska, Zuzana

Quantitative STIR MRI as prognostic imaging biomarker for nerve regeneration Viddeleer, Alain

Bouwen op een gemeenschappelijk verleden aan een succesvolle toekomst Welling, Derk Theodoor

University of Groningen. Hulp op maat voor leerlingen met leerproblemen in het vmbo Mombarg, Remo

Uw mening over gaswinning uit het Groningen-gasveld: Onderzoeksresultaten fase 2 Hoekstra, Elisabeth; Perlaviciute, Goda; Steg, Emmalina

University of Groningen. Stormy clouds in seventh heaven Meijer, Judith Linda

University of Groningen. Resultaat van pleegzorgplaatsingen Oijen, Simon van

Citation for published version (APA): Weide, M. G. (1995). Effectief basisonderwijs voor allochtone leerlingen Groningen: s.n.

Citation for published version (APA): Hoekstra, H. J. (1982). Fractures of the proximal femur in children and adolescents [S.n.]

University of Groningen. Quantitative CT myocardial perfusion Pelgrim, Gert

Improving metabolic control in NIDDM patients referred for insulin therapy Goddijn, Patricia Petra Maria

University of Groningen. Pieces of the Puzzle Vissia, Eline Margreta

University of Groningen

Citation for published version (APA): Roodenburg, J. L. N. (1985). CO2-laserchirurgie van leukoplakie van het mondslijmvlies. [S.l.]: [S.n.].

Hypothalamus, pituitary and thyroid. The control system of thyroid hormone production. Sluiter, Wim J.

University of Groningen. Positron emission tomography in urologic oncology Jong, Igle Jan de

Today's talented youth field hockey players, the stars of tomorrow? Gemser, Marije

Molecular aspects of HNPCC and identification of mutation carriers Niessen, Renee

University of Groningen. Safe and Sound van den Bosch, Kirsten Anna-Marie

The infant motor profile Heineman, Kirsten Roselien

Citation for published version (APA): de Boer, H. (2009). Schoolsucces van Friese leerlingen in het voortgezet onderwijs. Groningen: s.n.

Understanding the role of health literacy in self-management and health behaviors among older adults Geboers, Bas

The importance of tactical skills in talent development Kannekens, Rianne

Verbindingskracht & combinatievermogen de Vries ev Delies, Jantina Jantje

University of Groningen. Structured diabetes care in general practice Fokkens, Sudara Andrea

University of Groningen. Electron Holography of Nanoparticles Keimpema, Koenraad

Citation for published version (APA): Egberink, I. J-A. L. (2010). Applications of item response theory to non-cognitive data Groningen: s.n.

The development of stable influenza vaccine powder formulations for new needle-free dosage forms Amorij, Jean-Pierre

Man of vrouw? Een onderzoek naar sekseverschillen in reacties op chronische aandoeningen Roeke, M.

Citation for published version (APA): Tijdschrift voor Genderstudies (2018). Jaarrekening Stichting Tijdschrift voor Vrouwenstudies.

The diversity puzzle Mäs, Michael

Opvoeding op school en in het gezin. Onderzoek naar de samenhang tussen opvoeding en de houding van jongeren ten opzichte van sociale grenzen

Citation for published version (APA): Crane, L. M. A. (2011). Intraoperative fluorescence imaging in cancer Groningen: s.n.

University of Groningen. Dwaallichten, struikeltochten, tolwegen en zangsporen Roodbol, Pieternella

Citation for published version (APA): Scheepstra, A. J. M. (1998). Leerlingen met Downs syndroom in de basisschool Groningen: s.n.

Electric double layer interactions in bacterial adhesion and detachment Poortinga, Albert Thijs

Citation for published version (APA): Holwerda, A. (2013). Work outcome in young adults with disabilities Groningen: s.n.

Helping infants and toddlers in Foster family care van Andel, Hans

University of Groningen

Citation for published version (APA): Sarkova, M. (2010). Psychological well-being and self-esteem in Slovak adolescents. Groningen: s.n.

University of Groningen. Symptoms of Distress and Imbalance in Children Nijboer, J.M.

Citation for published version (APA): van der Ploeg, J. (1997). Instrumental variable estimation and group-asymptotics Groningen: s.n.

Lamotrigine in bipolar depression Loos, Marcus Lambertus Maria van der

Self-reported health and health risky behaviour of Roma adolescents in Slovakia Kolarčik, Peter

University of Groningen. Dilemmas in child protection Bartelink, Cora

Citation for published version (APA): Faber, A. (2006). Stimulant treatment in children: A Dutch perspective s.n.

Cryosurgery in cervical intraepithelial neoplasia. A morphometric study Boonstra, Hendrik

The etiology of functional somatic symptoms in adolescents Janssens, Karin

University of Groningen. The impact of political factors on drivers of economic growth Klomp, Johannes Gerardus

University of Groningen. The clinical learning environment Hell, Elisabeth Aaltje van

Multiple sclerose Zwanikken, Cornelis Petrus

University of Groningen. Ondernemerschap in Zuidoost Drenthe Hans, Lianne; Edzes, Arend; Koster, Sierdjan

Voorbereiding pilot studie Power for Teens voor tieners met overgewicht en angstige en depressieve klachten.

University of Groningen. Living with Rheumatoid Arthritis Benka, Jozef

University of Groningen. Who cares? Kamstra, Aafke

University of Groningen

Citation for published version (APA): Zwanikken, C. P. (1997). Multiple sclerose: epidemiologie en kwaliteit van leven s.n.

University of Groningen. Embryogenesis and neogenesis of the endocrine pancreas Gangaram-Panday, Shanti Tireshma

University of Groningen. Paula voor goud Piersma, Theun. Published in: Vogels+

Effective monitoring and control with intelligent products Meyer, Gerben Gerald

University of Groningen. Risk factors for injury in talented soccer and tennis players van der Sluis, Alien

University of Groningen. Taalonderwijs en onderzoek Lowie, Wander

Towards optimal decision making in personalized medicine Cao, Qi

Coronary heart disease from a psychosocial perspective Skodova, Zuzana

University of Groningen. Mental health from a life-course perspective Veldman, Karin

The utility and effectiveness of an educational computer game aimed at improving ineffective learning behavior in preschool children Veenstra, Baukje

Transcriptie:

University of Groningen Is één klas voldoende? De betrouwbaarheid van leerlingenobservaties opnieuw bekeken met oog op het risico van high-stake besluiten van der Lans, Rikkert; Helms-Lorenz, Michelle; Maulana, Ridwan IMPORTANT NOTE: You are advised to consult the publisher's version (publisher's PDF) if you wish to cite from it. Please check the document version below. Document Version Publisher's PDF, also known as Version of record Publication date: 2017 Link to publication in University of Groningen/UMCG research database Citation for published version (APA): van der Lans, R., Helms-Lorenz, M., & Maulana, R. (2017). Is één klas voldoende? De betrouwbaarheid van leerlingenobservaties opnieuw bekeken met oog op het risico van high-stake besluiten. Copyright Other than for strictly personal use, it is not permitted to download or to forward/distribute the text or part of it without the consent of the author(s) and/or copyright holder(s), unless the work is under an open content license (like Creative Commons). Take-down policy If you believe that this document breaches copyright please contact us providing details, and we will remove access to the work immediately and investigate your claim. Downloaded from the University of Groningen/UMCG research database (Pure): http://www.rug.nl/research/portal. For technical reasons the number of authors shown on this cover page is limited to 10 maximum. Download date: 27-02-2019

Is één klas voldoende? De betrouwbaarheid van leerlingenobservaties opnieuw bekeken met oog op het risico van high-stake besluiten Deze studie focust op de betrouwbaarheid van leerlingenobservaties voor docenten in het voortgezet onderwijs (VO). Uit eerder onderzoek naar de betrouwbaarheid van studentenobservaties in hoger onderwijs (HO) blijkt dat studenten hun docenten met hoge betrouwbaarheid kunnen evalueren, maar dit resultaat is nog niet gerepliceerd met leerlingen in het VO. Ook is er kritiek op de onderzoeksopzet voor de bepaling van de betrouwbaarheid. Deze studie verkent daarom de betrouwbaarheid van leerlingenobservaties van docenten VO nagegaan mbv twee verschillende onderzoeksopzetten: een geneste en een gekruiste. De steekproef bestond uit 407 leerlingen uit 17 klassen. De resultaten bevestigen de betrouwbaarheid van leerlingenobservaties, maar suggereren tegelijk dat reguliere schattingen van de betrouwbaarheid optimistischer zijn dan schattingen die gebaseerd zijn op een complexere gekruiste onderzoeksopzet. Introductie Deze studie is gemotiveerd uit de beleidsagenda om de kwaliteit van lesgeven meer transparant te maken en individuele docenten in grotere mate aansprakelijk te stellen voor geleverde kwaliteit (NCTQ, 2013; Nusche, et al. 2014). Dit beleid zorgt ervoor dat de aard, de frequentie en het belang van onderwijsevaluatie aan het veranderen is (Marzano & Toth, 2013). In Nederland wordt er bijvoorbeeld naar gestreefd dat in 2020 100% van de docenten primair onderwijs (PO) en voortgezet onderwijs (VO) jaarlijks functioneringsgesprekken krijgt, iets waar Nederland historisch geen traditie in heeft (Nusche, et al. 2014). In relatief korte tijd zijn ook de adviezen voor implementatie en gebruik van instrumenten steeds verder gewijzigd. Oorspronkelijk was het idee dat evaluatie voor highstake besluiten zou plaatsnemen op basis van gestandaardiseerde leerlingenprestatietoetsen en evaluatie voor low-stake feedback op basis van lesobservaties en leerlingenobservaties (zie bijvoorbeeld Kane, et al. 2012). Maar recent worden lesobservaties en leerlingenobservaties over het pedagogisch-didactisch handelen steeds vaker geopperd in de context van high-stake besluiten (Darling-Hammond, 2013; Marzano & Toth, 2013; NCTQ, 2013). Eén van de hoofdredenen hiervoor is de (te) lage betrouwbaarheid van gestandaardiseerde leerlingenprestatietoetsen. Bovengenoemde ontwikkelingen vergroten de kans dat leerlingenobservaties (in de toekomst) worden meegenomen in high-stakes besluiten over aanstellingen en/of salarisverhoging. Echter, in tegenstelling tot lesobservaties, is over leerlingenobservaties geringe kennis over de betrouwbaarheid voor high-stake gebruik. Eerdere studies naar de betrouwbaarheid van leerlingenobservaties komen voornamelijk uit het hoger onderwijs (HO) (e.g. Marsh, 2007) en kennen meestal eenzelfde onderzoeksopzet (Morley, 2012). Morley argumenteert dat deze veel toegepaste onderzoeksopzet varianties verstrengelt, waardoor de betrouwbaarheid overschat wordt. De studie stelt zich daarom twee doelen. De eerste is om de eerdere bevindingen uit het HO te repliceren in de context van het VO; de tweede is om te verkennen of er aanleiding is te suggereren dat de betrouwbaarheid van leerlingenobservaties wordt overschat.

Onderzoeksvragen: 1. Is de betrouwbaarheid van leerlingenobservaties in het VO vergelijkbaar met de betrouwbaarheid van studentenobservaties in het HO, zoals gerapporteerd in Marsh (2007)? 2. Zijn er aanwijzingen dat eerdere studies de betrouwbaarheid van leerlingenobservaties hebben overschat? Methode Steekproef De steekproef voor dit onderzoek bestond uit 409 leerlingen uit 17 klassen uit de onderbouw VO (leeftijd 12 tot 15 jaar). De data komt van acht scholen. Iedere klas observeerde de kwaliteit van het pedagogisch-didactisch handelen van 3 of 4 docenten. In totaal deden 63 docenten mee aan het onderzoek. Instrument De gebruikte Mijn Leraar vragenlijst telt 40 items die tezamen het pedagogisch-diactisch handelen van docenten evalueren (Maulana, et al. 2015). Analyse De analyse maakt gebruik van het Geraliseerbaarheid in Item Response Theorie (GIRT) raamwerk (Choi, 2013). Om de analyses genoemd door Marsh (2007) te repliceren in het VO is van iedere leerling willekeurig één van de drie of vier beschikbare leerlingenobservaties geselecteerd voor analyse. Dit resulteerde in een geneste steekproef van 409 leerlingen waarbij iedere leerling één docent evalueerde. Morely (2012) argumenteert dat een gekruiste onderzoeksopzet, zoals één waarin leerlingen meerdere docenten beoordelen, tot meer accurate en waarschijnlijk ook lagere schatting zou komen in vergelijking met de geneste procedure. Om deze claim te onderzoeken is een analyse gedaan met een gekruiste opzet waarin van iedere leerling observaties van meerdere docenten werden meegewogen. Resultaten en Conclusies De Figuur 1 geeft de betrouwbaarheid aan van leerlingenobservaties. De figuur laat zien dat de betrouwbaarheid toeneemt wanneer observaties van een groter aantal leerlingen wordt samengenomen. Vergeleken met studies uit het HO, neemt de betrouwbaarheid van observaties van leerlingen VO sneller toe. De indicatie is dat bij ongeveer 15 leerlingen (in plaats van 24 leerlingen voor HO (Marsh, 2007)) betrouwbaarheid hoger is dan.90. De analyses suggereren tegelijk dat Morely (2012) terechte kritiek heeft geuit. De schatting van de betrouwbaarheid is inderdaad lager wanneer gebruik wordt gemaakt van een gekruiste procedure. Op basis van een gekruiste onderzoeksopzet is de inschatting dat meer 37 leerlingen nodig zijn om tot het criterium van.90 te komen.

1.00 0.90 0.80 0.70 0.60 0.50 0.40 0.30 geneste procedure 0.20 gekruiste procedure 0.10 0.00 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 Figuur 1. Betrouwbaarheid van leerlingenobservaties bij een toenemend aantal leerlingen. Implicaties De resultaten suggereren dat leerlingenobservaties uit één klas te weinig betrouwbare informatie bieden voor high-stake besluiten. Op basis van deze data is de inschatting dat 37 leerlingen (twee klassen) voldoende betrouwbare scores leveren voor high-stake beslissingen. Een kanttekening hierbij is dat ook in de hier toegepaste gekruiste onderzoeksopzet niet alle verstrengelingen van varianties ontrafelt, waardoor ook in deze opzet de betrouwbaarheid mogelijk nog wordt overschat. Het voorlopig advies is om leerlingenobservaties te combineren met meerdere lesobservaties van verschillende personen bij high-stake besluiten. Referenties Choi, J. (2013). Advances in combining generalizability theory and item response theory. Doctoral dissertation, University of California, Berkeley. Darling-Hammond, L. (2013). Getting teacher evaluation right. What really matters for effectiveness and improvement. New York, USA: Teachers College Press Kane, T. J., Staiger, D. O., McCaffrey, D., Cantrell, S., Archer, J., Buhayar, S., Kerr, K., Kawakita, T., & Parker, D. (2012). Gathering feedback for teaching: Combining highquality observations with student surveys and achievement gains. Seattle, WA: Bill & Melinda Gates Foundation. Marsh, H. D. (2007). Students evaluations of university teaching: Dimensionality, reliability, validity, potential biases and usefulness. In R. P. Perry & J. C. Smart (eds.), The scholarship of teaching and learning in higher education: An evidence-based perspective (pp. 319 383). Dordrecht, The Netherlands: Springer. Marzano, R. J., & Toth, M. D. (2013). Teacher evaluation that makes a difference. A new model for teacher growth and student achievement. Alexandria, Virginia: ASCD

Maulana, R., Helms-Lorenz, M., & Van de Grift, W. (2015). Development and evaluation of a questionnaire measuring pre-service teachers teaching behaviour: A Rasch modelling approach. School Effectiveness and School Improvement, 26(2), 169-194. Morley, D. D. (2012). Claims about the reliability of student evaluations of instruction: The ecological fallacy rides again. Studies in Educational Evaluation, 38(1), 15-20. NCTQ (2013). Connect the dots: Using evaluations of teaching effectiveness to inform policy and practice. Washington, DC: National Council on Teacher Quality. Nusche, D., Braun, H., Halász, G., & Santiago, P. (2014). OECD Reviews of Evaluation and Assessment in Education: Netherlands 2014. OECD Reviews of Evaluation and Assessment in Education, OECD Publishing. http://dx.doi.org/10.1787/9789264211940-en