Proefschrift Sylvia P. van Borkulo The assessment of learning outcomes of computer modeling in secondary science education

Vergelijkbare documenten
Het Verband Tussen Persoonlijkheid, Stress en Coping. The Relation Between Personality, Stress and Coping

Vragenlijst deelnemers Vlaams Lerend Netwerk STEM SO

Laag Vaardigheden Leerdoelen Formulering van vragen /opdrachten

De Taxonomie van Bloom Toelichting

Creatief onderzoekend leren

Evalueren van de kwaliteit van onderzoek

Het LOVS rekenen-wiskunde van het Cito

Het LOVS rekenen-wiskunde van het Cito

Het NHL InnovationLab : Learning outcomes, Design Thinking, UDL en Blended Learning in samenhangend perspectief. (draft version)

Een exploratieve studie naar de relatie tussen geïntegreerd STEM-onderwijs en STEM-vaardigheden op secundair niveau

Beïnvloedt Gentle Teaching Vaardigheden van Begeleiders en Companionship en Angst bij Verstandelijk Beperkte Cliënten?

Proefschrift Simone Löhner Computer Based Modeling Tasks: the Role Of External Representation

Relatie tussen Cyberpesten en Opvoeding. Relation between Cyberbullying and Parenting. D.J.A. Steggink. Eerste begeleider: Dr. F.

Samenvatting. Ontwikkeling en evaluatie van een implementatiestrategie voor het verzekeringsgeneeskundig protocol Depressieve stoornis

VRAGEN STELLEN.

The Effectiveness of Community Schools: Evidence from the Netherlands

Roeien met de riemen die je hebt Beoordeling interculturele competenties

Pesten onder Leerlingen met Autisme Spectrum Stoornissen op de Middelbare School: de Participantrollen en het Verband met de Theory of Mind.

Onderwijsvernieuwing. We doen er allemaal aan mee.

Workshop voorbereiden Authentieke instructiemodel

Voorbeeld lesplan: Modelleren van de glucose-insuline regulatie

Samenvatting Proefschrift Fostering Monitoring and Regulation of Learning Mariëtte H. van Loon, Universiteit Maastricht

Wetenschap en technologie in het basisonderwijs

Mens en Natuur, Natuurkunde. VO onderbouw (havo/vwo) 2-3 lesuren

Tool IC-2 Toetsen en beoordelen van onderzoekend leren

Faculteit Ontwerpwetenschappen Handleiding Opstellen van een toetsmatrijs Versie 15/04/2015

Vanuit de HvA zijn we bezig met een onderzoek om onderzoeksvaardigheden van kinderen te meten opdat de leerkracht beter kan sturen in het leerproces

Bijlage 1: het wetenschappelijk denk- en handelingsproces in het basisonderwijs 1

VALIDITEIT EN BETROUWBAARHEID VAN TOETSEN. Johan Jeuring Informatica Voorzitter toetsadviescommissie

Innovatief Onderwijs Ontwerpen. Jeroen van Merriënboer

Ouderlijke Controle en Angst bij Kinderen, de Invloed van Psychologische Flexibiliteit

Rekenen in Beeld - Kritische analyse van rekenopgaven - - Wetenschappelijk onderzoek naar contextgebruik -

LESSON STUDY IN DE TWEEDEGRAADS LERARENOPLEIDING

Samenvatting Hoofdstuk 1 Hoofdstuk 2

Leren onderzoeken leer je niet van zomaar onderzoek doen! Patricia Kruit Ed van den Berg Ron Oostdam Jaap Schuitema

Summary in Dutch 179

SCHOLEN DIE VERBINDEN Naar een beter begrip van de impact van binding en een autoritatief schoolklimaat op spijbelen

Het Toetsen Tournée. Paul Drijvers Freudenthal Instituut Universiteit Utrecht

HOOFDSTUK 6: INTRODUCTIE IN STATISTISCHE GEVOLGTREKKINGEN

Samenvatting. Samenvatting 8. * COgnitive Functions And Mobiles; in dit advies aangeduid als het TNO-onderzoek.

Tijdschrift voor Didactiek der B-wetenschappen 7 (1989) nr.1 79

Amsterdam University of Applied Sciences. Leren redeneren en experimenteren met concept cartoons Kruit, P.M. Link to publication

Kris Verbeeck (KPC Groep) en Liesbeth Baartman (TU Eindhoven) Waarom samenhangend toetsbeleid?

Taxonomie van Bloom. (taxonomie = wetenschap van het indelen) 6. Creëren. Nieuwe ideeën, producten of gezichtspunten genereren

Operationaliseren van variabelen (abstracte begrippen)

Bloom. Taxonomie van. in de praktijk

Ontwerponderzoek Paper 3: Onderzoeksplan

Draagt lesmateriaal bij aan het vergroten van financiële vaardigheden van basisschoolleerlingen?

Doesjka Nijdeken Trinitas College Heerhugowaard Woudschoten Chemie Conferentie 2011

Competenties semester 4

Programma. - Construct-> dimensies -> indicatoren -> items vragenlijst. - Pilot met de vragenlijst. - Plannen van het onderzoek.

Rubrics ontwerpen met behulp van de SOLO Taxonomie

Introductie. De onderzoekscyclus; een gestructureerde aanpak die helpt bij het doen van onderzoek.

Prijsontwikkeling koopwoningen

Kwaliteit van toetsing - borging van het eindniveau

Software Engineering. Universiteit Antwerpen

Er staat veel op het spel bij selectie voor de geneeskundeopleiding. Slechts 6-30% van de kandidaten kan toegelaten worden tot de opleiding en selecti

Reactie op Notitie t.b.v. de Resonansgroep Wiskunde over de Syllabi Wiskunde voor Motivatie. Notitie. ü Inleiding. Resonansreac1.

Proefschrift René Westra Learning and teaching ecosystem behaviour in secondary education. System thinking and modeling in authentic practices

Research in Higher Professional Education: A staff perspective. Mw. D.M.E. Griffioen

Formulier voor het beoordelen van de kwaliteit van een artikel over een diagnostische test of screeningsinstrument.

Sekseverschillen in Huilfrequentie en Psychosociale Problemen. bij Schoolgaande Kinderen van 6 tot 10 jaar

Doel training. Programma Programma Voordelen voor de kandidaat. Uitgangspunten EVC. Assessoren en EVC-begeleiders training

Academische taal & gesprekken over techniek met kleuters

Criteria selectie educatiemateriaal (zwerf)afval

Work Ability Index Duurzame inzetbaarheid van uw medewerkers

Aansluitingsonderwijs Radboud Universiteit

Mindshifts mbt leren nodig voor high impact teaching

Sleuteltermen Stappenplan, belevingswereld, motivatie, boxenstelsel, economie Bibliografische referentie

Rekenen: ook in de andere vmbo vakken

Peiling wiskunde secundair onderwijs 1 ste graad A-stroom. Duiding van de resultaten. Johan Deprez Brussel, 12/06/19

Hypertekst schrijven en observerend leren als aanvullende didactiek 1

Examenbespreking havo maatschappijwetenschappen Donderdag 23 mei 2019

Competentie niveaus HHS TIS opleiding Werktuigbouwkunde

Cognitieve strategieën voor diepe verwerking en feedback

VERBETEREN VAN DE TAALVAARDIGHEID (RESULTATEN POST-DOC ONDERZOEK)

AOS docentonderzoek. Rapporteren en presenteren

De peilingsresultaten PAV in internationaal perspectief Colloquium peiling PAV, Brussel, 11 juni 2014

Hoe goed of slecht beleeft men de EOT-regeling? Hoe evolueert deze beleving in de eerste 30 maanden?

Denken kun je Leren!

Competentieleren in het vak Nederlands: een denkoefening

Fabel Positieve feedback in het schrijfschrift zorgt ervoor dat kinderen leesbaar leren schrijven.

Bent u gemotiveerd? L.E.J. Gerretsen Studentnummer: Eerste begeleider: prof. dr. L. Lechner Tweede begeleider: Dr. A.

De Relatie Tussen de Gehanteerde Copingstijl en Pesten op het Werk. The Relation Between the Used Coping Style and Bullying at Work.

Bullying in Schools for Special Education: Who Are the Defenders?

Interfacultaire Lerarenopleidingen, Universiteit van Amsterdam. natuurkundeonderwijs, motivatie, differentiatie, flipping the classroom

Windenergie Leerkrachthandleiding

Isaac Asimov. marnix academie

Effecten van contactgericht spelen en leren op de ouder-kindrelatie bij autisme

Concept Cartoons. Ed van den Berg, Kenniscentrum Hogeschool van Amsterdam en VU EWT Noord-Holland en Flevoland

Interfacultaire Lerarenopleidingen, Universiteit van Amsterdam

De Relatie tussen Momentaan Affect en Seksueel Verlangen; de Modererende Rol van de Aanwezigheid van de Partner

Beoordelingsmodel Profielwerkstuk HAVO/ VWO

nederlandse samenvatting Dutch summary

Voorspellers van Leerbaarheid en Herstel bij Cognitieve Revalidatie van Patiënten met Niet-aangeboren Hersenletsel

Geheugenstrategieën, Leerstrategieën en Geheugenprestaties. Grace Ghafoer. Memory strategies, learning styles and memory achievement

Beoordelingsmodel bij een PWS binnen het natuurprofiel

Kwaliteitsvol evalueren

Studiewijzer BACHELOR KUNSTMATIGE INTELLIGENTIE EXTRA KEUZENVAK VAK: C++ PROGRAMMEERMETHODEN

De jonge onderzoeker in het VWO

Transcriptie:

Tijdschrift voor Didactiek der -wetenschappen 27 (2010) nr. 1 & 2 105 Proefschrift Sylvia P. van Borkulo The assessment of learning outcomes of computer modeling in secondary science education Bespreking door: Wolter Kaper Universiteit van Amsterdam Wanneer leerlingen actief met lesmateriaal bezig zijn, steken zij er meer van op. Onder dat brede motto zijn veel onderwijsvernieuwingen te vatten, onder andere ook het onderzoekend leren, het leren natuurwetenschappelijk redeneren en het leren werken met modellen, bijvoorbeeld computermodellen. Vaak wordt geclaimd dat deze onderwijsvernieuwingen ons in staat stellen hogere orde leerdoelen te bereiken. Maar is dat ook zo? Sylvia van Borkulo stelt zich ten doel de vraag te beantwoorden welke leerdoelen er kunnen worden bereikt met het onderwijs in computer modelleren, en ook, hoe deze leeruitkomsten kunnen worden gemeten. Hiervoor vergelijkt zij drie leeractiviteiten: modelleren, waar leerlingen een door de leraar gegeven model kunnen inzien, wijzigen en uitbreiden, simuleren, waar het door de leraar geprogrammeerde model onzichtbaar blijft, en traditioneel onderwijs, bestaande uit een tekst gevolgd door oefening (het schrijven van een werkstuk). De enigszins verrassende uitkomst is, dat leerlingen door het modelleren niet alleen beter leren modelleren, maar dat ook hun antwoorden op reproductievragen verbeteren, mits die reproductievragen niet al te eenvoudig zijn. Omgekeerd geldt voor de eenvoudige reproductievragen (niet onverwacht) dat hier de traditionele aanpak tot betere resultaten leidt. Over hogere orde -redeneervaardigheden wordt het volgende geconcludeerd: toepassen van een model hieronder verstaat Van Borkulo het doen van een voorspelling of het verklaren van een gegeven door te redeneren volgens een als juist aangenomen model: hier maakt de onderwijsvorm niet uit als de taak maar eenvoudig genoeg is (het juiste antwoord niet meer dan één redeneerstap omvat). Is de taak ingewikkelder, dan doen leerlingen die getraind zijn in computermodelleren het beter. evalueren in de context van een model dat is het beoordelen van het model in het licht van data, of andersom: hier bleek de modelleer -groep licht in het voordeel boven de traditioneel onderwezen groep, weer mits de taak gecompliceerd genoeg is. Omdat echter de resultaten van beide vergeleken groepen laag waren, is de auteur toch niet tevreden hierover. creëren van een model: hier zijn de resultaten enigszins tegenstrijdig. Bij één van de twee onderwijsexperimenten kwam een verschil naar voren tussen leerlingen die leerden simuleren en zij die leerden modelleren. De laatsten leken in het voordeel bij het zelf creeren

106 The assessment of learning outcomes of computer modeling van een simpel model. Maar als ook het traditionele onderwijs in de vergelijking werd betrokken dan bleef dit verschil niet overeind 1. Bij de twee genoemde negatieve resultaten moet worden vermeld dat het experimentele onderwijs maar kort duurde: netto niet meer dan 5 uur (300 minuten) in twee sessies. Hierbij is nog afgezien van de tijd die nodig is voor het invullen van de tests vóór en na het onderwijs. De voornaamste trend is dat het leren modelleren van een domein (dat was in alle gevallen de warmtebalans van de aarde ) een goede invloed heeft op het vermogen van leerlingen om complexe vragen over dat domein te beantwoorden zowel reproductievragen als model-toepassingsvragen. Als verklaring voor het onverwachte succes bij complexe reproductievragen geeft de auteur, dat complexe reproductievragen wellicht niet uit het geheugen beantwoord worden, maar dat men het antwoord vindt door middel van een redenering. De leerlingen die leerden modelleren hebben in zulke redeneringen meer oefening gehad dan hun collega s uit de traditioneel onderwijs -groep. Om tot deze resultaten te komen was het nodig eerst te beargumenteren welke verschillende leeruitkomsten er als gevolg van modelleren te verwachen zijn. Hiervoor werd een raamwerk opgezet waarin vier soorten activiteiten (reproductie, toepassen van een model, evaluatie en creatie) de belangrijkste dimensie vormden. Een tweede dimensie was de complexiteit van de opgaven: hier werd een tweedeling gehanteerd, simpel (niet meer dan één relatie nodig om aan het antwoord te komen) of gecompliceerd (meerdere relaties nodig). De derde dimensie maakte onderscheid tussen domein-specifiek redeneren en domein-generiek redeneren. Evenwicht en feedback zijn bijvoorbeeld concepten die bij modelleren een rol spelen in heel verschillende domeinen. Ongeacht het domein geldt dat bij negatieve feedback het systeem naar een evenwicht tendeert. De derde dimensie onderscheidt zulke domeinonafhankelijke redeneringen van de domeinafhankelijke. Maar deze derde dimensie heeft in dit onderzoek nog niet de rol gekregen die nodig werd gevonden, dus deze dimensie is bij de aanbevelingen voor verder onderzoek terecht gekomen. Het raamwerk van drie dimensies levert in totaal 4 (activiteiten) x 2 (complexiteiten) x 2 (domeinafhankelijk of niet) = 16 cellen op, die elk werden gevuld met drie of vier testvragen. Een belangrijk deel van het onderzoekswerk bestond uit controles op betrouwbaarheid en validiteit van de test. De test bestaat uit open vragen en dus werd gemeten in hoeverre twee beoordelaars tot dezelfde interpretaties komen. Vervolgens werd gecontroleerd of de vier subschalen van de test een goede samenhang hebben, en ook, of de veronderstelling van vier verschillende redeneervaardigheden kon worden bevestigd. Tenslotte werd gekeken of universitaire natuurkundestudenten, die net een cursus Simuleren en Modelleren achter de rug hebben, beter scoren dan psychologiestudenten of leerlingen van een middelbare school met natuur en techniek als profiel. Het bleek dat de universitaire natuurkundestudenten beter scoorden op alle vier de subschalen (reproductie, toepassing, creëren en evalueren), hetgeen de validiteit ondersteunde.

Van Borkulo 107 Daarna volgen twee onderwijsexperimenten. Het verschil tussen de experimentele groep en de controlegroep is eerst maximaal groot (universitaire natuurkunde middelbare school) en wordt dan in twee stappen kleiner gemaakt: eerst modelleeronderwijs vergeleken met traditioneel onderwijs in twee groepen die verder (op basis van een pretest) met een gelijke modelleervaardigheid startten. In een tweede experiment werd een nog kleiner verschil gekozen: onderwijs in modelleren wordt vergeleken met simuleren. Het feit dat er ook in het laatste geval nog duidelijke verschillen werden gevonden, toont aan dat de test voldoende gevoelig is om ook de effecten van relatief kleine verschillen in onderwijsaanpak te laten zien. Aan de vraag naar de validiteit van een test zitten veel kanten. In hoofdstuk 1 wordt dan ook gesteld dat validiteit niet bewezen kan worden, maar dat men er hoogstens verschillende aanwijzingen voor kan aandragen. Twee vormen van validiteit, namelijk validiteit op het eerste gezicht en inhoudsvaliditeit krijgen in dit onderzoek weinig aandacht. Wel worden bij wijze van voorbeeld enkele testvragen getoond en toegelicht. Juist deze voorbeeldvragen brengen mij aan het twijfelen of er gemeten wordt wat men zegt te meten. Ik geef mijn twijfels hieronder weer. Bij een toepassings -taak wordt geredeneerd om een voorspelling of verklaring te genereren. Bij een simpele toepassing -taak, is het juiste antwoord gebaseerd op niet meer dan één relatie uit het gegeven model. Als voorbeeld wordt de volgende taak gegeven (pagina 27): Choose the correct statement. A. The higher the albedo, the larger the inflow of energy to the earth. B. The higher the albedo, the lower the inflow of energy to the earth. C. The albedo does not influence the inflow of energy to the earth. Explain your answer. Voorafgaand aan de test is het te gebruiken model aan leerlingen gegeven in de vorm van een schema met pijlen. Er is tijd aan besteed om zeker te stellen dat leerlingen deze pijlentaal kunnen lezen, en in de bespreking wordt nergens genoemd dat dit een probleem zou kunnen zijn. In het pijlendiagram zie ik een pijl van albedo naar inflow of energy (naar de aarde) met een minteken erbij, hetgeen betekent: een negatieve invloed. Mijn conclusie: de taak is geen redeneertaak, maar een reproductietaak. Het antwoord staat immers letterlijk (in pijlen-taal weliswaar) in het aangeboden diagram. Deze taak test niet het modelleren van de toepassing maar uitsluitend het kunnen lezen van het diagram! Dit roept een principiëlere vervolgvraag op: kan een één-staps-redenering worden getest? Is een dergelijke taak onderscheidbaar van een reproductietaak? Een evaluatie -taak is een taak waarbij model en data met elkaar worden geconfronteerd. Volgens de auteur moet hierbij ófwel het model, ófwel de data ter discussie worden

108 The assessment of learning outcomes of computer modeling gesteld, niet beide (pagina 40). Als voorbeeld van een complexe evaluatietaak wordt gegeven (pagina 44): Andre performed two experiments with the simulation to investigate the relation between inflowing radiation and temperature. [Er volgen twee tabellen en twee grafieken met gegevens uit beide computerexperimenten. De grafieken tonen de temperatuur tegen de tijd: een stijgende curve bij experiment 1, dalend bij experiment 2. Zowel de inflow of energy als de albedo hebben verschillende waarden in de beide experimenten] From these data, Andre concludes that, the higher the inflowing radiation, the higher the temperature on earth. Is it correct for Andre to draw this conclusion? Explain your answer. Uit de formulering blijkt dat het model hier als waar moet worden aangenomen, terwijl Andre's uitspraak (als data ) ter discussie staat. Om de juistheid van Andre s uitspraak te beoordelen zou ik (1) het model zelf toepassen (een meerstaps-toepassingstaak) en dan (2) mijn eigen resultaat met dat van Andre vergelijken. Bij een verschillende uitkomst concludeer ik dat Andre ongelijk heeft. In dit geval heeft hij ongelijk omdat bij hogere instraling de temperatuur best kan dalen. Dat gebeurt namelijk volgens het gegeven model als de albedo sterker toeneemt dan de instraling. Is dit nu een hoog niveau -redeneervaardigheid zoals bedoeld door de auteur bij haar verwijzing naar Bloom s herziene taxonomie (Anderson & Krathwohl, 2001, geciteerd op pagina 37)? Mijn redenering hierboven is equivalent aan het beantwoorden van een toepassingstaak, gevolgd door een ja/nee beslissing. Wat maakt evaluatie volgens Bloom tot een hoger niveau dan toepassing? Is dat die ja/nee beslissing, of moet het meer zijn? Wanneer evaluatie optreedt in een authentieke onderzoekssituatie dan staat er nooit zwart op wit gegeven welke van de twee voor waar moet worden aangenomen: het model of de data. In plaats daarvan kent de onderzoeker de achtergrond van de data (hoe kwam Andre aan zijn uitspraak, welke aanwijzingen voerde hij aan) en de onderzoeker kent de status van het model: successen en twijfels. Als model en data conflicteren, is de hamvraag: aan welke van de twee moeten we nu de schuld geven, aan het model of aan de data? Mijn conclusie luidt: als die keuze al door de maker van het test-item voor ons gemaakt is, dan wordt het hoge niveau van een evaluatietaak aanzienlijk verlaagd. Zijn er testmethoden voor hogere orde leerdoelen? Voorstanders van competentiegestuurd leren argumenteren dat niet elk leerdoel kan worden getoetst in een examensituatie. Aan de universiteit is het eindwerkstuk een bachelor- of master-scriptie, geen tentamen. Dat is niet voor niets. De reden is dat niet elke authentieke taak (zoals onderzoek doen, of modelleren) kan worden opgesplitst in kleine stukjes, die dan elk apart in onaf-

Van Borkulo 109 hankelijk te beantwoorden opgaven 2 worden getoetst. Iets dergelijks zou ook kunnen gelden voor sommige van de leerdoelen die Van Borkulo heeft uitgekozen. Werkstukken en projecten zijn minder intersubjectief betrouwbaar te beoordelen dan tentamens, en dat is jammer. Maar toch is er een reden waarom ze onlangs in de mode zijn gekomen, en dat heeft veel met hogere orde vaardigheden te maken. Enige discussie daarover zou een academisch proefschrift niet misstaan in deze tijden van snel wisselende (nu moet het evidence-based, maar kort geleden moest het vooral authentiek) modegrillen. Onze kennis over hoe de drie eerste Bloom-niveaus (reproductie, begrijpen, toepassen) kunnen worden bereikt en getoetst in onderwijs dat modelleren inzet als middel voor begripsvorming, is door dit proefschrift toegenomen. De conclusie dat modelleren vooral de vaardigheid beïnvloedt om complexere problemen te beantwoorden is grondig onderbouwd, belangrijk, en toepasbaar. Noten 1. Het lijkt nu een vreemde anomalie, dat de simulatie -leerlingen uit het tweede experiment bij het creëren van een simpel model onder de maat presteerden (zie tabel 6-2, pagina 95)! Een verklaring voor dit merkwaardige verschijnsel wordt niet gegeven. 2. Meerdere onafhankelijk te beantwoorden opgaven zijn nodig om statistiek te kunnen bedrijven. Een toets met maar één opgave (extreem voorbeeld: schrijf een proefschrift) heeft geen Cronbach alfa.

110 The assessment of learning outcomes of computer modeling