Comparatief beoordelen: (Hoe) werkt dat?

Vergelijkbare documenten
Competenties kwaliteitsvol beoordelen

Competenties kwaliteitsvol beoordelen

Een jaar na het winnen van de Prijs voor Examens. Marije Lesterhuis & Roos Van Gasse NVE congres 2019

Een toepassing van D-PAC

De kansen die comparatief beoordelen biedt

De leerkansen die comparatief beoordelen biedt

Meten we wat we willen meten?

De kracht van paarsgewijs vergelijken voor het beoordelen van competenties. Prof. dr. L. Coertjens

15/11/ 17. Peer assessment. Welke oplossingen biedt D-PAC. Maarten Goossens.

SIG (Digitaal) Toetsen en Leren Integreren

D-PAC feedback op organisatieniveau

Goed, beter, best. Eenvoudig en betrouwbaar beoordelen met D-PAC

Studenten maken de rubric zelf Comparative Judgement als methode om studenten succescriteria en standaarden te laten formuleren

Leren van een assessment. Workshop IVG Scholingsdag Toetsing Eric Entken en Titia van Eijndhoven 12 november 2012

Opdracht Feedback Feed up Feed forward

E-Portfolio inzet / programmatisch toetsen Master Diergeneeskunde SURF Seminar E-portfolio s in het hoger onderwijs 1 juni 2018 Dr. F.

CREATIEF VERMOGEN. Andrea Jetten, Hester Stubbé

ICT & Beginnende geletterdheid: Richtlijnen voor het pabo-curriculum

Hoe rijk is een GP ervaring? Proeven en Opbrengst Gericht Werken: Hoe zit dat?

Het authentieke portfolio als instrument in het zelfsturend leren van professionals

Criteria selectie educatiemateriaal (zwerf)afval

Comparative Judgement als methode om studenten succescriteria en standaarden te laten formuleren

Herinrichting Schoolplein mavo 3

VRAGENLIJST FORMATIEF TOETSEN DOCENT

Doel training. Programma Programma Voordelen voor de kandidaat. Uitgangspunten EVC. Assessoren en EVC-begeleiders training

Innovatieve vormen van leren, wat betekent dat voor toetsen?

Kris Verbeeck (KPC Groep) en Liesbeth Baartman (TU Eindhoven) Waarom samenhangend toetsbeleid?

COMPETENTIETOETSEN DOMEIN APPLIED SCIENCE ANTOINETTE VAN BERKEL HOGESCHOOL VAN AMSTERDAM 23 MAART 2017

Kwaliteit van toetsen en beoordelen. Desirée Joosten-ten Brinke. 25 oktober Programma

"Goed gedaan, maar kan nog beter "

Opdracht. Voorkennis Basale kennis van het proces van formatief evalueren.

D-PAC event 15 november 2017

D-PAC event 15 november 2017

Dr. Elianne Roelandse Koop VU Medische Centrum en P rof.dr. Hans W illems Universitair Medisch Centrum St Radboud

Ter introductie: een kijkje in 4 vmbo-tl

Anders kijken, anders leren

'DIGITAL TOOLKIT' RICHTLIJNEN

Een toetsprogramma om van te leren. Platform leren van toetsen 2 juni 2017 Wendy Peeters en Nienke Zijlstra

OPDRACHT FORMATIEF EVALUEREN: VAN CONTROLEREN NAAR INFORMEREN

3 DE NETWERKSESSIE : EVALUATIE F A T I H A B A K I

Skillslab en programmatisch toetsen

SPOORBOEKJE. Introductie Rondleiden is een vak! Workshop gebruiken van instrumenten Ervaringen met instrumenten Vragen

Kwaliteit van toetsing

Christel Wolterinck (Marianum en Universiteit Twente), Kim Schildkamp (Universiteit Twente), Wilma Kippers (Universiteit Twente)

Beoordelen van leeruitkomsten en de rol van de werkplek daarbij. Projectteam HAN Werkplekleren 23 januari 2017

Kaartspel De formatieve toetscyclus. NRO-PPO overzichtsstudie dossiernummer Judith Gulikers & Liesbeth Baartman

Dit portfolio is eigendom van: Naam: Adres: Postcode en woonplaats: Telefoon: Naam studieloopbaanbegeleider: Telefoon:

360 feedback assessment

Lab to Learn leren met morgen VOORBEELDRAPPORTAGE EDUCHECK VO. EJ"Chec Ra pp. orfa e. Ij IT-workz. liorl

Renske de Kleijn Module RUBRICS EMP OWK/PED 11-12

Roeien met de riemen die je hebt Beoordeling interculturele competenties

feedback Flexibel en online Robuust 360º Werkboek Robuus Hartelijk dank voor het gebruiken van Robuust 360º Haal het maximale uit 360º

Tool scan formatieve toetscyclus

Op zoek naar nieuwe standaarden voor examinering van Competentie Gericht Onderwijs. Confrontatie tussen twee visies

21e-eeuwse vaardigheden

Opdracht Inleiding Doel Benodigdheden Voorkennis Stappenplan Een les voorbereiden en achterhalen waar je leerlingen staan Voorbeeld Doel Resultaat

Child Care Quality in The Netherlands: From Quality Assessment to Intervention K.O.W. Helmerhorst

Creatief schrijven: een impuls voor je schrijfonderwijs. NEDwerk Conferentie Nederlands 3 april 2019 Clasine van Dorst

Spaarne Coaching 360º 360º feedback is een krachtig instrument, maar dient op de juiste wijze gebruikt te worden.

BKO-vragenlijst Individueel traject

Preffi 2.0: Preventie Effectmanagement Instrument. Ontwikkeling,validiteit, betrouwbaarheid en bruikbaarheid

Het Maastrichtse Model

Zelfreflectie meetinstrument Ondernemende houding studenten Z&W

Arbeidsmarktkansen van afgestudeerden: het perspectief van werkgevers

WHITEPAPER GEBRUIKEN VAN BEOORDELINGSSCHALEN VOOR OPDRACHTEN BEOORDELINGSSCHALEN VOOR CHECKLISTS EN RUBRICS, 24 VOORBEELDEN HOE GEBRUIK JE ZE?

De competentiemeter. Kris Mostrey Handleiding: snel starten

Effectieve feedback op schrijfproducten

COMPETENTIETOETSEN IN HBO OPLEIDINGEN

Leerlingen beter leren schrijven

Coach voor leren en ontwikkeling

Afstudeerscripties. Feedback geven en Beoordelen. Renske de Kleijn. Onderwijsadvies en Training - UU. 6 juni 2015

EXAMEN KEUZEDEEL VERRIJKING LEERVAARDIGHEDEN Code: K INFORMATIE VOOR DE STUDENT

Het Toetsen Tournée. Paul Drijvers Freudenthal Instituut Universiteit Utrecht

Leer Opdrachten ontwerpen voor Blended Learning

De Competentiemeter: doelgericht evalueren

Een comparatieve aanpak voor peer assessment: leren door te vergelijken

Zelfbeoordeling bij schrijfvaardigheid Duits

"Organisatie op scherp"

VRAGEN STELLEN.

Instumenten voor procesevaluatie in geïntegreerd STEMonderwijs. 8 februari 2017 Leen Goovaerts, Mieke De Cock, Wim Dehaene

Kwaliteitseisen. 4.1 Praktijk Reflectie Kwaliteitseisen voor toetsing Portfolio 30

Zes tips voor betere feedback. Dr. Linda Keuvelaar van den Bergh Fontys Opleidingscentrum Speciale Onderwijszorg (OSO)

Voorwaarden voor effectieve formatieve toetsing

TMA 360º feedback Flexibel en online. TMA 360º feedback werkboek. Dank u voor het gebruiken van de TMA 360º feedback competentie-analyse

11/8/2016. Academisch Schrijven in het curriculum. Opzet van deze bijeenkomst. Academisch schrijven. Toepassing in curriculum.

Toekomstgericht onderwijs. Schoolrapport eerste jaar Algemeen deel Maart 2017

Zeven Fontys Hogescholen naar online. Implementatie van online competentiemanagement bij Fontys

Toets Consultvoering in jaar 1 IB Aangepast

Verordening op het lokaal onderwijsbeleid in de gemeente Amsterdam Bijlage 13 Voorziening Taalinterventies

Formatieve evaluatie en de DTT bij Nederlands

Zelfevaluatieformulier

Dossier sjabloon. BKO registratie

Universiteit Maastricht en WUR Ca 50 Maastricht en Ca 30 Wageningen Ronde 2 Datum uitvoering Mei Joke Marinissen en Gwen Noteborn

BUE Feedbackgevers LK

Toetsvormen. Onderwijsmiddag 14 februari 2012 Ferdi Engels & Gerrit Heil toetsadviescommissie

Probleemstelling. Methode. Methode. Methode

Handleiding Assessment Startbekwaamheid

Beoordelen in het HBO

Symposium Platform Leren van Toetsen. 1 juni 2018

Formative assessment: leerlingen helpen de regie te nemen over eigen leren

Transcriptie:

Comparatief beoordelen: (Hoe) werkt dat? VLOR inspiratiedag 14/02/2019 Roos Van Gasse www.d-pac.be info@d-pac.be

Projectleider: Sven De Maeyer 2

Digital Platform for the Assessment of Competences 3

Overzicht 4 1. De moeilijkheden van beoordelen 2. Introductie D-PAC project 3. Comparatief beoordelen 4. Zelf aan de slag 5. Enkele wetenschappelijke bevindingen 6. Reflectie

Complexiteit Authenticiteit Aanleiding 5 Complexe competenties

Aanleiding 6 Beoordelen is moeilijk: op welke aspecten let je wel en welke niet? welk oordeel geef je, wat is de range? is deze beter dan de vorige? geef ik nog wel dezelfde scores als in het begin? geven mijn collega s dezelfde oordelen?

Beoordelen op een absolute manier 7 Hoe donker is dit vlak op een schaal van 1 tot 10?

Ondersteuning aan beoordelaars 8

Problemen met rubrics en criterialijsten 9 Lastig om te construeren (Chapelle, 2008; Fulcher, 2011) Definiëring van het construct Specifieke versus globale criteria Geen garantie voor betrouwbare en valide oordelen (Bouwer et al., 2015; Weigle, 2002) Ruimte voor interpretatie van criteria > lage interbeoordelaarsbetrouwbaarheid Verschil in strengheid/mildheid van de beoordelaar Naar een beperkt aantal criteria kijken (Halo-effecten) Volgorde-effecten

10 Comparatief beoordelen als alternatief Thurstone (1927): Law of Comparative Judgement Men is beter en betrouwbaarder in het vergelijken van twee objecten dan in het toekennen van absolute scores aan een enkel object

Beoordelen op een comparatieve manier 11 Welke van de 2 vlakken is het donkerst?

Rangorde van licht naar donker 12

Van: Hoe goed is deze?

Naar: Welke is beter?

Met meerdere beoordelaars

Rangorde van minder goed naar goed Een score en feedback voor 2800 teksten SP R A A K P R O D U C T I E B I J K I N D E R E N M E T E E N C O C H L E A I R I M P L A N T A AT, H O O R A P PA R A A T E N NORM AAL GEHOOR E E N C O M P A R A T I E V E S T U D I E V I A D - PA C O M P U T A T I O N A L L I L K E D E C L E R C K & N AT H A L I E B O O N E N I N G U I S T I C S A N D P S Y C H O L I N G U I S T I C S M I NLEIDING K inderen met een gehoor verlies 3 op 1000 pasgeboren baby s Afhankelijk van de plaats van gehoorverlies: cochleair implantaat (CI) of akoestisch hoortoestel (HA): CI : vervangt de functie van het slakkenhuis in het binnenoor en stimuleert rechtstreeks de gehoorzenuw. H A : wordt ingezet bij p rob l em en in bu i te n- o f middenoor door het geluid te versterken. R E S E A R C H Deelnemers: 7 CI, 7 HA en 7 NH kinderen (gem. leeftijd bij opname: 7;9 jaar; SD = 1;0). Stimuli: 6 uitingen per kind van het type Ik heb lala/ lele/lolo gezegd (n=126). Beoor delaar s: 20 audiologen, 20 leerkrachten lager onderwijs, 20 onervaren luisteraars. STAP 1: STUDIE 2: I s de klemtoonproductie in de eerste woorden van kinderen met een CI minder uitgesproken dan bij N H kinderen? N T W E R P E N R E SU L T AT E N ST U D I E 1: I D E N T I F I C E E R B A A R H E I D Ranking: normaalhorende kinderen zijn hoger gerangschikt (en klinken dus beter) dan kinderen met een gehoorverlies. Hoe langer kinderen een CI dragen, hoe hoger ze in de ranking eindigen. Dit geldt niet voor kinderen met een HA. Moeilijkheid van paren met dezelfde hoorstatus is hoger dan paren met verschillende hoorstatussen. ST U D I E K 2: L E M T O O N P R O D U C T I E A fhankelijke variabele: r a n k i n g, klemtoonpatroon. Hoe moeilijk vond u deze keuze? ST U D I E K 2: Stimuli: Opnames van spontane interacties vanaf het begin van woordproductie tot een woordenschat van 200 woorden was bereikt. à Disyllabische woorden (n=1089). Bv: mama, papa, auto,... Beoor delaar s: 100 beoordelaars gerecruteerd via de aanwervingspoel van imec. Design experiment: Elke beoordelaar maakte 90 vergelijkingen. Elke stimulus werd 15 keer beoordeeld. STAP 2: Universiteit Antwerpen Gebruikelijkeprocedurevoor peer feedback Proceduremet D-PAC 1 Eerste versie 1 Eerste versie 2 Algemene feedback van de docent in college 2 Paarsgewijze vergelijking en peer feedback bij 2 x 10 teksten met D-PAC 3 Peer feedback bij 2 teksten 3 Algemene feedback van de docent in college 4 Herschrijfplan In welke ui ng is het verschil in nadruk tussen de twee delen het grootst? Waar ligt de natdruk in ui ng A/B? Nederland 47 scholen vwo 4, 5 en 6 bachelor 1 en 2 Nationale peiling naar schrijfvaardigheid (syntheseteksten) > 700 leerlingen >2800 teksten 4 Gezamenlijke reflectie over dit proces qua ervaring & leereffect 5 Tweede versie 5 Herschrijfplan Deopdracht Dedoelenvandenieuweproceduremet D-PAC Het maken van een tekstkwaliteitsschaal 6 Tweede versie Ranking: normaalhorende kinderen zijn niet hoger gerangschikt (en klinken dus beter) dan kinderen met een gehoorverlies: geen verschil in mate van beklemtoning. CI minder doelklemtoonpatroon dan NH kinderen. Reageer schriftelijk op een onterechte klacht van een klant. (calliope.be blended learning module slechtnieuwscommunicatie case Learn-IT) MPC ers kennis laten maken met een nieuwe manier om feedback te geven; MPC ers een beter idee geven van hun plaats in de rangorde volgens de peers; Devalkuilen MPC ers meer inspiratie aanreiken voor hun tweede versie door: hen verschillende tekstsets met elkaar te laten vergelijken om hen zo bewuster te maken van de kwaliteitscriteria; meer peers feedback te laten geven bij hun tekst; hun toegang te geven tot alle teksten van hun peers, met een focus op the zone of proximal development. Foute selectie van informatie en argumenten Beschadiging relatie met klant en vakorganisatie Decriteria 5x beoordeling van 300 teksten met D-PAC D-PAC: comparative judgement 36 beoordelaars 5 assessments in D-PAC: globaal oordeel en 4 aparte criteria Rangschikking van laagste tot hoogste score (op 5 verschillende manieren) Interbeoordelaarsbetrouwbaarheid.70 Tekst A Is de indirecte structuur goed uitgewerkt? Is de gekozen conventie voor de briefopmaak correct toegepast? ie rmat info ang enh sam integratie taal STUDIE 2: Geen verschil in hoe uitgesproken de klemtoonproductie is, maar wel in de productie van het doelklemtoonpatroon. OVERKOEPELEND: Comparatieve beoordelingen zijn een geschikte methode om verschillen in de spraakproductie van kinderen bloot te leggen. O N T A C T 150 lager dang emidd (-1sd) eld globaal C O N C L U SI E STUDIE 1: Volgens luisteraars klinkt de spraak van normaalhorende kinderen beduidend beter da n di e va n k i n der en m et een gehoorverlies. Spraak van CI klinkt beter dan H A. 100 50 DeresultatenvansubgroepB(n= 35) DeresultatenvansubgroepA(n= 39) veel hoger dangem iddeld (+2 sd) t ldeteks gemidde deld dangemid veel lager(-2 sd) Tekst B MPC ers helpen reflecteren voor hun herschrijfplan met de volgende vragen: Ben je het eens met je plaats in de rangorde? Waarom? Wat kun je leren van de opdrachten uit het aanleunende segment? Wat kun je leren van de beste opdrachten? Is de argumentatie overtuigend en lezersgericht? Is de toon van de tekst neutraal tot positief? Is de formulering eigentijds en professioneel? L E M T O O N P R O D U C T I E Deelnemers: 9 CI en 9 NH kinderen. STAP 1: Nina Vandermeulen & Brenda van den Broek Ervaringenvanstudentenéndocentenprofessionelecommunicatie Afhankelijke variabele: ranking, moeilijkheid. C OVERKOEPELEND: Z ijn comparatieve beoordelingen een geschikte methode om de spraakproductie van kinderen in kaart te brengen? A N I V E R S I T E I T Beide studies: Statistische analyse via M ulti L evel M odels Welk kind klinkt het beste? STAP 2: STUDIE 1: Kunnen luisteraars een onderscheid maken tussen de spraak van kinderen met een CI, H A of normaal gehoor? U V OORL OPI GE 1: Design experiment: Elke beoordelaar maakte 65 vergelijkingen. Elke stimulus werd 20 keer beoordeeld. V R A A G ST E L L I N G ETHODE ST U D I E Verstaanbaarheid en identificeerbaarheid Studies hebben aangetoond dat spraak/ verstaanbaarheid van kinderen met een gehoorverlies ook na jaren gebruik van CI of HA verschilt van de spraak van normaalhorende leeftijdsgenoten. M ethodes om spraakproductie te onderzoeken Akoestische metingen: Klemtoon: duur, toonhoogte en luidheid van spraakdelen meten Perceptuele beoordelingen door luisteraars: Aanduiden op een schaal: hoe verstaanbaar, waar ligt de klemtoon Comparatief = D-PAC E N T E R I D E N T I F I C E E R B A A R H E I D Spraakproductie bij kinderen met gehoor verlies Geen perfect gehoor heeft implicaties op spraaken taalontwikkeling: Klemtoonproductie Normaalhorende (NH) kinderen kunnen vroeg in de taalontwikkeling delen van de spraak benadrukken waardoor spraak klinkt zoals de doeltaal. Kinderen met CI hebben hier moeite mee. C 125 75 Betrouwbaarheid Gemiddeld aantal beoordelingen Gemiddelde gespendeerde tijd 0,75 8,8 2:23:16 Ervaringenvanstudenten Meer inspirat ie De studenten ervaren het als positief dat ze alle teksten kunnen raadplegen om zo meer inspiratie op te doen voor hun tweede versie qua structuur, strategie, taal & opmaak. Betere inschat t ing capaciteiten Op bijna alle eerste versies valt er heel wat aan te merken, vanwege de vele valkuilenin de opdracht. Dat maakt veel studenten onzeker. Dankzij deze methode kunnen ze beter inschatten waar ze zich ergens in de rangorde bevinden. Uit zonderlijk: frust rat ie Eén student was danig gefrustreerd omdat haar opdracht door haar peers als beste opdracht werd gerangschikt, terwijl de docenten de 17e opdracht uit de ranking als beste rangschikten. 0,78 8,9 2:03:03 Tipsvoor docenten 2800 teksten beoordelen met schaal 48 beoordelaars Globaal oordeel Elke tekst wordt door 3 beoordelaars gescoord chaal op des plaats 150 teksten score= Communicat ie Communiceer duidelijk naar de studenten welke feedback er van hen verwacht wordt (eventueel met een paar voorbeelden) en hoeveel tijd ze moeten inplannen. Crit eria Varieer holistische beoordeling met criteria-beoordelingen in opeenvolgende sessies. Volgorde docentenfeedback & peer feedback Overweeg eens om de paarsgewijze vergelijking in te plannen na het feedbackcollege. ±3minuten per tekst Suggestiesvoor aanpassingworkflow D-PAC Geef gebruikers de mogelijkheid om eerst feedback te geven, en pas daarna te kiezen. SuzyStals LuukVanWaes Master MeertaligeProfessioneleCommunicatie SpecialisatieBedrijfscommunicatie Feedback Ontwikkeling in scores over de leerjaren 100 90 80 70 60 50 40 30 20 10 0 nina.vandermeulen@uantwerpen.be brenda.vandenbroek@uantwerpen.be Individuele feedback met 1 instrument vergelijking met schaalteksten - feed forward 90 vwo 4 vwo 5 vwo 6 veel lager dan gemiddeld lager dan gemiddeld gemiddeld hoger dan gemiddeld veel hoger dan gemiddeld Geef gebruikers de mogelijkheid om hun feedback nog aan te passen (lerend effect). ilke.declerck@uantwerpen.be nathalie.boonen@uantwerpen.be hoger dangemidde ld (+1sd) Schaal met 5 ankerteksten De gemiddelde tekst is een tekst die in D-PAC zowel globaal als op de 4 criteria gemiddeld scoorde. Bij elke ankertekst wordt een korte toelichting voorzien voor elk van de 4 tekstkwaliteitscriteria. Tekstkwaliteit beoordelen Betrouwbaarheid Gemiddeld aantal beoordelingen Gemiddelde gespendeerde tijd % leerlingen C www.liftwritingresearch.com Eigen tekst vergelijken met schaaltekst die hoger scoort. Waar werk ik naartoe? Wat kan beter? Lift WritingResearch 115 & Eigen tekst vergelijken met schaaltekst die lager scoort. Wat zijn de positieve aspecten van mijn tekst? @LiftWriting

De kracht van comparatief beoordelen Vergelijken is makkelijk en snel Maakt gebruik van de expertise van beoordelaars Elk werk komt terug in meerdere vergelijkingen Verspreid over meerdere beoordelaars betrouwbare en generaliseerbare oordelen

Hoe werkt dit in D-PAC? 18

19 Paarsgewijs vergelijken in D-PAC Online platform zelf werk uploaden, geheel anoniem Algoritmes voor paren random, equal views, placement Feedback op verschillende aspecten, zowel positieve als verbeterpunten Automatisch resultaten rangschikking van producten, feedback voor beoordelaars

20 Resultaten van paarsgewijze vergelijkingen Rangorde van representaties (scores in logits) Betrouwbaarheid van deze rangorde (Scale Separation Reliability) Beoordelaars die afwijken van het model (misfits) Representaties die afwijken van het model (misfits)

Waarvoor te gebruiken? Summatief assessment: Portfolio s Zelfreflecties Argumentatieve teksten Wiskundig probleemoplossend vermogen Interactieve installaties (live assessment) Professionalisering: Beoordelaarstraining examencommissie (schrijfvaardigheden) Selectie: CV screening Projectvoorstellen Formatief (peer)assessment: Moodboards Academisch schrijven Stage

Demo van D-PAC 22 Surf naar http://sandbox.d-pac.be/tool Ga naar beoordeel Kies schrijfvaardigheden 5ASO demo Kies Moodboards

Vier jaar onderzoek in de onderwijspraktijk 23 Basisonderwijs: beschrijvende teksten gespreksvaardigheden (video) inclusieve werkvormen (video) Voortgezet onderwijs: argumentatieve teksten synthese teksten creatieve teksten formele brieven probleemoplossend vermogen wiskunde schetsen voor beeldende vaardigheden Hoger onderwijs: wetenschappelijk rapporteren essays onderzoeksverslagen labverslagen behandelingsplannen zelfreflectie-opdrachten portfolio interactieve installaties (live assessment) statistische output (afbeelding) personal branding (afbeelding) moodboards (afbeelding) ER diagrammen (afbeelding) interviewvaardigheden (video) Presentatievaardigheden (video) animatiefilmpjes (video) Stages (video)

Betrouwbaarheid 24 Betrouwbaarheid van min..70: gemiddeld 12 vergelijkingen per representatie minimum 9, maximum 20 Betrouwbaarheid van min..80: gemiddeld 17 vergelijkingen per representatie minimum 13, maximum 25 Een voorbeeld met 20 studenten: 20*12 vergelijkingen/2 = 120 vergelijkingen

Beoordelaars 25 Geen effect van beoordelaar op betrouwbaarheid, maar Meer beoordelaars: - Verhogen de generaliseerbaarheid van de resultaten: groep consensus (Van Daal et al., 2017) - Verhogen de validiteit van de resultaten: verschillen tussen beoordelaars (Lesterhuis et al., 2017)

Beoordelaars: waar letten ze op 26 Beoordelaars vergelijken teksten op verschillende, maar relevante aspecten van schrijven Omdat meerdere beoordelaars de vergelijkingen maken, is de rangorde een weergave van de volledige competentie schrijfvaardigheid. Van Daal, Lesterhuis, Coertjens, Donche & De Maeyer, 2017

Beoordelaars: doet ervaring ertoe? 27 Docenten, docenten in opleiding en docentenopleiders: - Aantal jaren ervaring niet relevant - Achtergrond niet relevant Lesterhuis, Bouwer, De Maeyer, & Donche, 2017

Beoordelaars: is training nodig? 28 Bouwer, Lesterhuis, De Smedt, Van Keer, & De Maeyer, 2017

Beoordelaars: peer assessment? 29 ER-schema s - Studenten.73 - Docenten.77 Moodboards - Studenten.81 &.73 - Docenten.71 Zelfreflecties - Docenten.77 - Leken.73 r =.62 r =.65 & r =.63 r =.57

30 Beoordelaars: peer assessment? Leren door te vergelijken Voorbeelden van uiteenlopende kwaliteit Kwaliteitscriteria vaststellen (bottom-up) Bereidheid om feedback te gebruiken Focus op hogere orde aspecten van de taak Veilig want alles gaat anoniem

Beoordelaars: en wat als ze afwijken? 31 Interne beoordelaars (9 experts) & externen (16 freelancers) beoordelen 37 teksten in D-PAC In hoeverre beoordelen ze op dezelfde wijze? Pretest: 5 externen wijken significant af van de internen Misfit Analyse feedback: focus op andere aspecten Professionaliseringsdag Posttest: externen op één lijn met experts (nog maar 1 misfit)

Andere algoritmes voor selectie van paren 32 - Adaptief algoritme - Equal views - Plaatsingsalgoritme

Adaptief algoritme (ACJ) 33 Adaptieve versus random algoritme Paren worden samengesteld o.b.v. informatie (Pollitt, 2012) Efficiënter MAAR: Betrouwbaarheid is vertekend (zie Bramley, 2015)

Equal views 34 Zijn er situaties waarin het gewenst (of noodzakelijk) is dat alle beoordelaars alle representaties zien tijdens het vergelijken?

Equal views 35 Oplossing: Equal views algoritme

Plaatsingsalgoritme 36 Fase 1: een betrouwbare schaal met random algoritme Fase 2: nieuwe representaties op de schaal plaatsen met een adaptief algoritme

Plaatsingsalgoritme 37

Plaatsingsalgoritme 38?

Think pair share Welke toepassingen voor comparatief beoordelen zie je in jouw praktijk? Waar ligt de meerwaarde? Waarvoor zou je de methode nooit willen gebruiken? Welke opportuniteiten zie je? Waarom wordt het (n)ooit iets tussen jou en het comparatief beoordelen?

www.d-pac.be @dpaccj