Reactietijden en ontwikkeling in één balanstaakmodel

Reactietijden en ontwikkeling in één balanstaakmodel Anton Wijbenga, s1211005 Inleiding De balanstaak is misschien wel de meest bekende taak om proportioneel redeneren te bestuderen. Hoewel de taak zelf vrij eenvoudig is, is het vinden van de juiste antwoorden op problemen uit de taak, nog niet zo eenvoudig. Mensen doorlopen tijdens hun cognitieve ontwikkeling een aantal fasen wat betreft het oplossen van verschillende balansproblemen. Als mensen een fase verder komen dan betekent dat, dat ze een bepaalde categorie van balansproblemen correct oplossen die ze in de vorige fase nog incorrect oplosten. Als ze in de laatste fase zijn aangekomen dan worden alle problemen correct opgelost en wordt aangenomen dat ze kennis hebben van de regels die gelden voor het correct oplossen van balansproblemen. Van Rijn, Van Someren en Van der Maas (2003) hebben een model gemaakt wat de transities van de beginfase tot de eindfase kan verklaren. Hierbij wordt echter geen rekening gehouden met de tijd die het kost om specifieke balansproblemen op te lossen; de reactietijden. Van der Maas en Jansen (2003) hebben korte tijd na Van Rijn et al. (2003) een model gemaakt wat juist de reactietijden tijdens de verschillende fasen kan verklaren. Dit is echter een model wat niet de transities tussen de verschillende fasen verklaard. In mijn project wilde ik het model van Van Rijn et al. (2003) aanpassen zodat dat model zowel de transities tussen verschillende fasen verklaard als de reactietijden. Dit is echter gezien de tijd niet gelukt. Daarom zal ik in dit verslag mijn bevindingen tot nu toe presenteren. Daarnaast zal ik bespreken in hoeverre het doel van dit project in de toekomst te realiseren zal zijn en hoe dat dan gedaan zou moeten worden. Voordat ik dat doe zal ik echter eerst de balanstaak, het model van Van Rijn et al. (2003) en het model van Van der Maas en Jansen (2003) bespreken. De balanstaak Voor de balanstaak wordt een balans gebruikt met aan elke zijde van het evenwichtspunt een gelijk aantal staafjes. Om elk staafje kan een willekeurig aantal gelijkwegende gewichten geplaatst worden. Door de gewichten kantelt de balans naar rechts, dan wel links of blijft hij in balans. De proefpersoon moet bepalen wat de balans doet en de tijd die de persoon daarvoor nodig heeft wordt gemeten als reactietijd. Er is gebleken dat de proefpersonen in een aantal fasen geplaatst kunnen worden. Per fase laten de proefpersonen vergelijkbare reactietijden zien voor specifieke balansproblemen. Ook is het percentage correcte antwoorden op deze specifieke problemen kenmerkend voor iedere fase. Voordat de verschillende fasen toegelicht worden, zullen daarom eerst deze specifieke balansproblemen besproken worden (Van der Maas en Jansen, 2003). Acht balansprobleem categorieën: Er zijn in totaal acht verschillende categorieën van balansproblemen. De eerste is simple balance (sb). Bij deze categorie is aan beide zijden van de balans het aantal gewichten en de afstand waarop deze van het evenwichtspunt zijn geplaatst gelijk. Bij de simple weight (sw) categorie zijn de afstanden wel hetzelfde, maar de gewichten niet. Daardoor kantelt de balans naar de zijde de met het grootste gewicht. Voor simple distance (sd) categorie geldt juist dat de gewichten gelijk zijn, maar de afstanden niet. Daardoor kantelt de balans naar de zijde met de grootste afstand. Er zijn ook nog vier categorieën waarbij zowel de afstand als het gewicht verschillen. Dat zijn de conflict problemen. Bij de conflict balance a (cba) problemen is de balans in balans en is er een symmetrie waar te nemen. De symmetrie houdt in dat de afstand links gelijk is aan het aantal gewichten rechts en vice versa. Conflict balance b (cbb) is hetzelfde, maar dan zonder symmetrie. De andere twee categorieën zijn die waar de balans naar de zijde kantelt met het grootste aantal gewichten, de conflict weight (cw) problemen en die waar de balans naar de zijde kantelt met de grootste afstand, de conflict distance (cd) problemen. De laatste categorie is die waar zowel de gewichten als de afstand waarop deze geplaatst zijn aan één zijde groter zijn dan die aan de andere zijde. Dat zijn de zogenaamde weight distance (wd) problemen. Vijf fasen: De eerste fase is die waar proefpersonen alleen de gewichten beschouwen. Ze kiezen er altijd voor dat de balans naar de zijde met de meeste gewichten kantelt. Tenzij het aantal gewichten aan beide zijden gelijk is, dan is de balans in balans. Deze proefpersonen lossen daarom de categorieën sb, sw, cw en wd correct op. In de tweede fase wordt de afstand ook meegenomen door de proefpersonen, maar alleen indien de gewichten gelijk zijn. Indien de gewichten gelijk zijn wordt het antwoord gebaseerd op de afstanden. Nu worden ook de sd problemen correct opgelost. In de derde fase worden de afstanden altijd meegenomen in de beschouwing, dus ook als de gewichten verschillen. De proefpersonen gokken nu het antwoord bij de conflict categorieën. Wat nu opvalt, is dat hierdoor de cw problemen met een kans van 33% correct worden beantwoord, terwijl ze eerder altijd

correct beantwoord werden. Voor de andere conflict problemen geldt nu echter ook een kans van 33% op een correct antwoord, waardoor deze vaker correct worden opgelost als in de vorige fasen. De vierde fase is vrijwel gelijk aan de derde fase, maar in plaats van dat er gegokt wordt, wordt de momentwet toegepast. Dat wil zeggen dat bij de conflict problemen de balans naar de kant kantelt waar de afstand vermenigvuldigd met het gewicht het grootst is. Het is moeite waard om op te merken dat de vraag of dat deze wet ook wordt toegepast op simple problemen door proefpersonen uit de vierde fase op basis van het model van Van der Maas en Jansen (2003), met nee moet worden beantwoord. Simple problemen worden namelijk veel sneller opgelost dan conflict problemen (wel tot 3 seconden100% sneller). Hierover meer bij de beschrijving van dat model. Er is nog een vijfde fase die tussen fase drie en vier in valt. In deze fase wordt namelijk nog niet de wet van moment toegepast, maar wel een wet die alle dimensies, gewicht en afstand, beschouwt. De gewichten en afstand optellen is een voorbeeld. Een andere mogelijkheid wordt de buggy regel genoemd. Bij deze regel wordt de stapel gewichten aan de kant waar het aantal gewichten het grootst is en de afstand het kleinst, verplaatst naar de buitenkant van de balans. Bij iedere verplaatsing wordt het aantal gewichten met één verminderd, totdat ofwel de gewichten of wel de afstanden aan beide zijden van de balans gelijk zijn. Vervolgens wordt het antwoord gebaseerd op gewichten. Deze buggy regel heeft hetzelfde resultaat als de optelregel, maar de reactietijden zijn anders. Op basis daarvan beweren Van der Maas en Jansen (2003) dan ook dat het de buggy regel is die wordt toegepast en niet de optelregel. De regels die in de vijf fasen worden toegepast, worden respectievelijk regel I, regel II, regel III, regel IV en de compensatie regel (regel IIIc) genoemd. Deze regels zijn oorspronkelijk door Siegler (1976) geïdentificeerd. Nu duidelijk is wat de balanstaak inhoud, welke categorieën balansproblemen er precies zijn en wat de fasen inhouden waar proefpersonen zich in kunnen bevinden kunnen de modellen besproken worden. Het model van Van Rijn et al. (2003) Het model van Van Rijn et al. (2003) is zoals vermeld een model wat een mogelijke verklaring is voor de transities tussen de verschillende fasen. Dit model is gebaseerd op de ACT-R architectuur en zal vanaf nu het ACT-R-Model genoemd worden. Om een goed begrip te krijgen van dit model zal eerst de ACT-R architectuur moeten worden uitgelegd. ACT-R: ACT-R bestaat uit twee typen geheugen; declaratief geheugen en procedureel geheugen. Het declaratief geheugen bevat feiten in de vorm van chunks en procedureel geheugen, procedurele kennis in de vorm van productie regels. Deze productie regels zijn vorm gegeven als als-dan-regels. Het model wordt doorlopen in een aantal stappen. Bij elke stap wordt gekeken welke als-dan-regels matchen met het op dat moment gestelde doel en eventuele vereiste declaratieve kennis. Van deze matchende regels wordt de regel met de hoogste utility geselecteerd en uitgevoerd. Deze utility is gebaseerd op twee zaken. Ten eerste op het aantal keren dat het uitvoeren van de regel tot een succesvolle uitkomst leidt ten opzichte van het totaal aantal keren dat die regel is uitgevoerd. Van een succesvolle uitkomst kan gesproken worden, wanneer het doel waar de regel op matcht, uiteindelijk succesvol bereikt wordt. Ten tweede is de utiliteit gebaseerd op de gemiddelde tijd die het kost voor het al dan niet succesvol bereiken van het doel waarop de regel matcht. Is deze tijd hoog, dan is de utility lager en vice versa. Zoals vermeld moet een regel niet alleen matchen op het huidige doel, maar kan hij ook nog moeten matchen op declaratieve kennis; een bepaalde chunk. Deze chunk moet daarvoor in een regel die eerder is uitgevoerd, zijn opgevraagd. De regel die moet matchen op deze chunk, matcht alleen als de chunk succesvol is opgehaald uit het geheugen. Het succesvol ophalen van een chunk, wordt bepaald door formules gebaseerd op activatie. De formules voor activatie gebruiken voornamelijk de tijdstippen in het verleden waarop de chunk eerder is opgehaald. Hoe recenter en vaker dit is des te hoger is de activiteit van de betreffende chunk. Indien de chunk boven een in te stellen drempel uitkomt, dan kan deze succesvol worden opgehaald. Uit het de beschrijving van ACT-R tot nu toe blijkt dat ACT-R ook de tijd bijhoudt en dat bepaalde processen een bepaalde tijd kosten. ACT-R kan dan ook zeer goed gebruikt worden voor het voorspellen van reactietijden. Zo kosten productie regels standaard 50 milliseconden en wordt de tijd die het kost om een chunk op te halen gebaseerd op zijn activatie. Een hoge activatie betekend een kortere ophaaltijd. Hoewel in het huidige ACT-R-Model geen rekening wordt gehouden met de reactietijden, is het dus wel mogelijk om het model aan te passen zodat de reactietijden, naast ontwikkelingstransities, ook verklaard worden. Als laatste is het belangrijk om te weten dan als een productieregel een chunk opvraagt die door de daaropvolgende productieregel wordt gebruikt het ophaal proces kan worden geëlimineerd. Dit kan worden gedaan door de kennis die is opgeslagen in de chunk op te nemen als deel van een nieuwe productieregel samen met het als gedeelte van de eerste regel en het dan gedeelte van de daaropvolgende regel. Door dit proces, genaamd production composition, worden problemen sneller opgelost. De utiliteit van de nieuwe regel wordt volgens bepaalde formules bepaald op basis van de eerste van de twee regels waaruit deze is opgebouwd. Nu de relevante eigenschappen van ACT-R bekend zijn, kan uitgelegd worden hoe het ACT-R-Model is opgebouwd. ACT-R-Model: De werking van het model wordt bepaald door drie hoofdfactoren. Deze zijn de mechanismen, taak specifieke concepten en capaciteitsbeperkingen. De

transities en de verschillen tussen de verschillende fasen worden door deze factoren bepaald. De drie factoren bepalen hoe het model zich over het geheel gedraagt, maar niet precies wat de processen op een laag niveau, onder de motorkap, zijn. Nu eerst de drie hoofdfactoren. Drie hoofdfactoren: De mechanismen zijn een combinatie van de ACT-R architectuur en een soort van algemene kennis. Hoe de ACT-R architectuur werkt is net besproken en vormt de basis van het model. De algemene kennis bestaat uit algemene productieregels en declaratieve representaties van acties. Deze acties zijn erg algemeen. Een paar voorbeelden zijn het ophalen van een eigenschap (in de context van de balanstaak gewicht en afstand), het vergelijken van waarden of het zoeken naar een verschil. Dit laatste voorbeeld is eigenlijk de belangrijkste aangezien voor het bepalen van naar welke zijde een balans kantelt, verschillen tussen beide kanten van de balans bepalend zijn. Wil iemand dus de balanstaak leren, dan moet diegene zoeken naar verschillen. De algemene productieregels bepalen welke acties geselecteerd worden. Mensen leren eigenschappen en vaardigheden in hun leven. Hoe dat precies gebeurt, is een vraagstuk op zich, maar bij het ACT-R-Model wordt dit proces gesimuleerd door taak specifieke concepten. Dit zijn concepten die relevant zijn voor de taak die gemodelleerd wordt. Voor de balanstaak zijn dat gewicht en afstand, maar ook optellen en vermenigvuldigen. In de eerste fase is bijvoorbeeld het begrip gewicht bekend, maar het idee van afstand komt nog niet bovendrijven, omdat de activatie daarvan nog te laag is. Pas bij iemand in de tweede fase is de activatie daarvan hoog genoeg en gaat die persoon ook naar afstanden kijken. In het model wordt dit gerealiseerd door het toevoegen van een chunk die afstand representeert. De derde hoofdfactor die bepaalt hoe het model werkt zijn de capaciteitsbeperkingen. Dit houdt in dat hoewel iemand in de tweede fase ook naar afstanden gaat kijken hij zijn antwoorden niet op gewicht en afstand tegelijk kan baseren. Daarvoor heeft hij nog niet genoeg cognitieve capaciteit. Hij zal dan ook zijn aandacht verplaatsen van gewicht naar afstand op de manier zoals beschreven is onder het kopje Vijf fasen. Doordat de capaciteitsbeperkingen afnemen komen nieuwe eigenschappen en vaardigheden naar voren. Wanneer de capaciteit maximaal is kan het model zowel gewicht als afstand beschouwen en deze met elkaar vermenigvuldigen. Net zo als eerder de chunk afstand werd toegevoegd, worden ook nu chunks toegevoegd die de vaardigheid van optellen en vermenigvuldigen beschikbaar maken. Het bovenstaande is samen te vatten in figuur 1 (Van Rijn et al., 2003). Onder de motorkap: Om te beschrijven hoe het ACT-R- Model kan worden aangepast zodat het ook de reactietijden kan voorspellen moet nog wat dieper het model worden ingedoken. Daarvoor zijn een aantal stappen nodig (Van Rijn et al., 2003): Figuur 1: Overzicht van de drie hoofdfactoren die bepalen hoe het ACT-R-Model werkt 1. Haal een eigenschap uit het geheugen op waarop de twee zijden van de balans kunnen verschillen. 2. Neem de waarden van de eigenschap waar (ga naar stap 3 of 4). 3. Als de waarden ongelijk zijn, baseer dan het antwoord op het verschil. 4. Als de waarden gelijk zijn, zoek dan naar een nieuwe eigenschap en indien gevonden ga naar stap 2 anders stap 5. 5. Als er geen nieuwe eigenschap gevonden kan worden baseer dan het antwoord op de waargenomen waarden. Als deze stappen doorlopen worden in de eerste fase dan gaat dat als volgt. De eigenschap die wordt opgehaald bij stap 1 is gewicht. Het aantal gewichten links en rechts op de balans wordt waargenomen in stap 2. Stap 3 houdt in dat indien het aantal gewichten ongelijk is antwoord gegeven wordt. Bij stap 4 wordt indien het aantal gewichten gelijk is, gezocht naar een nieuwe eigenschap. Dat zou afstand moeten zijn, maar omdat de activatie van afstand niet hoog genoeg is lukt dat niet (eigenlijk is de chunk die afstand representeert nog niet aanwezig, maar dat komt overeen met het feit dat de activatie te laag is). Daarom wordt de volgende stap, stap 5. Er wordt alsnog antwoord gegeven op basis van gewicht. Iemand in fase twee heeft afstand wel beschikbaar en gaat dus terug naar stap 2 om vervolgens de afstanden te vergelijken en uit te komen bij stap 3 of 4. Dit gebeurt alleen indien de gewichten gelijk zijn, wat precies overeenkomt met de beschrijving van iemand uit fase 2 (zie: Vijf fasen ). Aangezien nu alle mogelijkheden met bovenstaande vijf stappen besproken zijn, moeten om fase 3 en 4 te beschrijven de stappen aangepast worden. Dat gebeurt door stap 3 te vervangen door (Van Rijn et al., 2003): 3a. Als de eerder waargenomen waarden ongelijk zijn, sla deze dan op en zoek voor een nieuwe eigenschap en ga naar stap 2. 3b. Als zowel de eerste waargenomen waarden als de tweede waargenomen waarden ongelijk zijn zoek dan naar een methode die beide gebruikt om tot een antwoord te komen en pas deze methode toe. Dit wordt gerealiseerd door weer chunks toe te voegen aan het model die het mogelijk maken naar verschillen te zoeken wanneer de al gevonden waarden ongelijk zijn.

Dat dit mogelijk is, is typisch een eigenschap van fase 3 en 4. Bij fase 4 is echter de cognitieve capaciteit zodanig toegenomen ten opzichte van fase 3, dat de methode om twee paar ongelijke waarden op de juiste manier volgens de momentwet te vergelijken, ook beschikbaar is. Elke bovenstaande stap komt ruwweg overeen met drie of vier productieregels. Zo zijn er specifieke productie regels voor het vergelijken van gewichten en/of afstanden. Door de tijd die het kost om deze productieregels uit te voeren aan te passen, kunnen de reactietijden op een gunstige manier beïnvloed worden. Daar kom ik echter nog op terug in het hoofdstuk Het ACT-R-Model aanpassen. Ik zal nu eerst het model van Van der Maas en Jansen (2003) bespreken. Het model van Van der Maas en Jansen (2003) Het model van Van der Maas en Jansen (2003) concentreert zich op de reactietijden van de balanstaak. In het ACT-R-Model worden de juiste regels geleerd door het model en leert het model door een toegenomen cognitieve capaciteit. In het model van Van der Maas en Jansen (2003), vanaf nu het RT-model genoemd, worden de regels niet geleerd. In plaats daarvan verwerken Van der Maas en Jansen (2003) de regels geïdentificeerd door Siegler (1976) in een model wat de reactietijden verklaart en niet de transities. Hoewel er niet geleerd wordt, zijn er wel parameters geschat met behulp van statische analyses, zodat het model de juiste reactietijden berekent. Deze parameters zijn op verschillende waarden geschat voor verschillende situaties. Zo is het model zowel toegepast op één proefpersoon als op het gemiddelde van een aantal proefpersonen. Beide toepassingen leveren andere waarden op voor de parameters. In dit verslag zijn we vooral geïnteresseerd in de schatting van wat Van der Maas en Jansen model 3 noemen (Van der Maas & Jansen, 2003). Model 3 is een mogelijke verklaring voor de gemiddelde reactietijden van een aantal proefpersonen. Het aantal parameters is aanzienlijk en ze zullen terwijl het model uitgelegd wordt naar voren komen. In figuur 2 hiernaast is alvast een overzicht te zien van het model. Het basis idee van dit model is dat elke elementaire stap die een proefpersoon in gedachten maakt tijd kost. Deze elementaire stappen zijn bijvoorbeeld het tellen van gewichten en het vergelijken daarvan. Het model houdt zich vrij strikt aan de regels geïdentificeerd door Siegler (1976), maar wijkt zoals zal blijken op een aantal punten af. Alle parameters houden zich qua notatie aan een aantal regels, zo zijn de parameters met een subscript 0 intercepts, zeg maar de b in een y a.x + b vergelijking. Alle parameters met subscript 1 zijn factoren; in bovenstaand voorbeeld de a. Parameters die slaan op het vergelijken van waarden die gelijk zijn worden aangegeven met en die ongelijk zijn met. Bij regel I zijn er twee mogelijkheden, of de gewichten zijn hetzelfde of ze verschillen. Voor beide mogelijkheden is een set parameters waaruit de Figuur 2: Overzicht van het model van Van der Maas en Jansen (2003) reactietijd is opgebouwd. Ten eerste zijn er de parameters w 0 en w 0 Deze twee parameters zijn de basistijd die het kost om überhaupt gewichten te vergelijken. Gezien de notatie zijn dit dus intercepts en zijn ze respectievelijk voor het vergelijken van gelijke waarden en ongelijke waarden. Ten tweede zijn er voor het vergelijken van de gewichten nog de vermenigvuldigingen w 1 W en w 1 W. Hier zijn w 1 en w 1 factoren, is W het aantal gewichten en is W het absolute verschil tussen de gewichten links en rechts. Als de gewichten gelijk zijn komt de reactietijd dus neer op w 0 + w 1 W en als ze ongelijk zijn op w 0 + w 1 W. De vermenigvuldigingen in deze vergelijking zorgen ervoor dat de reactietijd wordt aangepast indien het vergelijken van gewichten makkelijker is. Zo is het vergelijken van aan beide zijden één gewicht makkelijker dan vijf gewichten. Ook als de gewichten verschillend zijn is het makkelijker om dit te bepalen als dit verschil W groot is. Parameters kunnen dan ook zowel positief als negatief zijn. Voor regel II moet ook bepaald worden hoe lang het duurt om afstanden te vergelijken. Dit gebeurt op dezelfde manier als bij de gewichten. De formules voor afstand zijn dan: d 2,0 + d 2,1 D en d 2,0 + d 2,1 D. Hier is D een variabele die bepaalt dat het vergelijken van afstanden bij extreme afstanden, dus als de gewichten op het eerste of laatste staafje zijn geplaatst, minder tijd kost dan wanner de gewichten ergens in het midden geplaatst zijn. D wordt uitgedrukt in D 2.5-D l,r. Hier is D l,r de afstand links of rechts (deze zijn gelijk). D is het verschil tussen de afstanden links en rechts. Om te verduidelijken hoe deze formules werken een voorbeeld:

w 0 +w 1 W+d 2,0 +d 2,1 D ( W1 en D 2.5-2 0.5) Opvallend is dat in het RT-Model de afstanden ook beschouwd worden als de gewichten verschillen. Dat was niet zo in de regels geïdentificeerd door Siegler (1976). Wat verder opvalt, is dat de set parameters voor het vergelijken van afstanden in regel II anders is dan die voor regel III en IV. Vandaar het extra subscript 2 in de formules voor het vergelijken van afstanden. De formules voor regel III en IV zijn dan ook wel gelijk, maar de waarden van de parameters voor de afstanden verschillen wat aangeduid wordt met subscript 1. Dat wordt dan: d 1,0 + d 1,1 D en d 1,0 + d 1,1 D. Uiteraard is dat niet het enige verschil tussen regel II en regels III en IV. Voor beide regels komt er een parameter a bij die bepaalt hoe lang het duurt om te bepalen het probleem in de conflict categorieën hoort of bij de wd categorie. Alleen voor de conflict categorieën is het RT-Model geïmplementeerd. De categorie wd ontbreekt nog. Voor regel III komt er voor de conflict categorieën nog een formule bij die de tijd van het gokken berekent; g 0 + g 1 ( W + D). Het gedeelte tussen de haakjes laat zien dat het blijkbaar meer tijd kost om te gokken wanneer de verschillen tussen de gewichten en/of de verschillen tussen de afstanden groot zijn. Dat is dan ook wel voor te stellen. Als laatste wordt regel IV uitgebreid voor de conflict categorieën met de formule: p 0 + p 1 Sym + p 2 P + p 3 P + {p 4 H}. Sym geeft hier aan of er symmetrieën zijn die het verschil tussen cba en cbb verklaren en is daarom 0 of 1. P geeft de optelsom van de vermenigvuldigingen links en rechts. Hierdoor wordt de moeilijkheidgraad van de vermenigvuldigingen gemeten, waardoor de reactietijd hoger wordt als het rekenwerk lastig is. P is het verschil tussen de producten links en rechts. Parameter p 3 wordt echter niet gebruikt in model 3 waar we in dit verslag in geïnteresseerd zijn. De H variabele moet de tijd van een aarzeling schatten wanneer de balans naar de kant met de meeste gewichten kantelt. Dan is H namelijk 1 en anders 0. De aarzeling zou moeten voortkomen uit het feit dat het antwoord in dergelijke situaties te triviaal is. Hierover valt te discussiëren, omdat {p 4 H} niet geïdentificeerd was door Siegler (1976). Er is nog een belangrijkere reden voor discussie. Namelijk door wat {p 4 H} representeert, moet {p 4 H} eigenlijk ook bij d 1,0 + d 1,1 D geplaatst moet worden indien de gewichten ongelijk zijn. De vergelijking voor het bepalen van gelijke afstanden bij ongelijke gewichten, categorie sw, bij regel IV wordt dan: d 1,0 + d 1,1 D + {p 4 H}. Voor het model in het algemeen geldt nog de formule i 1 e i2.i. De uitkomst van deze formule wordt bij alle reactietijden opgeteld. In de formule zijn i 1 en i 2 weer te schatten parameters en is I het volgnummer van het probleem dat wordt aangeboden in de taak. Voor model 3 van Van der Maas en Jansen (2003) houdt dat in dat bij het eerste probleem dat wordt aangeboden 1.64 seconden moet worden opgeteld. Dit aantal seconden neemt langzaam af tot 0 seconden, maar heeft in het begin dus wel een vrij groot effect. De beschrijving van het RT-Model tot zover moet voldoende zijn om te begrijpen hoe het model werkt en hoe het RT-Model voor de aanpassing van het ACT-R- Model gebruikt kan worden. Nu kan worden beschreven hoe het ACT-R-Model aangepast kan worden met de kennis die is opgedaan in dit hoofdstuk. Het ACT-R-Model aanpassen Het RT-Model is zoals vermeld toegepast op het gemiddelde van een aantal proefpersonen. Dit heeft een specifieke set parameters opgeleverd voor model 3 (Van der Maas & Jansen, 2003). Om te bekijken wat de invloed van al deze parameters op de reactietijden is, is het RT-Model nagemaakt. Ook is dit gedaan om te bekijken hoe het model reageert op een andere dataset dan de data gebruikt voor model 3 (Van der Maas & Jansen, 2003). Daar zal nu eerst verder op ingegaan worden. Data: De data die is gebruikt voor het experiment en model 3 van Van der Maas en Jansen (2003) bestaat uit 76 unieke problemen. Deze waren opgedeeld in elf groepen. De eerste tien groepen bestonden steeds uit zeven problemen met één uit elke categorie balansproblemen. De volgorde van deze categorieën was steeds hetzelfde en was: sb, sw, sd, cbb, cw, cd, cba. De elfde groep bestond uit zes wd problemen, maar dat is nu niet relevant. Het aantal gewichten dat maximaal is gebruikt, is zes en het maximale aantal staafjes is vier. De reactietijden op deze dataset, die ik de experimentdata zal noemen, is weergegeven in figuur 3 onder het label Experiment. Om te kijken hoe model 3 reageert op een andere dataset is een dataset aangemaakt met alle permutaties van zes gewichten en vier staafjes. De resultaten van model 3 met deze dataset zijn weergegeven onder het label 4 Staafjes Alles in figuur 3. Wat opvalt is dat de reactietijden nogal verschillen ten opzichte van de reactietijden die horen bij de experimentdata. Als laatste zijn voor de zekerheid de reactietijden berekend met model 3 op basis van de dataset die ook gebruikt is in het ACT-R-Model. Deze dataset bestaat uit alle mogelijke combinaties van vijf gewichten en vijf staafjes. (hiervoor is de formule voor de waarde van D wel aangepast: D 3-D l,r -0.5, tenzij D l,r 3, dan geldt D0). Ook deze reactietijden zijn heel anders als de reactietijden die horen bij de experimentdata. Dit is te zien in figuur 3 onder het kopje 5 Staafjes Alles. Bij een cognitief model is het belangrijk dat het model dezelfde resultaten voorspelt als dezelfde data wordt gebruikt als bij het experiment met de proefpersonen. Daarnaast moet het goede voorspellingen kunnen doen wanneer andere data wordt gebruikt. Helaas ontbreken de empirische gegevens van andere data. Ook is het blijkbaar zo dat de reactietijden nogal sterk kunnen verschillen wanneer er een andere dataset gebruikt wordt. Om deze twee redenen is het daarom belangrijk dat het ACT-R-Model ook getest wordt op de experimentdata.

Experiment 4 Staafjes Alles 5 Staafjes Alles Experiment 4 Staafjes Alles 5 Staafjes Alles Fase 1 2 3 4 5 6 7 Fase 2 2 3 4 5 6 7 Experiment 4 Staafjes Alles 5 Staafjes Alles Experiment 4 Staafjes Alles 5 Staafjes Alles F ase 3 2 3 4 5 6 7 F ase 4 2 3 4 5 6 7 Figuur 3: De reactietijden van model 3 voor de vier fasen gegeven verschillende inputdata. Per fase zijn links onder het label Experiment de reactietijden gegeven met de inputdata van Van der Maas en Jansen. In het midden onder het label 4 Staafjes Alles staan de reactietijden van de dataset die alle permutaties van 6 gewichten en 4 staafjes bevat. Rechts onder het label 5 Staafjes Alles net zo, maar dan van 5 gewichten en 5 staafjes.

Het ACT-R-Model moet echter ook getraind worden. Het voorstel is dan ook om het model per fase te trainen op een aantal willekeurige problemen uit een set die alle permutaties bevat van zes gewichten en vier staafjes. Per fase kan vervolgens de experimentdata aangeboden worden om te bekijken hoe goed het ACT-R-Model presteert. Er zijn een aantal problemen bij het trainen. Hoe lang moet er namelijk getraind worden? Als er te lang getraind wordt dan kan het model te snel zijn, maar als er te kort getraind wordt dan is de taak nog niet voldoende geleerd. De trainingsduur zal dus onderzocht moeten worden. Parameters: Naast de reactietijden van model 3 zijn ook de reactietijden van het ACT-R-Model bekeken. Deze zijn vergeleken met de reactietijden die berekend worden als model 3 dezelfde dataset gebruikt als het ACT-R- Model. De reactietijden kwamen totaal niet overeen en de reactietijden waren zelfs allemaal onder een hele seconde. Dit is te verklaren doordat het ACT-R-Model bepaalde processen vereenvoudigd uitvoert. Het ACT-R-Model houdt bijvoorbeeld geen rekening met het feit dat het tellen van gewichten, het bepalen van afstand en vermenigvuldigen tijd kost. Er zijn wel productieregels die deze zaken bepalen, maar de informatie wordt gewoon opgehaald uit dezelfde chunks die de problemen representeren. Er wordt als het ware vals gespeeld, omdat de antwoorden al gegeven zijn. Om ervoor te zorgen dat het model toch de juiste reactietijden berekent, moeten daarom de productie regels aangepast worden. Om dat te doen zijn de verschillende parameters van model 3 bekeken. Zo kost het in fase 1 volgens model 3 altijd 2.02 seconde om gelijke aantallen gewichten te vergelijken plus 0.18 seconde per gewicht. In het ACT- R-Model is ook een productie regel aanwezig die bekijkt of de gewichten gelijk zijn. Het uitvoeren van deze regel kost op dit moment echter maar de standaardtijd van 50 milliseconden. Door een :effort parameter toe te voegen aan deze productieregel kan deze tijd aangepast worden. Het probleem is dan nog dat het vergelijken van verschillende aantallen gewichten dezelfde tijd kost. Om dit probleem op te lossen kan de formule die de activatie van een chunk berekend, uitgebreid worden. Als bijvoorbeeld het aantal gewichten klein is zou de activatie iets opgehoogd kunnen worden waardoor de reactietijd daalt. Dit zou onderbouwd kunnen worden doordat bij een kleiner aantal gewichten men nou eenmaal sneller ziet dat de gewichten gelijk zijn. Bij ongelijke gewichten kan iets vergelijkbaars gedaan worden. Ook nu wordt er een :effort parameter toegevoegd aan de productie regel die kijkt of gewichten ongelijk zijn. Er zijn echter ook weer verschillen tussen het vergelijken van vijf met één gewicht en vijf met vier gewichten. De eerste vergelijking is veel makkelijker. Door de activatie formule zo aan te passen dat de activatie wat hoger wordt indien het verschil tussen gewichten groot is, daalt de reactietijd bij deze makkelijkere vergelijkingen. Voor het vergelijken van ongelijke afstanden kan precies hetzelfde gedaan worden als voor ongelijke gewichten. Voor gelijke afstanden kan dat echter niet. Het is namelijk makkelijker om afstanden te vergelijken als de gewichten zich op extreme afstanden bevinden, dus op het eerste staafje of de laatste. De moeilijkheidsgraag neemt van binnen naar buiten eerst toe en dan weer af. De activatie formule moet ook nu weer aangepast worden zodat dat effect gesimuleerd wordt. Voor alle aanpassingen aan de activatie formule geldt dat deze onderbouwd worden door zo werkt de waarneming van mensen. Een andere manier om de reactietijden aan te passen zou zijn om het ACT-R model echt te laten tellen, dus tel het aantal staafjes vanaf het midden en bijvoorbeeld tel het aantal gewichten. Het probleem hiermee is dat lang niet altijd geteld wordt door proefpersonen en waarom zouden staafjes vanaf het midden geteld moeten worden en niet vanaf de buitenkant. Voor gewichten is het probleem bijvoorbeeld dat je ziet dat vier gewichten aan beide kanten even hoog zijn. Ze worden niet geteld, maar het zien dat ze even hoog zijn is lastiger dan bij één gewicht. Deze ander manier geniet dan ook niet de voorkeur. Als het toevoegen van :efforts en het aanpassen van de activatie formules werkt, ontstaat een probleem. De aanpassingen die tot nu toe zijn gedaan hebben allemaal betrekking op de simple categorieën. Alleen indien gewichten en afstanden verschillen worden complex regels gebruikt. Voor de simple categorieën gelden dus dezelfde regels voor alle vier fasen. Zoals bij de beschrijving van het RT-Model is vermeld gelden er echter verschillen de parameters voor het vergelijken van afstanden tussen fase II en fasen III en IV. Het verschil kan bijvoorbeeld 3.26 ten opzichte van 1.74 seconden zijn. Dat is niet gering. In de bovenstaande aanpassing wordt echter geen onderscheid gemaakt tussen fase II en fasen III en IV. Dit is een probleem wat niet opgelost kan worden in het ACT-R- Model. Een ander probleem is van een gelijke orde. De parameter {p 4 H} is zoals beschreven ook van toepassing bij de categorie sw. Deze categorie hoort bij de simple categorieën en er is net vermeld dat die categorieën door alle fasen op dezelfde manier door het ACT-R-Model worden opgelost. Het is niet mogelijk om alleen voor fase IV de reactietijd op problemen uit de sw categorie aan te passen. Hier kan echter wel een opmerking gemaakt worden. Van der Maas en Jansen (2003) hebben deze parameter pas vrij laat toegevoegd aan hun model en hebben niet echt een goede cognitieve onderbouwing voor hef feit dat de reactietijden van de sw problemen hoger zijn. De onderbouwing is gebaseerd op het feit dat mensen uit fase vier het triviaal vinden dat de balans naar de kant met de meeste gewichten gaat en daardoor aarzelen. Hierover valt natuurlijk te discussiëren en naar de echte reden voor het hoger zijn van de reactie tijd op de categorie sw zal eigenlijk onderzoek gedaan moeten worden.

Het verschil in de parameters voor het vergelijken van afstanden tussen fase II en fasen III en IV is wat beter onderbouwd. Blijkbaar hebben proefpersonen uit fase II meer moeite met het vergelijken van afstanden. Dat is niet zo raar, omdat ze nog maar net de beschikking hebben over de dimensie afstand. In fase I hadden ze dat nog niet. Maar ook dit effect is nader onderzoek waard. Aan een ander probleem is eerder voorbij gegaan. Dat probleem is dat proefpersonen uit fase II de afstanden ook beschouwen wanneer de gewichten al verschillen. Dit wijkt af van het model van Siegler (1976), zoals al vermeld onder de beschrijving van het RT-Model. Hoewel de dimensie afstand wel beschikbaar is voor proefpersonen uit fase II in het ACT-R-Model wordt deze dimensie niet gebruikt indien de gewichten verschillen. Dat zou eenvoudig aangepast kunnen worden. Zodat dat wel mogelijk is net als in fase III. Echter dat het antwoord gegokt wordt indien zowel afstand als gewicht verschillen moet worden voorkomen. Tijdens fase II moet het model zo aangepast zijn dat het antwoord gebaseerd moet worden op gewichten als de afstanden eenmaal bekeken zijn. Dat betekent dat voor complex categorieën er een kans is van 33% dat het antwoord goed is. Dat is ook zo als gekeken wordt naar tabel 4 van Van der Maas en Jansen (2003). Daar wordt namelijk 94% van de cw categorie correct opgelost en van de andere conflict categorieën nog geen 10%. Gemiddeld komt dat ongeveer op 33% uit. Wanneer het model vordert naar fase III, dan worden de problemen uit de cw categorie vaker gegokt en het percentage correcte oplossingen van 94% daalt dan ook naar 62%. De percentages correcte oplossingen voor de andere conflict categorieën stijgen echter, wat logisch is, omdat wanneer het antwoord altijd op basis van gewichten gegeven wordt tenzij de gewichten gelijk zijn (zoals in fase II), problemen uit bepaalde conflict categorieën altijd incorrect opgelost worden. Als er echter gegokt wordt, zoals in fase III, dan worden problemen uit deze conflict categorieën ook wel eens correct opgelost. Omdat problemen uit de andere conflict categorieën vaker correct opgelost worden, wordt de aanpassing waardoor alsnog het antwoord op basis van gewichten gegeven wordt nadat de afstanden zijn beschouwd, onderdrukt in fase III. Hierdoor krijgen de productie regels uit fase III uiteindelijk de overhand. Of dit precies zo werkt als beschreven is moeilijk te overzien en zal onderzocht moeten worden. Er zijn nog twee belangrijke aanpassingen die nog gedaan moeten worden. De eerste is een toevoeging aan het model waardoor bekeken wordt of als gewicht en afstand verschillen ze niet aan een zijde van de balans beide groter zijn. Dit komt overeen met de parameter a, welke constant is. De regel die toegevoegd moet worden kan daarom ook vrij makkelijk de juiste reactietijd opleveren door de juiste :effort in te stellen. De tweede aanpassing die gedaan moet worden is dat het vermenigvuldigen geïmplementeerd zou moeten worden. Dit kan op twee manieren. Het ACT-R-Model wordt aangepast zodat er productieregels zijn die in complex situaties de vermenigvuldiging doen of er wordt buiten het model om berekend hoe lang het duurt om de vermenigvuldiging uit te rekenen en deze tijd wordt opgeteld bij de reactietijd die het ACT-R-Model al geeft. De eerste mogelijkheid is zeer complex en moeilijk te overzien. Daarnaast is deze eigenlijk overbodig, omdat het wel bekend is dat rekenen tijd kost. Ook is wel bekend hoeveel tijd vermenigvuldigen ongeveer zou moeten kosten en kan daarom prima buiten het model om uitgerekend worden. Dat kan eventueel op dezelfde manier gedaan worden zoals Van der Maas en Jansen (2003) dat doen (p 0 + p 1 Sym + p 2 P + p 3 P + {p 4 H}). Conclusie Van bovenstaande aanpassingen kan niet verwacht worden dat als ze geïmplementeerd worden het model af is. Ten eerste omdat cognitieve modellen veel te complex zijn om zulke harde voorspellingen te doen. Alleen door het te implementeren kan zekerheid verkregen worden. Ten tweede zijn er nog een aantal zaken die nog onderzocht moeten worden voordat een cognitief model überhaupt een volledig plausibele verklaring is voor de balanstaak. Te denken valt aan het beschouwen van afstand indien gewichten verschillen in fase II en aan de toevoeging {p 4 H} aan regel IV. Een laatste mogelijkheid om het ACT-R-Model aan te passen is door het model om te zetten in andere code, bijvoorbeeld in R. Er kan dan makkelijker en specifieker invloed uitgeoefend worden op het verloop van de gesimuleerde processen. Het gevaar hierbij is dat het model plausibiliteit verliest. Elke aanpassing moet daarom goed onderbouwd worden en dat geldt ook voor bovenstaande aanpassingen. Daarvan zijn een aantal echter al onderbouwd door Van der Maas en Jansen (2003). Bovendien geldt dat als de aanpassingen de juiste reactietijden geven, de aanpassingen wel kunnen kloppen ook al is de interpretatie daarvan nog niet bekend. Kortom, het ACT-R-Model is een goede verklaring voor de transities tussen de verschillende fasen. Daarnaast heeft het de potentie om net als het RT-Model ook nog de reactietijden te verklaren. De kennis van het RT-Model toepassen bij het aanpassen van het ACT-R- Model is echter geen makkelijke klus, maar het is zeker niet onmogelijk. Het project was gegeven de tijd te ambitieus, maar met het uiteindelijke doel voor ogen verdient het onderzoek in de toekomst zeker meer tijd. Het voltooien van een model zoals de bedoeling was in dit project zou zeker geen geringe prestatie zijn op het gebied van de cognitieve wetenschap en is daarom zeker de moeite waard om te voltooien. Referenties Van Rijn, H., Someren, M. & Van der Maas, H.L.J., 2003. Modeling developmental transitions on the balance scale task. Cognitive Science, 27(2), 227-257. Van der Maas, H.L.J. & Jansen, B.R.J., 2003. What response times tell of children's behavior on the balance scale task. J Exp Child Psychology, Jun, 85(2), 141-177. Siegler, R. S. (1976). Three aspects of cognitive development. Cognitive Psychology, 8, 481 520.