HOOFDSTUK 6; CONDITIONERING EN LEREN.

HOOFDSTUK 6; CONDITIONERING EN LEREN. TERUGBLIK OP DE THEMA S Biologische factoren zijn cruciaal bij veel aspecten van het leren. Zo zorgt de biologie van een dier ervoor dat sommige relaties in de omgeving gemakkelijk te leren zijn en andere moeilijk. Biologische factoren hebben ook een invloed bij operante conditionering: conditionering is gemakkelijker als de te leren respons compatibel is met het natuurlijke repertoire van reacties ten opzichte van de bekrachtiger. Cognitieve factoren spelen eveneens een belangrijke rol bij het leren. Bij operante conditionering kunnen de cognitieve representaties over de situatie en de relaties tussen respons en bekrachtiger de prestaties van dieren zowel bevorderen (zoals bij de ontwikkeling van een cognitieve kaart) als bemoeilijken (zoals bij aangeleerde hulpeloosheid). Verder worden stimuli die bij klassieke conditionering aan elkaar gekoppeld worden, niet zo automatisch met elkaar geassocieerd als Pavlov aannam. Alleen de stimulus die als de beste voorspeller gepercipieerd wordt, raakt met de daaropvolgende ongeconditioneerde stimulus geassocieerd. Mensen en dieren kunnen ook leren door het gedrag van anderen te observeren. Kinderen leren evenveel door hun ouders te observeren en associaties te maken op basis van wat ze zien, als wanneer hun eigen gedrag door de ouders bekrachtigd of gestraft wordt. Alle leerprocessen die we in dit hoofdstuk besproken hebben, dragen bij om sociaal-culturele waarden op een kind over te dragen. Zodra kinderen ter wereld komen, worden ze bekrachtigd voor gedrag dat in overeenstemming is met de waarden in hun cultuur, en krijgen ze straf voor gedrag dat de culturele normen overschrijdt. Cultuur wordt verder nog geleerd door het gedrag van de andere leden in de cultuur te observeren. Sociaal-culturele factoren kunnen op hun beurt helpen of interfereren hij het latere leren. SAMENVATTING 1. Leren is een relatief permanente verandering in het gedrag of kennis ten gevolge van ervaring. 2. Er zijn vier basiselementen bij de klassieke conditionering (of Pavloviaanse conditionering): een ongeconditioneerde stimulus (OS) die zonder enige voorafgaande training een ongeconditioneerde respons (OR) uitlokt; vervolgens: een neutrale stimulus die na herhaaldelijk met de OS gepaard te zijn, een geconditioneerde stimulus (CS) wordt; vervolgens: een geconditioneerde respons (CR) die na een aantal CS-OS-presentaties door de CS uitgelokt wordt. Een veelheid aan responsen kan door klassieke conditionering verworven worden, waaronder veel fysiologische reacties. Pavlov ontdekte de volgende fenomenen: verwerving, extinctie, spontaan herstel, stimulus generalisatie en stimulus discriminatie. 3. Nadat een CS en een OS door een klassieke conditionering met elkaar geassocieerd zijn, zal de aanbieding van de CS zonder de OS leiden tot een verzwakking van de CR (extinctie); meestal keert de CR echter tot op zekere hoogte terug na een rustpauze volgend op de extinctie (spontaan herstel). Een CR treedt niet alleen op bij de CS die in de training gebruikt werd maar ook bij andere, gelijkaardige CS'en (stimulusgeneralisatie). Als één CS gepaard wordt met een OS en een andere CS met de afwezigheid van de OS, dan zal enkel een CR plaatsvinden bij de eerste CS maar niet bij de tweede CS (discriminatie). 4. Contiguïteit tussen CS en OS is noch noodzakelijk noch voldoende voor klassieke conditionering. Wat het eerste aspect betreft, kan conditionering plaatsvinden bij een lange tussentijd tussen CS en OS (zoals bij het leren van smaakaversie). Wat het tweede aspect betreft, is het mogelijk dat een CS steevast kort na een OS aangeboden wordt en toch niet met de OS geassocieerd geraakt. Dit is het geval wanneer er al een andere, biologisch relevantere CS bestaat of wanneer al een goede voorspeller van de OS aanwezig is.

5. Bij instrumentele of operante conditionering wordt alleen een bekrachtiger gegeven als het organisme de gepaste respons stelt. Een bekrachtiger versterkt het gedrag dat eraan voorafgaat; een straf verzwakt het gedrag dat eraan voorafgaat. Een positieve bekrachtiger is een gebeurtenis waarvan de presentatie leidt tot een versterking van de voorafgaande respons. Een negatieve bekrachtiger is een gebeurtenis waarvan de verwijdering leidt tot een versterking van de voorafgaande respons. Bekrachtigers kunnen ongeleerde (primaire) of geleerde (geconditioneerde) bekrachtigers zijn. 6. Schema's van intermitterende (onderbrekende) bekrachtiging (waarbij niet alle responsen door een bekrachtiger gevolgd worden) omvatten intervalschema's en ratioschema's. Bij een ratioschema heeft men een aantal responsen nodig voordat een bekrachtiging volgt. Bij een intervalschema wordt de eerste respons na een bepaald tijdsinterval bekrachtigd. Intermitterende bekrachtiging leidt tot een grotere weerstand tegen extinctie dan continue bekrachtiging. 7. Een effectieve straf is intens, wordt meteen en consistent toegediend, en wordt niet met een positieve bekrachtiging geassocieerd. 8. Negatieve bekrachtiging omvat ontsnappingsleren, waarbij de respons een aversieve stimulus beëindigt, en actief vermijdingsleren, waarbij een actieve respons een aversieve stimulus voorkomt. 9. Operante conditionering is gemakkelijker als de conditionering compatibel is met de natuurlijke, biologische reacties van het proefdier ten opzichte van de bekrachtiger. 10. Dieren zijn in staat cognitieve kaarten te vormen. Ze ontwikkelen ook verwachtingen; dit zijn cognitieve representaties over hoe twee gebeurtenissen in de tijd zich ten opzichte van elkaar verhouden. 11. Dieren (en mensen) kunnen leren door anderen te observeren zonder dat deze kennis meteen openlijk te zien is. Dit toont aan dat leren (wat we weten) niet altijd meteen in prestaties (wat we doen) weerspiegeld wordt. 12. Culturele normen en waarden beïnvloeden het leren bij mensen. Als je culturele achtergrond verschilt van de culturele omgeving waarin je leert, dan kunnen je prestaties beïnvloed worden door verschillen tussen deze twee culturen. UITTREKSEL: Leren: een relatief permanente verandering in gedrag of kennis als gevolg van ervaring. Klassieke conditionering (Pavlov): leren om 1 gebeurtenis met een andere te combineren. Ongeconditioneerde stimulus geeft een ongeconditioneerde (automatische) respons. Een neutrale stimulus geeft geen respons. Door deze stimulus te combineren met een ongeconditioneerde stimulus wordt de neutrale stimulus een geconditioneerde stimulus die een geconditioneerde respons uitlokt. Voor de conditionering KLASSIEKE CONDITIONERING OS (ongeconditioneerde stimulus) OR (ongeconditioneerde respons) CS (geconditioneerde stimulus) Oriëntatie van het geluid, alertheid Conditionering CS wordt aangeboden voor de OS OR (ongeconditioneerde respons) Na de conditionering CS (geconditioneerde stimulus) CR (geconditioneerde respons)

Door Pavlov ontdekte fenomenen: Verwerving: het proces waarbij een CS een CR gaat uitlokken. (leren) Extinctie: verzwakking van de CR als de CS herhaaldelijk zonder de OS aangeboden wordt. Spontaan herstel: de CR is zelden helemaal weg. Een uitgedoofde CR treedt na een rustperiode weer op als de CS aangeboden wordt. Stimulus generalisatie: een respons die op 1 bepaalde stimulus geconditioneerd werd, treed ook op bij andere, gelijkaardige stimuli. Stimulus discriminatie: treed op als een organisme verschillend reageert op twee CS en. Een persoon leren niet langer te reageren op een stimulus kan door discriminatietraining. Als gedrag gebeurt in de aanwezigheid van 1 stimulus en niet in de aanwezigheid van een andere stimulus, heeft de stimulus controle over het gedrag, dit heet stimuluscontrole. Een CS moet steeds kort voor de OS aangeboden worden om hiermee geassocieerd te worden. Dit noemen we de Contiguïteit. Uitzondering op dit principe: leren van smaakaversie. Er is een biologische predispositie om bepaalde associaties makkelijker te leren dan andere. Therapie op basis van smaakaversie wordt met succes gebruikt bij de behandeling van alcoholisme. Contiguïteit is niet voldoende voor conditionering. Klassieke conditionering is dus een actiever proces dan Pavlov vermoedde, en niet een mechanisch proces waarbij 1 stimulus geassocieerd wordt met de andere. Operante conditionering of instrumentele conditionering: ons gedrag wordt veranderd door hun gevolg. Hierbij gaat het over skeletresponsen of vrijwillige responsen. Procedure Wat wordt geleerd? Type respons Klassieke conditionering Stimuli worden zo aangeboden dat de ene stimulus de andere voorspelt De relatie tussen de stimuli Onwillekeurig Operante conditionering Stimuli zijn contigent op het gedrag Welk gedrag te stellen Willekeurig De eerste persoon die de operante conditionering bestudeerde was Edward L. Thorndike door zijn puzzelbox.

Op basis van zijn onderzoek suggereerde Thorndike zijn Wet op het effect: Een respons die een voldoening gevend gevolg heeft zal herhaald worden, bij een onbevredigend gevolg zal de respons niet herhaald worden. Op dit moment is de kooi van Skinner het meest gebruikte toestel om operante conditionering te meten. Skinner stelde het concept operant voor. Een operante respons is een gedrag dat resulteert in, of gevolgd wordt door een bepaald effect op de omgeving. BEKRACHTIGING: PRIMAIR (ongeconditioneerd) (niet geleerd) Positief: de aanbieding Negatief: de verwijdering versterkt versterkt de voorafgaande de voorafgaande respons. respons. Voedsel, water De verwijdering van de pijn. GECONDITIONEERD (secundair) (Geleerd) Geld, lof De verwijdering van een gevreesde stimulus. De regel van Premack: de prioriteit die iemand geeft aan verschillende activiteiten kun je afleiden door te kijken hoeveel tijd iemand aan elke activiteit besteed als deze vrij beschikbaar is.

4 Bekrachtigingsschema s 1. Schema s met een vaste ratio > SFR Er wordt een bekrachtiger toegediend om de x responsen. Bij SFR 10 wordt er na de tiende respons een bekrachtiger toegediend. Er is in dit schema sprake van een hoog reactietempo. 2. Schema s met een variabele ratio > SVR Het aantal responsen varieert voordat er een bekrachtiger toegediend wordt. Dit veroorzaakt een hoog aantal responsen. Een gokautomaat werkt volgens dit principe. 3. Schema s met een vast interval > SFI De eerste respons na een bepaalde tijdsperiode wordt bekrachtigd. De hoeveelheid responsen ervoor doen er niet toe, ze worden niet bekrachtigd. Bij een SFI 1-minuut wordt de eerste respons, nadat een minuut verstreken is bekrachtigd. Bij dit schema zie een zogenaamde SFI-schelp ontstaan, als benaming voor de grafiek. 4. Schema s met een variabele interval > SVI Het tijdsinterval dat moet verstrijken voordat een bekrachtiger toegediend wordt, varieert van beurt tot beurt. Bij dit schema SVI zie je een gestaag, traag responspatroon optreden. Voorbeeld: telefoonnummer bellen dat steeds in gesprek is. Wanneer niet elk gedrag gevolgd wordt door een bekrachtiger spreken we van partiele of intermitterende bekrachtiging. Hier tegenover staat continue bekrachtiging. Kenmerken van operante conditionering: Vorming (shaping) via successieve benaderingen: Elke reactie in de richting van het gewenste gedrag wordt bekrachtigd. Een effectieve manier om gedrag te onderdrukken: 1 gedrag niet langer bekrachtigen (extinctie) en tegelijkertijd een ander, meer gewenst gedrag wel bekrachtigen. De weerstand tegen extinctie is afhankelijk van het bekrachtigingsschema dat toegepast werd om het gedrag te conditioneren. Als er een schema van intermitterende bekrachtiging werd gevolgd zal de weerstand heel hoog zijn. Dit is een fenomeen dat bekend staat als het extinctie-effect van de partiele bekrachtiging. Doorzettingsvermogen is in dit kader dus een aangeleerde trek. Positieve en negatieve bekrachtiging en straf: Positief: toedienen van Negatief: wegnemen van een een stimulus. stimulus. BEKRACHTIGING Versterkt voorafgaand gedrag Voedsel Wegnemen van een shock. STRAF Verzwakt voorafgaand gedrag Shock Verwijdering van voedsel. Straf is een procedure die gedrag doet afnemen.

Als er straf gebruikt wordt moet dit een strenge straf zijn, direct vanaf het begin. Uitgestelde straf is niet efficiënt, straf moet direct na de respons toegediend worden. Als ouders niet naar kinderen omkijken behalve als ze zich misdragen, dan kan de straf haar doel missen omdat ze gezien wordt als een vorm van aandacht. Ontsnappingsconditionering doet een aversieve respons stoppen. Bij het leren van actieve vermijding voorkomt een actieve respons een aversieve stimulus. Mowrer: De prominentste theorie over vermijdingsleren is de tweefactorentheorie. De eerste factor: het proefdier leert een signaal vrezen (dmv klassiek conditionering) De tweede factor: het proefdier leert ontsnappen aan de angst door naar de ander kant van de pendelkooi te springen. Aangeleerde hulpeloosheid: het onvermogen om te leren hoe aan een aversieve stimulus ontsnapt kan worden. Waarom gebeurt dit? 1. De proefdieren worden aan oncontroleerbare stimuli blootgesteld, en leren dat vermijding onmogelijk is. 2. Daardoor vermindert de motivatie om te ontsnappen. 3. Ook de vaardigheid dat later gedrag effectief kan zijn neemt af. Er ontstaan cognitieve beperkingen. Verwachting is een mentale representatie dat een gebeurtenis zal volgen op een andere. Observerend leren. Gedrag dat bekrachtigd wordt zal geïmiteerd worden, gedrag dat niet bekrachtigd wordt of tot straf leidt zal niet geïmiteerd worden. Een model kan een belangrijke factor hierin zijn. Je eigen gedrag zal je kinderen meer beïnvloeden dan alle directe bekrachtigingen en straffen. In de westerse cultuur ligt de nadruk op individualisme, terwijl in andere culturen de nadruk ligt op het collectivisme. SLEUTELBEGRIPPEN Leren: Een relatief permanente verandering in gedrag of kennis tengevolge van ervaring. Klassieke conditionering: Ongeconditioneerde stimulus: (OS) Ongeconditioneerde respons: (OR) Leren om 1 gebeurtenis met een andere te associëren. Een gebeurtenis die zonder voorafgaand leren, aanleiding geeft tot een respons. Een respons die automatisch komt, zonder voorafgaand leren.

Geconditioneerde stimulus: (CS) Geconditioneerde respons: (CR) Verwerving: Extinctie: Spontaan herstel: Stimulusgeneralisatie: Stimulusdiscriminatie: Discriminatietraining: Contiguïteit: Leren van smaakaversie: Biologische restricties: Biologische predispositie: Blokkering: Operante/instrumentele conditionering: Een stimulus die geen specifieke respons produceert voor de training, maar wel erna De reaktie die uitgelokt wordt door de geconditioneerde stimulus. Het proces waarbij een geconditioneerde stimulus, een geconditioneerde respons uitlokt. Verzwakking van de geconditioneerde respons (CR), als de geconditioneerde stimulus (CS) herhaaldelijk aangeboden wordt zonder de ongeconditioneerde stimulus (OS) Het feit dat een uitgedoofde geconditioneerde respons (CR), na een rustperiode weer optreed als de geconditioneerde stimulus (CS) weer aangeboden wordt. Het optreden van een respons die op 1 bepaalde stimulus geconditioneerd werd, bij het aanbieden van andere, gelijkaardige stimuli. Het verschillend reageren op de aanbieding van twee verschillende geconditioneerde stimuli (CS). Twee verschillende CS s worden bij beurten op toeval door elkaar aangeboden. Slechts 1 CS zal gevolgd worden door een OS. Na verloop van tijd kan iemand de twee verschillende CS s uit elkaar houden, (1 CS wordt gediscrimineerd) en zal de CR alleen nog optreden bij de CS die gevolgd werd door de OS. Samenhang. Een CS aanbieden heel kort voor de OS om de CS met de OS te associëren. Het leren vermijden van voedingsmiddelen die je ziek maken. De aanbieding van de CS en de OS mogen hier wel uren uit elkaar liggen. Hierbij is Contiguïteit dus niet noodzakelijk. Het biologisch voorbestemd zijn om bepaalde stimuli met elkaar te combineren en andere niet. Het biologisch voorbestemd zijn om bepaalde associaties makkelijker te leren, dan andere. De aanwezigheid van een CS die de OS voorspelt, blokkeert de conditionering van andere stimuli. De manier waarop onze gedragingen veranderd worden door hun gevolgen. Wet van het Effect: Operant: Responsen die voldoening gevende gevolgen teweegbrengen, zullen herhaald worden, responsen die onbevredigende gevolgen teweegbrengen, zullen niet herhaald worden. Operante respons: Gedrag dat resulteert in of gevolgd wordt door een bepaald effect op de omgeving.

Bekrachtiging: Positieve bekrachtiger: Negatieve bekrachtiger: Primaire of ongeconditioneerde bekrachtigers: Positief of voldoening gevend resultaat. Een bekrachtiger die de respons versterkt die eraan voorafgaat. Een bekrachtiger die de waarschijnlijkheid van de respons verhoogd doordat hij weggenomen wordt. Bekrachtigers die hun effect uitoefenen zonder vroegere associaties of ervaringen. Bijvoorbeeld het geven van voedsel of het wegnemen van een shock. Secundaire of geconditioneerde bekrachtigers: Bekrachtigers die bekrachtigen door hun associatie met primaire bekrachtigers. (zoals geld of lof) Partiële/intermitterende bekrachtiging: Continue bekrachtiging: Ratioschema's: Schema met een vaste (fixed) ratio (SFR): Als niet ieder gedrag gevolgd wordt een bekrachtiger. Op ieder gedrag volgt een bekrachtiger. De bekrachtiging wordt alleen na een bepaald aantal responsen gegeven. De bekrachtiger wordt toegediend om de x responsen (bv 10), je spreekt dan van SFR 10. Schema met een variabele ratio (SVR): Het aantal responsen varieert voordat een bekrachtiger ontvangen wordt. (bv. SVR 10, dan ligt het aantal responsen tussen de 10 en de 30). Intervalschema's: Schema met een vast (fixed) interval (SFI): Schema met een variabel interval (SVI): De toediening van een bekrachtiger hangt af van het gedrag en van de verlopen tijd sinds de vorige respons. De eerste reaktie na een bepaalde tijdsperiode wordt bekrachtigd. De tijdsinterval die moet verstrijken voordat een bekrachtiger wordt toegediend, is verschillend van beurt tot beurt. Vorming (shaping) via successieve benaderingen: Differentiële bekrachtiging: Weerstand tegen extinctie: Het steeds bekrachtigen van gedrag als dit in de richting van het gewenste gedrag gaat, tot het uiteindelijk gewenste gedrag bereikt is. Het niet langer bekrachtigen van 1 gedrag (extinctie), en tegelijkertijd een ander, meer gewenst gedrag wel bekrachtigen. De tijd die een respons voortgezet zal worden nadat de bekrachtiging gestopt is. Extinctie-effect van de partiële

bekrachtiging: Discriminatieleren: Een grotere extinctie weerstand dan bij continue bekrachtiging het geval is. Lang blijven reageren, ook als er geen bekrachtiging meer verkregen wordt. Responsen in de aanwezigheid van bepaalde stimuli worden met bekrachtiging geassocieerd. Responsen in de aanwezigheid van andere stimuli worden niet met bekrachtiging geassocieerd. Stimuluscontrole: Wanneer gedrag gebeurt in de aanwezigheid van 1 stimulus, en niet in de aanwezigheid van een andere stimulus. De stimulus bezit dan controle over het gedrag. Straf: Ontsnappingsconditionering: Leren van actieve vermijding: Aangeleerde hulpeloosheid: Een procedure die het gedrag doet afnemen. Wanneer de respons een aversieve stimulus doet stoppen. Hierbij voorkomt een actieve respons een aversieve stimulus. Het onvermogen om te leren hoe aan een aversieve stimulus ontsnapt kan worden of hoe die vermeden kan worden, nadat het organisme aan een onontkoombare, onvermijdbare stimulus heeft blootgestaan. Cognitieve kaart: Verwachting: Model: Interne representatie. De kennis over de relatie tussen twee gebeurtenissen in de ruimte. De kennis over de relatie tussen twee gebeurtenissen in de tijd. Degene die geobserveerd word voor het stellen van eigen gedrag.