Instrumentele conditionering in psychologie

Instrumentele conditionering is een andere term voor operante conditionering, een leerproces dat voor het eerst werd beschreven door B.F. Skinner. Bij instrumentele conditionering worden wapening of straf gebruikt om de kans te vergroten of te verkleinen dat een gedrag in de toekomst opnieuw zal optreden.

Voorbeelden

Bijvoorbeeld, als een student wordt beloond met complimenten elke keer dat ze haar hand in de klas verhoogt, krijgt ze meer kans om haar hand in de toekomst opnieuw op te steken.

Als ze ook wordt uitgescholden als ze voor de beurt spreekt, krijgt ze minder kans om de klas te onderbreken. In deze voorbeelden gebruikt de docent versterking om het handverheffingsgedrag en de straf te versterken om het uitdraaien van het gedrag van de beurten te verzwakken.

Instrumentele conditionering wordt ook vaak gebruikt in diertraining. Als een hond bijvoorbeeld wordt getraind om de hand te schudden, moet elke keer dat het gewenste gedrag plaatsvindt, een beloning worden aangeboden.

Geschiedenis

Psycholoog E.L. Thorndike was een van de eersten die de impact van wapening in puzzelbox-experimenten met katten observeerde. Tijdens deze experimenten observeerde Thorndike een leerproces dat hij 'proeflezen' noemde.

De experimenten waren het plaatsen van een hongerige kat in een puzzeldoos en om zichzelf te bevrijden, moest de kat uitzoeken hoe hij kon ontsnappen. Thorndike merkte vervolgens op hoe lang het de katten kostte om zichzelf te bevrijden bij elke experimentele proef. Aanvankelijk hielden de katten zich bezig met ineffectieve ontsnappingsmethoden, krabben en graven aan de zijkanten of de bovenkant van de doos. Uiteindelijk zouden trial-and-error de katten ertoe brengen om met succes de ontsnappingsroute te duwen of te trekken. Na elke opeenvolgende proef namen de katten steeds minder deel aan het ineffectieve ontsnappingsgedrag en reageerden ze sneller met de juiste vluchtacties.

Thorndike verwees naar zijn waarnemingen als de Wet van Effect. De sterkte van een reactie neemt toe wanneer deze onmiddellijk wordt gevolgd door een "satisfier" (reinforcer). Aan de andere kant zullen acties die worden gevolgd door onplezierige effecten waarschijnlijk worden verzwakt.

In Thorndike's puzzelboxexperimenten was ontsnappen aan de doos het meest bevredigende. Telkens als de katten met succes uit de doos ontsnapten, werd het gedrag dat onmiddellijk aan de ontsnapping voorafging versterkt en versterkt.

Thorndike's werk had een enorm effect op B.F. Skinner's latere onderzoek naar operante conditionering. Skinner creëerde zelfs zijn eigen versie van de puzzeldozen van Thorndike, die hij een operante kamer noemde, ook bekend als een Skinner-doos.

Hoe het werkt

Skinner identificeerde twee belangrijke soorten gedrag. Het eerste type is het gedrag van de respondent. Dit zijn eenvoudig acties die reflexief plaatsvinden zonder enige vorm van leren. Als je iets heet aanraken, trek je onmiddellijk je hand terug in reactie. Klassieke conditionering concentreert zich op het gedrag van deze respondenten.

In de klassieke experimenten van Pavlov met honden was het gedrag van de respondent kwijlen aan de presentatie van voedsel. Door een verband te vormen tussen het geluid van een bel en de presentatie van eten, was Pavlov in staat om honden te trainen om daadwerkelijk te kwijlen op het geluid van die bel..

Skinner realiseerde zich dat hoewel klassieke conditionering zou kunnen verklaren hoe respondent gedrag tot leren zou kunnen leiden, het niet voor elk type van leren kon verklaren. In plaats daarvan suggereerde hij dat het de consequenties waren van vrijwillige acties die tot de grootste hoeveelheid leren leidden.

Het tweede type gedrag is wat Skinner operant gedrag noemde. Hij definieerde deze als elk en elk vrijwillig gedrag dat inwerkt op de omgeving om een reactie te creëren. Dit zijn de vrijwillige gedragingen die onder onze bewuste controle staan. Dit zijn ook acties die kunnen worden geleerd. De gevolgen van onze acties spelen een belangrijke rol in het leerproces.

Versterking en straf

Skinner identificeerde twee belangrijke aspecten van het operante conditioneringsproces. Versterking dient om het gedrag te vergroten terwijl straf het gedrag vermindert.

Er zijn ook twee verschillende soorten versterking en twee verschillende soorten straf. Positieve bekrachtiging houdt het presenteren van een gunstig resultaat in, zoals een kind een traktatie geven nadat ze haar kamer heeft schoongemaakt.

Negatieve versterking houdt het verwijderen van een onaangename stimulans in, zoals het vertellen aan een kind dat als ze al haar aardappelen eet, ze haar broccoli niet hoeft te eten. Omdat het kind van mening is dat broccoli een onplezierig gevolg is en het eten van de aardappelen leidt tot het verwijderen van dit ongewenste gevolg, wordt het eten van de aardappelen nadelig versterkt.

Positieve straf betekent het toepassen van een onaangename gebeurtenis na een gedrag. Spanking is bijvoorbeeld een veel voorkomend voorbeeld van positieve straffen. Dit type straf wordt vaak straf genoemd door toepassing. Een negatief gevolg wordt direct toegepast om het ongewenste gedrag te verminderen.

Negatieve straf houdt in dat iets aangenaams wordt weggenomen nadat zich een gedrag heeft voorgedaan. Als een kind bijvoorbeeld haar kamer niet schoonmaakt, vertellen haar ouders haar misschien dat ze niet met haar vrienden naar het winkelcentrum kan gaan. Het wegnemen van de gewenste activiteit fungeert als een negatieve punisher voor het voorgaande gedrag.