Vad är Operant Conditioning och hur fungerar det?

Hur förstärkning och bestraffning förändrar beteende

Operant konditionering (ibland kallad instrumentell konditionering ) är en metod för inlärning som sker genom belöningar och straff för beteende. Genom operant konditionering görs en koppling mellan ett beteende och en konsekvens för det beteendet.

När en labrottan trycker en blå knapp, får han till exempel en matpellet som en belöning, men när han trycker på den röda knappen får han en mild elektrisk chock.

Som ett resultat lär han sig att trycka på den blå knappen men undvika den röda knappen.

Men operant konditionering är inte bara något som äger rum i experimentella inställningar medan du tränar labbdjur; Det spelar också en stark roll i vardagslärandet. Förstärkning och bestraffning sker nästan varje dag i naturliga inställningar såväl som i mer strukturerade inställningar som klassrummet eller terapisammanträdena.

Låt oss ta en närmare titt på hur operant konditionering upptäcktes, vilken inverkan den hade på psykologi, och hur det används för att förändra gammalt beteende och undervisa nya.

Operatorkonditionens historia

Operant konditionering gjordes av behaviorist BF Skinner , varför du ibland kan höra den kallad Skinnerian konditionering. Som en behaviorist trodde Skinner att det inte var nödvändigt att titta på interna tankar och motivationer för att förklara beteendet. Istället föreslog han att vi bara skulle titta på de yttre, observerbara orsakerna till mänskligt beteende.

Genom den första delen av 1900-talet hade behaviorism blivit en stor kraft inom psykologin. John B. Watsons idéer dominerade den här tankskolan tidigt. Watson fokuserade på principerna om klassisk konditionering , en gång berömd att han kunde ta någon oavsett bakgrund och träna dem för att vara allt han valde.

Där de tidiga behavioristerna hade fokuserat sina intressen på associativt lärande var Skinner mer intresserad av hur konsekvenserna av människors handlingar påverkat deras beteende.

Skinner använde termen operant för att referera till något "aktivt beteende som verkar på miljön för att generera konsekvenser." Med andra ord förklarade Skinner teori hur vi förvärvar utbudet av lärda beteenden som vi uppvisar varje dag.

Hans teori var starkt påverkad av psykologens arbete Edward Thorndike , som föreslog vad han kallade effektlagen . Enligt denna princip är åtgärder som följs av önskvärda resultat mer benägna att upprepas medan de som följs av oönskade utfall är mindre benägna att upprepas.

Operant conditioning bygger på en ganska enkel premiss - åtgärder som följs av förstärkning kommer att stärkas och sannolikt kommer att uppstå igen i framtiden. Om du berättar en rolig historia i klassen och alla skrattar, kommer du förmodligen att vara mer benägna att berätta historien igen i framtiden. Om du lyfter din hand för att ställa en fråga och din lärare berömmer ditt artiga beteende, kommer du vara mer benägna att höja din hand nästa gång du har en fråga eller en kommentar.

Eftersom beteendet följdes av förstärkning eller ett önskvärt resultat förstärks de föregående åtgärderna.

Omvänt kommer åtgärder som leder till straff eller oönskade konsekvenser att försvagas och mindre sannolikt kommer att uppstå igen i framtiden. Om du berättar samma historia igen i en annan klass men ingen skrattar den här gången kommer du att vara mindre benägna att upprepa historien igen i framtiden. Om du råkar ut ett svar i klassen och din lärare skäller dig, kanske du är mindre benägna att avbryta klassen igen.

Typer av beteenden

Skinner skiljer sig mellan två olika typer av beteenden

Medan klassisk konditionering kunde svara för respondentbeteenden insåg Skinner att det inte kunde utgöra en hel del lärande. Istället föreslog Skinner att operant konditionering innehöll mycket större betydelse.

Skinner uppfann olika enheter under hans pojke och han satte dessa färdigheter i arbete under sina studier om operant konditionering.

Han skapade en enhet som kallas en operant konditionering kammare, som oftast kallas idag som en Skinner box . Kammaren var i huvudsak en låda som kunde rymma ett litet djur som en råtta eller duva. Lådan innehöll också en bar eller nyckel som djuret kunde trycka för att få en belöning.

För att spåra svar utvecklade Skinner också en enhet som kallas en kumulativ inspelare. Den inspelade anordningen svarar som en uppåtgående rörelse av en linje så att svarhastigheter kan läsas genom att titta på linjens lutning.

Komponenter av operantkonditionering

Det finns flera nyckelbegrepp i operantkonditionering.

Förstärkning i operativ konditionering

Förstärkning är något som förstärker eller ökar beteendet som följer. Det finns två typer av förstärkare:

  1. Positiva förstärkare är gynnsamma händelser eller resultat som presenteras efter beteendet. I situationer som återspeglar positiv förstärkning stärks ett svar eller beteende genom att lägga till något, till exempel beröm eller direkt belöning. Till exempel, om du gör ett bra jobb på jobbet och din chef ger dig en bonus.
  2. Negativa förstärkare innebär att man avlägsnar en ogynnsam händelse eller utfall efter att ett beteende har visats. I dessa situationer förstärks ett svar genom att avlägsna något som anses vara obehagligt. Till exempel, om ditt barn börjar skrika mitt i mataffären, men slutar när du skaffar honom en behandling, kommer du mer sannolikt att skänka honom en behandling nästa gång han börjar skrika. Din åtgärd ledde till att det obehagliga tillståndet avlägsnades (barnet skriker), vilket förstärker ditt beteende negativt.

I båda dessa fall av förstärkning ökar beteendet.

Straffet i Operant Conditioning

Straff är en presentation av en biverkning eller ett resultat som orsakar en minskning av beteendet som följer. Det finns två typer av straff:

  1. Positiv bestraffning , som ibland kallas straff genom ansökan, presenterar en ogynnsam händelse eller ett resultat för att försvaga svaret som följer. Spanking för felbeteende är ett exempel på straff genom ansökan.
  2. Negativt straff , även känt som straff genom borttagning, inträffar när en gynnsam händelse eller ett resultat avlägsnas efter att ett beteende uppträder. Att ta bort ett barns videospel efter misbehavior är ett exempel på negativ straff.

I båda dessa fall av straff minskar beteendet.

Förstärkningsplaner

Förstärkning är inte nödvändigtvis en enkel process och det finns ett antal faktorer som kan påverka hur snabbt och hur bra nya saker lärs. Skinner fann att när och hur ofta beteenden förstärkt spelade en roll i förvärvets snabbhet och styrka. Med andra ord påverkar förstärkningens tid och frekvens hur nya beteenden lärdes och hur gamla beteenden ändrades.

Skinner identifierade flera olika scheman av förstärkning som påverkar operantkonditioneringsprocessen:

  1. Kontinuerlig förstärkning innebär leverans en förstärkning varje gång ett svar uppstår. Inlärning tenderar att förekomma relativt snabbt, men svarfrekvensen är ganska låg. Utrotning sker också mycket snabbt när förstärkningen är stoppad.
  2. Fastförhållande scheman är en typ av partiell förstärkning. Svar förstärks först efter det att ett visst antal svar har inträffat. Detta leder vanligtvis till en ganska stabil svarfrekvens.
  3. Fasta intervallscheman är en annan form av partiell förstärkning. Förstärkning sker först efter det att ett visst tidsintervall har förflutit. Svarsfrekvensen förblir ganska stabil och börjar öka när förstärkningstiden närmar sig, men långsamt omedelbart efter det att förstärkningen har levererats.
  4. Variable-ratio scheman är också en typ av partiell förstärkning som involverar förstärkning beteende efter ett varierat antal svar. Detta leder till både en hög responshastighet och långsam utrotningshastighet.
  5. Variabelintervallscheman är den slutliga formen av partiell förstärkning Skinner som beskrivs. Detta schema innebär att man förstärker förstärkningen efter att en varierad tid har gått. Detta tenderar också att leda till en snabb responshastighet och långsam utrotningshastighet.

Exempel på operatorkonditionering

Vi kan hitta exempel på operant konditionering på jobbet runt omkring oss. Tänk på att barn fyller läxor för att tjäna en belöning från en förälder eller lärare, eller anställda avslutar projekt för att få beröm eller kampanjer.

Några fler exempel på operantkonditionering i åtgärd:

I några av dessa exempel orsakar löftet eller möjligheten till belöningar en ökning av beteendet, men operant konditionering kan också användas för att minska ett beteende. Avlägsnandet av ett önskvärt resultat eller ett negativt resultat kan användas för att minska eller förebygga oönskade beteenden. Till exempel kan ett barn få veta att de kommer att förlora fördjupningsrättigheter om de pratar om sin tur i klassen. Denna potential för straff kan leda till en minskning av störande beteenden.

Ett ord från

Även om behaviorism kan ha förlorat mycket av den dominans som den höll under den tidiga delen av 20-talet, är operant konditionering ett viktigt och ofta utnyttjat verktyg i inlärnings- och beteendemodifieringsprocessen. Ibland leder naturliga konsekvenser till förändringar i vårt beteende. I andra fall kan belöningar och straff bli medvetet uteslutet för att skapa en förändring.

Operant konditionering är något som du genast kan känna igen i ditt eget liv, oavsett om det är i ditt förhållningssätt att lära ditt barn gott beteende eller träna familjen hunden för att sluta tugga på dina favorit tofflor. Det viktiga att komma ihåg är att med någon typ av lärande kan det ibland ta tid. Tänk på vilken typ av förstärkning eller bestraffning som kan fungera bäst för din unika situation och bedöma vilken typ av förstärkning schema som kan leda till de bästa resultaten.

> Källor:

> Coon, D & Mitterer, JO. Psykologi: En resa. Belmont, CA: Wadsworth; 2014.

> Domjan, M. Principerna om lärande och beteende, sjunde upplagan. Stamford, CT; Cengage Learning; 2015.