TOKEN ECONOMY

Pubblicato: febbraio 26, 2013 in Comportamento, Insegnare
Tag:,

insegnare - comunicare “Comportamento” è ogni azione (volontaria o no, visibile dall’esterno o meno) che un organismo compie. Insegnare significa modificare il comportamento: farlo attraverso il Rinforzo significa ricompensare ogni comportamento a noi gradito esibito dal nostro allievo[1]. In questo modo il comportamento tenderà ad essere ripetuto e diventerà parte del repertorio del nostro soggetto. In altre parole: se desidero che mio figlio impari a mettersi  le scarpe, rinforzerò (“premierò” per usare un termine scorretto, ma che fa parte del nostro linguaggio comune) ogni comportamento che il bambino esibisca verso la meta finale: mettersi le scarpe. Una cosa da mettere subito in grande evidenza: “Rinforzo” è qualunque cosa che aumenti la frequenza di un comportamento: se il comportamento aumenta significa che è stato rinforzato, altrimenti no. Chi decide cosa è rinforzante? Il nostro allievo! E’ lui, non noi insegnanti, che stabilisce cosa piace ed è gradito e cosa no; per cosa si è disposti a lavorare o meno.

gettoniUna Token Economy (Token, in Inglese significa gettone) è un sistema per la modifica del comportamento che si basa sul rinforzo sistematico di un dato comportamento. Nata negli USA negli anni sessanta e diffusa fino alla fine degli anni settanta,  malgrado l’evidenza scientifica dei migliori risultati conseguiti, la Token Economy è praticamente scomparsa negli anni ottanta anche a causa di una serie di problemi sollevati dalla sua non corretta applicazione. In un carcere minorile americano i gettoni venivano distribuiti dai secondini. Queste persone, però, li consegnavano ai ragazzi con scherno e derisione,  non con sincero apprezzamento (rinforzo sociale) per gli sforzi e i risultati conseguiti. L’esperimento è finito quando i detenuti hanno dato fuoco alla prigione…

Nella Token Economy i gettoni vengono utilizzati come rinforzi. I gettoni accumulati possono in seguito essere scambiati (esattamente come una valuta) con altri beni: accesso a giochi, film, dolci o piccole somme di denaro possono essere alcuni esempi applicabili con i bambini. Un gelato estivo potrebbe valere due gettoni. Ragazzi ed adulti potranno avere accesso ad altri tipi di beni: rientrare a casa un po’ dopo l’ora del coprifuoco o buoni-benzina per gli adolescenti potrebbero essere beni scambiabili con i gettoni. Come funziona in pratica la Token Economy?

La prima cosa da sottolineare è che si tratta di un Sistema: con leggi e regole ben definite, chiare e condivise da tutti i partecipanti. La prima cosa da fare è stabilire esattamente quali sono i comportamenti che verranno “pagati” e quanto. Con mio figlio che ora ha 5 anni ho disegnato delle vignette con tutte le regole che controllano il nostro rapporto. In caso di contenzioso (finora non è  mai capitato) ci sono i disegni che dettano legge. Agganciare delle regole volanti a delle situazioni contingenti potrebbe non portare ai risultati sperati. In ogni caso, buona norma è sempre annunciare –chiaramente- cosa si ha intenzione di pagare e quanto. I valori di quanto pagare per un comportamento e il valore attribuito a un determinato bene, devono essere decisi insieme con l’allievo, in base alla nostra esperienza e modo di sentire. I risultati migliori si ottengono se l’allievo ha sempre un piccolo gruzzolo di gettoni da parte, ma non grandissimo: in questo modo rimarrà sempre coinvolto nel Sistema. (Se ho in tasca 50 gettoni non avrò tanta voglia di pulire la mia camera se con 10 gettoni posso “comprare” 2 ore di uscita extra il prossimo sabato sera.)

ladroIl secondo elemento consiste nel fatto che all’interno del sistema si va solamente a rinforzare comportamenti graditi e mai a punire quello che non ci piace. Per nessun motivo i gettoni guadagnati dovrebbero essere tolti come ripicca o punizione per un cattivo comportamento. (“Visto che non hai messo in ordine la tua stanza mi prendo 5 gettoni!!!”). E’ sicuramente difficile, all’inizio, resistere all’impulso di rivalersi, per un comportamento sgradito sul tesoretto accumulato, ma questo ha come unico risultato togliere entusiasmo e voglia di partecipare al Sistema che, ripeto, rimane funzionale ed efficace solo se costantemente pareggiato ad una situazione positiva e rinforzante.

Il terzo punto da valutare sempre, con grande attenzione, è il grado di competenza del nostro allievo. Bisogna essere sempre coscienti di cosa è in grado di poter fare, in ogni momento e in qualsiasi situazione, in modo da non stabilire leggi di scambio impossibili per lui. Se il bambino non sa ancora spogliarsi da solo è inutile offrire gettoni su gettoni come incentivo. L’unico risultato che sicuramente si otterrà, sarà di accrescere lo stress, rendendo l’esperienza punitiva per lui. Come fare in questi casi? Piuttosto che cercare in qualche modo di stimolare l’allievo con ricompense maggiori, cerchiamo di capire quale comportamento è in grado di esibire e iniziamo a pagare per questo. Se il bambino è in grado di togliersi le scarpe da solo, ma non le calze, iniziamo a “pagare” per le scarpe: coinvolgiamolo nel Sistema. In un secondo momento si potrà iniziare a pagare tentativi che vanno nella giusta direzione (mettere le mani sul calzino, prenderne la punta, tirare, afferrare il tallone) assicurandoci sempre che la nostra guida, il nostro insegnare a togliersi i calzini sia focalizzato su un solo passaggio alla volta. Questo processo che si chiama shaping (shaping, in Inglese, significa modellamento) consente di mantenere al minimo i livelli di stress e al massimo quelli di rinforzo.

Cosa insegna la Token Economy? Il più grande dono che possiamo fare ai nostri allievi (che siano i nostri figli, familiari, amici o colleghi di lavoro) è insegnare loro la Responsabilità. Ovvero che ogni comportamento ha delle conseguenze di cui solo noi siamo responsabili. La Token Economy mette all’interno di un sistema strutturato i comportamenti e fa in modo, senza mai essere punitiva che la responsabilità sia sempre dell’allievo. Se mio figlio consuma tutti i suoi gettoni per comprare cartoni animati in TV, è mio desiderio che impari che è una sua responsabilità recuperare, attraverso gli opportuni comportamenti (aiutare ad apparecchiare la tavola, per esempio), i gettoni che gli servono per venire a leggere una storia nel lettone di mamma e papà. Se i gettoni mancano, manca anche la possibilità di accedere alla risorsa desiderata. Ovviamente, come abbiamo già detto, il Sistema deve essere adattato alle competenze e capacità dell’allievo, rispettando con le proprie richieste quelle che sono le caratteristiche emotive e di sviluppo psico-fisiologico dell’allievo.


[1] Userò i termini “allievo” e “maestro” per descrivere i due cardini su cui si basa qualsiasi tipo di insegnamento: è necessario avere un “maestro” che passi informazione (cultura) ad un “allievo”. Questa situazione si applica a qualsiasi tipo d’interazione tra persone: con i bambini e gli adulti; a scuola o nell’ambiente di lavoro.

Annunci

AUTOMATIC AND CREATIVE

Pubblicato: dicembre 21, 2012 in behaviour, Teaching

città medievaleDuring the Middle Ages, and later still, in the Renaissance, the difference between artist and craftsman was very subtle. The training a potter or a painter received was, essentially, the same. Very young, still a child, you were sent to a Maestro,  as apprentice; you were supposed to stay and study, there, for a period of about 10 years. For 10 years an apprentice lived  close to the tools and the art with which later, he would had earned a living. At the end of the established time, a final examination was required before the apprentice could claim the title of Master and open,  his own workshop. The long training aimed to develop knowdlege of every tool, material and technique required to a Maestro. This knowledge needed to be acquired with Mastery. This term refers to the knowledge that goes beyond to the simple “know how to do” the things. It refers to circumstances when the answers to a problem  arouse “spontaneously” without an actual, conscious control. Primarily indicates the possession of Fluency: the skill to do things quickly and well.

brain 3d grid 2Our minds work on two levels: the first level (which we call “Unconscious”) is hidden in many respects, andit  includes all the behaviors over which we do not have effective control: breathing, walking … We do not know how to walk, simply we think that we want to go to a place and… we go. The second level (which we call “Conscious”) is where lives everything we are conscious of. Learning means -also-to transfer behavior and knowledge from the Conscious to the Unconscious; to give  control of our behaviors to the unconscious part of the brain. The more we learn the less we need to pay  attention to our behaviors. There are several advantages to this outpouring of knowledge:

• Availability of resources

• Speed ​​of execution

• Improved memorization

• Creativity

Let’s see, quickly, these elements.

 

1 – AVAILABILITY OF RESOURCES

The ability of doing things automatically, frees cognitive resources of Consciousness which can be used for other things, such as talking with our passengers while we’re driving. From an evolutionary  point of view, the advantages  -from this ability- are obvious. Being able to perform two-or more- behaviors at once, meanwhile focusing to something else, ensure high adaptability to the environment and this, in turn, means a better chance of survival. The same thing has happened to Computer. The first ones, like Commodore 64,C64_10 could manage one thing at a time, one game or one program. If we wanted to change program had to charge the data what we need. Nowadays, computers can easily handle several programs at once, and as I’m writing I can hear the music. [1]

2 – SPEED IMPLEMENTING

Behaviors are extremely faster when they are automatic. If meanwhile we’re walking we stumble, the motor reaction is fast enough to make we regain our balance before falling (usually …). If we were to perform the same action consciously, the results would be quite disastrous. Among humans, the category that achieves the more spectacular results than any other, thanks to the automatism acquired in behaviors are athletes. Tennis players, football players, gymnasts can express beauty, harmony and power in their actions because they have developed after years of training automatic (uncouscious) skills. If we try to ask to a top performer how he does his most spectacular blow, the answer, probably, would be a “I do not know”. The motor skills are automatic and, therefore, beyond the control of consciousness [2].

3 – BEST STORAGE

We Remember better and longer  automatic behaviors. Although for 11 months a year I do not go to the beach, either we do not forget how to swim. The same we can say for cycling or arithmetic. These are things that we will never forget, it doesn’t matter how many years have to pass before you ride  a bicycle again. To automate behavior means: Practice. To repeat the same action many, many times. The behaviors that go unconsciously have had this kind of training. These are things we have done and repeated because we liked them and found them fun or exciting. In a single word: Reinforcing.

4 – CREATIVITY

Back to our Maestri, the great artists of the Renaissance, have become such thanks to education, combined with natural talent [3]. The training in the workshops allowed Leonardo, Raphael and Michelangelo to learn with skill everything was possible to learn: how prepare the colors; how to hold a brush or a chisel, how to prepare canvas, plasters and marbles. Freed from the control of those aspects of their art, Maestri’s cognitive resources  were available for creativity that they express creating wonderful masterpieces. Without training, without practice, without skills we would not have the Mona Lisa, the Piety or the Venus of Urbino. To have automatic skills is not opposed to creativity. The opposite is true: the automatic behavior allows us to create, with wit and inventive, new things.la fornarina

What about us that we are not Michelangelo or Leonardo? Automatic means to become plastic and creative. Knowing how to do something more quickly and well, in fact, it frees the resources to express our higher cognitive potential. We must strive to find techniques and methodologies that enable teachers and students to practice gestures, actions and behaviors. To obtain this, the necessary practice must be reinforcing. It has to provide positive and well timed feedbacks. It should allow the student to constantly see the progresses he has made. Only in this way we would like to do, study, learn. It is the only way for us all, to  become Great Maestri.

clickers in cerchio

 

________________________________________

[1] The computers’ example is even more precise if we think that all the computers, from the primitive to the modern ones, have their own internal systems that make them work (the biological equivalent of “keep alive”) whose activities iare hidden and invisible: exactly what happens in our brains and body.

[2] To this regard Ted DesMasions wrote an interesting post, which you can find here,

[3] I believe, but it is my personal opinion (and, perhaps, it is wrong) that Maestri’s “natural gifts” were not about drawing and painting, but rather were that “Art” for them was the most reinforcing thing of their life. A passion so deep rooted and strengthened to shape the entire life of Michelangelo, Leonardo, Raphael and many others. Who knows, maybeall was needed wasjust  a particular compliment made by his mother to child Raphael for his first doodle …

AUTOMATICO & CREATIVO

Pubblicato: dicembre 20, 2012 in Comportamento, Insegnare, Teaching

città medievaleDurante il Medioevo, e dopo ancora, nel Rinascimento, la differenza tra artista ed artigiano era molto labile. Il tipo di formazione che veniva impartito a un vasaio o a un pittore era, sostanzialmente, uguale. Si entrava in bottega, da un maestro, come apprendisti ancora bambini e vi si rimaneva per un periodo di circa 10 anni. Per 10 anni un apprendista viveva a contatto con gli strumenti e l’arte con cui si sarebbe in seguito guadagnato da vivere. Alla fine dei 10 anni un esame finale stabiliva se l’apprendista poteva fregiarsi del titolo di Maestro ed aprire, così, la propria bottega. Il lungo tirocinio aveva lo scopo di far conoscere tutti gli strumenti, i materiali e le tecniche per usarli. La conoscenza doveva essere acquisita con Maestria. Questo termine indica la conoscenza che va oltre il sapere le cose, quando le risposte a un problema ci vengono “spontanee”, senza un effettivo, consapevole, controllo. Indica soprattutto il possedere fluenza: ovvero saper fare le cose presto e bene.

La nostra mente lavora su due livelli: il primo è un livello (che chiameremo “Inconscio”) per molti aspetti nascosto e comprende tutti i comportamenti che compiamo senza avere su di essi un effettivo controllo: respirare, camminare… Non sappiamo come facciamo a camminare, semplicemente pensiamo che vogliamo andare in un posto e ci andiamo. Il secondo livello (che chiameremo “Conscio”) è quello dove esiste tutto ciò di cui siamo consapevoli. Imparare significa –anche- trasferire comportamenti e conoscenza dal Conscio all’Inconscio, ovvero passare il controllo dei nostri comportamenti alla parte inconscia del cervello. Man mano che impariamo abbiamo bisogno di prestare meno attenzione ai comportamenti. Ci sono diversi vantaggi da questo riversamento di conoscenza:

  •   Disponibilità di Risorse
  •   Velocità d’esecuzione
  •   Migliore memorizzazione
  •   Creatività

Vediamo, velocemente, questi elementi

1-   DISPONIBILITA’ DI RISORSE

Il poter fare le cose automaticamente libera le risorse  cognitive del Conscio che possono così venire impiegate per fare altro, ad esempio parlare con il nostro passeggero mentre stiamo guidando. Dal punto di vista evolutivo i vantaggi dati da questa capacità sono facilmente intuibili. Poter fare due –o più- cose contemporaneamente, concentrando nel frattempo l’attenzione su un particolare garantisce un’alta adattabilità all’ambiente e questo, a sua volta, si traduce in maggiori probabilità di sopravvivenza. E’ accaduto lo

C64_10

Commodore 64… sigh, quanti ricordi.

stesso con i computer. Vi ricordate i primi modelli? Commodore e compagnia? Riuscivano a fare solo una cosa alla volta, un gioco o un programma. Se volevamo cambiare programma dovevamo caricare ciò di cui avevamo bisogno. Adesso i computer possono gestire molti programmi contemporaneamente e, mentre sto scrivendo posso ascoltare della Musica[1].

2-   VELOCITA’ D’ESECUZIONE

I comportamenti sono estremamente più rapidi quando sono automatici. Se camminando inciampiamo, la reazione motoria è veloce abbastanza da farci riprendere l’equilibrio prima di cadere (di solito…). Se dovessimo eseguire la stessa azione coscientemente, i risultati sarebbero piuttosto disastrosi. Tra gli esseri umani, la categoria che più d’ogni altra raggiunge risultati spettacolari, grazie all’automatismo acquisito nei comportamenti sono gli sportivi. Tennisti, calciatori, ginnasti possono esprimere bellezza, armonia e potenza nei loro gesti proprio perché sono competenze acquisite, dopo anni di allenamento, automaticamente. Se proviamo a chiedere a un campione come esegue il suo colpo più spettacolare la risposta, probabilmente, sarebbe un “Non lo so”. I componenti motori sono automatici e pertanto al di là del controllo della coscienza[2].

3-   MIGLIORE MEMORIZZAZIONE

Ricordiamo meglio e più a lungo i comportamenti automatici. Anche se per 11 mesi all’anno non andiamo al mare, per questo non ci dimentichiamo come si nuota. Lo stesso lo possiamo dire per andare in bicicletta o far di conto. Sono cose che non ci dimenticheremo mai dovessero passare anni prima di poter tornare a fare un giro in bicicletta. Automatizzare un comportamento significa: Pratica. Ripetere lo stesso gesto tante, infinite volte. I comportamenti che possediamo automatici hanno avuto questo tirocinio. Sono cose che abbiamo fatto e ripetuto perché ci piacevano erano divertenti o stimolanti. In una parola: Rinforzanti.

4-   CREATIVITA’

Tornando ai nostri Maestri, i grandi artisti del Rinascimento, sono diventati tali grazie all’educazione ricevuta, combinata con doti naturali[3]. Il tirocinio a bottega ha consentito a Leonardo, Raffaello e Michelangelo di imparare con maestria tutto quello che era possibile imparare, dal preparare i colori a reggere pennello o scalpello, dal disegnare al preparare tele, intonaci e marmi. Liberate dal dover controllare questi aspetti della loro arte le risorse cognitive si sono potute esprimere creando -creativamente- opere meravigliose. Senza tirocinio, senza pratica, senza maestria non avremmo nemmeno la Gioconda, La Pietà o la Venere d’Urbino. Al contrario di essere un modo vuoto ed poco creativo di possedere delle competenze l’automatismo dei comportamenti ci permette di creare, con inventiva ed ingegno cose nuove.

la fornarina

La Fornarina di Raffaello

E noi? Automatizzare significa diventare plastici e creativi. Saper fare una cosa sempre presto e bene, in maniera, appunto, automatica permette di liberare le risorse per esprimere le nostre potenzialità cognitive più elevate. Dobbiamo sforzarci di trovare tecniche e metodologie che consentano ad insegnanti ed allievi di poter praticare gesti, azioni e comportamenti. Per ottenere questo la pratica necessaria deve essere necessariamente rinforzante. Deve fornire feedback positivi e tempestivi e deve permettere costantemente all’allievo di vedere i progressi che ha fatto. Solo in questo modo ci piacerà fare, studiare, imparae; solo così potremo, tutti, diventare dei grandi Maestri.

clickers in cerchio


[1]  Il paragone informatico si fa ancora più preciso se pensiamo che tutti i computer da quelli primitivi a quelli moderni  possiedono al loro interno dei sistemi che li fanno funzionare (l’equivalente biologico di “tenere in vita”) la cui attività è nascosta ed invisibile: esattamente quello che accade nei nostri cervelli.

[2] A questo proposito Ted DesMasions ha scritto un interessante post, che potete trovare qui, nella versione in Inglese, o qui nella mia traduzione in Italiano (lettura raccomandata!)

[3] Io credo, ma è una mia personale opinione (e forse sbagliata) che “doti naturali” non fossero la predisposizione al disegno e pittura piuttosto che alla scultura dei Maestri, ma piuttosto il fatto che “Arte” per loro era la cosa più rinforzante della  vita. Una passione talmente profonda, radicata e rinforzante da plasmare l’intera vita dei vari Michelangelo, Leonardo e Raffaello. Chissà, magari è bastato un particolare complimento fatto dalla sua mamma al bambino Raffaello per un primo scarabocchio…

Trovate le differenze…

Ted DesMasions and me  are tuned. Although we live more than 5000 km far away. I wrote the first post on the punishment and  a couple of days later, he brought a second on the same subject. I read the second post and I had the idea for what I’m about to share with you. Ideas are bouncing across the Ocean 😉

Ted coaches a softball team and he plays this drill: “So we use Queen of the Hill. Throwing pairs line up with one partner on the left field foul line and the other in foul territory. Each pair leaves eight feet or so of space between themselves and the next pair so the group as a whole extends down the foul line. The two closest to home plate qualify as “Queens of the Hill,” and the others aspire to move up into that spot. Girls maintain their relative position by completing a clean throw and catch. If a pair overthrows a target or flubs a catch, that pair cedes their spot in the ‘hierarchy’ and sprints to the bottom spot along the foul line.[1] If they forget (or choose not) to actually sprint, the whole team stops, drops their gloves, and comes to the foul line for a single wind sprint out past centerfield and back. Then they all resume their places in the chain and continue”. The question  Ted addresses to himself and also to us, readers, is the following: Am I punishing the girls? Punishment comes after the unwanted behavior (poor performing) and should reduce the frequency of that behavior. Right? The question I pose to you, however, is this: what if you  sprints do increase the frequency of correct execution of the drill? What sprints becomes in this case? Technically they become the negative reinforcement for the desired behavior. Right?

Confused [1]? Reinforce one thing, means, necessarily punish another, or at the very least, negatively reinforce another. Take the case of Clicker Training. While I’m marking and reinforcing a behavior with food I am -at the same time- punishing / negative reinforcing everything else. One behavior increases in frequency (and this is part of the definition of reinforcement) and the rest decreases frequency (definition, this time, for punishment). A first explanation could come from the scientific theory:

1 – Reinforcement  happens during the behavior; punishment doesn’t ( I beat the dog that ALREADY peed on the carpet).

2 – Negative reinforcement can be avoided by changing behavior;  punishment doesn’t (I pull the rein, and in response the horse turns her head. The dog has nothing to change while she is beaten because she peed) .

When I decide that Akira, my border collie, is ready to learn a new criteria, the dog will –of course- try a few times to make me “Click!” performing the old criteria. My ignoring Akira’s behaviors, holding the “Click!” is, in fact, a punishment (I give something that the dog does not want – I hold the food- to decrease the frequency of a behavior: those that do not meet to my criteria). At the same time I’m reinforcing behaviors that meet my criteria.

I’m playing a little bit on the edge of the cliff, I know perfectly well that Clicker is -OBVIOUSLY- different from a stick.

In my opinion, though not often mentioned in the books, the only real yardstick for distinguishing punishment from reinforcement is both the role of the receiver and timing.

1 – Teacher’s action can be avoided by the receiver? Reinforcement. [2]

2 – Teacher’s action can not be avoided by the receiver? Punishment.

If the action is still contemporary to behavior it’s a reinforcement, otherwise we are in the field of punishment. [3]

Before going further still, just consider this: when we beat the dog for  peeing, or the boy for coming home late, what are we, EXACTLY, punishing? Behavior or who did it? I’m punishing the pee and the delay or the dog and the boy? In short, are we teaching or simply taking our revenge? Before get into any situation where something has already happened, let’s ask to ourselves whether our intervention will change things for the better: if the answer is yes, we can proceed, otherwise it is better to think of something else. [4] This idea is not mine but it’s from Dr. G. Lathman [5]. Most of the time our “punishments” are directed against those who have misbehaved. They are no longer teaching, but  revenge or vent for our frustration. Let’s stop for a moment to analyze the situation: we can realize the aims of our intervention and change them accordingly.

So, what’s Ted doing with his girls? Is he punishing behavior or  is he reinforcing  others one? Is he taking is revenge against something?

The athletes are training. If we could define training as a “macro-behavior”, we could say that Ted is reinforcing more or less negatively his girls. Ted’s interventions are contingent on behavior (which is the training in its entirety), but they can also be avoided by the girls (just by getting more engage in the next round). Knowing Ted, I can also say that his intents are to reinforce the correct behavior and do not punish anything else. Dealing with behaviors intentions count. Pretty much.

The true difference is in the quality of information that we communicate to our students. The more the environment is positive (Clicker Training and TAGteach in my practice), the more information will be easy, available and shared. It will be less “heavy” from the point of view of the emotional arousal, less unbalancing for the receiver. As we move and get closer to the edge of coercion information’ quality deteriorates, it becomes difficult, very heavy and very unbalancing. Only people who are particularly “gifted” and with  iron-gutt, are able to teach with these tools. A great skill is needed to be able to communicate just saying “No”. It ‘much easier to create confusion and fear than learning.

Do You want a proof? Do this game with someone. You can be in the group but it’s good also if you are only two. Who will be trained exit from the room. The group decides what to get him to do on his return (things easy for charity: take a book, sit in a chair). In return the teacher can guide his pupil just saying “Yes” (or using a clicker, if you have one at hand, marking every behavior towards the right direction). Then reverse roles. Bring out the trainer, choose a new behavior and guide him, this time, only using the word “No” (for which just stop every wrong thing he does). Is there something different between the two procedures?

Play yourself the role of the student and try to get you  driven  both ways: do you feel any difference?

 

[1] I will always remember with pleasure the confusion I had in mind after the conference Prof. Ruiz Rosalez gave to Clicker Expo 2012. Conference with similar arguments to those Idiscussed here. With great skill, the professor has led us to be almost unable to distinguish between reinforcement and punishment.

[2] With “teacher” I indicate who or what is acting upon the receiver.

[3] Question: if it rains and I have my umbrella, rain reinforces my “have an umbrella with me.” And if it doesn’t’ rains? Bring my umbrella is punished by the lack of rain (I cannot order  rain  ..). Unless, as soon as I reaIize the sunny day I  go back home to leave the umbrella. The sun negatively reinforces my “having the umbrella”. At this point, between punishment and reinforcement the meter is convenience: better to lose 3 minutes and return home, or to carry around all day a useless umbrella? If the next time, with the sun, I will not take the umbrella this will mean that taking out the umbrella with the sun  the previous day, was negatively reinforced (I do not like the concomitant presence of sun and umbrella, reinforcing  my “leave umbrella home” next day). What a beautiful mess isn’t it?

[4] Beating the dog improves the status of my carpet? I would say no. Maybe the dog was too much time alone in the house, maybe he has a little problem in the bladder or maybe I took it out too early this morning …

[5] “Unless what you are about to say or do has a high probability for making things better, do not say it and do not do it.” Lathman: “The Power of Positive Parenting”

NOTATE LA DIFFERENZA?

Pubblicato: novembre 27, 2012 in Insegnare
Tag:,

Trovate le differenze…

Io e Ted DesMasions siamo in sintonia. Anche se viviamo a più di 5000 km di distanza. Io ho scritto un primo post sulla punizione e lui un paio di giorni dopo ne ha proposto un secondo sullo stesso argomento. Io leggo il secondo post e mi viene l’idea per quello che sto per condividere con voi.

Ted fa questo esempio: lui allena una squadra di softball e fa un esercizio per cui se una coppia di giocatrici non esegue con il dovuto impegno l’intera sequenza di lancio e presa viene rimandata, di corsa, in fondo alla fila. Se la coppia non torna indietro di corsa, tutta la squadra si fa uno sprint lungo il campo (più o meno… non sono un esperto di softball, comunque avete l’idea). La domanda che Ted si pone e rivolge anche a noi lettori è la seguente: sto punendo le ragazze? La punizione avviene dopo il comportamento indesiderato (fare male l’esercizio) e dovrebbe ridurre la frequenza del medesimo comportamento. E quindi questo è il caso giusto? La domanda che io pongo a voi è, invece, questa: ma se fare le corse per il campo aumenta la frequenza delle corrette esecuzioni dell’esercizio? Cosa diventano gli sprint in questo caso? Tecnicamente dei rinforzi negativi per il comportamento desiderato. Giusto?

Cominciamo ad essere confusi[1]? Rinforzare una cosa, significa, necessariamente punirne un’altra, o per lo meno, rinforzare negativamente un’altra. Facciamo l’esempio del Clicker Training. Mentre sto marcando e rinforzando con il cibo un determinato comportamento sto, allo stesso tempo, punendo/rinforzando negativamente tutto il resto. Un comportamento aumenta di frequenza (e questa è parte della definizione di rinforzo) e tutto il resto diminuisce di frequenza (definizione, questa volta, di punizione). Un primo chiarimento potrebbe venirci dalla teoria scientifica:

1-   il rinforzo avviene in contingenza al comportamento; la punizione no (picchio il cane che ha fatto la pipì sul tappeto).

2-   il rinforzo negativo può essere evitato modificando il proprio comportamento; la punizione no (tiro la redine e, in risposta il cavallo gira la testa. Mentre il cane non ha niente da modificare intanto che viene picchiato perché ha GIA’ fatto la pipì).

Quando decido che Akira, il mio border collie, è pronto per imparare un nuovo criterio, il cane ovviamente proverà per qualche volta a farmi fare “Click!” attraverso il vecchio criterio. Il mio ignorare i comportamenti del cane trattenendo il “Click!” è, di fatto, un punizione (do qualcosa che il cane non vuole –trattengo il cibo- per diminuire la frequenza di un comportamento –nello specifico tutti quelli che non corrispondono al mio criterio).

Sto un pochino giocando sul filo dell’assurdo, lo so perfettamente che il Clicker è –OVVIAMENTE- diverso da un bastone.

Secondo me, anche se non spesso ricordato dai testi, l’unico vero metro per distinguere punizione da rinforzo consiste nel ruolo del ricevente e nella tempistica.

1- L’intervento “del maestro” può essere evitato dal ricevente? Rinforzo.[2]

2- L’intervento “del maestro” non può essere evitato dal ricevente ? Punizione.

Se l’intervento è contemporaneo sul comportamento parliamo ancora di rinforzo, viceversa siamo nel campo della punizione[3].

Prima di andare avanti consideriamo ancora questo: quando picchio il cane per aver fatto la pipì, o il ragazzo per essere tornato a casa tardi, cosa sto, ESATTAMENTE, punendo? Il comportamento o chi l’ha fatto? Sto punendo la pipì e il ritardo o il cane e il ragazzo? Insomma: stiamo insegnando o ci stiamo semplicemente vendicando? Prima di intervenire, in qualsiasi situazione in cui qualcosa è già successo, chiediamoci se il nostro intervento cambierà in meglio la situazione: se la risposta  è sì, possiamo procedere, altrimenti meglio pensare a qualcos’altro[4]. Quest’idea non è mia, ma del Dott. G. Lathman[5]. La maggior parte delle volte le nostre “punizioni” sono rivolte contro chi ci ha fatto il torto. Non si tratta più d’insegnamento, ma di vendetta o sfogo della nostra frustrazione. Fermandoci un’attimo ad analizzare la situazione ci possiamo rendere conto dove mira il nostro intervento e modificarlo di conseguenza.

Allora Ted, con le sue ragazze cosa sta facendo? Sta punendo dei comportamenti o ne sta rinforzando degli altri? Si sta vendicando di qualche “torto” subito?

Le atlete stanno facendo allenamento. Se potessimo definire l’allenamento come “macro-comportamento”, potremmo dire che Ted stia rinforzando più o meno negativamente le ragazze. Gli interventi di Ted sono contingenti sul comportamento (che è l’allenamento nella sua interezza), ma possono anche essere evitati dalle ragazze (basta che s’impegnino nel prossimo turno). Conoscendo Ted posso anche affermare che il suo intento è quello di rinforzare il comportamento corretto e non punire il resto. E in questi casi anche le intenzioni contano. Molto.

La differenza, vera, sta alla fine nella qualità dell’informazione che comunichiamo ai nostri allievi. Più l’ambiente è positivo (Clicker Training, TAGteach per quanto mi riguarda) più l’informazione sarà facile, disponibile e condivisa. Essa sarà meno pesante dal punto di vista del carico emotivo, meno sbilanciante l’equilibrio del ricevente. Man mano che ci spostiamo e ci avviciniamo alla sponda della coercizione la qualità dell’informazione si deteriora, diventa difficile, molto pesante ed estremamente sbilanciante. Solo persone particolarmente “dotate” e dallo stomaco di ferro, riescono ad insegnare in queste condizioni. Ci vuole una enorme perizia per riuscire a comunicare solo dicendo “No”. E’ molto più facile creare confusione e paura che apprendimento.

Volete la prova? Fate questo gioco con qualcuno. Potete anche essere in gruppo ma va bene anche se siete solo in due. Chi verrà addestrato esce dalla stanza. Il gruppo decide cosa fargli fare al suo rientro (cose facili per carità: prendere un libro, sedersi su una sedia). Al rientro l’educatore potrà guidare il suo allievo solo dicendo “Sì” (o con un clicker se ce l’avete sottomano marcando ogni comportamento nella direzione corretta). Poi invertite i ruoli. Fate uscire il maestro, decidete un nuovo comportamento e guidatelo, questa volta, solo con il “No!” (per cui bloccate ogni cosa sbagliata che fa). Cambia qualcosa tra le due procedure?

Mettetevi nei panni dell’allievo e provate a farvi guidare in tutti e due i modi: notate la differenza?


[1] Ricorderò sempre con piacere la confusione che ho avuto in mente dopo la conferenza del Prof. Rosalez Ruiz alla Clicher Expo 2012. Conferenza su argomenti simili a questi qui trattati dove, con maestria, il professore ci ha –quasi- portato a non sapere più distinguere tra rinforzo e punizione.

[2] Con “maestro” indico chi o cosa sta intervenendo sul ricevente.

[3] Domanda: se piove e io ho l’ombrello la concomitanza tra pioggia e presenza dell’ombrello rinforza il mio “avere l’ombrello con me”.  E se non piove? Il mio portare l’ombrello viene punito dall’assenza di pioggia (non è che posso far piovere a comando, quindi ..). A meno che, visto il sole, decido di tornare in casa e mollare l’ombrello. Il sole rinforza negativamente il mio “avere” l’ombrello. A questo punto tra punizione e rinforzo la misura sta nella convenienza: meglio perdere 3 minuti e rientrare in casa o, portarmi dietro tutto il giorno l’ombrello? Se la prossima volta, con il sole, non userò l’ombrello significa che il portare fuori l’ombrello con il sole del giorno precedente,   è stato rinforzato negativamente (la presenza concomitante di sole e ombrello non mi piace e rinforza il mio lasciare a casa l’ombrello l’indomani). Bella confusione vero?

[4] Picchiare il cane migliora la situazione del mio tappeto? Direi di no. Forse il cane è stato troppo tempo solo in casa, forse ha un piccolo problema alla vescica o forse l’ho portato fuori troppo presto questa mattina…

[5]Unless what you are about to say or do has a high probability for making things better, don’t say it and don’t do it”. Lathman: “The power of Positive Parenting”

UNBEARABLE UNCERTAINTY

Pubblicato: novembre 20, 2012 in behaviour, Teaching

A few days ago I was walking with my dogs. When we are in the county my feet follow the path and my mind takes trips. So I think a lot and “chew” a lot. Pay attention, not every time there are large and deep thoughts, indeed. Almost every time my thoughts are tuned to “generic”, but sometimes I have some good flash.

A few days ago, I had one of these thoughts and I’ve decided to share it with you. Since when I’m working in education and teaching I’ve always found nasty what scientific books wrote about  punishment and reinforcement [1]. I do like the main definition of reinforcement (it is “an event that increases the frequency of a given behavior”) the definition of punishment just pissed me: “it is an event that decreases the likelihood of a given behavior to reoccur”. The “Likelihood” bothered me, leaving some doubt that, some time, in some way, it could work. Like leaving a door slighlty, almost an invitation or justification. “Look, if you want to try … it might just work.”

Parentheses. I have the proof that punishment does not work. Never. A month ago I experienced something “heavy”. I’ve teached as substitute, for two weeks in our middle school (children aged 10-14). With the older ones I succumbed to temptation, that small opening that “decreases the likelihood…” I wrote a couple of reprimands. Obviously the boys have quietly ignored my “punishment”, so I found myself with no more weapons for control their behaviors. When you shoot the bigger nuke than you have, or you have won the war or you have  lost.it.  I have lost my war, and the sense of helplessness that this defeat gave me was a bad load to carry on for few days.

A few days ago I realized that, sometimes, what works in punisment (hence the “reduce the likelihood …”), it isnot the event itself, but the effectst it leaves later.

Let me explain.

When we take a fine for over-speeding, we are punished for exceeding the speed- limit. What makes us go slowly, after the fine, it is not the fine itself, but it is the memory of the fine which negatively reinforces our going slow (negative reinforcement = give something you do not like to increase the likelihood of a behavior). That is. as long as I have in mind the memory of the fine I will respect the limits. As memory begins to loosen its grip, and my rushing through the streets gets stronger day by day, since, at least statistically,I  will not meet other  patrols, the punishment has no longer any effect. In practice I have not learned.

I’m not sure, but my suspicion is this: that the “collateral” effects, that we all know, arising from the use of punishment (anxiety, stress, behavior problems etc etc) are derived from this after-effect during which the punishment, while no longer existing, continues to exert its influence and the subject is torn between the desire to do something, and the memory of the punishment itself. The problem may be that the negative reinforcement is only a mental image, while the rushing with the car  is a true Reinforcement, tangibly present in my “here and now”? Let me clarify. One thing is to use negative reinforcement to increase the frequency of a behavior, such as pulling  the reins to turn horse’s head. But, in this case, there is contingency between the two physical actions “pull” and “turn”. There is, in fact, a direct flow of information. At every moment the horse may decide to turn her heads and stop the pulling. The receiver has an active role [2].

In the case of punishment, the receiver has no active role. Those who suffer the punishment can not do anything to avoid it. The fine unlike the rein does not give me anything to do but … pay. The next effect is that until I’ll remember the fine,I’ll slow down for a while my speed. In the case of punishment, there is no information flowing, and I’m alone,  fighting between increasing my speed (positive reinforcement) and the risk of taking a second fine (negative reinforcement). The concomitant presence of the two types of reinforcements leads to confusion, stress and uncertainty. From my point of view, uncertainty, or the lack of clear information is the worst thing that can happen to someone who is-or should be-learning something. In the presence of a stimulus, the  learning how to handle it it is an absolute priority.

Back for a moment to my experience in school. This lack of information in the punishment becomes even more evident. Pupils’s life has not changed after my reprimands: my enforcement , late behavior had since long lost its effectiveness when there are no left  “negative reinforcement ghost” to regulate pupils’ behavior. In other words, if the punishment is not scary  for the receiver there is no more chance for any kind behavioral  change [3].

Bacteria: they still have to learn…

I am a supporter of the concept of homeostasis, as theorized by Antonio Damasio. Homeostasis is nothing more than the ideal balance (ideal, because it is never reached) towards which all functions and settings of body [4] go: body glucose levels, indoor and outdoor temperature, blood oxygenation, heart rate etc etc. For each stimulus, external or internal, which reaches and affects our body, our regulatory mechanisms work so that the parameters of homeostasis remain within the limits where life is still possible. Enlarging this concept, even the brain mechanisms, aimed at learning, fit within available tools homeostasis management. When an external stimulus unbalances my homeostasis (for example,during  a diner someone who   asks me to pass the salt [5]), my body tries to regain his balance by using the appropriate strategies (passing the salt, for example). In this process of imbalance I had the opportunity to respond with a precise action and, therefore, to learn.

Learning is a must of evolution: the more I learn, the more I can manage the environment and increase the chances of passing my genes to future generations. In nature, the punishment does not exist, all the behaviors even the most coercive are expressions of negative reinforcement.

The use of punishment does not allow us to learn and, to a stimulus that unbalances my balance, I have no possibility to answer: we are, in fact, powerless. From here all the deleterious effects that result from the use of punishment.

An alternative to fines? Here it is: http://www.youtube.com/watch?v=iynzHWwJXaA

The fun-really-can change the behavior!

[1] My opinion of Reinforcement and Punishment are described in the post “Teaching”

[2] I’m not a fan of negative reinforcement used as only tool for education or training. I know that positive reinforcement allows me to get better results, faster, and longer. That said, correctly applied the negative reinforcement can be an effective aid to the positive reinforcement, as brilliantly demonstrates, for example, the work of Alexandra Kurland (http://www.theclickercenter.com/ if you are interested in

[3] Karen Pryor in “Do not shoot the dog!” Writes that there is only one type of punishment, that, absolutely and scientifically, works: extinction. For example, the extinction (killing or abandonment) of the barking  dog certainly solves the problem of barking.

[4] I use the word “body” as indicating the unity of mind, internal control mechanisms and the actula physical body.

[5] I still used the example “of the pass the salt” in the post: “Teaching”, which contains some complementary concepts to this post. So, if you want to know more …

L’INSOSTENIBILE INCERTEZZA…

Pubblicato: novembre 20, 2012 in Comportamento, Insegnare

Qualche giorno fa ero a spasso con i cani. Quando sono per campi con loro i piedi vanno lungo il sentiero e la testa parte per altri viaggi. Per cui penso molto e “mastico”. Intendiamoci, non è che ci siano sempre grandi e profondi pensieri, anzi. Quasi sempre siamo sul generico-banale, ma qualche volta ho qualche sprazzo degno di nota.

Qualche giorno fa, ho avuto uno di questi pensieri, che ho deciso di condividere con voi. Da quando mi occupo d’educazione ed insegnamento mi ha sempre dato un po’ fastidio quello che recitano i testi scientifici, quando definiscono punizione e rinforzo[1]. Fatto salvo che la definizione di rinforzo mi piace (è: “un evento che aumenta la frequenza di un certo comportamento”) la definizione di punizione proprio non mi va giù: “è un evento che diminuisce la probabilità che un comportamento si ripresenti”. “la probabilità” mi dava fastidio, lasciando il dubbio che qualche volta in qualche modo potesse funzionare. Come a voler lasciare uno spiraglio di porta aperta, quasi un invito o una giustificazione. “Guarda, se vuoi provare … potrebbe anche funzionare”.

Parentesi. Ho la prova che la punizione non funziona. Mai. Un mese fa ho vissuto un’esperienza “pesante”. Ho fatto supplenza per due settimane alle scuole medie. Con i più grandi ho ceduto alla tentazione, a quel spiraglio che “diminuisce la probabilità”: ho messo un paio di note. Ovviamente i ragazzi hanno tranquillamente continuato a fare quello che facevano, per cui io mi sono trovato senza più armi con le quali poter esercitare un minimo di pressione. Quando hai sparato la bomba più grossa che hai a disposizione, o hai vinto la guerra o l’hai persa. Io l’ho persa, e il senso d’impotenza che questa sconfitta mi ha dato ha pesato per parecchi giorni sul mio umore.

Qualche giorno fa ho realizzato che quello che qualche volta potrebbe funzionare nella punizione (da qui il “diminuisce la probabilità…”), non è l’evento in sé, ma l’effetto che lascia in seguito.

Mi spiego.

Quando prendiamo una multa per eccesso di velocità, veniamo puniti per aver superato il limite. Quello che ci fa andare piano, dopo, non è la multa in sé per sé, ma è il ricordo della multa che rinforza negativamente il nostro andare piano (rinforzo negativo = dare qualcosa che non piace per aumentare la probabilità di un comportamento). Ovvero fintanto che ho in mente il ricordo della multa rispetterò i limiti. Appena la memoria comincia ad allentare la sua presa, e il mio correre per le strade si rinforza giorno dopo giorno, visto che, almeno statisticamente, non incontreremo per un po’ altre pattuglie di vigili, la punizione cessa ogni effetto. In pratica non ho imparato.

Non lo so, ma il mio sospetto è questo: che gli effetti “collaterali” che tutti conosciamo, derivati dall’uso della punizione (ansia, stress, problemi di comportamento etc etc) derivino da questo effetto onda durante il quale la punizione, pur non più presente, continua ad esercitare la sua influenza e il soggetto è combattuto tra il  desiderio di fare qualcosa, e il ricordo della punizione stessa. Il problema potrebbe essere che il Rinforzo negativo è solo un’immagine mentale, mentre il correre è un vero rinforzo tangibilmente presente nel mio “qui ed ora”? Chiarisco. Un conto è usare il Rinforzo negativo per aumentare la frequenza di un comportamento, tipo tiro la redine e il cavallo gira la testa. Ma in questo caso esiste contingenza tra le due azioni fisiche “tirare” e “girare”. C’è, di fatto, passaggio d’informazione diretto. In ogni istante il cavallo può decidere di girare la testa e far cessare il tirare. Il soggetto ricevente ha un ruolo attivo[2].

Nel caso della punizione il ricevente non ha nessun ruolo attivo. Chi subisce la punizione non può far nulla per evitarla. La multa a differenza delle redine non mi da null’altro da fare che… pagare. L’effetto successivo consiste nel fatto che io ricordandomi della multa, rallento per un po’ il mio correre. Nel caso della punizione, non c’è nessun passaggio, e io sono da solo a combattere tra l’andare spedito (rinforzo positivo) e il rischio di prendere una seconda multa (rinforzo negativo). La concomitante presenza dei due tipi di rinforzi genera confusione, stress e incertezza. Dal mio punto di vista, l’incertezza, ovvero la mancanza di chiare informazioni è la cosa peggiore che possa capitare a qualcuno che sta –o deve- imparare qualcosa. In presenza di uno stimolo, imparare a gestirlo è una assoluta priorità.

Tornando, per un attimo, alla mia esperienza a scuola, questa mancanza d’informazioni nella punizione diventa ancora più palese. Una volta ricevuta la nota per i ragazzi la vita non è cambiata di una virgola: la mia azione coercitiva, in ritardo sul comportamento aveva da tempo perso la sua efficacia nel momento in cui non lasciava più nessun “Rinforzo negativo fantasma” a regolare le azioni dei ragazzi. In altre parole: se al ricevente la punizione, la punizione stessa, non fa paura non c’è più spazio per nessun tipo di modifica del comportamento[3].

Batteri: anche loro devono imparare…

Sono un sostenitore del concetto di omeostasi, come teorizzato da Antonio Damasio. L’omeostasi altro non è che l’equilibrio ideale (ideale, perché mai raggiungibile) cui tendono tutte le funzioni e le regolazioni corporee: livelli di glucosio, temperatura esterna ed interna, ossigenazione del sangue, battito cardiaco etc etc. Ad ogni stimolo, esterno od interno che raggiunge ed interessa il nostro corpo, i nostri meccanismi di regolazione lavorano affinchè i parametri dell’omeostasi rimangano all’interno dei limiti nei quali la vita è ancora possibile. Allargando questo concetto, anche i meccanismi  celebrali, finalizzati all’apprendimento rientrano all’interno egli strumenti a disposizione del corpo[4] per gestire la propria omeostasi. Quando uno stimolo esterno sbilancia la mia omeostasi (per esempio un commensale che a tavola mi chiede di passargli il sale[5]), il mio corpo cerca di recuperare l’equilibrio utilizzando le strategie opportune (passando il sale per esempio). In questo processo di sbilanciamento io ho avuto l’opportunità di rispondere con un’azione precisa e, quindi, d’imparare.

Imparare è un must evolutivo: più imparo, più posso gestire l’ambiente e e aumentare le probabilità di passare il mio patrimonio genetico. In natura la punizione non esiste, tutti i comportamenti anche i più coercitivi sono espressioni di Rinforzo negativo.

L’uso della punizione non consente d’imparare e, a uno stimolo che sbilancia il mio equilibrio, io non ho nessuna possibilità di risposta: di fatto sono impotente. Da qui tutti gli effetti deleteri che dall’uso della punizione derivano. Un’alternativa alle multe? Eccola qua: http://www.youtube.com/watch?v=iynzHWwJXaA

Il divertimento può cambiare –davvero- il comportamento!


[1] La mia opinione su Rinforzo e Punizione sono descritte nel post “Insegnare”

[2] Non che io sia un fan del rinforzo negativo usato come esclusivo mezzo d’educazione o addestramento. Lo so che il rinforzo positivo mi permette di ottenere risultati migliori, più veloci e più duraturi. Ciò detto, correttamente applicato il rinforzo negativo può essere un efficace aiuto al rinforzo positivo, come dimostra brillantemente, ad esempio il lavoro di Alexandra Kurland (http://www.theclickercenter.com/ se foste interessati a un’approfondimento)

[3] Karen Pryor in “Don’t shoot the dog!” scrive che esiste solo un tipo di punizione che, assolutamente e scientificamante, funziona: l’estinzione. Per esempio l’estinzione (uccisione o   abbandono) del cane che abbaia di notte risolve sicuramente il problema dell’abbaio.

[4] Uso la parola “corpo” come indicante l’unità tra mente, meccanismi di  regolazione interni e corpo fisico.

[5] Ho impiegato ancora l’esempio “del passare il sale” nel post: “Insegnare” che contiene concetti complementari a questi. Per cui, se desiderate approfondire…