Archivio per la categoria ‘Insegnare’

L’ ambiente ci bombarda di stimoli. Impariamo a rispondere a questi stimoli o per lo meno a quelli rilevanti, importanti per la “sopravvivenza”, attraverso l’esibizione di determinati comportamenti. In classe si sta –sperabilmente– seduti, in palestra ci si allena, nel campo di agility salti (effettivamente è il cane a saltare) gli ostacoli.

L’apprendimento consiste nell’imparare quale comportamento esibire, date certe condizioni: potremmo chiamare queste condizioni segnali. I comportamenti diventano condizionati a questi segnali. Quando batto sulla tastiera, ho imparato che per ottenere la lettera “A”, che ho imparato a sua volta rappresenta il suono “a”, devo battere un certo tasto <A>.

Una tastiera... quanti segnali da discriminare!

Una tastiera… quanti segnali da discriminare!

Non imparo a battere il tasto: imparo in quali condizioni battere il tasto <A> funziona e viene –quindi– rinforzato. Se voglio scrivere “CASA”, ho due suoni “A” che rinforzano il battere il tasto <A>. Se invece di <A> battessi <E> otterrei “CESE” parola che non ha senso nella mia lingua e che non mi porterebbe nessun rinforzo. Anche il mio cane Akira sa battere su una tastiera, quello che non sa e non potrà mai saper fare, date le sue competenze fisico cognitive è discriminare il significato di battere <A> .(Potrei modellare il comportamento, ma, per il cane, questo non avrà mai il significato che potrà avere per una persona.) Senza disturbare il mio border, che dopo la passeggiata quotidiana dorme beato, anche mio figlio a 5 anni e mezzo sa “battere” sulla tastiera. E’ anche capace di mandare SMS ai suoi cugini più grandi: “AIHHIHEEEEEE4444FDFFFF   FFFFFFFFFFFFFFHJH” che significa “Ciao, come stai?”

Quale competenza deve apprendere il bambino?  Non il comportamento di battere sui tasti –quello lo sa già fare– ma discriminare quando battere la <A> funziona ovvero verrà rinforzato. In altre parole, deve imparare a scrivere.

Di nuovo, non si tratta di insegnare delle nuove capacità fisiche o motorie. Questi o sono presenti nel repertorio dell’individuo o non lo sono e non possono, pertanto venire insegnati. Sono cose che vengono “naturalmente” con lo sviluppo psico-fisico-cognitivo della persona in un ambiente naturale e normale. Il patrimonio genetico si attiva progressivamente durante tutta la vita, per assicurare in ogni momento le migliori risorse comportamentali e di conseguenza le migliori probabilità di sopravvivenza. Questo patrimonio di comportamenti viene modellato dall’ambiente che seleziona sia quali comportamenti resteranno, sia quando questi dovranno essere esibiti. Se gioco a calcio so che è opportuno indossare la divisa per una partita; lo stesso comportamento “indossa la divisa” non verrà rinforzato per un incontro galante. Il comportamento è uguale; ciò che cambia sono i segnali. La partita è il segnale che, quando si presenta, è la condizione per cui l’indossare la divisa ha senso, o meglio sarà rinforzato. Ma l’indossare in sé e per sé non viene insegnato: o si è biologicamente in grado di indossare la divisa o non lo si è. Per questo motivo non potrò mai insegnare ad Akira a mettersi –da solo– i pantaloncini: gli mancano le giuste articolazioni, le dita opponibili etc. etc. Inoltre gli manca la competenza cognitiva per discriminare l’”utilità” di indossare i pantaloncini.

Quello che viene insegnato è il condizionamento del comportamento a usemaforono specifico segnale. Per questo motivo dobbiamo prestare la massima attenzione che nell’ambiente d’apprendimento in cui ci troviamo ad operare non siano presenti altri segnali che possono distrarre o confondere l’allievo. Se insegno un target mano a un cane, il segnale che do, presentando la mano deve essere assolutamente consistente, come lo è un semaforo rosso. Immaginate cosa potrebbe capitare se i semafori agli incroci fossero di dimensioni o colori leggermente diversi: verde smeraldo o verde acido più o meno grandi… Quanti incidenti?

Un segnale che condiziona il comportamento è sempre presente per insegnare. Lo shaping non è insegnare a incrementi graduali un certo comportamento, ma, piuttosto è condizionare, per incrementi graduali, un determinato segnale.

 

TOKEN ECONOMY

Pubblicato: febbraio 26, 2013 in Comportamento, Insegnare
Tag:,

insegnare - comunicare “Comportamento” è ogni azione (volontaria o no, visibile dall’esterno o meno) che un organismo compie. Insegnare significa modificare il comportamento: farlo attraverso il Rinforzo significa ricompensare ogni comportamento a noi gradito esibito dal nostro allievo[1]. In questo modo il comportamento tenderà ad essere ripetuto e diventerà parte del repertorio del nostro soggetto. In altre parole: se desidero che mio figlio impari a mettersi  le scarpe, rinforzerò (“premierò” per usare un termine scorretto, ma che fa parte del nostro linguaggio comune) ogni comportamento che il bambino esibisca verso la meta finale: mettersi le scarpe. Una cosa da mettere subito in grande evidenza: “Rinforzo” è qualunque cosa che aumenti la frequenza di un comportamento: se il comportamento aumenta significa che è stato rinforzato, altrimenti no. Chi decide cosa è rinforzante? Il nostro allievo! E’ lui, non noi insegnanti, che stabilisce cosa piace ed è gradito e cosa no; per cosa si è disposti a lavorare o meno.

gettoniUna Token Economy (Token, in Inglese significa gettone) è un sistema per la modifica del comportamento che si basa sul rinforzo sistematico di un dato comportamento. Nata negli USA negli anni sessanta e diffusa fino alla fine degli anni settanta,  malgrado l’evidenza scientifica dei migliori risultati conseguiti, la Token Economy è praticamente scomparsa negli anni ottanta anche a causa di una serie di problemi sollevati dalla sua non corretta applicazione. In un carcere minorile americano i gettoni venivano distribuiti dai secondini. Queste persone, però, li consegnavano ai ragazzi con scherno e derisione,  non con sincero apprezzamento (rinforzo sociale) per gli sforzi e i risultati conseguiti. L’esperimento è finito quando i detenuti hanno dato fuoco alla prigione…

Nella Token Economy i gettoni vengono utilizzati come rinforzi. I gettoni accumulati possono in seguito essere scambiati (esattamente come una valuta) con altri beni: accesso a giochi, film, dolci o piccole somme di denaro possono essere alcuni esempi applicabili con i bambini. Un gelato estivo potrebbe valere due gettoni. Ragazzi ed adulti potranno avere accesso ad altri tipi di beni: rientrare a casa un po’ dopo l’ora del coprifuoco o buoni-benzina per gli adolescenti potrebbero essere beni scambiabili con i gettoni. Come funziona in pratica la Token Economy?

La prima cosa da sottolineare è che si tratta di un Sistema: con leggi e regole ben definite, chiare e condivise da tutti i partecipanti. La prima cosa da fare è stabilire esattamente quali sono i comportamenti che verranno “pagati” e quanto. Con mio figlio che ora ha 5 anni ho disegnato delle vignette con tutte le regole che controllano il nostro rapporto. In caso di contenzioso (finora non è  mai capitato) ci sono i disegni che dettano legge. Agganciare delle regole volanti a delle situazioni contingenti potrebbe non portare ai risultati sperati. In ogni caso, buona norma è sempre annunciare –chiaramente- cosa si ha intenzione di pagare e quanto. I valori di quanto pagare per un comportamento e il valore attribuito a un determinato bene, devono essere decisi insieme con l’allievo, in base alla nostra esperienza e modo di sentire. I risultati migliori si ottengono se l’allievo ha sempre un piccolo gruzzolo di gettoni da parte, ma non grandissimo: in questo modo rimarrà sempre coinvolto nel Sistema. (Se ho in tasca 50 gettoni non avrò tanta voglia di pulire la mia camera se con 10 gettoni posso “comprare” 2 ore di uscita extra il prossimo sabato sera.)

ladroIl secondo elemento consiste nel fatto che all’interno del sistema si va solamente a rinforzare comportamenti graditi e mai a punire quello che non ci piace. Per nessun motivo i gettoni guadagnati dovrebbero essere tolti come ripicca o punizione per un cattivo comportamento. (“Visto che non hai messo in ordine la tua stanza mi prendo 5 gettoni!!!”). E’ sicuramente difficile, all’inizio, resistere all’impulso di rivalersi, per un comportamento sgradito sul tesoretto accumulato, ma questo ha come unico risultato togliere entusiasmo e voglia di partecipare al Sistema che, ripeto, rimane funzionale ed efficace solo se costantemente pareggiato ad una situazione positiva e rinforzante.

Il terzo punto da valutare sempre, con grande attenzione, è il grado di competenza del nostro allievo. Bisogna essere sempre coscienti di cosa è in grado di poter fare, in ogni momento e in qualsiasi situazione, in modo da non stabilire leggi di scambio impossibili per lui. Se il bambino non sa ancora spogliarsi da solo è inutile offrire gettoni su gettoni come incentivo. L’unico risultato che sicuramente si otterrà, sarà di accrescere lo stress, rendendo l’esperienza punitiva per lui. Come fare in questi casi? Piuttosto che cercare in qualche modo di stimolare l’allievo con ricompense maggiori, cerchiamo di capire quale comportamento è in grado di esibire e iniziamo a pagare per questo. Se il bambino è in grado di togliersi le scarpe da solo, ma non le calze, iniziamo a “pagare” per le scarpe: coinvolgiamolo nel Sistema. In un secondo momento si potrà iniziare a pagare tentativi che vanno nella giusta direzione (mettere le mani sul calzino, prenderne la punta, tirare, afferrare il tallone) assicurandoci sempre che la nostra guida, il nostro insegnare a togliersi i calzini sia focalizzato su un solo passaggio alla volta. Questo processo che si chiama shaping (shaping, in Inglese, significa modellamento) consente di mantenere al minimo i livelli di stress e al massimo quelli di rinforzo.

Cosa insegna la Token Economy? Il più grande dono che possiamo fare ai nostri allievi (che siano i nostri figli, familiari, amici o colleghi di lavoro) è insegnare loro la Responsabilità. Ovvero che ogni comportamento ha delle conseguenze di cui solo noi siamo responsabili. La Token Economy mette all’interno di un sistema strutturato i comportamenti e fa in modo, senza mai essere punitiva che la responsabilità sia sempre dell’allievo. Se mio figlio consuma tutti i suoi gettoni per comprare cartoni animati in TV, è mio desiderio che impari che è una sua responsabilità recuperare, attraverso gli opportuni comportamenti (aiutare ad apparecchiare la tavola, per esempio), i gettoni che gli servono per venire a leggere una storia nel lettone di mamma e papà. Se i gettoni mancano, manca anche la possibilità di accedere alla risorsa desiderata. Ovviamente, come abbiamo già detto, il Sistema deve essere adattato alle competenze e capacità dell’allievo, rispettando con le proprie richieste quelle che sono le caratteristiche emotive e di sviluppo psico-fisiologico dell’allievo.


[1] Userò i termini “allievo” e “maestro” per descrivere i due cardini su cui si basa qualsiasi tipo di insegnamento: è necessario avere un “maestro” che passi informazione (cultura) ad un “allievo”. Questa situazione si applica a qualsiasi tipo d’interazione tra persone: con i bambini e gli adulti; a scuola o nell’ambiente di lavoro.

AUTOMATICO & CREATIVO

Pubblicato: dicembre 20, 2012 in Comportamento, Insegnare, Teaching

città medievaleDurante il Medioevo, e dopo ancora, nel Rinascimento, la differenza tra artista ed artigiano era molto labile. Il tipo di formazione che veniva impartito a un vasaio o a un pittore era, sostanzialmente, uguale. Si entrava in bottega, da un maestro, come apprendisti ancora bambini e vi si rimaneva per un periodo di circa 10 anni. Per 10 anni un apprendista viveva a contatto con gli strumenti e l’arte con cui si sarebbe in seguito guadagnato da vivere. Alla fine dei 10 anni un esame finale stabiliva se l’apprendista poteva fregiarsi del titolo di Maestro ed aprire, così, la propria bottega. Il lungo tirocinio aveva lo scopo di far conoscere tutti gli strumenti, i materiali e le tecniche per usarli. La conoscenza doveva essere acquisita con Maestria. Questo termine indica la conoscenza che va oltre il sapere le cose, quando le risposte a un problema ci vengono “spontanee”, senza un effettivo, consapevole, controllo. Indica soprattutto il possedere fluenza: ovvero saper fare le cose presto e bene.

La nostra mente lavora su due livelli: il primo è un livello (che chiameremo “Inconscio”) per molti aspetti nascosto e comprende tutti i comportamenti che compiamo senza avere su di essi un effettivo controllo: respirare, camminare… Non sappiamo come facciamo a camminare, semplicemente pensiamo che vogliamo andare in un posto e ci andiamo. Il secondo livello (che chiameremo “Conscio”) è quello dove esiste tutto ciò di cui siamo consapevoli. Imparare significa –anche- trasferire comportamenti e conoscenza dal Conscio all’Inconscio, ovvero passare il controllo dei nostri comportamenti alla parte inconscia del cervello. Man mano che impariamo abbiamo bisogno di prestare meno attenzione ai comportamenti. Ci sono diversi vantaggi da questo riversamento di conoscenza:

  •   Disponibilità di Risorse
  •   Velocità d’esecuzione
  •   Migliore memorizzazione
  •   Creatività

Vediamo, velocemente, questi elementi

1-   DISPONIBILITA’ DI RISORSE

Il poter fare le cose automaticamente libera le risorse  cognitive del Conscio che possono così venire impiegate per fare altro, ad esempio parlare con il nostro passeggero mentre stiamo guidando. Dal punto di vista evolutivo i vantaggi dati da questa capacità sono facilmente intuibili. Poter fare due –o più- cose contemporaneamente, concentrando nel frattempo l’attenzione su un particolare garantisce un’alta adattabilità all’ambiente e questo, a sua volta, si traduce in maggiori probabilità di sopravvivenza. E’ accaduto lo

C64_10

Commodore 64… sigh, quanti ricordi.

stesso con i computer. Vi ricordate i primi modelli? Commodore e compagnia? Riuscivano a fare solo una cosa alla volta, un gioco o un programma. Se volevamo cambiare programma dovevamo caricare ciò di cui avevamo bisogno. Adesso i computer possono gestire molti programmi contemporaneamente e, mentre sto scrivendo posso ascoltare della Musica[1].

2-   VELOCITA’ D’ESECUZIONE

I comportamenti sono estremamente più rapidi quando sono automatici. Se camminando inciampiamo, la reazione motoria è veloce abbastanza da farci riprendere l’equilibrio prima di cadere (di solito…). Se dovessimo eseguire la stessa azione coscientemente, i risultati sarebbero piuttosto disastrosi. Tra gli esseri umani, la categoria che più d’ogni altra raggiunge risultati spettacolari, grazie all’automatismo acquisito nei comportamenti sono gli sportivi. Tennisti, calciatori, ginnasti possono esprimere bellezza, armonia e potenza nei loro gesti proprio perché sono competenze acquisite, dopo anni di allenamento, automaticamente. Se proviamo a chiedere a un campione come esegue il suo colpo più spettacolare la risposta, probabilmente, sarebbe un “Non lo so”. I componenti motori sono automatici e pertanto al di là del controllo della coscienza[2].

3-   MIGLIORE MEMORIZZAZIONE

Ricordiamo meglio e più a lungo i comportamenti automatici. Anche se per 11 mesi all’anno non andiamo al mare, per questo non ci dimentichiamo come si nuota. Lo stesso lo possiamo dire per andare in bicicletta o far di conto. Sono cose che non ci dimenticheremo mai dovessero passare anni prima di poter tornare a fare un giro in bicicletta. Automatizzare un comportamento significa: Pratica. Ripetere lo stesso gesto tante, infinite volte. I comportamenti che possediamo automatici hanno avuto questo tirocinio. Sono cose che abbiamo fatto e ripetuto perché ci piacevano erano divertenti o stimolanti. In una parola: Rinforzanti.

4-   CREATIVITA’

Tornando ai nostri Maestri, i grandi artisti del Rinascimento, sono diventati tali grazie all’educazione ricevuta, combinata con doti naturali[3]. Il tirocinio a bottega ha consentito a Leonardo, Raffaello e Michelangelo di imparare con maestria tutto quello che era possibile imparare, dal preparare i colori a reggere pennello o scalpello, dal disegnare al preparare tele, intonaci e marmi. Liberate dal dover controllare questi aspetti della loro arte le risorse cognitive si sono potute esprimere creando -creativamente- opere meravigliose. Senza tirocinio, senza pratica, senza maestria non avremmo nemmeno la Gioconda, La Pietà o la Venere d’Urbino. Al contrario di essere un modo vuoto ed poco creativo di possedere delle competenze l’automatismo dei comportamenti ci permette di creare, con inventiva ed ingegno cose nuove.

la fornarina

La Fornarina di Raffaello

E noi? Automatizzare significa diventare plastici e creativi. Saper fare una cosa sempre presto e bene, in maniera, appunto, automatica permette di liberare le risorse per esprimere le nostre potenzialità cognitive più elevate. Dobbiamo sforzarci di trovare tecniche e metodologie che consentano ad insegnanti ed allievi di poter praticare gesti, azioni e comportamenti. Per ottenere questo la pratica necessaria deve essere necessariamente rinforzante. Deve fornire feedback positivi e tempestivi e deve permettere costantemente all’allievo di vedere i progressi che ha fatto. Solo in questo modo ci piacerà fare, studiare, imparae; solo così potremo, tutti, diventare dei grandi Maestri.

clickers in cerchio


[1]  Il paragone informatico si fa ancora più preciso se pensiamo che tutti i computer da quelli primitivi a quelli moderni  possiedono al loro interno dei sistemi che li fanno funzionare (l’equivalente biologico di “tenere in vita”) la cui attività è nascosta ed invisibile: esattamente quello che accade nei nostri cervelli.

[2] A questo proposito Ted DesMasions ha scritto un interessante post, che potete trovare qui, nella versione in Inglese, o qui nella mia traduzione in Italiano (lettura raccomandata!)

[3] Io credo, ma è una mia personale opinione (e forse sbagliata) che “doti naturali” non fossero la predisposizione al disegno e pittura piuttosto che alla scultura dei Maestri, ma piuttosto il fatto che “Arte” per loro era la cosa più rinforzante della  vita. Una passione talmente profonda, radicata e rinforzante da plasmare l’intera vita dei vari Michelangelo, Leonardo e Raffaello. Chissà, magari è bastato un particolare complimento fatto dalla sua mamma al bambino Raffaello per un primo scarabocchio…

NOTATE LA DIFFERENZA?

Pubblicato: novembre 27, 2012 in Insegnare
Tag:,

Trovate le differenze…

Io e Ted DesMasions siamo in sintonia. Anche se viviamo a più di 5000 km di distanza. Io ho scritto un primo post sulla punizione e lui un paio di giorni dopo ne ha proposto un secondo sullo stesso argomento. Io leggo il secondo post e mi viene l’idea per quello che sto per condividere con voi.

Ted fa questo esempio: lui allena una squadra di softball e fa un esercizio per cui se una coppia di giocatrici non esegue con il dovuto impegno l’intera sequenza di lancio e presa viene rimandata, di corsa, in fondo alla fila. Se la coppia non torna indietro di corsa, tutta la squadra si fa uno sprint lungo il campo (più o meno… non sono un esperto di softball, comunque avete l’idea). La domanda che Ted si pone e rivolge anche a noi lettori è la seguente: sto punendo le ragazze? La punizione avviene dopo il comportamento indesiderato (fare male l’esercizio) e dovrebbe ridurre la frequenza del medesimo comportamento. E quindi questo è il caso giusto? La domanda che io pongo a voi è, invece, questa: ma se fare le corse per il campo aumenta la frequenza delle corrette esecuzioni dell’esercizio? Cosa diventano gli sprint in questo caso? Tecnicamente dei rinforzi negativi per il comportamento desiderato. Giusto?

Cominciamo ad essere confusi[1]? Rinforzare una cosa, significa, necessariamente punirne un’altra, o per lo meno, rinforzare negativamente un’altra. Facciamo l’esempio del Clicker Training. Mentre sto marcando e rinforzando con il cibo un determinato comportamento sto, allo stesso tempo, punendo/rinforzando negativamente tutto il resto. Un comportamento aumenta di frequenza (e questa è parte della definizione di rinforzo) e tutto il resto diminuisce di frequenza (definizione, questa volta, di punizione). Un primo chiarimento potrebbe venirci dalla teoria scientifica:

1-   il rinforzo avviene in contingenza al comportamento; la punizione no (picchio il cane che ha fatto la pipì sul tappeto).

2-   il rinforzo negativo può essere evitato modificando il proprio comportamento; la punizione no (tiro la redine e, in risposta il cavallo gira la testa. Mentre il cane non ha niente da modificare intanto che viene picchiato perché ha GIA’ fatto la pipì).

Quando decido che Akira, il mio border collie, è pronto per imparare un nuovo criterio, il cane ovviamente proverà per qualche volta a farmi fare “Click!” attraverso il vecchio criterio. Il mio ignorare i comportamenti del cane trattenendo il “Click!” è, di fatto, un punizione (do qualcosa che il cane non vuole –trattengo il cibo- per diminuire la frequenza di un comportamento –nello specifico tutti quelli che non corrispondono al mio criterio).

Sto un pochino giocando sul filo dell’assurdo, lo so perfettamente che il Clicker è –OVVIAMENTE- diverso da un bastone.

Secondo me, anche se non spesso ricordato dai testi, l’unico vero metro per distinguere punizione da rinforzo consiste nel ruolo del ricevente e nella tempistica.

1- L’intervento “del maestro” può essere evitato dal ricevente? Rinforzo.[2]

2- L’intervento “del maestro” non può essere evitato dal ricevente ? Punizione.

Se l’intervento è contemporaneo sul comportamento parliamo ancora di rinforzo, viceversa siamo nel campo della punizione[3].

Prima di andare avanti consideriamo ancora questo: quando picchio il cane per aver fatto la pipì, o il ragazzo per essere tornato a casa tardi, cosa sto, ESATTAMENTE, punendo? Il comportamento o chi l’ha fatto? Sto punendo la pipì e il ritardo o il cane e il ragazzo? Insomma: stiamo insegnando o ci stiamo semplicemente vendicando? Prima di intervenire, in qualsiasi situazione in cui qualcosa è già successo, chiediamoci se il nostro intervento cambierà in meglio la situazione: se la risposta  è sì, possiamo procedere, altrimenti meglio pensare a qualcos’altro[4]. Quest’idea non è mia, ma del Dott. G. Lathman[5]. La maggior parte delle volte le nostre “punizioni” sono rivolte contro chi ci ha fatto il torto. Non si tratta più d’insegnamento, ma di vendetta o sfogo della nostra frustrazione. Fermandoci un’attimo ad analizzare la situazione ci possiamo rendere conto dove mira il nostro intervento e modificarlo di conseguenza.

Allora Ted, con le sue ragazze cosa sta facendo? Sta punendo dei comportamenti o ne sta rinforzando degli altri? Si sta vendicando di qualche “torto” subito?

Le atlete stanno facendo allenamento. Se potessimo definire l’allenamento come “macro-comportamento”, potremmo dire che Ted stia rinforzando più o meno negativamente le ragazze. Gli interventi di Ted sono contingenti sul comportamento (che è l’allenamento nella sua interezza), ma possono anche essere evitati dalle ragazze (basta che s’impegnino nel prossimo turno). Conoscendo Ted posso anche affermare che il suo intento è quello di rinforzare il comportamento corretto e non punire il resto. E in questi casi anche le intenzioni contano. Molto.

La differenza, vera, sta alla fine nella qualità dell’informazione che comunichiamo ai nostri allievi. Più l’ambiente è positivo (Clicker Training, TAGteach per quanto mi riguarda) più l’informazione sarà facile, disponibile e condivisa. Essa sarà meno pesante dal punto di vista del carico emotivo, meno sbilanciante l’equilibrio del ricevente. Man mano che ci spostiamo e ci avviciniamo alla sponda della coercizione la qualità dell’informazione si deteriora, diventa difficile, molto pesante ed estremamente sbilanciante. Solo persone particolarmente “dotate” e dallo stomaco di ferro, riescono ad insegnare in queste condizioni. Ci vuole una enorme perizia per riuscire a comunicare solo dicendo “No”. E’ molto più facile creare confusione e paura che apprendimento.

Volete la prova? Fate questo gioco con qualcuno. Potete anche essere in gruppo ma va bene anche se siete solo in due. Chi verrà addestrato esce dalla stanza. Il gruppo decide cosa fargli fare al suo rientro (cose facili per carità: prendere un libro, sedersi su una sedia). Al rientro l’educatore potrà guidare il suo allievo solo dicendo “Sì” (o con un clicker se ce l’avete sottomano marcando ogni comportamento nella direzione corretta). Poi invertite i ruoli. Fate uscire il maestro, decidete un nuovo comportamento e guidatelo, questa volta, solo con il “No!” (per cui bloccate ogni cosa sbagliata che fa). Cambia qualcosa tra le due procedure?

Mettetevi nei panni dell’allievo e provate a farvi guidare in tutti e due i modi: notate la differenza?


[1] Ricorderò sempre con piacere la confusione che ho avuto in mente dopo la conferenza del Prof. Rosalez Ruiz alla Clicher Expo 2012. Conferenza su argomenti simili a questi qui trattati dove, con maestria, il professore ci ha –quasi- portato a non sapere più distinguere tra rinforzo e punizione.

[2] Con “maestro” indico chi o cosa sta intervenendo sul ricevente.

[3] Domanda: se piove e io ho l’ombrello la concomitanza tra pioggia e presenza dell’ombrello rinforza il mio “avere l’ombrello con me”.  E se non piove? Il mio portare l’ombrello viene punito dall’assenza di pioggia (non è che posso far piovere a comando, quindi ..). A meno che, visto il sole, decido di tornare in casa e mollare l’ombrello. Il sole rinforza negativamente il mio “avere” l’ombrello. A questo punto tra punizione e rinforzo la misura sta nella convenienza: meglio perdere 3 minuti e rientrare in casa o, portarmi dietro tutto il giorno l’ombrello? Se la prossima volta, con il sole, non userò l’ombrello significa che il portare fuori l’ombrello con il sole del giorno precedente,   è stato rinforzato negativamente (la presenza concomitante di sole e ombrello non mi piace e rinforza il mio lasciare a casa l’ombrello l’indomani). Bella confusione vero?

[4] Picchiare il cane migliora la situazione del mio tappeto? Direi di no. Forse il cane è stato troppo tempo solo in casa, forse ha un piccolo problema alla vescica o forse l’ho portato fuori troppo presto questa mattina…

[5]Unless what you are about to say or do has a high probability for making things better, don’t say it and don’t do it”. Lathman: “The power of Positive Parenting”

L’INSOSTENIBILE INCERTEZZA…

Pubblicato: novembre 20, 2012 in Comportamento, Insegnare

Qualche giorno fa ero a spasso con i cani. Quando sono per campi con loro i piedi vanno lungo il sentiero e la testa parte per altri viaggi. Per cui penso molto e “mastico”. Intendiamoci, non è che ci siano sempre grandi e profondi pensieri, anzi. Quasi sempre siamo sul generico-banale, ma qualche volta ho qualche sprazzo degno di nota.

Qualche giorno fa, ho avuto uno di questi pensieri, che ho deciso di condividere con voi. Da quando mi occupo d’educazione ed insegnamento mi ha sempre dato un po’ fastidio quello che recitano i testi scientifici, quando definiscono punizione e rinforzo[1]. Fatto salvo che la definizione di rinforzo mi piace (è: “un evento che aumenta la frequenza di un certo comportamento”) la definizione di punizione proprio non mi va giù: “è un evento che diminuisce la probabilità che un comportamento si ripresenti”. “la probabilità” mi dava fastidio, lasciando il dubbio che qualche volta in qualche modo potesse funzionare. Come a voler lasciare uno spiraglio di porta aperta, quasi un invito o una giustificazione. “Guarda, se vuoi provare … potrebbe anche funzionare”.

Parentesi. Ho la prova che la punizione non funziona. Mai. Un mese fa ho vissuto un’esperienza “pesante”. Ho fatto supplenza per due settimane alle scuole medie. Con i più grandi ho ceduto alla tentazione, a quel spiraglio che “diminuisce la probabilità”: ho messo un paio di note. Ovviamente i ragazzi hanno tranquillamente continuato a fare quello che facevano, per cui io mi sono trovato senza più armi con le quali poter esercitare un minimo di pressione. Quando hai sparato la bomba più grossa che hai a disposizione, o hai vinto la guerra o l’hai persa. Io l’ho persa, e il senso d’impotenza che questa sconfitta mi ha dato ha pesato per parecchi giorni sul mio umore.

Qualche giorno fa ho realizzato che quello che qualche volta potrebbe funzionare nella punizione (da qui il “diminuisce la probabilità…”), non è l’evento in sé, ma l’effetto che lascia in seguito.

Mi spiego.

Quando prendiamo una multa per eccesso di velocità, veniamo puniti per aver superato il limite. Quello che ci fa andare piano, dopo, non è la multa in sé per sé, ma è il ricordo della multa che rinforza negativamente il nostro andare piano (rinforzo negativo = dare qualcosa che non piace per aumentare la probabilità di un comportamento). Ovvero fintanto che ho in mente il ricordo della multa rispetterò i limiti. Appena la memoria comincia ad allentare la sua presa, e il mio correre per le strade si rinforza giorno dopo giorno, visto che, almeno statisticamente, non incontreremo per un po’ altre pattuglie di vigili, la punizione cessa ogni effetto. In pratica non ho imparato.

Non lo so, ma il mio sospetto è questo: che gli effetti “collaterali” che tutti conosciamo, derivati dall’uso della punizione (ansia, stress, problemi di comportamento etc etc) derivino da questo effetto onda durante il quale la punizione, pur non più presente, continua ad esercitare la sua influenza e il soggetto è combattuto tra il  desiderio di fare qualcosa, e il ricordo della punizione stessa. Il problema potrebbe essere che il Rinforzo negativo è solo un’immagine mentale, mentre il correre è un vero rinforzo tangibilmente presente nel mio “qui ed ora”? Chiarisco. Un conto è usare il Rinforzo negativo per aumentare la frequenza di un comportamento, tipo tiro la redine e il cavallo gira la testa. Ma in questo caso esiste contingenza tra le due azioni fisiche “tirare” e “girare”. C’è, di fatto, passaggio d’informazione diretto. In ogni istante il cavallo può decidere di girare la testa e far cessare il tirare. Il soggetto ricevente ha un ruolo attivo[2].

Nel caso della punizione il ricevente non ha nessun ruolo attivo. Chi subisce la punizione non può far nulla per evitarla. La multa a differenza delle redine non mi da null’altro da fare che… pagare. L’effetto successivo consiste nel fatto che io ricordandomi della multa, rallento per un po’ il mio correre. Nel caso della punizione, non c’è nessun passaggio, e io sono da solo a combattere tra l’andare spedito (rinforzo positivo) e il rischio di prendere una seconda multa (rinforzo negativo). La concomitante presenza dei due tipi di rinforzi genera confusione, stress e incertezza. Dal mio punto di vista, l’incertezza, ovvero la mancanza di chiare informazioni è la cosa peggiore che possa capitare a qualcuno che sta –o deve- imparare qualcosa. In presenza di uno stimolo, imparare a gestirlo è una assoluta priorità.

Tornando, per un attimo, alla mia esperienza a scuola, questa mancanza d’informazioni nella punizione diventa ancora più palese. Una volta ricevuta la nota per i ragazzi la vita non è cambiata di una virgola: la mia azione coercitiva, in ritardo sul comportamento aveva da tempo perso la sua efficacia nel momento in cui non lasciava più nessun “Rinforzo negativo fantasma” a regolare le azioni dei ragazzi. In altre parole: se al ricevente la punizione, la punizione stessa, non fa paura non c’è più spazio per nessun tipo di modifica del comportamento[3].

Batteri: anche loro devono imparare…

Sono un sostenitore del concetto di omeostasi, come teorizzato da Antonio Damasio. L’omeostasi altro non è che l’equilibrio ideale (ideale, perché mai raggiungibile) cui tendono tutte le funzioni e le regolazioni corporee: livelli di glucosio, temperatura esterna ed interna, ossigenazione del sangue, battito cardiaco etc etc. Ad ogni stimolo, esterno od interno che raggiunge ed interessa il nostro corpo, i nostri meccanismi di regolazione lavorano affinchè i parametri dell’omeostasi rimangano all’interno dei limiti nei quali la vita è ancora possibile. Allargando questo concetto, anche i meccanismi  celebrali, finalizzati all’apprendimento rientrano all’interno egli strumenti a disposizione del corpo[4] per gestire la propria omeostasi. Quando uno stimolo esterno sbilancia la mia omeostasi (per esempio un commensale che a tavola mi chiede di passargli il sale[5]), il mio corpo cerca di recuperare l’equilibrio utilizzando le strategie opportune (passando il sale per esempio). In questo processo di sbilanciamento io ho avuto l’opportunità di rispondere con un’azione precisa e, quindi, d’imparare.

Imparare è un must evolutivo: più imparo, più posso gestire l’ambiente e e aumentare le probabilità di passare il mio patrimonio genetico. In natura la punizione non esiste, tutti i comportamenti anche i più coercitivi sono espressioni di Rinforzo negativo.

L’uso della punizione non consente d’imparare e, a uno stimolo che sbilancia il mio equilibrio, io non ho nessuna possibilità di risposta: di fatto sono impotente. Da qui tutti gli effetti deleteri che dall’uso della punizione derivano. Un’alternativa alle multe? Eccola qua: http://www.youtube.com/watch?v=iynzHWwJXaA

Il divertimento può cambiare –davvero- il comportamento!


[1] La mia opinione su Rinforzo e Punizione sono descritte nel post “Insegnare”

[2] Non che io sia un fan del rinforzo negativo usato come esclusivo mezzo d’educazione o addestramento. Lo so che il rinforzo positivo mi permette di ottenere risultati migliori, più veloci e più duraturi. Ciò detto, correttamente applicato il rinforzo negativo può essere un efficace aiuto al rinforzo positivo, come dimostra brillantemente, ad esempio il lavoro di Alexandra Kurland (http://www.theclickercenter.com/ se foste interessati a un’approfondimento)

[3] Karen Pryor in “Don’t shoot the dog!” scrive che esiste solo un tipo di punizione che, assolutamente e scientificamante, funziona: l’estinzione. Per esempio l’estinzione (uccisione o   abbandono) del cane che abbaia di notte risolve sicuramente il problema dell’abbaio.

[4] Uso la parola “corpo” come indicante l’unità tra mente, meccanismi di  regolazione interni e corpo fisico.

[5] Ho impiegato ancora l’esempio “del passare il sale” nel post: “Insegnare” che contiene concetti complementari a questi. Per cui, se desiderate approfondire…

All our lives long, we are constantly learning and teaching. As soon as we interact with other individuals (both people or animals) we are going to change their and our behaviors: that’s the true meaning of the word “teaching”. We accomplish this by unbalancing our party through the stimuli that we present in order to get the desired behavior. We don’t realize it, but our activities are a continuous, single and life long lasting process of teaching and learning.  I Can use different methods and techniques to achieve this result: from the most kind and compassionate to the most coercive and negative. When I started my own experience as Clicker Trainer I was taught that we can choose from four different types of tools:

R + (Positive Reinforcement): the delivering of  something desiderable to  increases the emission of a given behavior. The dog sits, the dog receives food.

R-(Negative Reinforcement): the delivering of something that the subject does not want –aversive- increases the frequency of a given behavior. Kick the horse’s flanks to make it move (of course I should stop when I get what I want).

P + (Positive Punishment): the delivering of something that the subject does not want with the intent to decrease the frequency emission of a given behavior. Beat the dog because he peed the carpet.

P- (Negative Punishment): take away something that the subject wishes to decrease the frequency of emission of a given behavior. Tonight Sam will not watch the TV because he went home lately after school.

A reinforcer is an event that occurs during the behavior; the subject performing the behavior may or may not receive or avoid changing its own behavior. If the horse takes a step he is no longer kicked. The choice is up to the subject: he/she is the one who decides to operate his/her behavior according to its consequences (hence the definition “operant conditioning”). Punishment, on the other side, takes place after the behavior and the subject cannot avoid it, but only endure. Sam can only not watch TV tonight, and the dog cannot help but be beaten because the carpet is wet. I’m not dividing between more or less coercive behaviors. A lady told me tonight thats he slapped lightly her dog because he flew away. I’m sure the slap was really light, but it was still a punishment. In this case, even a simple “bad dog!” would be labeled as punishment.

My opinion is this: since it happens after the behavior, and has no educational significance to the recipient (the dog has learned not to pee?) we can get rid of punishment from our choice of useful tools for teaching. Let’s leave the punishment to the role -sometimes legitimate, as in the case of the lady- vent of our frustration for not being able to change the behavior of the subject according to our wishes. A this point are left with R + and R-. We could then assume the learning process, not as a cross divided between reinforcements and punishments as described,  but as a flowing continuum. In the middle we have our students with  R + and R – to the sides. Task of us teachers is to keep as much as possible our student in the central zone that is where  optimal learning happens, correcting the course through the two reinforcements. We must be cautious in the use of reinforcements since their misuse can unbalance the behavior of our student and keep it away from our area of ​​learning.

 “Could you pass me the salt?” is a stimulus that unbalances the balance of the person we are addressing to. As  easiest way to get her balance back he/she has to performe the required behavior: to pass the salt. Our “thank you” works as reinforcement (happens during the behavior) and indicates that we got what we wanted. The person who has passed the salt understands that you are satisfied, regaining in this way his/her balance. In this example, our request (our teaching) has minimally skewed balance (probably the person to whom we turned to will not even raise his head from the dish) and everything went smoothly.

My parents went on holiday in Poland. Of course, they do not speak Polish and, of course, they had some difficulties with the language. A simple ” Podaj mi sól, proszę?” is a demand (we can call it stimulus) rather unbalancing: when we do not understand a request we employ all our resources to try to understand and this is pretty overbalancing. If this situation should last for a long period there might be serious consequences. When we can no longer rely on the language, we find ourselves in the same condition in which we are when we work with animals.

 Imagine being invited to dinner in Poland.  A diner asks you, “Podaj Mi Sol, prosze?” You try to understand what you are asked and you move a little, nervous, in the chair. The diner gets angry and slams his fists yells at you “Podaj Mi Sol, prosze?”. You’re in panic! What the hell do he wants from you? Why he’s getting angry? You try to stand up and he gets angry even more, he threatens you, screams etc etc. You try something, there’s some water on the table. you pass the water and hew completely freaks out: he grabs you by the shoulders, shaking and yelling his: ” Podaj Mi Sol, prosze?”. Somehow you understand that the diner’s behavior has something to do with the table … but you are out of your spirits, frustrated and angry. You get out coarsing to the diner and slamming the door. In the meanwhile the diner turnes to other guests saying, “osoba leniwa the nieinteligentny …”

What happened? Simply that the stimulus that you faced  with was too unbalancing and you have decided to quit. Wouldn’t it be better if your diner should have shaped your behavior instead of screaming’? Using  kind words and affably signaling and marking your progress toward what he wanted and keeping silent about your not successfully attempts. Relax and calm you would understand what he wanted and you would have learned your first words in the new language.

As you can see the first situation is a metaphor for teaching coercive, based on punishment and negative reinforcement, the second is a positive teaching based on positive reinforcement. Where were you better? Where do you think your son, your coworker or your dog would do better? As long as we can keep our learnes inside the understanding zone we are provide them with the perfect environment for a safe learning, and this will make us great teachers.

THANKS TO:

The concepts of “understanding zone” and teaching as a flowing continuum are gift from Les Kiger. Yu can find Les’s  thoughts here: http://equuality.com/blog/

The idea that we, as teachers, are deliberately unbalancing our students is a gift from Ted DesMaisons. Ted share his thoughts here: http://tedwordsblog.com/

Impariamo ed insegniamo costantemente nella nostra vita: nel momento in cui interagiamo con altri individui (persone od animali) andiamo a modificare il loro e nostro comportamento. In questo consiste, secondo la mia opinione, il vero significato della parola “insegnare”. Facciamo questo  sbilanciando l’equilibrio psicofisico del nostro interlocutore con gli stimoli che gli presentiamo allo scopo di ottenere il comportamento desiderato. Non ce ne rendiamo conto ma la nostra vita è un continuo, unico che dura tutta la vita insegnare ed imparare. Posso usare diversi metodi e tecniche per ottenere questo: dalle più gentili e compassionevoli alle più brutali e negative. Quando ho iniziato il mio percorso mi è stato insegnato che esistono 4 tipologie di strumenti:
R+ (Rinforzo Positivo): do qualcosa che il soggetto desidera e aumenta -di conseguenza- l’emissione di un comportamento. Il cane si siede, il cane riceve cibo.
R- (Rinforzo Negativo): do qualcosa che il soggetto non desidera o trova avversivo aumentando la frequenza di emissione di un comportamento. Calcio con i piedi i fianchi del cavallo per farlo muovere (ovviamente smetto quando ottengo quello che desidero).
P+ (Punizione positiva): do qualcosa che il soggetto non desidera per diminuire la frequenza di emissione di un comportamento. Picchio il cane perchè ha fatto la pipì sul tappeto;.
P- (Punizione negativa): tolgo qualcosa che il soggetto desidera per diminuire la frequenza di emissione di un comportamento. Stasera Luigino non vede la Tv perché è tornato a casa tardi da scuola.
Un rinforzo è un evento che avviene sul comportamento che il soggetto può o meno ricevere o evitare modificando il suo comportamento. Il cavallo si muove e non viene più calciato. La scelta è del soggetto: è lui che opera, modificando il proprio comportamento in base alle sue conseguenze (da qui, condizionamento operante) La punizione al contrario, avviene dopo il comportamento e il soggetto non la può evitare, ma solo subire. Luigino non può far altro che non vedere la TV questa sera e il cane non può far altro che ricevere le botte perché il tappeto è bagnato. Attenzione non sto dividendo tra comportamenti pù o meno coercitivi. Una signora, stasera mi ha detto di aver dato una pacca leggera sul sedere del cane perché era scappato. Sono sicuro che la pacca fosse leggera, ma era comunque una punizione. In questo caso anche un semplice “brutto cane!” sarebbe equivalso a una punizione.
La mia opinione è questa: dal momento che avviene dopo il comportamento e che di fatto non ha significato educativo per chi la riceve  (il cane ha imparato a non abbaiare?) possiamo eliminare la punizione dalla nostra serie di strumenti utili per insegnare. Releghiamola al ruolo di –talvolta legittimo, come nel caso della signora- sfogo della nostra frustrazione per non essere riusciti a modificare il comportamento del soggetto secondo i nostri desideri. A questo punto rimangono R+ e R-. Potremmo allora ipotizzare il processo di apprendimento non più come una croce fatta da Rinforzi e Punizioni come abbiamo visto all’inizio ma come un continuum con in mezzo il nostro allievo e ai lati R+ e R-. Compito di noi insegnanti è quello di mantenere il più possibile il nostro allievo nella zona centrale che rappresenta l’apprendimento ottimale, correggendo la rotta attraverso i due Rinforzi. Dobbiamo essere cauti nell’uso dei rinforzi in quanto il loro uso scorretto può sbilanciare il comportamento del nostro allievo ed allontanarlo dalla nostra zona d’apprendimento.

“Mi passi il sale?” è uno stimolo che sbilancia l’equilibrio della persona cui ci rivolgiamo che ha come mezzo più semplice per recuperarlo il compiere il comportamento richiesto, passare il sale appunto. il nostro “grazie” funziona come rinforzo (avviene sul comportamento richiesto) e segnala che abbiamo ottenuto quello che volevamo. La persona che ci ha passato il sale capisce di conseguenza di aver eseguito quanto le stavamo chiedendo riguadagnando il proprio equilibrio. In questo caso la nostra richiesta (il nostro insegnamento) ha minimamente sbilanciato l’equilibrio (probabilmente la persona cui ci siamo rivolti non avrà nemmeno alzato la testa dal piatto) e tutto è filato liscio.
I miei genitori sono stati in vacanza in Polonia. Ovviamente non parlano polacco e altrettanto ovviamente hanno avuto qualche difficoltà con la lingua. Un semplice “Podaj mi sól, proszę?” costituisce una richiesta -uno stimolo- piuttosto sbilanciante: nel momento in cui non si capisce una richiesta impieghiamo tutte le nostre risorse per cercare di capire e questo sbilancia di molto il nostro equilibrio; se questa situazione durasse a lungo ci potrebbero essere delle conseguenze pesanti. Nel momento in cui non possiamo più fare affidamento sul linguaggio, ci ritroviamo nelle stesse condizioni in cui stiamo quando lavoriamo con gli animali.

Immaginatevi di essere in Polonia invitati a cena (no, non ce l’ho con il polacco nè, tantomeno con i polacchi. E’ solo un esempio.) Un commensale vi chiede: “Podaj mi sól, proszę?” Cercate di capire cosa vi viene chiesto e vi muovete un pochino, nervosi, sulla sedia. Il commensale si arrabbia sbatte i pugni e vi richiede -urlando-: “Podaj mi sól, proszę?”. Panico cosa vuole questo? perché s’arrabbia? provate ad alzarvi in piedi e quello s’arrabbia ancora di più, vi minaccia, urla etc etc. Provate a passargli l’acqua e quello da completamente di matto: vi afferra per le spalle, vi sbattacchia urlando il suo: ” “Podaj mi sól, proszę?”. In qualche modo capite che il comportamento dell’altro ha a che fare con qualcosa che c’è sulla tavola…ma siete stressati, frustrati e arrabbiati. Non ce la fate più: alla fine mandate a quel paese il commensale e ve ne andate sbattendo la porta e imprecando. Il commensale intanto si è rivolto agli altri ospiti dicendo: “osoba leniwa i nieinteligentny …” Cos’è successo? Semplicemente che lo stimolo che vi è arrivato vi ha sbilanciato troppo e voi avete deciso di chiudere lo scambio uscendo. Meglio se il vostro commensale anziché urlare avesse modellato il vostro comportamento con parole gentili segnalando e marcando affabilmente i vostri progressi verso quanto desiderava e tacendo sui vostri tentativi non a buon fine. Rilassati e tranquilli avreste capito cosa voleva e avreste imparato le prime parole nella nuova lingua.
Come avrete capito la prima situazione è una metafora di un insegnamento coercitivo, basato sulla punizione e il rinforzo negativo, il secondo è un insegnamento positivo basato sul rinforzo positivo. Dove siete stati meglio? Dove pensate vostro figlio, il vostro collega o il vostro cane stia meglio? Finché riusciamo a mantenere il nostro allievo all’interno della zona di comprensione gli avremmo assicurato la possibilità d’apprendere in un ambiente sicuro, facendo di noi dei grandi insegnanti.

RINGRAZIAMENTI.
Il concetto dell’insegnamento come uno scorrevole continuum e della zona di comprensione “understanding zone” sono regali di Les Kiger. Per apprezzare il pensiero di Les e godere dei suoi post, questo è il link al suo Blog: http://equuality.com/blog/
L’idea che siamo noi insegnanti a sbilanciare volutamente i nostri interlocutori è un altro, grande regalo, questa volta di Ted DesMaisons. Questo è il suo Blog dove conoscere il suo pensiero: http://tedwordsblog.com/