Apprendimento del cane per prove ed errori
Già teorizzato da Thorndike e Skinner
L’apprendimento per prove ed errori è il processo principale tramite cui gli animali acquisiscono nuovi comportamenti complessi.
Questo processo, studiato da Thorndike (1874-1949), si basa su una serie di tentativi casuali svolti per risolvere una situazione.
I tentativi che portano a un successo tendono a essere ripetuti mentre quelli fallimentari vengono gradualmente scartati.
In questo modo l’animale impara a specializzarsi in determinate situazioni, andando a mettere in atto comportamenti sempre più funzionali e specifici.
Skinner (1904-1990) ampliando gli studi di Pavlov sul condizionamento classico e prendendo spunto dal lavoro di Thorndike, studiò come rinforzi e punizioni potessero portare a scegliere determinati comportamenti invece di altri.
Gran parte dell’addestramento si basa proprio su quanto studiato da Skinner.
Nello specifico ci sono due momenti fondamentali per il processo di apprendimento e di discriminazione.
In ordine temporale, quando insegniamo qualcosa a un cane interveniamo inizialmente a livello muscolare, tralasciando il ragionamento.
Per esempio usiamo del cibo e grazie ad esso muoviamo il corpo del cane per posizionarlo.
In questa fase il cane viene sempre premiato, e vengono evitati (nella maggior parte dei casi) gli errori poiché siamo noi a “gestire” il corpo del cane.
Successivamente, quando il cane sa rispondere muscolarmente a un nostro gesto, inseriamo il comando e riduciamo gradualmente i movimenti.
Durante questa fase il cane tenterà di svolgere l’attività richiesta, associando la parola ascoltata al movimento che successivamente noi di solito gli indichiamo.
Quando la nostra indicazione non è più presente, se l’esercizio è stato ripetuto un numero adeguato di volte, il cane continua a ripetere il comportamento che noi gli abbiamo fatto eseguire precedentemente con il cibo.
A questo punto il cane sa, per esempio, che se dopo aver sentito il comando “seduto” lui si siede, ottiene una ricompensa.
Tuttavia non ha ancora appreso il significato di “seduto”.
Infatti il cane sa che “seduto” significa sedersi, ma non sa ancora che non significa stare in piedi o alzarsi e camminare. Il momento in cui questo viene appreso coincide con la possibilità di sbagliare e la comparsa della punizione, grazie alla quale il cane impara a discriminare i comportamenti.
Durante la prima fase di apprendimento la punizione messa in atto è una “punizione negativa”, ovvero viene sottratto qualcosa di piacevole.
Nel nostro caso il qualcosa di positivo è il premio alimentare che noi abbiamo in mano.
Il cane sa che questo premio è presente, e tenta quindi di eseguire correttamente quanto richiesto per potervi accedere.
Nel momento in cui il cane non svolge correttamente l’esercizio, il premio gli viene negato.
Il cane viene poi aiutato a compiere l’esercizio e a quel punto ha accesso al premio. Con questa serie di azioni il cane impara a discriminare determinati comportamenti, cominciando a escludere tutti quelli che non portano al premio, e ripresentando l’unico che porta a un successo. In questo modo impara che seduto significa esclusivamente mettersi in una sola posizione, perchè qualunque altro comportamento non gli permette di ottenere una ricompensa.
Utilizzando la punizione negativa, cioè togliendo qualcosa che il cane desidera quando sbaglia, gli permettiamo di riprovare a eseguire l’esercizio senza il timore che gli venga inflitta una punizione, motivandolo tramite la presenza di un premio che vuole raggiungere.
Durante questa fase il cane non deve essere punito in modo diretto perché non sa che il comando che gli chiediamo esclude tutti gli altri comportamenti, quindi non avrebbe senso punirlo per qualcosa che ancora non conosce.
Vedendosi negato il premio tuttavia ridurrà la comparsa del comportamento sbagliato. Si tratta sempre di una punizione, ma è una punizione che permette al cane di rimanere propositivo, continuare a provare e non temere di sbagliare.
Nel momento in cui questo processo si conclude e il cane sa che “seduto” significa solo una cosa ed esclude tutte le altre azioni, se il cane decidesse volontariamente di mettere in atto un altro comportamento ignorando quello che abbiamo chiesto, sarebbe eventualmente possibile intervenire con una punizione positiva, cioè aggiungendo qualcosa di spiacevole (commisurata al cane che si ha di fronte e non inflitta in modo violento).
Questo ulteriore passaggio fa sì che non solo il cane apprenda che un comando deve portare a una sola azione, escludendo tutte le altre, ma che deve anche essere esclusa la scelta volontaria di fare altro, se è stata richiesta l’esecuzione di un comando.
Sbagliare e poter sbagliare è importante
L’importanza di permettere al cane di sbagliare è quindi fondamentale perché proprio tramite l’errore può discriminare le azioni che invece portano al premio.
La premura di chi lavora con il cane dovrà essere quella di permettere al cane di compiere un errore perché capisca che in quel modo non può accedere al premio (con una conseguente riduzione dei comportamenti non richiesti) ma facendo in modo che non faccia esperienza relativamente alle azioni scorrette.
Cioè, se si chiede al cane di sedersi e lui si alza e corre via andando ad annusare altrove, la negazione del premio non avrà effetto perché l’azione di annusare è autogratificante.
Di conseguenza questo tipo di esperienza porterebbe il cane a non collegare la scorretta esecuzione dell’esercizio a un mancato premio.
Anzi, lo invoglierebbe a disobbedire.
Sarà dunque necessario permettere al cane di compiere errori, per esempio non sedersi, ma impedirgli di compiere azioni potenzialmente gratificanti. Questo è facilmente attuabile lavorando con il cane al guinzaglio.