Jackpot

Est-ce une bonne chose? Une mauvaise chose? Existe-t-il?

Je vous explique ce que je veux dire par le mot « jackpot ». C’est exactement la même chose que dans les casinos : un renforcement étonnamment énorme qui arrive de façon conditionnelle. Et là, le mot « conditionnelle » est primordial. Pour renforcer un comportement précis, le jackpot doit arriver et être aperçu par l’apprenti pendant qu’il est en train d’exécuter l’exercice qu’on souhaite voir. Pas après !

Si tu click et puis tu donnes une friandise bien après, même si c’est une énorme friandise d’un goût exceptionnel, l’effet au niveau du renforcement du comportement souhaité sera identique à n’importe quelle friandise. Les bonnes friandises, les grandes friandises peuvent rendre le travail au clicker encore plus intéressant, mais ça ne renforce pas un comportement spécifiquement. C’est le « click » qui fait le travail dans ce cas. Les friandises qui sont grandes et apétantes peuvent rendre l’élève plus enthousiaste par rapport aux entrainements et à l’apprentissage en général, mais elles ne sont pas informatives. L’association est « Pavlovienne » : le « click » signifie l’arrivée de la friandise. Si la friandise est quelques fois une croquette et une autre fois du poulet, quelques fois en petite quantité et d’autres en grande, c’est parfait, le clicker reste efficace, mais ça ne donne aucune information à l’animal par rapport à son comportement. Donc ce n’est pas ce que j’appelle « jackpot ».

Des gens pensent que le jackpot est une récompense exceptionnellement grande. Un participant au concoures d’obéissance m’a dit un jour : « J’utilise des jackpots : nous faisons le travail sur le terrain pendant le concours, puis quand je mets mon chien dans sa cage, il y trouve 6-8 friandises qu’il adore, et il sait qu’elles sont là. » … Oui, peut-être le sait il, ou peut-être ne le sait il pas. Il est difficile de dire ce que les chiens savent. Et que pensez vous que ces friandises renforcent ? Le travail sur le terrain ? Je dirai plutôt le fait de rentrer dans la cage. Ce n’est pas un jackpot ! C’est juste une friandise d’une taille exceptionnelle associée avec rien en particulier. Très bien, mais…

La propriétaire d’une perruche me dit: “J’utilise des jackpots. Quand il fait quelque chose de bien, je fais la fête et je lui donne 6 morceaux de fruits au lieu d’un seul, comme je fais d’habitude. » La même chose. Qu’est-ce que la perruche apprend ? « Des fois ma maitresse me donne plus de fruits que d’habitude ». Super ! Et alors ?

Plusieurs personnes m’ont dit qu’ils ont testé « la théorie du jackpot » en faisant la chose suivante : Ils ont divisé les friandises en petites et grandes quantités, puis ils ont récompensé (après avoir clické) un comportement avec la petite quantité et un autre avec la grande. Normalement il n’y a aucune différence de résultats entre les deux, le comportement est maintenu. Est-ce qu’on peut conclure que le jackpot ne marche pas ?

Non ! Car ce n’est pas un jackpot ! Le jackpot est un vrai « jackpot » uniquement s’il est donné de façon à devenir un marqueur d’un événement qui est en train de se faire. En même temps il devient également un renforcement primaire inattendu, ce qui rend la probabilité que ce comportement se répète plus élevée.

Un jackpot réel doit être une surprise qui arrive tellement rapidement que cela peut paraitre effrayant. Pensez aux jeux au casino ! Avez-vous déjà gagné ? Quand vous jouez avec 50 centimes, vous tirez le bras, des fois vous êtes tout prêt d’une position gagnante, puis des fois vous gagnez quelques euros qui vous motivent à continuer à jouer. Et quand finalement vous décidez d’arrêter et chercher quelque chose à manger, tout d’un coup les cloches sonnent, les lumières qui flashent (ce sont vos clicks !!) et puis vous trouvez plus de cent euros qui sortent de la machine. Quelle surprise !!

Qu’est-ce que vous étiez en train de faire ? Vous regardiez les rouleaux en train de tourner après avoir tiré sur le bras de la machine. Quel comportement était renforcé ? Le regard sur les rouleaux en espérant de gagner.

Pour répéter l’expérience vous aurez besoin encore de la monnaie et de tirer sur le bras pour faire tourner les rouleaux donc vous pouvez les regarder et espérer un autre jackpot. C’est une chaine de comportement. Pour maintenir la chaine seul le dernier comportement doit être renforcé (regarder les rouleaux) et seulement sporadiquement (donc renforcement variable dans le temps, ce qui peut être addictif). Observez juste des gens en train de jouer dans les casinos, comment ils regardent les rouleaux pendant qu’ils « jouent » pendant des heures !

OK, maintenant imaginez ce qui se passe si, quand vous regardez les rouleaux tourner, vous voyez que la machine vous indique que vous avez gagné. Mais vous ne touchez pas immédiatement la somme, il faut que vous rentriez dans votre chambre pour retrouver l’enveloppe. C’est la même somme. Mais qu’est-ce qu’elle renforce ? Peut-être aimeriez vous revenir plus tard dans ce même hôtel? Peut-être allez vous entrer dans votre chambre plus souvent ? Mais probablement vous n’allez pas du tout avoir envie de retourner dans la salle de jeu pour jouer encore avec la même machine. Vous pouvez même décider de dépenser ce que vous venez de gagner et acheter de souvenirs avec… Croyez-moi, les casinos ne font jamais cette erreur. Leurs jackpots ne sont pas uniquement extrêmement remarquables (pour vous et pour tout le monde autour) mais ils sont conditionnels ; vous devez mettre encore plus de l’argent dans la machine et regarder les rouleaux tourner-exactement ce que le casino veut que vous fassiez !

Donc pendant le travail avec des animaux je n’utiliserai JAMAIS des quantités plus importantes pour maintenir un comportement déjà acquis. J’utiliserai uniquement les quantités exceptionnellement grandes comme les vrais jackpots, c’est-à-dire donnés TOUS en même temps et de façon conditionnelle afin de marquer et de renforcer très fortement la première apparition d’un comportement très rare ou la première réussite pour l’exécution d’un mouvement compliqué.

Quand je voulais donner un jackpot à un dauphin pour passer à travers un cerceau très effrayant, je sifflais et en même temps j’ai jeté dans l’air tous les poissons du seau comme s’il pleuvait des poissons. Je donnais un jackpot à mes chiens quand, pour la première fois, je faisais un rappel avec eux sur une longue distance.

Dans mon livre « Ne tue pas le chien » (Don’t shoot the dog) je décrivais le jackpot en donnant l’exemple d’un éducateur de chevaux. Il travaillait avec une race qui a une façon plutôt pas très naturelle d’évoluer sur quatre rythmes. Les chevaux sont sélectionnés pour le faire, mais au début le cavalier doit aider avec l’apprentissage. Quand cet éducateur travaillait avec des poulains, son habitude était de sauter du dos de l’animal et d’enlever la selle et la bride tout de suite quand le poulain prenait le rythme recherché, donc il était libre. Ça, c’est un jackpot ! C’est un renforcement négatif, libérer le poulain des contraintes de l’éducateur. Mais c’est un vrai jackpot. Et le fait que c’était quelque chose de nouveau le rend mémorable. Je crois que ça aidé à mémoriser le mouvement qui a déclenché le jackpot.

En même temps, personne n’a la vérité absolue. Nous sommes toujours en train d’apprendre, de réviser et d’ajouter des nouvelles connaissances. C’est un de plaisirs de la science et aussi du travail avec le clicker.

Avec le recul, je crois que dans mon livre, qui a été écrit il y a 20 ans et révisé il y a 6 ans, je n’ai pas réussi à bien expliquer la différence entre le jackpot et la récompense non-conditionnelle.

La récompense non-conditionnelle est également quelque chose que tu gagnes par surprise, mais elle n’est pas associée avec un comportement précis. Un exemple dans mon livre était quand je donnais 2 poissons « gratuits » à un dauphin découragé ce qui l’a aidé à lui remonter le moral et d’essayer à gagner de nouveaux des récompenses. Un autre exemple était quand mes parents m’avaient offert un forfait de 10 séances d’équitation parce que j’étais une bonne élève. Ça m’a tout de suite remis en forme après ma fatigue. Ces ne sont pas des jackpots mais des récompenses non-conditionnelles. L’utilisation la plus efficace de ce type de récompense est pour ne pas laisser disparaitre les comportements déjà acquis par simple extinction. L’individu se rend compte que ça vaut la peine à faire les efforts et essayer de gagner les renforcements encore.

Comme le jackpot, la récompense non-conditionnée est à utiliser très rarement. Et, comme le jackpot, si ça marche, vous ne devez le faire qu’une seule fois.

Source: Jackpot –hitting it big !, http://www.clickertraining.com/, Karen PRYOR, 2006

Traduit par Zita NAGY

Posted in Uncategorized.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *