Are we like Skinner’s pigeon? / Sommes-nous comme le pigeon de Skinner ?

During the 20th century, the American psychologist and behaviorist B. F. Skinner studied behavior analysis and conditioning and wrote various novels about human behavior. Since then, his work has been quoted many times and even applied to some of our contemporary systems in fields as diverse as video games, education or work management.

As is explained in this great video by Extra Credits, Skinner is known to have studied psychology in a brand new way, radically different from his predecessors. Before him, behavior studies had shown some results in conditioning reactions: you could train a dog to respond to a stimulus by doing something. But Skinner wanted to take it one step further: he wanted to condition decisions (or “volition“). In other words, he wanted the conditioning of the agent to push it to actively choose to do something rather than just push it to passively react to a stimulus. This is called operant conditioning (as opposed to classical conditioning like Pavlov’s well-known experiments).

Among Skinner’s detractors was Noam Chomsky who argued against extending the experiments’ results to humans (in particular in his 1971 publication “The Case Against B.F. Skinner” that was revisited more recently by J. Virués-Ortega). In particular, Chomsky said that behaviorism could not explain the creativity of children – specifically language-wise – and that, overall, Skinner’s human behavior study was no science. It is fun to note though that in 1953, in his book Science and Human Behavior, Skinner started by questioning whether it was reasonable and acceptable to think of human behavior as a science.

I admit that although I think Skinner was spot-on on various topics such as the peculiar place of science in our societies, its special relationship to authority or its hard-core devotion to use facts and “intellectual honesty” rather than “wishful thinking” (cf Skinner’s Science and Human Behavior‘s introduction), I don’t agree with all of his work. In particular, even though I don’t have a deep comprehensive knowledge of all his publications, I feel like his idea of conditioning went far beyond my comfort zone. To me, trying to analyze and predict people’s behavior can eventually turn into some kind of nightmare land of “scientifized oppression”. Still, I believe it’s interesting to see what his experiments and discoveries can teach us about our own behavior and how, in my opinion, they rely to some of our current issues.

Can we study human behavior as a science?

The first section of the book is entitled “The possibility of a science of human behavior” and the first chapter focuses specifically on the dangers of studying it as a science, the possible rejection you could get from broad audience and the practical issues with doing so. In other words, Skinner’s short introduction, “Can science help?”, is a way for him to warn the reader not to treat this question lightly. But why is that?

At the time, Skinner wrote a paragraph that I find particularly striking today because it still carries such a ring of truth:

[…] Man’s power appears to have increased out of all proportion to his wisdom. He has never been in a better position to build a healthy, happy, and productive world; yet things have perhaps never seemed so black. Two exhausting world wars in a single half century have given no assurance of a lasting peace. Dreams of progress toward a higher civilization have been shattered by the spectacle of the murder of millions of innocent people. The worst may be still to come. Scientists may not set off a chain reaction to blow the world into eternity, but some of the more plausible prospects are scarcely less disconcerting.

It seems that we are today in a similar situation as the one Skinner described 55 years ago: we have achieved outstanding scientific breakthroughs, we have never known so much about our surroundings, we have never had that high a production… but most of our societies are in crisis, plenty of governments are fighting against their people in many ways and each day brings a new “natural” disaster. On the sole topic of ecology, researchers have established models for the worst case scenario that we have already long exceeded in a decade – be it in terms of land use, energy management, biodiversity, etc..

Does that mean that science isn’t the right way to go? Some do consider leaving science behind, still it would also mean depriving us of health care, food, electricity, transportation, Internet and so much more! As Skinner said:

There is no virtue in ignorance for its own sake. Unfortunately we cannot stand still: to bring scientific research to an end now would mean a return to famine and pestilence and the exhausting labors of a slave culture.

According to the psychologist, the idea is not to see an enemy in science itself but rather in its wrong applications.

Among other things, Skinner discusses in these paragraphs the threat that developing a science of human behavior poses to freedom. As he rightly points out, many of us feel displeased (to say the least) when they are told that some external uncontrollable power, whatever its form, is choosing all of our actions, deciding of everything for us and essentially prepares our destiny in advance. We like the idea that we are “free agents”, that we are able to think for ourselves. If science were to reveal that this is not the case, lots of us would probably instinctively fight the proposed theory. Indeed, it is way more agreeable to consider that science explains many things but cannot access the ultimate realm of human decisions and “inner will”.

Skinner also recalls the ambivalence we have towards responsibility: how come we concede that there can be extenuating circumstances for bad actions but we give fully personal credit to good men? How come we consider uneducated people the victims of their environment but treat the elite has inherently having something more? To Skinner, this is the proof that we are currently “in transition” (and I’d even pretend it is still the case nowadays) – according to the psychologist, we humans admit that their is some determinism in our behavior, yet we refuse to accept science as the only explanation and quickly re-infuse our philosophy and our beliefs into the study.

In short, the idea that we could discuss human behavior in a scientific way also implies that we are partly controlled – and controllable – through deterministic patterns.

So why is it so important to know if we have a scientific or a philosophic point of view on human behavior? Because our approach of this concept conditions our way of thinking it and therefore, the practice we have of it. Skinner writes that:

Science is more than the mere description of events as they occur. It is an attempt to discover order, to show that certain events stand in lawful relations to other events. No practical technology can be based upon science until such relations have been discovered. […] Science not only describes, it predicts. It deals not only with the past but with the future. Nor is prediction the last word: to the extent that relevant conditions can be altered, or otherwise controlled, the future can be controlled. If we are to use the methods of science in the field of human affairs, we must assume that behavior is lawful and determined. We must expect to discover that what a man does is the result of specifiable conditions and that once these conditions have been discovered, we can anticipate and to some extent determine his actions.

His foreword is thus stating that formally establishing human behavior as a science, as something that can be studied, then predicted and even controlled, will have more than mere theoretical consequences; it will change the way we interact and regard each other’s actions and decisions.

Superstition and randomness: Skinner box

Step 1: Teaching rituals to a bird

In 1948, Skinner published a famous article in the Journal of Experimental Psychology called “‘Superstition’ in the pigeon”. The experiment itself is quite simple: suppose we put a pigeon in a box with a system that delivers food to the bird “at regular intervals with no reference whatsoever to the bird’s behavior” (cf the article’s abstract). The interesting thing is that whenever food comes, the pigeon will think that whatever action it was taking at this instant results in food coming in. When food suddenly comes into the box, the bird will associate the action with the result – even though there is absolutely no link between this behavior and the reward. Some pigeons thought that flapping their wings or turning counter-clockwise in the box would bring them the reward. Other even inferred longer patterns, like having to turn multiple times and do a series of complex actions before getting food.

In this short video, Skinner shows how we can condition the animal to believe that a specific action results in getting the reward (for example, eating if you turn counter-clockwise):

With this experiment, Skinner proved that these birds quickly developed “rituals” and false beliefs about their world and that they became superstitious. The psychologist also demonstrated that there could be an operant conditioning of the pigeon – meaning we could use punishment (here: no food) and reward (here: food) to teach the agent a specific active behavior.

Step 2: Adding randomness to obviate the need

Now, let’s look at another experiment from Skinner that is quite similar. Let’s take our pigeon once again and put it in the box. Then, it the box, we also put a button and the food delivery system. This time, the mechanism does not work according to a regular clock. Instead, whenever the pigeon taps the button with its beak, it gets some food and it can eat. This is straightforward and the pigeon quickly gets it: when it wants food, it clicks the button and it gets it reward.

But for Skinner, this conditioning still had a flaw. As soon as it stopped being hungry, the pigeon would stop tapping the button. Skinner wanted it to click even if it wasn’t hungry anymore. To do that, the psychologist discovered that you just had to add some randomness: say you rig the food system so that it delivers food after a random number of clicks on the button. Then, the pigeon will tap on the button regularly in the fool hope that it will give it the reward… and with the fear that this may never happen again in the future.

When you add randomness into the mix, the pigeon will start clicking the button continuously in the hope it will get its reward (image taken from the Extra Credits’s video:

Step 3: Transposing to humans?

Here is the catch: Skinner’s work seem to show that we are as “conditionable” and superstitious as a pigeon. Our brains are naturally tuned to search for patterns. We like to find logic in things. If something happens, we want it to happen for a reason. And if the reward depends on an inconsistent or a random set of rules (at least from our point of view), we are going to continue clicking the button until we get it…

Even if Chomsky thought we could not extend the psychologist’s results to our own case, it looks like the same behavior often arises in us. For example, this “superstition” mechanism has been used a lot for game design. One of the reasons so many people continue playing slot machines or video games like Blizzard’s Diablo 3 is that the designers of these games use this kind of manipulation to keep the player “hooked in”. Skinner actually realized that for humans, this conditioning is less and less effective for primary needs (food, water, reproduction, etc.) as they get satiated… on the other hand, with secondary needs (like money or fame) that don’t really seem to have a satiation point, the human agent will immerse herself in the experience for way longer – if not infinitely! Thus in World of Warcraft or Diablo 3, you’re hooked in by the cleverly designed loot system. This loot system that randomly drops an extremely rare item for you is rewarding you with a priceless gift that you strut about with to impress your friends, while in the meantime having you click again and again on the button, a bit like the pigeon in its box.

Skinner’s pigeon technique is thus an easy way of extending the lifetime of a game by “creating the illusion of engagement” in the form of compulsion but there many others that honour the player’s intelligence far more than that (cf Extra Credits’s video)!

“Okay, and what?” – you’re gonna say. “These are just games; how is that critical?” I believe that the crucial – and somewhat scary – thing is that this conditioning can be applied in various domains, in our everyday lives, without us noticing. This is becoming even more true as we use gamification to add points, badges, leaderboards, performance graphs and so on everywhere. For example, it sometimes looks like there is no logical reason your colleague should get promoted when you don’t; you start wondering: “what did I do wrong? how should I change my behavior in order to get my reward?”. This is pushing you to turn counter-clockwise, like the pigeon in its box, because, perhaps, the others did and that got them a promotion. Or perhaps not – who knows? In big companies, the “salary bonus points” that you might earn by finishing a specific list of to-dos can also become a reenactement of Skinner’s experiment: when the system is (voluntarily or not) too complex for the employees to decipher, they can easily be stuck in their own Skinner box with no other choice but to keep on clicking the button in the hope that they will someday get their reward. Or they just run around exhausting themselves trying to find the one action that can result in them getting the reward.

In my opinion, whichever operant conditioning experiment we refer to here, both relay to the pervasive sensation many of us have that in today’s world everything’s getting faster without necessarily resulting in an actual outcome. We can test new patterns over and over again but to us the system is nowadays so random that we are not guaranteed those have any link with us being rewarded. This is one of the cause of the evermore-frequent burn-outs people experienced: we are told to run and click ad vitam eternam with no explanation whatsoever what the rules of the game are – it’s usually even worse because these rules change continuously, preventing us from ever learning the ropes and mastering the system. We know that we can never achieve the final goal and get rewarded for it. We just run to the next checkpoint and hungrily grab the intermediary rewards because, in that instant, it’s better than nothing.

I’d say that we ought to be careful we don’t get trapped in such a Skinner box – but I think we may already be in those cages and we need to escape them. Especially when people continuously repeat that “there is no other option”, or that “we have to do that”. This (in)famous phrase – which is commonly used at work – is a way of obfuscating the fact that there could be something else out of the box, perhaps something that is more valuable to us than just the food we’re erratically given for now.

What about the “box”?

Indeed, to me, another interesting part of Skinner’s experiment is, perhaps surprisingly, the box itself. Why is that? Because the word “box” is not harmless or insignificant: it is a small opaque space that has been artificially built by a human to enclose the agent into a subpart of the world. It also isolates the agent so that it is not aware of the rest of the world outside the box.

From an experimental point of view, it is of course a way of reducing as much as possible any uncontrollable stimuli so that you have a clean and methodically prepared test environment. It is therefore a necessary condition to your experimental setup so that you can study the situation you intend to without too much external interference.

Still, what about us? If we assume that there actually are situations that resemble Skinner’s experiments where we are the pigeons, then we are in a box, too. And there are walls that mask out the rest of the world. I’m not directly referencing the cubicles in work open-spaces, here (although they could be regarded as sort of a real-life Skinner box…), rather I’m talking of metaphorical boxes that surround us in our lives, be it at home or at work. They isolate us in a specific part of the world with a limited knowledge of what’s outside of it and an overall control system that seems random. Those boxes are way bigger than the pigeon’s. Yet they’re still here. With today’s omnipresent information and data flood, we’re sometimes cracking a window open in them; but most of the time, we don’t even realize where the wall is.

In Playtime, Jacques Tati immerses us in a dystopian near-future Paris that highlights and criticizes the inevitable problems of our modern societies. (Jacques Tati’s Playtime © 1967 / Les Films de Mon Oncle – Specta Films CEPEC. All rights reserved)

Something worth mentioning though is that there are boxes of various sizes that are more or less deformable. I think that even people high in the hierarchy (either in the society or at work) are somewhat trapped in a box – it’s just that this one is huge and can adapt a bit around them. The trick is that as long as you don’t feel its boundaries, you can delude yourself into thinking you’re completely free. But that may be why bosses at work are the ones that say “we don’t have a choice” so frequently: because even though they try to push the boundaries back, they themselves have their view limited by the walls of the cage…

Durant le 20e siècle, le psychologue et béhavioriste Américain B. F. Skinner a étudié l’analyse du comportement et le conditionnement et il a écrit plusieurs livres à propos du comportement humain. Depuis, son travail a été cité de nombreuses fois et il a même été appliqué à certains de nos systèmes contemporains dans des domaines aussi variés que les jeux vidéos, l’éducation ou l’organisation du travail.

Comme expliqué dans cette excellente vidéo de Extra Credits, Skinner est connu pour avoir étudié la psychologie d’une manière totalement nouvelle, radicalement différente de ses prédécesseurs. Avant lui, les études sur le comportement avaient montré des résultats pour le conditionnement des réactions : on pouvait entraîner un chien à répondre à un stimulus en faisant une action donnée. Mais Skinner voulait aller plus loin : il voulait conditionner les décisions (la “volonté“). En d’autres termes, il voulait que le conditionnement de l’agent le pousse à choisir activement de faire quelque chose plutôt que de simplement le pousser à passivement réagir à un stimulus. On appelle cela le conditionnement opérant (en opposition au conditionnement classique comme celui des fameuses expériences de Pavlov).

Parmi les détracteurs de Skinner, il y avait Noam Chomsky qui s’opposait à l’idée que les résultats de ces expériences puissent être étendus aux humains (notamment dans sa publication de 1971 “The Case Against B.F. Skinner” qui a été réexaminée plus récemment par J. Virués-Ortega). En particulier, Chomsky disait que les théories sur le comportement ne pouvaient pas expliquer la créativité des enfants – plus spécifiquement en termes de langage – et que, dans l’ensemble, l’étude du comportement humain que faisait Skinner ne pouvait pas être considérée comme une science. Cependant, il est amusant de remarquer qu’en 1965, dans son livre Science and Human Behavior, Skinner commençait par se demander s’il était raisonnable et acceptable de voir en l’étude du comportement humain une science.

Je dois admettre que même si je pense que Skinner avait vu juste sur différents points, comme la place spéciale de la science dans nos sociétés, sa relation particulière à l’autorité ou sa dévotion totale à utiliser les faits et “l’honnêteté intellectuelle” plutôt que nos “douces illusions” (cf l’introduction de Science and Human Behavior de Skinner), je ne suis pas d’accord avec l’entièreté de son travail. En particulier, même si je n’ai pas une connaissance exhaustive et en profondeur de ses publications, j’ai l’impression que son idée du conditionnement dépassait de loin ma zone de confort. Pour moi, essayer d’analyser et de prédire le comportement des gens peut à terme se transformer en un monde de cauchemar où l’on “scientifise l’oppression”. Néanmoins, je crois qu’il est intéressant de voir ce que ses expériences et ses découvertes peut nous apprendre sur notre propre comportement et comment, à mon avis, elles sont reliées à certains de nos problèmes actuels.

Peut-on étudier le comportement humain comme une science ?

La première section du livre est intitulée “La possibilité d’une science du comportement humain” et le premier chapitre s’intéresse plus particulièrement aux dangers de l’étudier comme une science, au possible rejet de la part du grand public et aux problèmes pratiques de faire cela. Autrement dit, la petite introduction de Skinner, “La science peut-elle aider ?”, est un moyen pour lui de prévenir le lecteur qu’il ne faut pas prendre cette question à la légère. Mais pourquoi donc ?

A l’époque, Skinner a écrit un paragraphe que je trouve encore frappant de vérité aujourd’hui (traduction personnelle, lire la version en anglais de l’article pour la citation originale) :

[…] Le pouvoir de l’Homme paraît avoir augmenté hors de proportion avec sa sagesse. Il n’a jamais été dans une meilleure position pour construire un monde sain, joyeux et productif ; pourtant les choses n’ont peut-être jamais semblé aussi sombres. En un demi-siècle, deux guerres mondiales épuisantes n’ont donné aucune assurance d’une paix durable. Nos espoirs de progresser vers une civilisation plus évoluée ont été anéantis par le spectacle de la mort de millions d’innocents. Il est possible que le pire reste à venir. Les scientifiques ne lanceront peut-être pas une réaction en chaîne qui détruira le monde pour l’éternité, mais certaines de leurs projections les plus plausibles sont tout aussi troublantes.

Il semble que, de nos jours, nous soyons dans une situation similaire à celle que Skinner décrivait il y a 55 ans : nous avons fait des avancées scientifiques incroyables, nous n’avons eu une aussi bonne connaissance de notre environnement, nous n’avons jamais produit autant… mais la plupart de nos sociétés sont en crise, beaucoup de gouvernements s’opposent à leur peuple de différentes façons et chaque jour il y a une nouvelle catastrophe “naturelle”. Si on se concentre sur le sujet de l’écologie, les chercheurs ont établi des modèles pour le pire cas qui ont déjà été dépassés depuis longtemps en une décennie – pour ce qui est de l’usage des sols, de la gestion de l’énergie, de la biodiversité, etc..

Est-ce que cela signifie que la science n’est pas la bonne voie ? Certains imaginent de laisser la science de côté mais cela voudrait aussi dire que l’on se priverait des soins, de la nourriture, de l’électricité, des transports, d’Internet et de bien plus ! Comme l’a dit Skinner (traduction personnelle, lire la version en anglais de l’article pour la citation originale) :

Il n’y a pas de valeur dans l’ignorance pour elle-même. Malheureusement, nous ne pouvons pas rester immobile : arrêter la recherche scientifique maintenant signifierait revenir à la famine et la pestilence et aux labeurs épuisants de la culture de l’esclavage.

Pour le psychologue, l’idée n’était pas de voir la science elle-même comme un ennemi mais plutôt ses mauvaises applications.

Entre autres choses, Skinner évoque dans ces paragraphes la menace que le développement d’une science du comportement humain pourrait faire peser sur la liberté. Comme il le fait justement remarquer, beaucoup d’entre nous sont mécontents (et c’est un euphémisme) quand on leur dit qu’il existe un pouvoir extérieur incontrôlable, quelle que soit sa forme, qui choisit toutes nos actions, décide de tout pour nous et, en fait, trace à l’avance notre destinée. Nous aimons l’idée que nous sommes des “agents libres”, que nous pouvons penser par nous-mêmes. Si la science devait révéler que ce n’est pas le cas, bon nombre d’entre nous refuserait probablement d’abord instinctivement la théorie. En effet, il est bien plus plaisant de considérer que la science explique beaucoup mais qu’elle ne peut accéder au royaume final des décisions humaines et de la “volonté intérieure”.

Skinner rappelle aussi l’ambivalence que nous avons envers la responsabilité : pour quelle raison admettons-nous qu’il peut y avoir des circonstances atténuantes pour les mauvaises actions mais donnons-nous absolument tout le crédit personnel aux hommes bons ? Pourquoi considérons-nous que les gens non éduqués sont des victimes de leur environnement mais que l’élite a, de manière inhérente, quelque chose de plus ? Pour Skinner, c’est la preuve que nous sommes actuellement “en transition” (et je prétends que c’est encore le cas aujourd’hui) – pour le psychologue, nous admettons qu’il y a un peu de déterminisme dans notre comportement, mais nous refusons encore d’accepter que la science explique tout et on ré-injecte vite notre philosophie et nos croyances dans cette étude.

En somme, imaginer que l’on puisse parler de manière scientifique du comportement humain suppose aussi que nous sommes en parti contrôlé – et contrôlables – selon des schémas déterministes.

Mais pourquoi est-il si important de savoir si nous avons un point de vue scientifique ou philosophique sur le comportement humain ? Parce que la façon dont nous approchons ce concept influe sur notre façon de le penser et donc, sur la pratique que nous en avons. Skinner écrit que (traduction personnelle, lire la version en anglais de l’article pour la citation originale) :

La science est plus qu’une simple description des évènements à mesure qu’ils se produisent. C’est une démarche visant à découvrir l’ordre des choses, à montrer que certains évènements sont légitimement reliés à d’autres évènements. Aucun application technologique pratique ne peut se baser sur la science jusqu’à ce que ces relations aient été découvertes. […] La science ne se content pas de décrire, elle prédit. Elle ne porter pas seulement sur le passé mais aussi sur l’avenir. Elle la prédiction n’est pas la finalité : dans la mesure où on peut altérer, ou du moins contrôler, les conditions pertinentes, le futur peut être contrôlé. Si on souhaite utiliser la méthode scientifique dans le champ des affaires humaines, nous devons présupposer que le comportement humain suit une loi et est déterminé. Nous devons nous attendre à découvrir que ce qu’un Homme fait dépend de conditions précises et qu’une fois que nous aurons découvert ces conditions, nous pourrons anticiper et dans une certaine mesure déterminer ses actions.

Son avant-propos déclare donc qu’établir formellement l’étude du comportement humain comme une science, comme quelque chose qui peut être étudié, puis prédit et même contrôlé, aura plus que de simples conséquences théoriques ; cela changera la manière dont nous interagirons et le regard que nous porterons sur les actions et les décisions des autres.

Superstition et aléatoire : la boîte de Skinner

Etape 1 : Apprendre des rituels à un oiseau

En 1948, Skinner a publié un article bien connu dans le Journal of Experimental Psychology appelé “‘Superstition’ in the pigeon” (“La ‘superstition’ chez le pigeon”). L’expérience est en soi assez simple : supposons que l’on mette un pigeon dans une boîte avec un système qui lui donne de la nourriture “à intervalles réguliers mais sans aucun lien avec le comportement de l’oiseau” (voir l’abstract de l’article). Ce qui est intéressant, c’est que dès que la nourriture arrive, le pigeon croit que l’action qu’il effectuait à ce moment là a pour conséquence cette arrivée de nourriture. Quand la nourriture apparaît soudainement dans la boîte, l’oiseau associe l’action avec le résultat – même s’il n’y absolument aucun lien entre ce comportement et la récompense. Certains pigeons pensaient que battre des ailes ou tourner dans le sens anti-horaire à l’intérieur de la boîte leur donnerait leur récompense. D’autres ont même supposé qu’il y avait des schémas plus long, comme tourner plusieurs fois et effectuer une série d’actions complexes avant de recevoir la nourriture.

Dans cette courte vidéo (en anglais), Skinner montre comme on peut conditionner l’animal à croire qu’une action spécifique a pour conséquence l’obtention de la récompense (par exemple, manger si on a tourné dans le sens anti-horaire) :

Avec cette expérience, Skinner a prouvé que ces oiseaux développaient rapidement des “rituels” et des fausses croyances à propos de leur monde et qu’ils devenaient superstitieux. Le psychologue a aussi démontré qu’il pouvait y avoir un conditionnement opérant du pigeon – autrement dit, que l’on pouvait utiliser la punition (ici : pas de nourriture) et la récompense (ici : de la nourriture) pour apprendre à l’agent un comportement actif spécifique.

Etape 2 : Ajouter de l’aléatoire pour rendre le besoin inutile

Maintenant, regardons une autre expérience assez similaire de Skinner. Prenons de nouveau notre pigeon et remettons-le dans la boîte. Ensuite, dans la boîte, mettons également un bouton et toujours un système délivrant de la nourriture. Cette fois, le mécanisme n’a plus une horloge régulière. A la place, dès que le pigeon appuie sur le bouton, il obtient de la nourriture et peut la manger. La logique est évidente et le pigeon comprend vite : quand il veut de la nourriture, il appuie sur le bouton et il reçoit sa récompense.

Mais, pour Skinner, il y a un défaut avec ce conditionnement. Dès que le pigeon n’a plus faim, il arrête d’appuyer sur le bouton. Skinner voulait que l’oiseau continue d’appuyer même s’il n’avait plus faim. Le psychologue a découvert qu’il suffisait d’introduire de l’aléatoire dans l’expérience pour que cela fonctionne : imaginons que l’on truque le système pour donner de la nourriture après un nombre aléatoire de clics du bouton. Alors, le pigeon appuiera sur le bouton régulièrement dans l’espoir fou de recevoir sa récompense… et dans la peur que cela n’arrive plus par la suite.

Quand on ajoute de l’aléatoire à l’expérience, le pigeon commencera à appuyer sur le bouton en continu en espérant recevoir sa récompense (image prise de la vidéo d’Extra Credits :

Etape 3 : Transposer aux humains ?

La vraie astuce, c’est que les travaux de Skinner semblent montrer que nous sommes aussi “conditionnables” et superstitieux qu’un pigeon. Nos cerveaux ont naturellement tendance à chercher des schémas. Nous aimons trouver de la logique dans les choses. Si quelque chose arrive, nous voulons qu’il y ait une raison. Et si la récompense dépend d’un ensemble de règles incohérent ou aléatoire (en tout cas de notre point de vue), nous allons continuer à appuyer sur le bouton jusqu’à comprendre…

Même si Chomsky pensait que les résultats du psychologue ne s’étendaient pas à notre cas, il semble que nous ayons souvent le même comportement que le pigeon. Par exemple, ce mécanisme de “superstition” a beaucoup été utilisé pour la conception de jeux. Une des raisons pour lesquelles tant de gens continuent de jouer aux machines à sous ou à des jeux vidéos comme Diablo 3 de Blizzard, c’est que les concepteurs de ces jeux ont utilisé ce type de manipulation pour garder le joueur “accroché”. En réalité, Skinner s’est rendu compte que pour les humains, le conditionnement est de moins en moins opérant pour les besoins primaires (nourriture, eau, reproduction, etc.) à mesure que l’on est rassasié… en revanche, pour les besoins secondaires (comme l’argent ou la gloire) qui n’ont a priori pas vraiment de point de satiété, l’agent humain s’immergera dans l’expérience bien plus longtemps – voire à l’infini ! Ainsi, dans World of Warcraft ou Diablo 3, on est accroché par le système de butin malignement pensé. Ce système de butin qui donne aléatoirement un objet extrêmement rare vous récompense avec un cadeau précieux avec lequel vous pavaner devant vos amis tout en vous poussant, en attendant, à cliquer encore et encore sur des boutons, un peu comme le pigeon dans sa boîte.

La technique du pigeon de Skinner est donc un moyen facile d’étendre la durée de vie d’un jeu en créant “l’illusion de l’implication” sous la forme d’un comportement compulsif mais il en existe bien d’autres qui font plus honneur à l’intelligence du joueur (voir la vidéo d’Extra Credits) !

“D’accord, et alors ?” – pourriez-vous me dire. “Ce ne sont que des jeux ; en quoi est-ce important ?” Je pense que ce qui est crucial – et un peu effrayant – c’est que ce conditionnement s’applique dans de nombreux domaines, dans nos vies quotidiennes, sans que l’on s’en aperçoive. C’est de plus en plus vrai à mesure que nous utilisons la gamification (ou “ludification”, en bon français) pour ajouter des points, des badges, des tableaux de scores, des graphes de performance ou autre partout. Par exemple, on a parfois l’impression qu’il n’y a aucune raison logique pour laquelle son collègue a une promotion alors que l’on n’en a pas ; on s’interroge alors : “qu’est-ce que j’ai fait de mal ? comment devrais-je modifier mon comportement pour obtenir ma récompense ?”. Cela vous pousse à tourner dans le sens anti-horaire, comme le pigeon dans sa boîte, parce que, peut-être, les autres l’ont fait et ont eu une promotion. Ou peut-être pas – qui sait ? Dans les grandes entreprises, les “primes de salaires” que l’on peut gagner en finissant une liste de tâches spécifique peuvent aussi devenir une reproduction de l’expérience de Skinner : quand le système est (volontairement ou non) trop complexe pour que les employés puissent le déchiffrer, ils peuvent facilement se retrouver bloqués dans une boîte de Skinner sans autre choix que de continuer à appuyer sur le bouton dans l’espoir d’un jour obtenir leur récompense. Ou bien ils courent juste dans tous les sens en s’épuisant, cherchant l’action qui peut leur permettre d’avoir cette récompense.

A mon avis, quelle que soit l’expérience de conditionnement à laquelle on se réfère, les deux sont liées à cette sensation partagée par nombre d’entre nous que le monde actuel va de plus en plus vite sans forcément aboutir à un résultat concret. On peut essayer de nouveaux schémas sans cesse mais le système est aujourd’hui si aléatoire que nous n’avons aucune garantie que ces schémas soient liés à une récompense. C’est l’une des causes des burn-outs de plus en plus fréquents : on nous dit de courir et d’appuyer sur le bouton ad vitam eternam sans aucune explication des règles du jeu – pire encore, ces règles changent en permanence, ce qui nous empêche de jamais apprendre les trucs et astuces et de comprendre le système. Nous savons que ne pourrons jamais atteindre le but final et obtenir notre récompense. On court juste jusqu’au point de sauvegarde suivant en attrapant avidement les récompenses intermédiaires parce que, pour l’instant, c’est mieux que rien.

En théorie, j’aimerais préconiser de ne pas se laisser piégé dans de telles boîtes de Skinner – mais je pense que nous sommes déjà dans ces cages et que nous devrions nous en échapper. Surtout quand des gens nous répètent inlassablement “qu’il n’y a pas d’autre option” ou que “nous sommes obligés de faire ça”. Cette expression, tristement célèbre et souvent utilisée au travail, est un moyen de cacher le fait qu’il pourrait y avoir quelque chose à l’extérieur de la boîte, peut-être quelque chose qui a plus de valeur pour nous que simplement la nourriture que l’on obtient de manière erratique pour le moment.

A propos de la boîte

En effet, pour moi, une autre partie intéressante de l’expérience de Skinner est, peut-être de manière surprenante, la boîte elle-même. Pourquoi ? Parce que le mot de “boîte” n’est pas anodin ou futile : on parle d’un petit espace opaque construit artificiellement par un humain pour y enfermer l’agent dans une sous-partie du monde. Une boîte, ça isole aussi l’agent pour qu’il n’ait pas conscience du reste du monde au-dehors.

D’un point de vue expérimental, c’est bien sûr un moyen de réduire autant que possible les stimuli incontrôlables pour avoir un environnement de test propre et préparé méthodiquement. C’est donc une condition nécessaire à la mise en place de l’expérience pour pouvoir étudier la situation que l’on veut sans trop d’interférences extérieures.

Mais alors, qu’en est-il pour nous ? Si on suppose qu’il existe en effet des situations qui ressemblent aux expériences de Skinner dans lesquelles nous sommes les pigeons, alors nous sommes dans une boîte, nous aussi. Et il y a des murs qui masquent le reste du monde. Je ne fais pas ici directement référence aux cubicules des open-spaces (même si on pourrait les voir comme une sorte de boîte de Skinner grandeur nature…), je parle plutôt de ces boîtes métaphoriques qui nous entourent dans la vie de tous les jours, au travail ou à la maison, et nous isolent dans une partie spécifique du monde avec une connaissance limitée de ce qui se passe à l’extérieur et un système de contrôle global qui semble aléatoire. Ces boîtes sont bien plus grandes que celle du pigeon. Pourtant, elles sont quand même là. Aujourd’hui, avec l’omniprésence de l’information et des données, on peut parfois ouvrir une fenêtre dans ces boîtes ; mais, la plupart du temps, on ne voit même pas où se trouve le mur.

Dans Playtime, Jacques Tati nous plonge dans un futur proche dystopique à Paris qui souligne et critique les problèmes inévitables de nos sociétés modernes. (Jacques Tati’s Playtime © 1967 / Les Films de Mon Oncle – Specta Films CEPEC. Tout droits réservés)

Il faut cependant préciser que ces boîtes ont des tailles variées, et que l’on peut plus ou moins les déformer. Je pense que même des personnes qui sont haut placées dans la hiérarchie (dans la société ou au travail) sont parfois piégées dans une boîte – simplement, elle est immense et peut s’adapter un peu autour d’eux. La ruse, c’est que tant que l’on n’en sent pas les contours, on peut se bercer d’illusions et croire qu’on est complètement libre. Mais c’est peut-être pour cela que les patrons sont ceux qui disent que “nous n’avons pas le choix” : parce que même leur vision est limitée par les murs de la cage…

2 thoughts on “Are we like Skinner’s pigeon? / Sommes-nous comme le pigeon de Skinner ?”

  1. Jean-Baptiste Boisseau

    Excellent article ! Il y a beaucoup de choses auxquelles j’aimerais réagir, mais en tant que pigeon prisonnier d’un boîte temporelle, je vais en retenir une concernant la dernière phrase :
    “Mais c’est peut-être pour cela que les patrons sont ceux qui disent que “nous n’avons pas le choix” : parce que même leur vision est limitée par les murs de la cage”

    => Je pense pour ma part que le fait de dire qu’on a pas le choix est plus souvent une manière de construire une boîte autour des autres. Qu’un patron arrive après coup à s’auto-persuader qu’il n’y a pas d’autre alternative est une simple méthode pour résoudre la dissonance cognitive ou le petit cas de conscience moral qui s’opposerait sinon à lui (ne pas voir là une critique marxiste primaire : je suis moi aussi patron à l’occasion).

    1. Merci beaucoup 🙂 Tu as raison sur le fait que le “on n’a pas le choix” enferme les autres, et que c’est parfois de l’auto-persuasion. Mais je pense aussi que certaines personnes se disent “boss” et pensent avoir les coudées franches… sans forcément se rendre compte de leurs limites et de leurs propres contraintes. Encore un coup, il existe mille situations différentes, et je suis bien d’accord avec toi que parfois les patrons sont moins “victimes” que ce que je dépeins là, hein…

