Le renforcement, l'apprentissage et les TIC

FarstadStuntGirl.jpgLa récompense, c’est ce qui nous rend bons ou mauvais. (Robert Herrick)

En apercevant le titre du billet (Cognitive Daily : Learning: Is reinforcement required?) et le graphique ci-dessous, j’ai d’abord cru que mon aversion pour les récompenses scolaires serait ébranlée. Une étude laisse entendre que le renforcement immédiat favorise l’apprentissage d’une tâche banale ou ardue. Rassuré du fait qu’il s’agit de renforcement à court terme, j’en induis par ailleurs que l’apprentissage de connaissances et d’habiletés peu motivantes intrinsèquement, comme l’école l’exige souvent, peut être stimulé par un sourire, un bon mot, un élément ludique, voire même un répit pour récompenser l’effort. Peut-être même sous-estimons-nous l’autogratification dans la motivation scolaire.



    SeitzReinforcement.jpg

Sans trop s’écarter du cadre expérimental toutefois, je suis saisi de la similitude entre le renforcement offert par les chercheurs, un simple signal relatif à la réussite ou l’échec d’une réponse, et l’interaction inhérente aux exercices sur un ordinateur. Dans l’acquisition de connaissances spécifiques, le renforcement immédiat donné par un ordinateur est sans doute plus efficace que le renforcement différé associé à un cahier d’exercices dont la correction tarde à venir. De plus, l’interaction et le renforcement instantané permettent à l’élève de rajuster le tir au fur et à mesure, tandis que la même erreur peut être répétée dans un cahier avant que l’élève en soit avisé.

L’avantage des nouvelles technologies sur le plan du renforcement immédiat demeure une hypothèse, mais assez plausible il me semble pour faire l’objet d’une étude.

(Image thématique : Stunt Girl’s Sweet Reward, par Julie Farstad)


Par ricochet :

Chuchoter le renforcement

Outils d’évaluation en ligne : objectif connaissances

Vous pouvez suivre les commentaires en réponse à ce billet avec le RSS 2.0 Vous pouvez laisser une réponse, ou trackback.

5 réponses

  • Il serait important de faire la distincton entre renforcement et feedback. A la lecture de votre billet, je crois qu’il y a une petite confusion entre les deux. En passant, il existe plusieurs études sur le feedback immédiat ou l’absence de feedback. Plus le feedback est immédiat, meilleur sera ce dernier. C’est-à-dire que l’élève risque d’apprendre à la suite de ce dernier. Mais, ce n’est pas de ce qu’il est question ici n’est-ce pas?

  • marc st-pierre dit :

    Plus le renforcement est immédiat, meilleur aussi sera ce dernier… Le feedback peut être utilisé comme renforcement. On s’en sert dans plusieurs programmes de contrôle de poids ou de contrôle de certains symptômes de dépression. Ces discussions sur les renforcements nous renvoient à nos bons vieux échanges sur le behaviorisme en particulier et les théories de l’apprentissage en général. Je me permets de ressortir des boules à mites (mythes???) ce commentaire que j’avais fait, il y a un temps, sur le blogue de Mario (c’est le commentaire 14): http://carnets.opossum.ca/mario/archives/2006/04/piaget_ou_rosen.html

    « Juste un petit mot. Il y a de ça plusieurs années, alors que j’étais étudiant au doctorat en technologie éducative à Concordia, nous avions eu une longue discussion (via le web) sur le potentiel éducatif de ce qu’on nommait alors le « computer conferencing ». On se demandait entre autre ce qui pouvait régir le mécanisme des contributions, pourquoi certains sujets attiraient plus de monde, alors que pour d’autres, l’action d’un modérateur-animateur était essentielle pour augmenter la fréquence et quelquefois la qualité des contributions, deux conditions que nous jugions essentielles à la « construction de connaissances ».

    Finalement, le constat « troublant » que nous avions fait, tout doctorant que nous étions, c’est que le processus des contributions se faisait sous le mode du conditionnement opérant. On contribue rarement sur une base régulière quand on ne reçoit pas un feedback sur ce qu’on écrit. La réponse de l’autre, sa réaction, agit comme renforcement. Le comportement de contribuer est maintenu parce qu’il a comme conséquence la réponse « gratifiante » de l’autre.Et plus cet autre est « gratifiant », plus sa réponse le sera… Alors voyez-vous, il n’y a rien de tout blanc ou de tout noir quand il est question d’apprentissage. Tout est attaché et chaque théorie est une tentative d’explication qui est coloré par les conditions initiales où se déroule l’expérience. Et il ne faut jamais, à partir du moment où elle est proposée, tenter de prouver qu’une théorie fonctionne. Il faut essayer de la réfuter. C’est à ce prix qu’on avance.

    Je respecte la démarche de Piaget, comme celle de Vigotsky. Chacun vivait en son propre temps, dans sa propre société et il n’est pas étonnant, par exemple, qu’un jeune russe du début du siècle ait développé la thèse d’une construction sociale des connaissances dans une société soviétisée qui « trippait » sur le collectivisme. Et pas étonné non plus que son oeuvre ait refait surface au début des années « 70 dans l’Amérique de Woodstock…

    Mais j’apprécie aussi et tient en haute estime l’oeuvre de Skinner qui, dans « Par-delà la liberté et la dignité » aura su dire les « vraies affaires ».

    Finalement, mon commentaire est un peu plus long que je n’aurais cru… Sorry. »

  • Je crois savoir que dans ce genre d’expérience, la psychologie parle de renforcement, lequel relève du conditionnement opérant, comme Marc le mentionne. L’usage de feedback, courant dans plusieurs domaines, ne m’est pas familier dans ce contexte. Quoi qu’il en soit, je remercie Louis et Marc de confirmer que des études ont démontré l’efficacité du renforcement immédiat.

    Enfin, je partage tout à fait le point de vue de Marc sur l’importance du behaviorisme, tout comme les autres grandes théories de l’apprentissage. La pensée, et la vie qui l’entoure, sont trop complexes pour se limiter à un seul mode d’apprentissage. Comme dans toute bonne sauce, le secret est dans le dosage des bons ingrédients et dans l’art de les combiner, sans oublier l’amour à la tâche.

    P.-S. Désolé d’avoir tardé à vous répondre.

  • Non seulement plusieurs formes de feedback peuvent être source de motivation ou jouer le rôle de récompenses, mais on peut aussi ajouter une composante computationnelle à l’explication.

    En intelligence artificielle (lorsque les machines apprennent), on divise généralement l’apprentissage en 3 catégories. La première, dite supervisée, probablement similaire au feedback, est de donner la bonne réponse après chaque choix/action/décision de la machine. La deuxième, dite de renforcement, est l’équivalent du conditionnement opérant. La machine reçoit une récompense ou punition (mais on ne lui donne pas la bonne solution), et parfois, uniquement après plusieurs actions (comme une partie d’échec où on ne lui dirait qu’à la fin, tu as gagné ou perdu).

    Computationnellement, ce second type d’apprentissage est beaucoup plus difficile que le premier. Non seulement la bonne réponse n’est pas donnée, mais en plus, il n’y a pas d’information sur quelle action est en cause dans le résultat obtenu. Plus il y a d’action entre l’erreur et le feedback, plus le problème computationnel est grand. C’est ce qu’on appelle le ‘credit assignment problem’. À qu’elle action la faute?

    (Finalement, il y a aussi l’apprentissage non supervisé. Auquel cas, aucun feedback n’est donné.)

  • C’est courageux d’établir un parallèle avec l’intelligence artificielle, François, considérant la délicatesse du sujet et les différences entre le cerveau et l’ordinateur. Néanmoins, sur la base de réactions cérébrales aussi vives que le feedback immédiat, la comparaison est intéressante. À tout le moins, ton commentaire souligne la complexité des réactions à la lumière du feedback. Merci de partager ainsi tes connaissances et d’apporter un jour nouveau à la question.



Laisser un commentaire

*