Behavioristische Theorien des Lernens und der Lern-Motivation

© Georg Lind
Letzte Änderung: 23.4.2005
 
  • Behaviorismus (Watson)

  • Klassische Konditionierung (Pavlov)

  • Gesetz der Wirkung (Thornedike)

  • Operantes Konditionieren, Verstärkung, Löschung und Vergessen (Skinner)

  • Kritik

    • Menschliches Lernen ist komplexer und vielschichtiger als es die behavioristischen Theorien beschreiben. Es lässt sich nicht ohne Bezugnahme auf innere Prozesse vollständig beschreiben und fördern.

    • Extrinsische Motivation ist für das Lernen wenig effektiv und entspricht nicht dem Menschenbild der Demokratie.

J. B. Watson (1878-1958)

Behaviorismus

"Der Behaviorist fragt: Warum machen wir nicht aus dem, was wir beobachten können, das eigentliche Feld der Psychologie? Lasst uns beschränken auf die Dinge, die beobachtet werden können, und Gesetze formulieren, die nur solche Dinge betreffen. Nun, was kann man beobachten? Wir können Verhalten ("behavior") beobachten -- was der Organismus tut oder sagt. Und lassen Sie uns gleich festhalten: reden ist auch eine Tätigkeit -- das heißt, Verhalten." (Watson, 1924: Behaviorism, S. 6; meine Übersetzung, GL)

"Der Behaviorist tilgt aus seinem wissenschaftlichen Vokabular alle subjektiven Begriffe wie Empfindung, Wahrnehmung, Vorstellung, Verlangen, Zweck und sogar Denken und Emotionen, solange sie subjektiv definiert sind." (S. 6)
"Der Behaviorist erkennt keine solchen Dinge an wie mentale Eigenschaften, Dispositionen oder Neigungen." (S. 98)

Einfluss auf Schule und Erziehung

Vor allem werden der Pädagogik wichtige Begriffe wie Lernen und Motivation entzogen, da diese innere, mentale Zustände beschreiben, die nach Meinung von Watson nicht Gegenstand einer wissenschaftlich orientierten Psychologie und Pädagogik sein dürfen.

Lern-Motivation

Watson und mit ihm alle konsequenten Behavioristen lehnen den Motivationsbegriff ab, da er einen inneren Zustand bezeichnet, das nach Meinung der Behavioristen sich jeglicher wissenschaftlicher Analyse entzieht.

Implizit haben die Behavioristen jedoch eine Motivationstheorie. Sie gehen davon aus, dass die Motivation für Handeln eine Kombination von erblich fixierten Instinkten und äußeren Reizen entspringt, auf das der Einzelne keine Einwirkungen hat -> extrinsiche Motivation.

Ivan P. Pavlov (1849-1936)

Klassisches Konditionieren

Wenn ein neutraler Reiz einem effektiven Reiz oft genug vorangeht oder mit ihm zeitlich zusammenfällt, übernimmt ersterer im Laufe der Zeit einige der Eigenschaften des effektiven Reizes. Es entsteht eine "Reiz-Substituierung" (Pawlow).

Pavlovs Hund

Beispiel 1: Ein Hund zeigt nach einer gewissen Zeit eine Speichelreaktion auf einen Ton (vorher neutraler Reiz), nachdem der Ton etliche Male mit Futter (effektiver Reiz) gepaart wurde.

Beispiel 2: Der Schüler Hans wird immer aufmerksam, wenn von Essen die Rede ist. Der Lehrer bietet mehrmals Essensbegriffe zusammen mit mathematischen Problemen an ("Acht leckere Pizzastücke müssen für vier Kinder reichen. Wieviele Pizzastücke bekommt jedes Kind?"). Wenn nach einer Weile der neutrale Reiz "Zahl" eine ähnliche Wirkung auf die Aufmerksamkeit von Hans hat wie die Erwähnung des Wortes Pizza, ist Hans "konditioniert" auf Zahlen.

Edward Lee Thornedike
(1874-1949)

Gesetz der Wirkung: Bestrafung und Belohnung (Thornedike)

Dieses von Thornedike formulierte Gesetz bedeutet, dass ein Verhalten, auf das verstärkende Konsequenzen (Belohnungen, Bekräftigungen) folgen, die Tendenz zeigt, wiederholt zu werden. Ein Verhalten, auf das dies nicht zutrifft oder das bestraft wird, wird aus dem Verhaltensrepertoire eliminiert.

Er stützt dieses Gesetz auf Experimente, in denen er hungrige Katze in die sogenannte Puzzle-Box, einer Art Irrgarten setzte. Der einzige Weg, aus der Box zu entkommen war, dass die Katze erfolgreich bestimmte Verhaltensweisen ausführte wie eine Schnurr ziehen und einen Knopf drücken. Thornedike maß die Zeit, die die Katze benötigte, um zu fliehen.

In einer Serie solcher Versuche fand er heraus, dass die Katze zunächst nach reinem Versuch-und-Irrtum vorging, dann aber bei jedem Versuch weniger Zeit benötigte, um die Box bzw. den Irrgarten zu entkommen, wenn sie danach immer Fressen bekam. Er interpretierte das so, dass die Katze eine Verbindung herstellte zwischen dem Futter und dem richtigen Verhalten, das aus dem Irrgarten zum Futter führte. Wenn sie am Ende kein Futter, sondern Scherzen zugefügt bekam, wurde dieses Verhalten ausgelöscht.

Seine Schlussfolgerung formulierte er als das "Gesetz des Effekts" (law of effect). Es besagt, dass Tiere nach Versuch und Irrtum vorgehen oder nach Belohnung und Bestrafung. Das Tier lernt, indem es zwischen einem bestimmten Verhalten, das zu Belohnung führt, eine Verbindung herstellt. Thornedike nahm an, dass auch menschliches Lernen nach demselben Gesetz funktioniert, dass aber Menschen mehr Verbindungen herstellen als Tiere und dadurch mehr lernen würden.

Thornedikes Puzzle Box

Einfluss auf Schule und Erziehung

Schulen sind schon immer Gegenstand der Kritik gewesen. Um 1900 verbindet sich in den USA diese Kritik mit der Forderung, wissenschaftliche Methoden in den Schulunterricht einzuführen. Thornedike forderte schon damals die Einführung eines standardisierten Lehrplans und die Spezifizierung eines einheitliches Leistungsziels für alle Schüler. Den Unterricht stellten sich die Schüler Thornedikes wie eine Maschine vor, bei der der Lehrer die Vorgänge festlegt und die Schüler sie genau einhalten. Fehlern wurde kaum Raum gegeben und ebensowenig Erfindungsreichtum und Kreativität. Der Einfluss dieser Bewegung wird heute noch (oder wieder!) verspührt.

Burrus F. Skinner (1904-1990)

Skinner-Box

 

Operantes Konditionieren

Theorie

Skinner griff die Theorie Thorndikes auf und nahm an, dass ein Verhalten umso häufiger ausgeführt wird, je konsequenter es verstärkt (belohnt) wird. Die Verstärkung zusammen mit den Umständen erlangt also nach mehrmaliger Darbietung die Kontrolle über das Verhalten. Seine wichtigsten Begriffe sind (positive und negative) Verstärker, Belohnung, Bestrafung, Konditionieren und Löschung.

(Positiver) Verstärker = alle Reize, die die Häufigkeit des Auftretens eines Verhaltens einer bestimmten Person in einer bestimmten Situation erhöhen.
Beispiel: Wenn die Note "5" in Französisch bei Hans die Häufigkeit erhöht, mit der er Vokabeln lernt, dann ist die Note "5" ein positiver Verstärker.
Merke: Die Wirkung des Reizes auf die Reaktion definiert, ob es sich bei dem Reiz um einen Verstärker handelt, nicht die Natur dieses Reizes!

Negativer Verstärker = alle Reize, die bei ihrem Verschwinden zu einem häufigern Verhalten einer bestimmten Person in einer bestimmten Situation führt.
Beispiel: Wenn Hans in Französisch keine "5" mehr erhält und Hans danach noch häufiger Vokabeln lernt, dann ist die Note "5" ein negativer Verstärker.

Bestrafung = alle Reize, die die Häufigkeit des Auftretens eines Verhaltens einer bestimmten Person in einer bestimmten Situation vermindern.
Beispiel: Wenn die Note "5" in Französisch bei Hans die Häufigkeit vermindert, mit der er Vokabeln lernt, dann ist die Note "5" eine Bestrafung.

Konditionierung meint die erfolgreiche Verknüpfung eines Verstärkers mit einer bestimmten Reaktion. Man könnte hier von einem Lernprozess sprechen, was von Skinner abgelehnt würde, das er als Behaviorist die Benutzung von Begriffen ablehnt, die innere Zustände beschreiben (Beispiel siehe unten).

Löschung = wenn eine bestimmte Verhaltensweise plötzlich nicht mehr verstärkt wird, nimmt diese schnell ab.
Beispiel: Der Lehrer gibt Hans in Französisch immer als Verstärker eine "2", wenn der seine Vokabeln fleißig gelernt hat. Nachdem Hans die Schule beendet, bekommt er keine Noten mehr. Sein Vokabellernen nimmt rapide ab. Sein Lernverhalten ist gelöscht.

Konditionierungs-Experimente & Skinner-Box: Meist mit Ratten, manchmal auch mit anderen Tieren, selten mit Menschen. Vor dem Experiment wird durch längeren Nahrungsentzug dafür gesorgt, dass die Versuchstiere ausreichend "motiviert" sind. Eine weitere Maßnahme, um den gewünschten Erfolg eines Experiments zu garantieren ist, die Umwelt, in der es stattfindet, möglichst umfassend zu kontrollieren, indem alle anderen Reize außer dem Verstärker ausgeschaltet werden und das Versuchstier nur die Verhaltensweisen zeigen kann, an der der Versuchleiter interessiert ist ("Skinner-Box" benannt nach ihrem Erfinder).

Beispiel: Hans möchte Gretel dazu bringen, ihn zu heiraten. Er sperrt sie dazu einige Zeit in ihre Wohnung ein, damit sie keinen Mann zu Gesicht bekommt ("Motivation"). Dann lädt er sie in seine Wohnung ein, wo er alle Bilder und Gegenstände entfernt, die Gretel an Männern erinnern könnten ("Reiz-Kontrolle"), und befiehlt ihr, während ihres Besuchs keine anderen Wörter zu gebrauchen als "Ja" (Reaktions-Kontrolle). Dadurch wird die Wahrscheinlichkeit gesteigert, dass Gretel ihn heiratet. Allerdings gibt es keine Gewissheit, sondern nur Wahrscheinlichkeit.

Einfluss auf Schule und Erziehung

Skinner empfahl, die Lernumwelt des Schülers möglichst umfassend unter Kontrolle zu bringen, so dass immer nur der vom Lehrer gewünschte Verstärker und keine anderen Umwelteinflüsse präsent sind und beim Schüler möglichst nur das gewünschte Verhalten auftritt. Diese Empfehlung hat Skinner zu einer Gesellschafts- und Moraltheorie ausgebaut ("Futurum Zwei", "Jenseits von Freiheit und Würde").

In seinem Buch "Futurum Zwei" vertritt Skinner die These, dass Lernen nach den Prinzipien des von ihm entwickelten operanten Konditionierens gestaltet werden sollte und dass immer eher positiv als negativ verstärkt werden sollte, weil das eher zu dem gewünschten Verhalten der Schüler führen würde. Er entwirft als wünschenswerte Utopie eine ganze Gesellschaft, die nach dem Vorbild der "Skinner-Box" gestaltet ist. Menschen erhalten für gewünschtes Verhalten immer eine Belohnung, so dass sie dieses Verhalten häufiger zeigen. Damit würde jede Bestrafung überflüssig.

Auf den Unterricht angewandt bedeutet Skinners Vorschlag, dass, wie schon von Thornedike gefordert, die Regierung genau festlegt, welches Verhalten erwünscht ist und verstärkt oder konditioniert wird.

Skinner sagt nicht explizit, wer diese Belohnungen vergibt und wer bestimmt, was "wünschenswertes" Verhalten ist. Diese, so werfen Kritiker Skinner vor, sind niemand anders als die jeweilige Machthaber in einer Gesellschaft: Regierung, Wirtschaftsbosse, Lehrer und Eltern. Für individuelle Freiheit gibt es in seiner solchen Gesellschaft keinen Platz. Solchen ethischen Bedenken begegnet er in einem zweiten Buch mit dem bezeichnenten Titel "Jenseits von Freiheit und Würde".

Aber selbst wenn ethische und politische Einwände beseite gelassen würden, stellt die Komplexität menschlichen Verhaltens den auf Konditionierung konditionierten Lehrer vor kaum lösbare Probleme. Das haben schon Skinners Experimente selbst gezeigt zeigt.

Beispiel: Ein Kind hat die richtige Lösung in einer Additions-Aufgabe (= gewünschteReaktion). Der Lehrer lobt das Kind (= operantes Konditionieren). Der Skinner-Theorie sagt voraus, dass nach mehrmaligen Loben das Kind immer häufiger die richtige Lösung findet.

Kritik: (1) Nehmen wir an, das Kind hat die Lösung bei seinem Nachbarn nicht selbst gefunden, sondern beim Nachbarn abgeschrieben. Durch das Lob wird das Kind auf Abschreiben konditioniert. In Zukunft wird es also vermehrt abschreiben. Wenn es dabei nicht erwischt wird, führt das Lob also zu einem durchaus unerwünschten Verhalten.
(2) Das Kind hat erfahren, dass der Lehrer es nicht leiden kann und empfindet das Lob als negativen Verstärker und reagiert daher darauf mit immer weniger richtigen Lösungen.
(3) Es werden immer wieder neue Aufgaben gestellt und nicht immer dieselbe. Die Verstärkung kann daher gar nicht wiederholt werden. Es kann eingewendet werden, dass die Verstärkung nicht nur eine ganz bestimmte Aufgabe (= Reiz) betrifft, sondern ganze Aufgabenklassen und daher sehr wohl wiederholt werden. Nur muss man dann fragen, wie solche "Klassen" bestimmt werden. Sind es im obigen Beispiel alle denkbaren Mathematikaufgaben? Dann hätten wir eine Zauberformel gefunden, die alles problemlösende Denken erübrigt. Oder betrifft es nur Additions-Aufgaben? Wenn ja, welche?
(4) Mit dem Begriff des "negativen Verstärkers" schützt Skinner seine Theorie vor jeder Widerlegung. Wenn nämlich ein Verhalten auch dann vermehrt eintritt, wenn der Verstärker gar nicht mehr da ist, findet nach Skinner dennoch Verstärkung statt. Beispiel: ein Kind, das auch eifrig lernt, obwohl sein Lehrer es nicht mehr belobigt, verhält sich danach ebenso Theorie-gemäß wie ein Kinder, das dieses Verhalten nur nach Lob zeigt.

Später hat Skinner den programmierten Unterricht propagiert, um für jeden Menschen optimalen Verstärkungspläne individuell herauszufinden und einzusetzen. Programmierter Unterricht wurde in den 60er Jahren bei einigen Pädagogen sehr populär. Da aber für die oben erwähnten Probleme der Theorie keine Lösunge gefunden werden konnte, hat sich diese Idee als wenig fruchtbar erwiesen. Sie ist schon bald wieder zu den Akten gelegt worden.

Motivationstheorie

Wie alle Behavioristen lehnt auch Skinner den Motivationsbegriff ab. Implizit scheinen die Behavioristen aber zu glauben, dass das menschliche Verhalten allein durch Verstärkung und Bestrafung von außen, also extrinsisch motiviert wird, und eigene Interessen und Fähigkeiten keine Rolle für das Lernen spielen.

Literatur

Skinner, B.F. (1972). Futurum Zwei. Reinbeck b. Hamburg: Rowohlt (Original 1948).

Skinner, B.F. (1982). Jenseits von Freiheit und Würde. Reinbek: Rowohlt.