Skip to main content

Konditionierung: Bedeutung, Definition, Ordnung, Formen, Verstärker, Theorien und Grenzen


Konditionierung ist eine Form des Lernens, welches an bestimmte Reize gekoppelt wird. Dabei wird zwischen Konditionierung erster und zweiter bzw. höherer Ordnung unterschieden. Außerdem gibt es das klassische Konditionierung und das operante.

Was bedeutet Konditionierung

In der Psychologie wird unter Konditionierung das Phänomen verstanden, dass nach einem Reiz beziehungsweise einem Verhalten eine bestimmte Reaktion beziehungsweise eine Konsequenz auf das Verhalten auftritt.

Die Verkettung von Reiz und Reaktion wird auch klassische Konditionierung genannt, während es sich bei der operanten Konditionierung um den Zusammenhang zwischen einer Verhaltensweise und einer darauffolgenden Konsequenz handelt.

Eingängig erforscht wurde dieses Konzept von den Vertretern des Behaviorismus. Dazu zählten etwa B.F. Skinner, Edward Thorndike oder John B. Watson. Den Grundstein für die Erforschung dieser Lernprozesse legte jedoch Iwan Pawlow.

Zu großer Bekanntheit kamen Pawlows Hunde. Iwan Pawlow war ein russischer Physiologe und Mediziner, der die Verbindung zwischen Reiz und Reaktion eher zufällig entdeckte. Ursprünglich war er eigentlich an den Verdauungsvorgängen interessiert, welche er bei Hunden untersuchte.

Die Verdauung beginnt beim Hund, wie beim Menschen auch, bereits bei der Nahrungsaufnahme. Denn der Speichel zersetzt die Nahrung bereits und spaltet Teile davon auf. Somit bestand Pawlows Arbeit auch darin, Hundespeichel zu untersuchen.

Während seiner Experimente fiel ihm auf, dass die Hunde nicht erst beim Fressen mehr Speichel produzierten. Sie speichelten bereits beim bloßen Anblick des gefüllten Futternapfs. Weiterhin erkannte er, dass nicht nur der Napf als Reiz die Reaktion des erhöhten Speichelflusses auslöste. Auch die wiederholte Kombination mit einem neutralen Reiz führte zu dieser Reaktion.

Wurde gleichzeitig eine Glocke geläutet, während der Hund das Futter erhielt, reagierte der Hund nach einigen Malen bereits auf das Glockenläuten mit vermehrtem Speicheln. Der Speichelfluss setzte also bereits ohne den Anblick des Futters ein.

Somit konnte die Nahrung als Reiz ersetzt werden und dennoch kam es zum physiologischen Prozess der Speichelbildung. Dass die Glocke gleichzeitig Nahrung bedeutet wurde somit konditioniert bzw. gelernt.

Klassische Konditionierung

Unterschieden wird zwischen mehreren Varianten von Reizen und Reaktionen.

Ein unbedingter Reiz löst eine unbedingte Reaktion aus. Diese sind angeboren und nicht erlernt. Dazu gehören etwa Reflexe. Ein menschliches Beispiel ist der Saugreflex bei Babys. Dieser ist nicht erlernt, sondern sie zeigen dieses Verhalten sobald sie mit dem unbedingten Reiz – in diesem Falle etwa die Brust der Mutter – konfrontiert werden. Im Beispiel von Pawlows Hunden stellt das Futter den unbedingten Reiz dar, der die unbedingte Reaktion in Form des vermehrten Speichelflusses auslöst.

Daneben gibt es noch den neutralen Reiz und die neutrale Reaktion. Auf diesen Reiz folgt keine spezifische Reaktion. Ohne die Assoziation zwischen Glockenläuten und Futter, bleibt der Ton der Glocke für den Hund ein neutraler Reiz. Er zeigt kein bestimmtes Verhalten darauf, sondern schaut sich gegebenenfalls lediglich nach der Quelle des Geräusches um.

Ein bedingter Reiz ist ein neutraler Reiz, der an einen unbedingten Reiz gekoppelt wurde

Nach einer Konditionierung kommen dann der bedingte Reiz (Glockenläuten) und die bedingte Reaktion (Speichelbildung) ins Spiel.

Beides ist nicht angeboren, sondern erlernt. Der bedingte Reiz (Glocke) ist ursprünglich ein neutraler Reiz, welcher an einen unbedingten (Füttern) gekoppelt wird. Der Hund hat eine Verbindung zwischen Glocke und Futter hergestellt und die unbedingte Reaktion wird zur bedingten. Sie ist nun Folge des bedingten Reizes.

Konditionierung höherer bzw. zweiter Ordnung

Bei der Konditionierung zweiter Ordnung wird ein neutraler Reiz mit dem konditionierten Reiz gekoppelt.

Durch diese weitere Verbindung kommt es zur konditionierten Reaktion, obwohl keine Verbindung zwischen dem neuen Reiz und dem unkonditionierten Reiz bestand.

Das klingt erst einmal etwas verwirrend, daher nehmen wir wieder das Beispiel mit Pawlows Hunden: Der Hund hat bereits gelernt, dass das Läuten der Glocke das Futter ankündigt und beginnt zu speicheln. Das Glockenläuten ist der konditionierte beziehungsweise bedingte Reiz und das Speicheln die konditionierte beziehungsweise bedingte Reaktion.

Jetzt kommt noch ein neuer Reiz hinzu. Das kann zum Beispiel das Aufleuchten eines Lichtsignals sein. Das Licht ist noch ein neutraler Reiz und steht weder mit der Reaktion noch mit dem Futter oder dem Glockenläuten in Verbindung. Leuchtet wiederholt das Licht beim Ertönen der Glocke auf, entsteht eine neue Verkettung. Der Hund assoziiert das Licht mit der Glocke, welche mit dem Futter assoziiert ist. Nach einer weiteren Konditionierung beginnt der Hund zu speicheln, wenn er nur das Licht sieht.

Möglichkeiten und Grenzen der klassischen Konditionierung

Die klassische Konditionierung kann zum Erwerb emotionaler Reaktionen genutzt werden sowie für den Auf- oder Abbau von bedingten Verhaltensweisen.

Wird dem Hund zum wiederholten Male trotz des Glockenläutens kein Futter gegeben, lässt der Speichelfluss irgendwann nach. Es findet eine Löschung oder auch Extinktion statt. Die Assoziation zwischen Glockenton und Futter nimmt immer weiter ab, woraufhin die Reaktion ebenfalls seltener gezeigt wird.

Neben der Löschung besteht auch die Möglichkeit einer Gegenkonditionierung, auch Desensibilisierung genannt. Dabei wird die erlernte Assoziation durch eine andere ersetzt. Diese Funktion kann auch im Rahmen von Psychotherapien genutzt werden, um zum Beispiel Angststörungen zu behandeln.

Timing ist alles beim Konditionieren

An seine Grenzen stößt die klassische Konditionierung, sofern der zeitliche Abstand zwischen dem unbedingten und dem neutralen Reiz zu groß ist. Im Beispiel der Pawlow´schen Hunde müssen das Glockenläuten (neutraler Reiz) und das Futter (unbedingter Reiz) also zeitlich eng gekoppelt sein, damit eine Konditionierung stattfinden kann.

Folgt auf das Futter erst nach einer längeren Zeit die Glocke, erkennt der Hund keinen Zusammenhang mehr zwischen den beiden Reizen. Der Speichelfluss bleibt also auf den Futterreiz beschränkt. Das wäre ebenso der Fall, wenn zuerst die Glocke ertönt und dem Hund erst nach einer längeren zeitlichen Verzögerung das Futter gegeben wird.

Operante Konditionierung

Operante Konditionierung bedeutet, dass auf ein bestimmtes Verhalten eine Konsequenz folgt.

Anders als bei der klassischen Konditionierung werden bei der operanten Variante keine Reize eingesetzt, auf die eine Reaktion folgen soll. Ausschlaggebend ist hier eine Verhaltensweise.

Thorndike untersuchte als Erster den Mechanismus der operanten Konditionierung. Dazu nutze er eine Puzzlebox. Dabei handelte es sich um eine Kiste, die sich von innen durch einen simplen Mechanismus öffnen ließ. Etwa durch das Verschieben eines Riegels. In die Puzzlebox setzte Thorndike eine Katze.

Das Versuchstier im Inneren brauchte beim ersten Versuch noch recht lange, um diesen Mechanismus zu betätigen und die Tür zu öffnen. Sobald die Katze aus der Puzzlebox herauskam, gab es Futter zur Belohnung. Beim ersten Mal brauchte das Tier noch relativ lange, um aus der Box zu kommen. Erst als es den Mechanismus zufällig auslöste, öffnete sich die Tür. Die Katze kam also nicht zu einer Einsicht, sondern erlernte das Verhalten durch Versuch und Irrtum.

Übung macht den Meister

Nach einigen Versuchen gelang es dem Tier immer schneller, sich aus der Box zu befreien und an das Futter zu gelangen.

Bald gelang es der Katze, sich innerhalb von wenigen Sekunden aus der Puzzlebox zu befreien. Sie hatte also gelernt, dass auf ihr Verhalten (Mechanismus betätigen) eine Konsequenz folgt (Tür öffnet sich und es gibt Futter).

Thorndike erklärte dies mit dem Gesetz der Wirkung. Das Tier verbindet das mit der Belohnung einhergehende Verhalten mit der Situation. Wiederholt sich diese oder eine annähernd gleiche Situation, wendet das Tier dasselbe Verhalten an. Im Umkehrschluss bedeutet das: Geht ein Verhalten nicht mit einem Erfolg einher, wird dieses Verhalten in Zukunft auch nicht mehr gezeigt.

Ein weiteres Beispiel ist die Skinner-Box. Auch Burrhus F. Skinner arbeitete mit Versuchstieren, die durch ein bestimmtes Verhalten eine Belohnung bekamen. Er arbeitete allerdings nicht mit Katzen, sondern mit Tauben und Ratten. Seine Versuchstiere setzte er in eine Box, in der eine Taste oder ein Hebel vorhanden waren. Betätigte das Tier diesen Auslöser, öffnete sich ein Fach mit Futter. Hatten die Tiere das erst einmal begriffen, betätigten sie den Auslöser immer häufiger.

Die Konsequenzen beeinflussen die Auftretenswahrscheinlichkeit des Verhaltens. Entscheidend sind hierbei Belohnung und Bestrafung. Beide werden in zwei Kategorien unterschieden. Die Belohnung wird auch Verstärkung genannt und kann positiv oder negativ ausfallen. Eine positive Belohnung bedeutet, dass ein Verhalten mit einer angenehmen Konsequenz verknüpft ist.

Bei einer negativen Belohnung bleibt eine unangenehme Konsequenz aus. Die zweite Kategorie ist die Bestrafung oder auch Abschwächung. Sie beinhaltet ebenfalls eine positive und eine negative Variante. Die positive Bestrafung geht mit einer unangenehmen Konsequenz einher, während diese bei der negativen Bestrafung ausbleibt.

Positiv und negativ bedeutet im Kontext der operanten Konditionierung also weniger „gut“ oder „schlecht“, sondern beschreibt einfach nur das Vorhandensein beziehungsweise Ausbleiben einer bestimmten Konsequenz.

Primäre und sekundäre Verstärker beim Konditionieren

Die Verstärkung beschreibt also die Konsequenz.
Mit Verstärkern hingegen sind angenehme oder unangenehme Reize gemeint, die das Verhalten beeinflussen. Hier wird zwischen primären und konditionierten Verstärkern unterschieden. Primäre Verstärker sind angeboren und damit biologisch verankert. Beispiele dafür sind Nahrung oder Wasser.

Thorndike und Skinner nutzten also primäre Verstärker als sie ihre Versuchstiere mit Futter belohnten. Konditionierte oder sekundäre Verstärker sind erlernt. Sie sind lediglich die Assoziation zwischen einem neutralen Reiz und einem primären Verstärker. Geld ist zum Beispiel ein sekundärer Verstärker.

Für sich genommen ist Geld ein neutraler Reiz, der allerdings mit einem primären Verstärker gekoppelt ist. Immerhin können wir uns von Geld etwas zu Essen kaufen und Nahrung ist ein primärer Verstärker. Weitere Beispiele für konditionierte Verstärker sind Lob, Noten oder Auszeichnungen.

Konditionierung lässt sich mit Verstärkerplänen messen

Welche Art der Verstärkung am effektivsten ist, kann anhand von Verstärkerplänen veranschaulicht werden.

Unterschieden werden fixierte und variable Quotenpläne sowie fixierte und variable Intervallpläne. Der Quotenplan sieht nach einer bestimmten Anzahl der gezeigten Verhaltensweisen eine Belohnung vor. In der fixierten Variante erhält eine Ratte zum Beispiel immer dann Futter, wenn sie eine Taste fünfmal gedrückt hat.

Bei einem variablen Quotenplan erhält sie die Belohnung zwar im Durchschnitt auch nach jedem fünften Drücken. Allerdings nicht immer: Beim ersten Mal kann das Futter schon nach zweimaligem Betätigen der Taste erscheinen, beim zweiten Mal erst nach siebenmaligem Drücken und so weiter.

Ebenso verhält es sich bei Intervallplänen. Hier spielt der zeitliche Abstand zwischen den Belohnungen eine Rolle. So bekommt die Ratte beispielsweise alle zehn Sekunden eine neue Portion Futter, unabhängig von der Anzahl des gezeigten Verhaltens. Bei variablen Intervallplänen erfolgt die Belohnung auch durchschnittlich alle zehn Sekunden, doch in unregelmäßigen Abständen. Zum Beispiel zuerst nach acht Sekunden, dann nach zwölf, anschließend nach neun Sekunden etc.

Erlerntes Verhalten kann auch wieder gelöscht werden, sobald das Verhalten nicht mehr belohnt wird. Durch variable Verstärkerpläne werden Verhaltensweisen jedoch löschungsresistenter. Zwar wird ein bestimmtes Verhalten durch diese Pläne auch langsamer erlernt, doch es bleibt nachhaltiger bestehen. Das liegt daran, dass beim Erlernen bereits nicht immer ein Verstärker auf das Verhalten führte.

Bleibt der Verstärker irgendwann gänzlich aus, wird das Verhalten dennoch über einen längeren Zeitraum gezeigt. Immerhin könnte der Verstärker ja trotzdem noch einmal auftreten. Ein Beispiel für die Wirksamkeit von variablen Verstärkerplänen ist die Glücksspielsucht. Die Belohnung kommt nicht bei jedem Versuch, kann jedoch hin und wieder auftreten. Daher bleibt das Verhalten hartnäckig bestehen, was in diesem Fall sehr von Nachteil sein kann.

Möglichkeiten und Grenzen der klassischen Konditionierung

Operante Konditionierung kann in der Erziehung oder im Schulalltag eingesetzt werden.

Wenn ein Kind ein gewünschtes Verhalten zeigt, folgt eine dementsprechende Konsequenz. So kann es zum Beispiel dazu gebracht werden, sein Zimmer in Ordnung zu halten. Erhält es für jedes Aufräumen einen Verstärker (zum Beispiel seine Lieblingssendung als Belohnung), wird es das Verhalten häufiger zeigen.

Ähnlich verhält es sich mit positiver Bestrafung. Zeigt das Kind ein unerwünschtes Verhalten, wird es ausgeschimpft und das Verhalten sollte abnehmen. Allerdings besteht bei Bestrafung das Problem, dass es zu einer Generalisierung auf die gesamte Situation kommen kann. In diesem Fall weiß das Kind gar nicht so recht, wofür es überhaupt bestraft wird.

Zeitliche Verzögerungen schmälern auch hier den Lernerfolg. Wird ein Kind nicht direkt nach einem Verhalten bestraft oder belohnt, kann es die Konsequenz keinem Verhalten mehr zuordnen. Außerdem ist die Regelmäßigkeit wichtig. Sobald auf das Verhalten eine andere Konsequenz folgt, wird die Verbindung zwischen den beiden Faktoren abgeschwächt.


Über den Autor

wissen
Folge Sciodoo und bleibe stets auf dem Laufenden. Schließ dich uns an und abonniere unseren Instagram-Kanal ein. Wir stellen täglich neue Artikel für dich rein.
Weiter zum Kanal>>>