Willkommen! Anmelden Ein neues Profil erzeugen

Erweiterte Suche

Regeln für Lob und Bestärkung

geschrieben von Martin + Mirko(YCH) 
Regeln für Lob und Bestärkung
18. Juni 1997 18:07


Grüss Euch alle zusammen!

Wenn wir unseren Hund mit Belohnung und Liebe erziehen wollten, so ist das sicher lobenswert, aber keine Garantie für einen guten Erfolg.
Darum seien nachfolgend einige Regeln angeführt, die man sich sehr gut einprägen sollte.


BESTÄRKUNGS-REGELN

Kein Tier hat bei seinen Tätigkeiten jedesmal Erfolg. Ein Raubtier bei der Jagd hat eine etwa 10% Erfolgschance. Es muss trotz Misserfolgs wieder mit vollem Einsatz neu beginnen. Das vorweg.

Man hat daher sehr gründlich untersucht, wie Zeitpunkt und Häufigkeit einer Bestärkung (Belohnung) auf das Lernverhalten wirken.

Es gibt:

- die Immerbestärkung (jede richtige Handlung wird belohnt)

- die Bestärkung in festem Verhältnis (jedes zweite Mal, 2:1,jedes dritte Mal 3:1 usw.)

- die variable Bestärkung (Zufallsprinzip, Glücksspiel)
Nach wieviel Wiederholungen oder nach welchen Zeitdauern im Mittel bestärkt werden sollte, hängt von der Tierart und der Tätigkeit ab.

Diese Bestärkungsschemata wirken verschieden auf das Lernen.

- Die Immerbestärkung erreicht die schnellsten Lernerfolge (Änderung des Verhaltens; Shaping)

- Das feste Verhältnis erreicht die schnellste Festigung des Verhaltens, d.h. es wird häufig und zuverlässig gezeigt.

- Die variable Bestärkung erreicht die größte Sicherheit gegen Auslöschung (Extinktion).

Wird ein Verhalten (das nicht natürlich vorkommt z.B. Einschalten eines Lichtschalters mit der Schnauze) nicht mehr bestärkt, so stirbt es aus. Es wird immer seltener gezeigt, bis es nicht mehr vorkommt. Wie oft es noch gezeigt wird, wenn man abrupt aufhört zu belohnen, ist ein Mass für die Zuverlässigkeit des Gelernten.

Wenn wir im Training immer mit Leckerle belohnen und dann in der Prüfung plötzlich nichts mehr geben, werden wir Zeuge, wie das Aussterbens gerade zu Beginn ziemlich schnell vorangeht. (Seufz)

Den Rekord hält eine Taube, die ~800 mal gegen eine bunte Scheibe pickte, ohne belohnt zu werden, bevor sie endgültig aufgab.

Jetzt kommt ein wichtiger Satz:
Auch ein Verhalten, das ausgestorben war, wird nach wenigen Bestärkungen wieder in voller Intensität gezeigt (wenn man das Tier wieder dazu veranlassen konnte.)
Klar, warum das Betteln bei Tisch so schwer abzugewöhnen ist? Jeder gelegentliche nachsichtige Gast mit einem Häppchen sorgt dafür, dass dieses Verhalten bombenfest durch variable Bestärkung zementiert wird.

Und nun kann man auch das "Rezept" verstehen:
Zuerst erfolgt das Formen (Shaping) mittels Immerbestärkung, bis das Verhalten in der Qualität gezeigt wird, die wir uns vorstellen:
z.B. ein Vorsitz dicht und gerade.

Dann geht man über zum festen Verhältnis (Tausch 2:1) 2x richtiges Verhalten gegen 1x Bestärkung. Das steigert man allmählich vielleicht auf 5:1.

Dann geht man über zur variablen Bestärkung. Es werden sowieso nur die sehr guten Leistungen bestärkt. Einmal mit einem besonders guten Leckerle (Ball werfen), einmal mit einem normalen, immer öfter gar nicht.

Im Idealfall fügt man jetzt das Signal (den Befehl) vorweg (Pawlowsche Konditionierung)
"Erst kommt die Qualität in ein Produkt, dann das Etikett darauf."

Für einfache Verhaltensweisen guten Benehmens kann man das aber schon nach dem Shaping tun.

Man muss gewärtig sein, dass das Tier, wenn wir nicht jedesmal bestärken (beim Shaping, wenn die Ausführung nicht gut genug war) alles mögliche auszuprobieren beginnt. Es muss ja herausfinden, wann es etwas gibt.

Die Regel heisstOhne Quatsch keine Qualität
oder ohne Blödsinn keine Bestleistung.
Wenn wir etwas völlig neues probieren wollen, wird uns unser Hund mit allem eindecken, was er irgendwann einmal gelernt hat. Dann sagen wir "falsch" in neutralem Ton und bleiben ermunternd in unserer Haltung, um ihn weiter aktiv zu halten. Nur dann kann er sein Verhalten ändern.

Wenn wir verfolgen, wie der Wechsel der Bestärkung geht, sehen wir sofort eines
Üben, üben, üben! Zu Beginn möglichst ohne Ablenkung.

Ob man nun mit Clicker übt, mit Worten lobt, mit Spiel oder Futter belohnt. Diese Regeln treffen immer zu.

Grüsse von Martin & Mirko