:: Die zu erwartete Belohnung muss etwas sein, was
:: Deinen Hund aus der Reserve lockt, etwas, was ihn
:: so hoch motiviert, dass er sein Verhalten auf jeden
:: Fall auch dann noch mehrmals wiederholt, wenn es
:: dafür kein C&B gibt.
: Nun, jetzt bin ich weiterhin etwas unschlüssig. Hund
: wird von mir mit der Belohung nicht gelockt, dennoch
: soll ich sie ihm in Aussicht stellen? Wenn ich Leckerli
: oder Spielzeug schon mal auspacke, dann geht das
: ganz zackig. Das ist ja aber nicht der Sinn der Sache.
Hallo Andreas,
Deine Frage kann ich gut verstehen. Sie wird immer wieder gestellt von Leuten, die mitdenken..
Mit dem Auspacken und Bereitlegen von Leckerli und Spielzeug eröffnest Du Deine Clickersitzung. An diesen Vorbereitungen erkennt Dein Hund schon sehr früh, dass jetzt Clickern angesagt ist und dass er jetzt aktiv werden darf und mit einer Belohnung rechnen kann. Ich denke das ist richtig und auch gut so. Das war auch schon Gegenstand der Erörterung weiter unten im Thread "Clickern mal anders". Harr hatte die Idee ein Start-Kommando für die Clickersession einzuführen, weil er die gleiche, gedankliche Klippe vor sich hatte. Ob man das braucht oder nicht, mag jeder für sich und seinen Hund entscheiden. Die Praxis zeigt meist, dass es nicht notwendig ist. Mit wachsender Erfahrung des Hundes ist ohnehin immer das erste "Click" einer Session das Erkennungssignal für den Hund, dass jetzt geclickert wird, egal ob Leckerchen schon vorbereitet sind oder nicht.
Der Hund merkt selber, wenn es jetzt losgeht. Da sind die meisten Vierbeiner ganz fix im Kapieren. Man muss ihnen dazu nicht extra ein Leckerchen oder das Spielzeug vor die Nase halten. Oft ist auch die Örtlichkeit ein deutliches Indiz für den Hund. Ich denke das wird sich auch bei Euch so entwickeln. Ein direktes Locken mit Leckerli ist nicht mehr nötig, wenn der Hund einmal kapiert hat, wie das Clickern abläuft.
Das Wissen um die Möglichkeit einer Belohung oder die Möglichkeit eines Spiels motiviert den Hund und macht ihn zum aktiven Partner. Er beginnt zu agieren und Du reagierst mit C&B unter Beachtung der Regeln für
a) Immerbelohnung
b) variable Bestärkung
c) Shaping.
Eine Session, die das Verfestigen einer vorher erlernten Aktion zum Ziel hat (variable Bestärkung), könnte zum Beispiel so aussehen:
Hund bemerkt die Vorbereitungen,
deshalb beginnt er zu agieren
Aktion
Aktion
Aktion C&B
Aktion C&B
Aktion C&B
Aktion
Aktion C&B
Aktion
Aktion C&B
Aktion C&B
Aktion
Aktion C&B
Aktion
Aktion C&B
Aktion
Aktion
Aktion C&B
Aktion
usw.
Jede Regelmäßigkeit in der Vergabe der C&B ist zu vermeiden, weil sie einen unerwünschten Lerneffekt erzeugen könnte*). Diese Phase dient nur dazu eine "sichere Wiederholung des Gelernten zu erreichen". C&B wird in diesem Stadium noch völlig willkürlich und unabhängig von der Qualität der Aktion gegeben. Martin schreibt in seiner Clickereinführung: "Die variable Belohnung ist das Geheimnis für eine stete und sichere Wiederholung des Gelernten". Weltweit bekanntes Musterbeispiel hierfür ist das Betteln am Tisch.
Erst wenn Du eine "stete und sichere Wiederholung des Gelernten" erreicht hast, kannst Du mit dem Shaping beginnen. Vorher mit dem Shaping zu beginnen wäre falsch, der Hund wäre verunsichert und Deine Frage diesbezüglich war deshalb vollkommen berechtigt.
Ist diese Phase der variablen Bestärkung mit Erfolg abgeschlossen, dann erst beginnt das Shaping, das Formen des Verhaltens.
Shaping:
Du kannst, wenn ein Verhalten stetig und sicher gezeigt wird, ein Kriterium nach dem anderen mittels Shaping optimieren. Aber immer nur eines, niemals zwei Kriterien parallel!
Eines der Kriterien kann z.B. sein, dass der Hund sich **schnell** hinsetzt, also förmlich in den Hinterbeinen zusammenklappt. Dazu belohnst Du nur noch die schnelleren Aktionen, so dass Du theoretisch auf eine Bestärkungsrate von 2:1 bis 3:1 kommst. Die langsamen Ausführungen ignorierst Du. Der Hund wird dabei schnell merken, worauf es Dir ankommt. Und er *muss* es merken, sonst ist das Shaping sinnlos. Auf diese Weise wird der Hund in der Ausführung immer schneller. Die Vergabe der C&B in dieser Phase geschieht also gezielt und orientiert sich an der Qualität der Aktion. Hier soll damit ein bestimmter Lerneffekt erreicht werden (schnellere Ausführung, gerades Vorsitzen usw. usw.), ganz im Gegensatz zur vorangegangenen Phase der variablen Bestärkung.
An dieser Stelle taucht immer wieder ein anderes Missverständnis auf, das ich am Beispiel "Sitz" erklären möchte: Es geht uns hier und jetzt darum, wie schnell der Hund beim Sitz den Popo auf den Boden kriegt, wie schnell er also hinten herunterklappt. Es geht darum, die Ausführungszeit der Aktion zu verkürzen. Eine andere Sache, die später in Angriff genommen wird, ist die Reaktionszeit nach dem Signal, also die Zeit zwischen Signal und dem Beginn der Aktion. Auch diese Zeit muß möglichst verkürzt werden, das ist wichtig für das zuverlässige Befolgen eines Signals, aber das ist zu diesem Zeitpunkt natürlich noch nicht möglich, weil das Signal noch gar nicht eingeführt wurde. Das muss man also alles fein säuberlich auseinanderhalten.
Viele Grüße
aus dem Wilden Südwesten
Reinhold + Ayko
*) Ein sehr schönes Beispiel dafür zeigte Martin auf einem seiner Seminare. Er clickerte mit einem ihm fremden Welpen, der zuvor noch nie einen Clicker gehört hatte. Innerhalb kürzester Zeit hatte er dem Welpen "sitz" beigebracht. Ohne jedes Signal setzte der Welpe sich hin und erwartete sein Leckerchen. Das zeigte er wiederholt, stetig und recht zuverlässig.
Daraufhin begann Martin konsequent nur noch jede zweite Aktion des Welpen mit C&B zu bestätigen. Wir trauten unseren Augen kaum, wie schnell der Welpe dadurch lernte, dass er sich jetzt zweimal hinsetzen muss um einmal C&B zu bekommen, er zeigte von diesem Zeitpunkt ab zu unseren Verblüffung ganz zuverlässig folgendes Verhalten:
Popo runter, Popo hoch, Popo runter, Warten auf Leckerle C&B
Popo runter, Popo hoch, Popo runter, Warten auf Leckerle C&B
Popo runter, Popo hoch, Popo runter, Warten auf Leckerle C&B
usw.
Und diesen Zyklus wiederholte er beständig. Keine Angst: Für einen erfahrenen Clickertrainer ist es kein Problem, dieses Verhalten genauso schnell wieder zurückzuformen zu einem einfachen Sitz, man muss nur einfach wieder zur Immerbestärkung zurückkehren. :-))))
Ich wollte damit nur erklären, warum man in der Phase der variablen Bestärkung vorsichtig sein muss und nicht stur und stupide z.B. nur jede zweite Aktion mit C&B bestätigen darf.