Willkommen! Anmelden Ein neues Profil erzeugen

Erweiterte Suche

Shaping = variable Bestärkung ?

geschrieben von Harr und Ronja(YCH) 
Shaping = variable Bestärkung ?
20. Januar 2000 11:12

Hallo!

Bevor ich mit dem Shaping (am Beispiel des Touchsticks) anfange,
möchte ich die Clickerexperten mal fragen, ob nicht Shaping aus
der Sicht des Hundes mit variabler Bestärkung gleichbedeutend ist?

Für den Hund stellt es sich doch so dar:

- Hund führt Aktion aus, für die es bisher immer C+B gab.
- Plötzlich gibt's kein C!
- Hund fragt sich: how?
- Hund probiert Variationen des Themas, denn er will ja das C+B!
- zufällig kommt irgendwann eine Aktion, die näher am gewünschten
Ziel liegt.
- jetzt kommt das C+B.
- Hund ist glücklich und probiert's gleich nochmal und nochmal ....

Ich behaupte jetzt einmal, dass bis auf die marginale Differenz
in der Aktion des Hundes kein nennenswerter Unterschied zwischen
Shaping und variabler Bestärkung liegt.
Das würde auch erklären, warum variable Bestärkung den Hund
überhaupt derart motivieren kann.

Grübel, grübel....

Harr.


20. Januar 2000 14:38

Grüß Dich Harr,

du behauptest

: ... jetzt einmal, dass bis auf die marginale Differenz
: in der Aktion des Hundes kein nennenswerter Unterschied zwischen
: Shaping und variabler Bestärkung liegt.

JEIN. Beide male arbeitet man gegen das löschen. Beim shaping soll der hund variieren, was er natürlicherweise irgendwann tut, bevor er ganz aufgibt (deswegen die kleinen schritte) -
bei der variablen bestärkung wird aber immer das gleiche verhalten bestärkt, nicht die variation. Auch hier muss hund durchhalten.

Einmal ist das übergeordnete verhalten: ändern / probieren
beim anderen mal: dabeibleiben / wiederholen.

Wenn ein verhalten sehr lange nicht bestärkt wird, wird der hund immer beginnen zu variieren, weil das teil der löschung ist.
Beispiel: hund kommt auf ruf zurück, erfährt aber nie etwas positives. Nun varriert er, kommt ein wenig, reicht schon oder? Gibt man sich damit zufrieden, "naja, eigentlich solltest du ganz herkommen, aber meinetwegen kannst du auch da schnüffeln", dann wurde hund für diese variation belohnt! Er wird weiter "eigenmächtig" handeln, weil ihm das ja bestärkt wird. Und bei der ultimativen variation: OK, höre dich, geht dir noch gut; bekommen wir dann einen alpha-zorn, den hund gar nicht verstehen kann.

tschüß martin & mirko

20. Januar 2000 15:18

Hallo Martin,

sind doch schön diese Unterbrechungen während der drögen Arbeit
am Schreibtisch.... ;-)))

: Einmal ist das übergeordnete verhalten: ändern / probieren
: beim anderen mal: dabeibleiben / wiederholen.

Ja, aber liegt hier nicht der selbe Prozess im Hundehirn zugrunde?

Ich meine, aus der Sicht des Hundes ist es doch gar nicht
unterscheidbar, ob es um eine allmähliche Änderung seines
Verhaltens oder um exakt immer das gleiche Verhalten geht
(wobei "exakt" sowieso nie geht, denn eine geringe
Abweichung wird es immer geben -- und sei es zum "besseren"winking smiley

Die Unterscheidung zwischen Shaping und variabler Bestärkung
findet doch bloss in unserer(!) Vorstellung statt.

Worauf ich hinaus will: variable Bestärkung ist letztlich
nichts anderes als ein Grenzfall des Shapings, oder?

Wenn dem so wäre, dann muss ich bei variabler Bestärkung
eigentlich nichts anderes tun, als einfach nur auf eine
Gelegenheit warten, wo das Verhalten des Hundes
dem gewünschten Ziel bereits ein kleines bisschen näher
gekommen ist und das dann bestätigen. Es würde aber
auch nichts schaden, wenn ich "gleich gutes" Verhalten
bestätige, sozusagen zur Sicherheit, bevor es wieder
"schlechter" wird.
Ich darf nur niemals "schlechteres" Verhalten bestärken!

Wenn ich mich an diese letzte Regel halte, kann doch
eigentlich alles immer nur besser werden, oder?

Viele Grüsse,
Harr.


20. Januar 2000 16:01

Hallo Harr !

yawning smileyb nicht Shaping aus
:der Sicht des Hundes mit variabler
:Bestärkung gleichbedeutend ist?

Mmmh ! Ich glaube, das ist eine Frage der Begriffs-
definition.

Bei der Verhaltensformung werden kleine Schritte im Hinblick
auf das Ziel bestärkt. Ich stelle mir das immer so vor (stammt von
Jean Donaldson, nicht von mir):

Wenn ein bestimmtes Verhalten gezeigt wird, so penedelt die
Intensität diese Verhaltens um einen Mittelwert. Beispiel:
"Voran" klappt im mittel auf 6m, bevor der Hund stehenbleibt und
sich umsieht...durch gezielte variable Bestärkung verschiebt
sich der Mittelwert auf 7m, 8m u.s.w. .... das ist der Prozeß
der Verhaltensformung. Ähnliches gilt für den Targetstick...
zunächst ist der Mittelwert das Hingucken, dann das Zuwenden
und schließlich das Berühren des Sticks...Jetzt ist es möglich,
die Geschwindigkeit zu verbessern, die Intensität des Touch oder
auch die Genauigkeit...(aber immer nur 1 Kriterium!)

Die Aufgabe des Trainers ist es dabei, die Schritte so klein zu
gestalten, daß der Hund immer eine Chance zum Erfolg hat.

Vo variabler Bestärkung spricht man wohl eher, wenn ein Verhalten stabil
gezeigt wird und dann auch die "Mittelwerte" bestärkt werden. Es
gibt keine für den Hund erkennbare Erhöhung der Kriterien.

Btw: Der Begriff variable Bestärkung ist ziemlich inter-
pretationsfähig :-) zeitlich, örtlich, intensität...?

:- Hund führt Aktion aus, für die es bisher immer C+B gab.
:- Plötzlich gibt's kein C!
:- Hund fragt sich: how?
:- Hund probiert Variationen des Themas, denn er will ja das C+B!
:- zufällig kommt irgendwann eine Aktion, die näher am gewünschten
:Ziel liegt.
:- jetzt kommt das C+B.
:- Hund ist glücklich und probiert's gleich nochmal und nochmal

...das ist die Verhaltensformung.

:Ich behaupte jetzt einmal, dass bis auf die marginale Differenz
:in der Aktion des Hundes kein nennenswerter Unterschied zwischen
confused smileyhaping und variabler Bestärkung liegt.

Eigentlich schon. Bei variabler Bestärkung steigerst Du ja nicht
die Anforderungen.

Aber es ist natürlich etwas variables, das Verhalten entwickelt sich
weiter..ist im Fluß, sozusagen. Insofern Ja und Nein !

Wobei ich glaube, daß ein erfahrener Clickerhund sehr wohl weiß,
ob es ums "weiterentwickeln" oder ums "kriege ich diesmal einen
Click?" geht.

Eine interessante Frage. Im Prinzip hatte ich vor Deiner Frage noch
nie so recht drüber nachgedacht... :-)

Ciao

Rolf

20. Januar 2000 16:32

Hallo Rolf,

: Eine interessante Frage. Im Prinzip hatte ich vor Deiner Frage noch
: nie so recht drüber nachgedacht... :-)

es geht mir halt darum, die Dinge möglichst präzise
und dabei einfach zu halten. Aus der oben genannten
Behauptung leitet sich nämlich eine ganz simple
Regel ab, die da lautet:

"Man kann alles Verhalten bestätigen, solange es nicht
schlechter ist als das bisher schon gezeigte"

Das kann man sich gut merken und jedem erklären.

Später, wenn das Verhalten perfekt sitzt und man mit
der Konditionierung des Signals beginnt, muss man nur
noch gegen die Verschlechterung des Verhaltens
bestätigen. Hier käme dann der von Dir beschriebene
Mittelwert zum tragen. Aber am Ende bleibt es immer
das gleiche Spiel.

Die Schwierigkeit besteht nur noch darin, zu erkennen,
wann ein Verhalten "schlechter" ist. Martins Beispiel
mit dem Kommen ist sehr einleuchtend.

Bis dann,
Harr.


20. Januar 2000 16:58

Grüß Dich Harr,

jetzt hab ich´s kapiert:

: Ich darf nur niemals "schlechteres" Verhalten bestärken!
:
: Wenn ich mich an diese letzte Regel halte, kann doch
: eigentlich alles immer nur besser werden, oder?

Du hast natürlich mit der grenzfalldefinition recht. Das shaping kann ja immer nur ein gewisses niveau erreichen. besser geht es nicht.
(Das liegt schon daran, dass das diskriminationsvermögen grenzen hat.
Ich glaube, das hast du auch im sinn.)
Und dieses plateau kann man durch variable bestärkung erhalten. Natürlich geht das auch schon bei einer anderen ausführung.
Innerhalb der tagesform wird das verhalten immer variieren.
Ich muss dabei an sport denken, wo es einem auch einmal passiert, dass die koordination einfach nicht stimmt und etwas total sicheres plötzlich wackelt.

tschüß martin & mirko