Pozitívny prístup vo výcviku zvierat

Prednáškový seminár RNDr.Františka Šustu (Sibracentrum 11.1.2014)

Kto je F.Šusta: Absolvent Prírodovedeckej fakulty Karlovej Univerzity a fakulty živ.prostredia ČZU v Prahe,od roku 2008 na pozícii špecialistu tréningu zvierat v ZOO Praha,autor rady odborných a popularizačnych článkov ocenený niekoľkými medzinárodnými oceneniami od ABMA (Animal Behavior Management Aliance).

Nie je celkom dobre možné zachytiť a dostať do článku všetko čo sa dozviete v priebehu 8-hodinového seminára a preto prezentujem tento článok viac-menej ako upútavku na  tému tréningu pozitívnym posilnením. Jedná sa o veľmi zaujímavú problematiku z ktorej si každý kynológ má čo zobrať... 

TRÉNING POZITÍTVNYM POSILNENÍM – "Positive reinforcement training"

S teóriou učenia ,,posilnením“ ( reinforcement) ako prvý prišiel americký psychológ a behaviorista B.F.Skinner už v roku 1957. Dlhodobé pozorovania ukazujú, že táto metóda je úspešne použiteľná u akéhokoľvek zvieraťa  a že zviera trénované touto metódou má o tréning i svojho trénera o mnoho väčší záujem než pri iných metódach.
Pozitívne posilnenie, resp. pozitívna motivácia je metodika, ktorá cielene zvyšuje pravdepodobnosť chceného chovania tým, že ho v jasných súvislostiach spojuje s odmenami. Nestojí to však len na odmenách. Je to skôr ucelený systém, ktorý kladie dôraz na vedomú aktivitu a snahu na strane zvieraťa. Do kynológie ju vniesla Karen Pryor a práve František Šusta je v našom regióne jej úspešným nasledovníkom. Aj keď sám o sebe hovorí, že nie je kynológ- odborník, myslím, že práve u kynológov získáva čoraz väčšie uznanie .
Pokiaľ chceme zviera niečo učiť, mali by sme si  uvedomeniť zákonitosti a snažiť sa im porozumieť. Rozdiel medzi pozitívnym a negatívnym posilnením je najlepšie ukázať  na príklade:                                                                                
Vľavo je vrcholový športovec na štadione, ktorý trénuje aby niečo získal a vpravo je vojak na ,, buzerplace“,ktorý cvičí,lebo je donútený...

VRCHOLOVÝ ŠPORTOVEC
(cieľ je olympiáda , tréner je prostriedok,
ktorý mu k tomu môže pomôcť)
vs. VOJAK na ,,buzerplace“
(cieľ: mať to za sebou , veliteľ je dôvod, niekto, kto ho k cvičeniu núti)

Na to aby bol vidieť jasný rozdiel ktorý v praxi nastane medzi chovaním športovca a vojaka stačí jednoduchá situácia napr: čo sa stane keď sa pri tréningu dostanú za chrbát trénera resp. veliteľa ? Športovec nespomalí bude bežať rovnakým tempom lebo chce niečo získať. V prípade vojaka nastane s najväčšou pravdepodobnosťou k zvolneniu, prestane vykonávať cvik správne minimálne  do chvíle až sa opäť nedostane do zorného poľa veliteľa.
Ako možno definovať čo sa deje pri pozitívnom resp. negatívnom posilnení?

  • Pozitívne posilnenie nastáva keď niečo, čo živočích (ďalej len pes )chce pridávame do prostredia (žrádlo,pozornosť...)
  • Negatívne posilnenie nastáva keď niečo ,čo pes nechce (nemá rád, obmedzuje ho to) z prostredia odstránime ( obojok)
  • Oboje zvyšuje pravdepodobnosť, že sa konkrétne chovanie bude opakovať

Takisto však vieme definovať aj tresty

  • Pozitívny trest prichádza keď do prostredia pridávame niečo čo pes nechce
  • Negatívny trest prichádza keď niečo čo pes chce z prostredia odstraňujeme (napr.odobratie žrádla)
  • Oboje znižuje pravdepodobnosť, že sa konkrétne chovanie bude opakovať

Oba druhy trestu si vyžadujú veľmi presné načasovanie,aby boli spojené s nežiadúcim  chovaním a znižovali tak jeho opakovanie.

*A  nezabudnite: ,,čo je trest a čo odmena nerozhodujete Vy ,ale pes ...„

Rovnako ako trest aj posilnenie je dôležité správne načasovať. Aby sme podporili to chovanie, ktoré požadujeme, musíme dať psovi zreteľne a v správnu chvíľu vedieť ,,toto je ono“/,,takto to má byť“. Ak tú chvíľu dokážeme podchytiť a posilniť v správny moment, až potom môžeme hovoriť, že pracujeme metódou pozitívneho posilnenia.

Na záver úvodnej kapitoly,ktorá bola skôr venovaná pojmom ešte jedno vysvetlenie ,, pozitívneho posilnenia“ inými slovami, takže:
TO ČO SA MI PÁČI POSILNÍM TÝM ČO MÁ PES RÁD (tým,čo mu je príjemné,tým čo bude pre neho natoľko atraktívne,aby sa to snažil aktívne získávať).

K tomuto však treba hneď dodať ,že  ,,dávať odmeny ešte neznamená pozitívne posilovať taktiež ako to,že negatívne posilovanie nemusí znamenať ,,byť zlý na zviera „. V praxi je dôsledné používanie ktoréjkoľvek z týchto metód ťažko realizovateľné a výcvik je založený viac-menej na ich kombinácii.

Ako sa v praxi prejavuje  rozdiel v metodike pozitívneho a negatívneho posilnenia a ako sa prejavuje u zvieraťa je možné vidieť v naledujúcej tabuľke.
Našim cieľom je : VYTVORIŤ NOVÉ CHOVANIE

K tabuľke len krátko: Všetko sa odvíja od toho ako zviera chápe cieľ. Pri pozitívnom posilnení je to možnosť získať odmenu .pri negatívnom je cieľ uhnúť tlaku. Od toho možno odvodiť ako sa to odráža v hladine hormónov, z akého stavu do akého sa zviera dostáva. Pri poz. posilnení ( pes usiluje o blaho, dostáva sa z bodu 0 do +,hladina endorfínov  stúpa  +) ,pri negat. posilnení ( usiluje o normál, dostať sa z – do bodu 0 , kortizol - )

Zostávajú posledné dva riadky: kto vloži do výsledku viac úsilia a preberá za chovanie zodpovednosť?
Pri pozit. posilnení je to zviera, pri negatívnom človek. Je to úplne logicky do seba zapadajúce.... A napriek tomu sa v týchto posledných dvoch riadkoch skrýva vysvetlenie mnohých ,,nevysvetliteľných“ situácií , keď napriek dlhodobej príprave založenej na pozitívnom posilňovaní Vám pes ,,vybuchol“ v najmenej vhodnej chvíli t.j. na pretekoch či skúške .Ak sa chcete dopracovať k príčine otvorte si scan ešte raz a zamyslite sa čo sa v skutočnosti na inkriminovanom preteku či skúške stalo v kontexte posledných dvoch riadkov.

Nestalo sa náhodou to, že ste v rámci kontroly nad situáciou(aj keď nechtiac)  prevzali zodpovednosť za chovanie a výsledok a tým navodili podmienky, ktoré pes nedokázal v danom momente prekonať a zlyhal ? Áno, práve to sa stalo...

AKO VYTVORIŤ  CHOVANIE

Chovanie môžeme v skratke charakterizovať ako reakciu na podnet. Reakcia môže byť  vrodená (pudová) a naučená. Cieľom ktorý sledujeme pri vytváraní chovania je aby  po našom  signále nasledovalo zo strany psa požadované chovanie .Každý prejav či správanie má svoj podnet ale aj následok. Následok je to ,čo nasleduje po určitom chovaní. Podľa toho či je následok subjektom vnímaný ako prínos alebo nie, sa pravdepodobnosť, že sa chovanie bude v budúcnosti opakovať buď zvyšuje alebo znižuje. Chovanie je len jednou tretinou celku.Naša úspešnosť  nie je vždy priamo  závislá len na tom, či správne chápeme reťazec  podnet- chovanie- následok, ale či je to rovnako vnímané aj zo strany psa. Signál sa stane podnetom až vo chvíli keď bude zviera chápať, že znamená výzvu nejaké chovanie a toto chovanie nám ponúkne len vtedy ak preň bude motivované dôsledkom. To je síce veľmi individuálne, ale v zásade platí (ako pri treste),že to čo je tou správnou motiváciou nerozhodujeme my ,ale pes.Je na Vás a na tom ako dobre svojho psa poznáte ,aby ste ,, vycítili „ čo je tou ,,správnou“  motiváciou.

Existuje niekoľko spôsobov vytvárania chovania.Tu je popis dvoch základných:

Prvý spôsob je ZACHYTENÍM (capturing) – jeho podstatou je zachytenie prirodzeného chovania a jeho podporenie (napr. pribehiehanie psa  transformujeme do cviku privolania). Tento spôsob logicky nie je príliš dobre využiteľný pre zložité cviky.

Druhý spôsob,kde postupnými krokmi vytvárame  chovanie sa nazýva TVAROVANIE (shaping). Keďže týmto spôsobom učíme nové cviky,tu sú  v skratke pravidlá shapingu :

  • 1. Postupujeme malými krokmi - ,,pes musí mať vždy šancu na úspech“Tento bod predpokladá rozdelenie daného cviku na dostatočne malé krôčky,aby tam šanca na splnenie vždy bola.
  • 2. Trénujeme vždy len jeden aspekt,nikdy nie dva naraz (napr. priradenie k nohe: najprv presnosť dosadania,potom rýchlosť)
  • 3.Pri zavedení nového kritéria do tréningu staré kritérium nepripomíname (zviera si spomenie)
  • 4.Byť vždy o krok vpredu,mať stanovený dobrý plán,zbytočne nezastavovať
  • 5. Nemeňte trénera uprostred výuky
  • 6.Keď jedna metóda nefunguje,treba skúsiť inú.Pes nemusí chápať čo od neho chcete.
  • 7.Neprerušujte lekciu bezdôvodne... (pes nerozumie prečo miesto odmeny zazvonil mobil)
  • 8.Pri zhoršení  chovania vo vyššej fáze cviku  sa vráťte o krok  spáť
  • 9.Skonči dokiaľ je to dobré.Premostením ku koncu tréningu môže byť ľahší cvik aleho hra,aby pes ukončenie nechápal ako trest.

K téme shapingu ešte štyri ,,Frantiho“ dodatky

  • Vždy cvičte takým tempom,aby pes stíhal
  • Zároveň tak rýchlo,aby nestíhal nič ďalšie
  • Pri zachycovaní nového chovania sa uisti,že nezachycuješ prejav nejakej nálady(inak povedané,že sa do cviku nedostáva niečo,čo tam nemá byť)
  • Stále sa na to dívaj z pohľadu zvieraťa : ,, snaží sa viac zviera alebo Vy ...„

ODNAUČENIE NECHCENÉHO CHOVANIA

Pri odnaučovaní nechceného chovania sa v prvom rade snažíme vyhnúť trestom a negatívnemu posilňovaniu. Predstava, že strach z trestu je jediná záruka spoľahlivosti a že tzv. ,,naučená bezmoc„ je jej doživotnou zárukou nezohľadňuje fakt, že každé zviera má v sebe potenciál zbaviť sa tlaku ,ak už presiahne určitú mieru. Tresty okrem toho, že zviera nemusí vedieť za čo trest prichádza, vedú mimo iného k pasivite. Naviac tresty fungujú so zárukou len tam, kde sa im nedá uniknúť.(viď Murphyho zákon ,, pes po uvoľnení z vodítka ohluchne..“ A to treba povedať, že pes má snáď zo všetkých zvieracích druhov najvyššiu mieru tolerancie voči trestom... Pozitívna cesta je vždy lepšia v tom, že pes bude úkon vykonávať aj pre toho, kto nad ním nemá v tom momente fyzickú kontrolu a prevahu. V tejto kapitole sa F.Šusta pristavil aj pri téme používania elektronických obojkov ako pomôcky resp. nástroja používaného na odstraňovanie nechceného chovania. Zástancovia tejto techniky budú mať určite iný názor na vec, ale tu je niekoľko nevyvrátiteľných faktov súvisiacich s používaním elektr. obojkov:

  • ich úspešné používanie predpokladá kvalitného psovoda. Každá ranka musí prísť v úplne jasnej súvislosti. Tú súvislosť sa ale človeku nemusí vždy podariť dodržať, naviac zviera ju nie vždy pochopí (zvlášť keď sa práve vysporadúva s fyzickou bolesťou)
  • tresty majú radu zlých vedľajších účinkov – apatiu, všeobecne strach z vecí s ktorými sme súvislosť vôbec nechceli vytvoriť , agresiu (tá prichádza obvykle až keď už zviera nemá inú možnosť)
  • v neposlednom rade si treba uvedomiť ,že pes veľmi dobre rozoznáva prítomnosť zdroja trestu ( teda nasadeného elektr. obojku)
  • hlavným problémom sa však stáva fakt, že trest sa stáva pre trestajúceho drogou a počet ,,trestov“ a ich intenzita stúpa...

Tu je niekoľko metód odnaučenia nechceného chovania:
Najprv štyri MENEJ ÚSPEŠNÉ:

  1. ,,odstrel zviera„ - pod týmto názvom sa skrýva fyzické znemožnenie činnosti (pes v noci šteká pod oknom, tak ho zavrieme do koterca ,čím ukončíme pre nás nechcené chovanie ,nevýhoda tohto riešenia je ,že je to riešenie len pre danú chvíľu a nabudúce to urobí znova)
  2. trest – často prichádza neskoro (ak by sme išli potrestať za štekanie pod oknom, samotnému trestu predchádza x vecí ako napr. zasvietenie svetla ,odomknutie dverí ..., nehovoriac o tom, že spojitosť následného trestu s predchádzajúcim štekaním je pochopiteľná pre nás ,nie pre neho)
  3. negatívne posilovanie (napr. pre štekanie používanie proti štekacích obojkov)
  4. vymizenie t.j. očakávanie, že chovanie nevšímaním zmizne samo....

Štyri ÚSPEŠNÉ METÓDY:

  1. ,,podporuj nezlučiteľné chovanie“ – nacvičíme chovanie pri ktorom nie je možné pokračovať v starom chovaní a ,,nové“ podporujeme
  2. ,,dať nechcenému chovaniu povel „ reakcia na povel potom znamená ukončenie nechceného chovania
  3. odmeniť absenciu nechceného chovania (musí sa vytvoriť jednoznačná súvislosť čím menej nechceného chovania – tým viac odmien)
  4. zmeniť motiváciu – je to dosť individuálne, ale funguje najlepšie.

BRIDGE

Pri pozitívnom posilňovaní je často používaným slovom ,, bridge“ t.j. most či premostenie. Bridge sa dá charakterizovať ako signál z prostredia, podľa ktorého zviera vie, že prichádza odmena. Tento signál znamená (čo sa týka chovania) dve zásadné veci:
prvá - bolo to správne, prichádza odmena a druhá - skončilo to.

Bridge z tohto pohľadu môže byť čokoľvek používané pri výcviku napr.kliker, pochvala, pohladenie... teda čokoľvek po čom príde upevňovač,odmena. Keď chceme posilniť konkrétne chovanie, musí prísť odmena presne v okamihu keď chovanie prebieha. Spozdenie čo i len o pár sekúnd je úplne zlé, pretože už za 5 sekúnd sa pre zviera stráca súvislosť medzi vecami. Preto sa odkliknutie klikerom (aj kvôli tomu, že zvuk klikra je stále rovnaký) považuje sa za zrejme najúčinnejšiu metódu ako psovi označiť presne správne chovanie. Bridge v podobe klikru psovi kliknutím signalizuje ,,zálohu na výplatu“ ,teda odmenu.

Samozrejme aj pri ,,bridgoch“ ako v každej inej časti výcviku sú úskalia na ktoré treba dať pozor, aby nedošlo k nežiaducim momentom. Svet okolo nás a teda aj nášho psa je plný ,,bridgov“ a tak si pes môže vybrať iný ,,bridge“ a my ani nemusíme vedieť o aký sa jedná. Klasickým je napríklad siahnutie do vrecka pre pamlsok alebo určitý pohyb tela. Tieto ,,bridge“ sú však často mimo našej kontroly a teda nám pri tréningu nutne spôsobia problémy, takže máme dve možnosti: buďto ich dostať pod úplnú kontrolu alebo ich zrušiť a zaviesť také, ktoré plne ovládame. Dôležitosť ,,bridgu“ nikdy nepodceňujme. Je to nakoniec naše jediné skutočné spoločné slovo so psom vďaka ktorému sa dokáže rýchle učiť.

ODMENY

Ich význam vo výcviku je zbytočné popisovať. Podobne ako ,,bridge“ sú prostriedkom na vysvetlenie ,,cesty k úspechu“ Na úvod treba povedať, že odmena musí byť niečo ,čo zviera moc a moc chce. Často sa medzi kynológmi hovorí : ,, keď ti pes nechce odmeny, skús lepšie odmeny“ ... Súčasne ale platí, že aj keď by sme mali mať pripravené nadpriemerné až výnimočne obľúbené odmeny, nemali by sme nimi plytvať. Výnimočná odmena by mala byť niečím, čo je stále očakávané s nadšením.(tak ako Vianoce majú svoje kúzlo v tom, že sú len raz v roku...)

So zvýšením kvality odmeny súvisí aj tzv.Jackpot. Podobne ako u hracích automatov znamená jackpot obvykle to, že za pomerne jednoduchý výkon sa vysype nečakane veľké množstvo odmien. A podobne ako u gamblera za automatom i u psa jackpot znamená :nekončíme, hráme ďalej. Samozrejme, jackpot nemôže prísť príliš často, inak sa stáva bežnou odmenou a taktiež by sa ním mali odmeňovať len tie úlohy, ktoré pes dobre ovláda. Jackpot udrží zviera v hre, pretože zviera nepracuje za odmenu, ktorú dostane, ale za tú, ktorú očakáva. A od okamihu podania jackpotu ho očakáva znovu. Veľmi dobrým motivačným nástrojom pre úlohy, ktoré už zviera ovláda je aj nepravidelný rozvrh odmien. Nehodí sa ale pre fázu keď sa zviera úlohu učí.

Vtedy dodržujeme PRAVIDELNÝ ROZVRH ODMIEN ,pretože zviera potrebuje pochopiť, čo po ňom chceme. Musíme teda dodržovať zásadné pravidlá, ktoré pravidelný rozvrh predpokladá a to sú:

  • za úspech príde vždy odmena, naviac rovnaká a rovnako veľká
  • odmena dáva psovi istotu vďaka čomu je kľudnejší

Pravidelný rozvrh má tiež zradné miesta:

  • dáva psovi až moc veľkú istotu, už dopredu vie čo príde
  • pri neúspechu sa zviera ľahšie odradí
  • tento spôsob nie je úplne prirodzený- v prírode sa takmer nevyskytuje

Oproti tomuto spôsobu rozvrhu odmien stojí NEPRAVIDELNÝ ROZVRH ODMIEN, ktorý predpokladá, že zviera chápe ,čo po ňom chceme a už len ,,loví“ úspechy. Dá sa popísať takto:

  • dmena prichádza nepravidelne (ale nie náhodile !)
  • dáva psovi menšiu istotu ,spôsobuje určitú nervozitu
  • vedie k väčšiemu úsiliu, pes nikdy nevie čo dostane ,tak to radšej skúsi
  • neúspech zviera tak ľahko neodradí, skúsi to znova
  • naučené chovanie vyprcháva pomalšie

Tu ale treba pripomenúť, že nepravidelný neznamená živelný a tento rozvrh sa tiež musí nacvičiť rovnako ako chovanie.

Pri kapitole o odmenách by som sa ešte zmienil o jednom dôležitom prvku vo výcviku a tým je : ,,princíp krátkej príležitosti". Ten vychádza z faktu, že niečo čo je tu stále môžem využiť aj za chvíľu, ale to čo mám šancu získať len teraz, to sa musí využiť okamžite. Je to motivačný prvok používaný bežne predajcami (cena platí len ak si tovar objednáte do 10 minút po skončení programu...atď) Proste krátka príležitosť, ktorá sa nebude opakovať, robí zo šance skutočnú šancu.

V praxi: ,,od vydania povelu máš šancu ho splniť a zaslúžiť si ho len do piatich sekúnd. Pokiaľ to nesplníš, prišiel si o odmenu. Nič viac sa nedeje, len si prišiel o odmenu. Taká je logika pozitívneho posilňovania a ,,krátka šanca“ je jedným z jej hlavných princípov.

A na záver už len dva citáty, ktoré by mal mať na pamäti každý psíčkár:
,, ...Pes vám odpustí najviac chýb zo všetkých zvierat a ako jednému z mála zvierat mu tiež záleží na tom či bude jeho pán spokojný...“
a ak nie ste spokojný s nejakým chovaním nezabudnite, že: ,,... Problémový nie je pes, len jeho chovanie - a to meníme. Takže si to neberte osobne – je to len chovanie...“
,, Don´t take it personally, it is just behavior...“

Prečítajte si tiež