みなさん、こんにちは。
まずは、こちらの動画をご覧ください。
何をしているかわからないかもしれないので、説明をしますね。
動画の解説
動画は、私と4歳のトイプードルさんとのやりとりです。
おもちゃを強化子として使い、トイプードルさんの行動を強化しようとしています。
強化する行動は、オレンジのコーンを半周回ること。
動画の前半。
トイプードルさんは、私が投げたおもちゃより、おやつを食べることを選択しています。
動画を撮る前は、ノリノリで遊んでいたのですが、カメラをセットしたらムードが変わってしまいました。
画面左で、見切れているところにトリーツが入った入れ物があります。トイプードルさんは、そこに向かっていきました。
トイプードルさんの興味は、【おもちゃ<トリーツ】になっているので、この場面では、このおもちゃを強化子として使えません。
トリーツを食べたいトイプードルさんの気持ちを汲んで、トリーツを提供。この時は、わざわざ、何かしらの行動を求めることはしませんでした。「食べたいんだな〜」と思って、単に提供しました。
動画0:50過ぎ
違うおもちゃを準備。こちらのおもちゃは、この日初登場で、トイプードルさんが好きなおもちゃの一つです。
私は、おもちゃの音を鳴らしたり、床で動かして、興味を持たせる動きをしています。
それの乗ってきたトイプードルさん。
私は、何度かおもちゃを放って、トイプードルさんに取ってきてもらい、おもちゃ遊びを継続するようにしています。
動画1:15あたり。
私は、トイプードルさんがテンポよく遊ぶようになったのを確認して、コーンを回るよう誘っています。
コーンを回るのは、トリーツを使って強化済みの行動です。ですが、この時は、コーンの先っぽに鼻をタッチする行動が出ていました。
その後、手による誘導で、コーンを回る行動が出たので、その流れで、おもちゃを放って、その行動を強化しました。このとき、トイプードルさんは、おもちゃでの遊びを楽しむことができていたので、強化子に使えると判断しました。
その後も、コーンを回る行動が出にくく、その要因として、私とコーンの距離が遠過ぎると考え、私は、ジリっとコーンに近づきました。その後も、トイプードルさんに余計な刺激(遊びを中断させるような刺激)を与えないよう、さりげなく、ジリジリとコーンとの距離を詰めています。
動画1:45あたり
私は、トイプードルさんにコーンを回るように誘ってみるものの、鼻タッチで止まっていました。そのあと、「コーンを回りそう!」と私が先読みをしすぎて、回らないうちに、おもちゃを手前に出しました。マーカーである「グッ!」も言っています。
この私の行動は、「おもちゃを放る」前触れになり、それを見たトイプードルさんは、取りに行く準備をします。すなわち、すでに強化子が出た状態です。
なので、そのあと、やり直しを求めることせず、そのままおもちゃを放りました。
その後、おもちゃへの興味を持続する目的で、特定の行動を求めずに、おもちゃ遊びの時間を長く取っています。おもちゃを放っていますが、これは強化子としてではありません。
動画2:15あたり
頃合いを見て、トイプードルさんからおもちゃをもらい、コーンを回るよう誘いました。この時、おもちゃを奪い取ることはしません。犬がおもちゃを渡す意思を確認してもらうようにします。「ちょうだい」というキューを出すこともあります。それでも、犬が、おもちゃを放し難い場合は、私は、おもちゃをもらうことを諦めます。
動画の最後では、トイプードルさんが水を飲みに行ったので、おしまいです。引き留めたりはしません。
おもちゃを強化子に使うには
おもちゃを強化子に使うためには、いくつかの条件が必要です。
- おもちゃに興味があること(興味を持つようなおもちゃを用意するとも言えます)
- 人と一緒におもちゃで遊ぶことができる(引っ張りっこ、持ってこい)
- 犬が持っているおもちゃをもらうことができる
- 人が手に持っているおもちゃに飛び付かない(おもちゃが提供されるまで前足を床につけていられる)
おもちゃを提供したあと、犬が持って飼い主から離れて行く場合、強化子にできないことはありませんが、行動を1回しか強化できません。続けて強化したい場合には不向きです。
強化の頻度が落ちる
強化の頻度というのは、たとえば、1分間に強化子を10個(回)提供するのと、1分間に強化子を5個(回)提供するのを比べた場合、前者の方が強化の頻度が高いとということ。
動画のトイプードルさんは、おもちゃを持ってくるのと引っ張りっこがセットになっているので、その分、強化子を提供する時間が長くなります。
ボールなどを持ってきて放すだけの場合でも、持ってくる時間がかかるので、ぺろっと食べるだけで済む食べ物を使うよりは、強化子の提供に時間を要します。
なので、おもちゃを使って、1分間のトレーニングセッションをした場合、その間に求められる行動の回数も減りますし、それに伴って、犬が強化を受ける回数も減ります。それは、行動が定着するまでに時間がかかるということです。
行動形成の流れが止まる
特定の行動を教えるために、おもちゃを使おうとする場合、強化子を提供するたびに、動きがリセットされてしまいます。
どういうことかというと、動画のように、コーンを回ることをおもちゃを強化子に教えたい場合、
コーンに近づいただけでも強化子を提供したいわけです。
食べ物を強化子に使うならば
1.コーンに近づく
2.コーンの片側に回り込む
というような、行動をパーツごとに強化する場合、その場で強化子を提供して、すぐに次に取り掛かれます。
ところが、おもちゃを強化子に使った場合、コーンから離れたところで強化子を提供しなければなりません。そして、遊び終わって、次の行動を強化しようとするのは、効率が悪くなりますし、クリーンなループができないので、犬が混乱する可能性があります。(できないわけではありません)
動画のトイプードルさんの場合
動画のトイプードルさんは、食べ物を強化子に使って、コーンを回ることを強化しています。
余談ですが、私がトリーツを持っていると、動画よりもスムーズにコーンを回ります。これは、「おやつをもらえると思うとやる気を出す」ということではありません。
私が何を持っているか、というのは、トイプードルさんはわかっているでしょう。匂いでもわかりますよね。私がトリーツを持っているという状況は、環境のキューとしてひとくくりになっているということです。
話を戻しますね。
トイプードルさんは、コーンを回るという行動はもともと持っている状態です。それと、もともと好きなおもちゃで遊ぶことを組み合わせて、
行動の結果に獲得する強化子を、食べ物からおもちゃに変更した、ということです。
コーンを回ることを一から教えるために、おもちゃを使った訳ではありません。
日常に起きることを強化子に
強化子を変更する流れは、おもちゃに限ったことではありません。
犬が持っている行動は、食べ物を獲得するために使うばかりではなく、たとえば、マッサージ、匂いを嗅ぐ、誰かに挨拶する、、、など、日常にあることで、それらを獲得するためにも使うことができます。
犬が獲得した行動のレパートリーは、本犬の暮らしをより豊かにするために使われるべきです。
芸ではなく、犬が自らの環境をより良いものへとコントロールするために、犬自身が持っている行動を使えるようになること。
これが、私たちが犬をトレーニングする理由です。
トリーツが提供できるような状況であり、犬がトリーツを望んでいるならば、トリーツをどんどん使えば良いですし、
犬がトリーツ以外の何かを求めていて、それを提供できる状況なのであれば、それは、すでに覚えている行動の強化子に使えます。
強化子=食べ物ではありません
教える過程では、強化子として食べ物を使うのが便利で、使いやすいです。
覚えた行動を日常で使う場合や、偶然の行動を強化する場合には、その時、犬が欲しているものを強化子として使うことができます。
私からのアドバイスでは、強化子に食べ物を使うことを提案することが多いですが、それは、説明のしやすさからでもあります。
「強化子」の意味をしっかり理解することで、臨機応変に対応することができます。
強化子については、以下の記事も参考にしてみてください。
最低限知っておきたい専門用語【強化・強化子】
トリーツが強化子(報酬)にならない場合もあります。
強化子で喜ばせる必要はありません
強化子を考える