犬のしつけや動物の行動学を学ぼうとすると、必ず出てくるのがこのオペラント条件づけですね。
とても大切な項目ですが、「正の強化」「負の罰」など、その後に続く“条件づけの種類”がややこしく、ここで理解をあきらめてしまう人も多いのではないでしょうか?
今回は、そんな『オペラント条件づけ』を、できるだけ分かりやすく取り上げてみたいと思います。
ペットの行動やしつけを理解する上で大変役立つテーマとなっておりますので、ぜひ苦手意識を捨てて読んでみてください。
しつけの基本『オペラント条件づけ』って何?
小難しいテキストには、↓こう書いてあります。
オペラント条件づけ 動物の自発的な行動の直後に報酬(or罰)などの特定の刺激を与えることで、その行動の生起頻度が増加(or減少)する手法のことをいい、アメリカの心理学者スキナーが考案したことから「スキナー的条件づけ」、また行動そのものを道具として用いることから「道具的条件づけ」とも呼ばれている。 |
一読しただけでは、なんのことかよくわかりませんね・・。
平たく言うと、犬が行動した結果「いいこと(快刺激)」が起きればその行動の頻度が増え、「嫌なこと(嫌悪刺激)」が起きればその行動の頻度は減少する(※その逆に快刺激が減ればその行動頻度が減少し、嫌悪刺激が減ればその行動頻度が増加する)ということです。
“飛び付いた”ら構ってもらえた(=「いいこと」が起きる) ⇒犬の“飛び付く”という行動の頻度は増加する |
|
“飛び付いた”ときに無視された(=「いいこと」がなくなる) ⇒犬の“飛び付く”という行動頻度は減少する |
|
“飛び付いた”ら叱られた(=「嫌なこと」が起きる) ⇒犬の“飛び付く”という行動頻度は減少する |
もちろん、罰(嫌なこと)を与えてペットの行動を減らそうとするのは好ましくありません(→「犬を叱ってはいけない理由」)ので、「オペラント条件づけ」を用いて“犬の飛び付き”を改善させたい場合は、飛びついても無視する(「いいこと」がなくなる=“飛びつく”行動頻度の減少)か、飛び付かずオスワリをしているときに褒める(「いいこと」が起きる=“飛びつかない”行動頻度の増加)という方法が推奨されます。
オペラント条件づけの『表』を理解しよう
犬の行動学やオペラント条件について考察する際、必ずといっていいほど出てくるのが下の表です。
<オペラント条件づけ>
いいこと(快刺激) | 嫌なこと(嫌悪刺激) | |
起きる(出現) | ①正の強化 行動頻度が増える |
②正の罰 行動頻度が減る |
なくなる(消失) | ③負の罰 行動頻度が減る |
④負の強化 行動頻度が増える |
この表は、動物の行動後に出現(or消失)する刺激(快/嫌悪)の結果、その行動の生起頻度が増加(or減少)するという『オペラント条件づけ』を表しています。
ここで登場するのが、「正の強化」や「負の罰」などといった、条件付けの種類を表す用語です。
これが字面だけ追うと頭の中でぐちゃぐちゃっとしてしまい、理解しにくくする要因のひとつとなっています。
強化や罰は何となく言葉のニュアンスで理解できそうですが、何で「嫌なことがなくなる」と『負の強化』なの?と、正・負・強化・罰の組み合わせに、こんがらがってしまうのです。
このような専門用語を必ずしも覚える必要はありませんが、理屈(学問)を知っていれば犬の行動原理もより明確に見えてきて、ペットシッターのお仕事はもちろん、日常のペットライフでも十分活かすことができます。
今まで苦手意識を持っていた方も、「正」とは何か?「強化」や「負」とは何か?を、ぜひこの機会にしっかり理解しましょう。
『正』/『負』とは?
『正』や『負』という漢字から(正)「正しい/正攻法」または(負)「ネガティブ/望ましくない」しつけ方法を連想しそうですが、この場合の「正」と「負」とは、行動の後に<ある刺激>が出現(=正)するか消失(=負)するかの、プラスマイナスの(+正-負)を意味しています。
プラスされる刺激が犬にとって快刺激(=いいこと)であれば、上表①の「正の強化」となります。
その逆に、プラスされるのが嫌悪刺激(=嫌なこと)であれば、②の「正の罰」となります。
同様に、マイナス(消失)される刺激が快刺激であれば③「負の罰」となり、マイナス(消失)されるのが嫌悪刺激であれば④「負の強化」となります。
今はいったん「強化/罰」の意味は置いておいて、刺激の出現が「正」、刺激の消失が「負」であることを理解しましょう。
『強化』/『罰』とは?
これも字のイメージから『罰』は叱る、悪いことが起きる、と連想しがちですが、『強化』が文字通り“行動の強化(行動頻度が増える)”を表わしているのに対し、『罰』は強化の対義語である「弱化=減少」を意味しています。
決して天罰や体罰のような、「罰する」といった意味ではありません。ここがややこしく誤解を招くところですね。
<ある刺激>が出現(正)または消失(負)した結果、その行動が増える(強化)か、減る(罰)かという学習理論が、オペラント条件づけです。
強化/罰は“犬の行動頻度”を意味し、強化が増える、罰が減るということを理解できましたね。
では最後に、これらのことを「犬の飛び付き」行動を例にして見てみましょう。
いいこと(快刺激) | 嫌なこと(嫌悪刺激) | |
起きる(出現) | 犬が飛び付いたときに構ってあげると、犬の「飛び付く」という行動は増えていく。 ・刺激(構ってもらえる)の出現⇒正 ・行動頻度が増す⇒強化 <正の強化> |
犬が飛び付いたときに叱られると、犬の「飛び付く」という行動は減少/弱化していく ・刺激(叱られる)の出現⇒正 ・行動頻度が減る⇒罰 <正の罰> |
なくなる(消失) | 今まで遊んでいたのに、犬が飛び付いた瞬間遊びをやめてしまうと、犬の「飛び付く」という行動は減少していく ・刺激(遊び)の消失⇒負 ・行動頻度が減る⇒罰 <負の罰> |
(あまり考えにくいことですが)地面が熱いなど不快で、飛び付くことで解放されると、「飛び付く」行動は増えていく ・刺激(熱い)の消失⇒負 ・行動頻度が増す⇒強化 <負の強化> |
オペラント条件付けの4パターン「正の強化/正の罰(弱化)/負の強化/負の罰(弱化)」を正しく理解できましたでしょうか?
もちろん、これらの用語や細部まで覚えなければ「犬のしつけ」ができない、というわけではありませんので、「犬にとっていいこと(=快刺激)が起きればその行動は増える」「犬にとって嫌なこと(=嫌悪刺激)が起きればその行動は減る」というざっくりの概要だけでも、しっかり理解しましょう。
そして繰り返しになりますが、天罰方式であろうと何であろうと、犬に嫌悪刺激を与えて行動をやめさせるのは、大変リスクがあります。
なかには、「愛情を持って叱れば通じる」「リーダーとしての威厳がないと犬になめられる」などという人もいますが、それらは動物行動学を無視した、また犬とのフェアな関係性を放棄した、一番楽で都合の良い考え方です。
このあたりのことは別のコラムで詳しく書いていますので、ぜひそちらをご参照ください(→「犬を叱ってはいけない理由」)。
しつけで応用できるオペラント条件づけ
「散歩中にリードを引っ張って困る」という場合は、“リードを引っ張る”という行動の結果、“行きたいところに行ける”や“嗅ぎたいニオイが嗅げる”といった快刺激が生じていることが分かります。
では、リードを引っ張ってもいいことが起きなければ(負の罰)、または飼主の隣を歩くことでいいことが起きれば(正の強化)、引っ張りの行動を修正できますね。
具体的には、リードを引っ張ったら止まって進めないようにする(リードが緩んだら歩き出しまた引っ張ったら止まる、を繰り返す)、引っ張らず飼主の隣を歩いているときにフードを与える、などです。
また、咥えているものを取り上げようとしたら噛みついてくる~というのも、犬にとっては「負の強化」が起きていることになります。取られまいとして噛みついたら、その嫌悪刺激(取り上げようとしてくる手)は引っ込んでなくなるわけですから。
そして唸ったり噛んだりすることで獲物が得られれば、それは「正の強化」にもなります。
こうした、いわゆる問題行動と言われる行動も、このようにオペラント条件づけで原理を知ることができれば、それらを別のオペラント条件づけで正しく修正していくこともできます。
「ちょーだい」や「オフ」などの咥えているものを離すしつけは、“離した結果もっといいことが起きる(美味しいおやつと交換できる)”などの正の強化で教えていくことができます。
ただ一方的に力で奪っては、犬にとっては「快刺激がなくなるだけ」であり、飼主さん自身が「嫌悪刺激の対象」になりかねません。
噛み癖があるなら、おもちゃ遊びをしていて人間の手に犬の歯があたったら、「イタイ」と言って手をひっこめてしまいます(このとき犬がおもちゃを咥えているなら、無理に離そうとせず手だけをひっこめます)。場合によっては飼主さんが部屋を出てしまってもいいでしょう。
噛むと遊びが終わっちゃう~負の罰となり、「噛む」という行動頻度は減少していきます。別に叩いたり怒ったりする“正の罰”を与える必要はまったくありませんね?
このように犬の行動原理をオペラント条件づけに当てはめ紐解くことで、より良い関係作りや問題行動の改善にもつながっていきます。
そして、せっかく覚えるなら「お、それは負の罰だね」「正の強化がされちゃってるね」とか言いたいじゃないですか(笑)
ツウっぽく見え、「え?どういうこと。もっと教えて」と知識を披露し褒められることで、理解はより深まるというものです(正の強化)。
ということで、今回はオペラント条件づけについてまとめてみました。
よく、オペラント条件づけをパブロフの犬実験で有名なレスポンデント条件づけと混同されている方もいますが、それはまた別の機会にお話ししたいと思います。