心理学の世界にコロがりこもう!

オペラント条件づけとは?例とスキナーの研究、正の強化・負の強化とは?

オペラント条件付け

オペラント条件づけとは

オペラント条件づけとは、特定の刺激下で、弁別刺激、反応(オペラント行動)、強化刺激を随伴(三項随伴性)させることによって、反応の頻度を変容させる学習です。

「特定の状況下で、動物が自発的または道具を使って行った行動に対して、報酬または罰を与えることにより、その行動を起こす頻度を変える手続き」と言い換えることもできます。

英語では「operant conditioning」と表記され、日本語では「オペラント条件づけ」、「道具的条件づけ」、「オペラント学習」と呼ばれています。

また、オペラント条件づけの体系的な研究を行ったアメリカ合衆国の心理学者スキナー,B.F.の名前にちなんでスキナー型条件づけと呼ばれることもあります。

オペラント条件づけは、人の能動的かつ意図的な反応の増大や低減を目的として行われる条件づけで、行動主義心理学の基本的な理論です。

動物の多様な能動的行動がその対象となり、日常生活の様々な場面で偶発的に生じていますし、子どものしつけなどにも活用されてきました。

MEMO

オペラント(operant):操作するという意味のオペレート(operate)を語源とするスキナーの造語

行動主義心理学とは

行動主義心理学とは、心という目に見えないものを客観的に捉えるため、観察可能な「行動」を研究対象とする心理学です。

行動心理学では、「環境からの働きかけを受けて行動が変容すること」が発達であり、「学習」とほぼ同じ意味とされています。

オペラント条件づけの歴史

オペラント条件づけの実験は、アメリカ合衆国の心理学者ソーンダイク,E.によって開始され、スキナーが体系的な研究を行いました。

ソーンダイクの研究

ソーンダイクは、動物の自発的な行動が経験を通してどのように変容するかについて、以下の手順で実験を行いました。

  1. 問題箱(ペダルを押すとドアが開く仕掛けのある箱)の中に空腹の猫を入れ、箱の外に食べ物を置く
  2. 猫がペダルを踏んで箱の外に出て餌を食べるまでの過程を記録する

猫は、最初のうちは箱の中を闇雲に動き回っていましたが、偶然ペダルを踏んで外へ出て餌を食べる経験をした後、回数を重ねるにつれて、箱に入れられてから脱出するまでの時間が短くなりました。

ソーンダイクは、この実験結果から、猫が箱の中を動き回るうちに偶発的に適切な反応(ペダルを踏むこと)が行われ、その反応と刺激(箱の内部の光景)の結びつきが強まることで脱出に要する時間が短縮されたと考えました。

また、刺激と反応の結びつきについて、「満足(不快)を伴う反応は、その他の条件が同じ場合、反応が起こった場面(刺激)とより強固に結合する(結合が弱くなる)。また、満足や不快の程度により結合の度合いは強固または軟弱になる。」という効果の法則を提唱しました。

その後、効果の法則は「正の強化」、満足は「正の強化子」、不快は「負の強化子」と名前を変え、現在まで重要な概念として使用されています。

スキナーの研究

スキナーは、行動を「反射による行動(レスポンデント)」と「自発的な行動(オペラント)」に分類し、パブロフの犬で有名な条件反射を古典的条件づけ(レスポンデント条件づけ)、ソーンダイクの効果の法則に基づく強化をオペラント条件づけ(道具的条件づけ)と定義しました。

また、スキナー箱という実験装置を使って強化と行動の関係を研究しました。

MEMO

スキナー箱:ソーンダイクの問題箱の改良版だが、記録や給餌が自動的に行うことができ、ソーンダイクの問題箱と比較すると実験者や被験対象の労力が少なくて済み、記録できる反応は増加している。

スキナー箱を用いた実験の手順は、以下のとおりです。

  1. スキナー箱に空腹のネズミを入れ、ブザーが鳴ったときにレバーを押すと餌が貰えるようにしておく
  2. ネズミがブザーを押して餌を食べる間隔を記録する

実験では、ネズミは、スキナー箱の中で過ごすうちにブザーが鳴ったときにレバーを押すと餌が出てくることを学習し、ブザーが鳴ったときにレバーを押す頻度が高くなり、ブザーが鳴ってからレバーを押すまでの時間が短くなるという結果が得られました。

レスポンデント条件付け(古典的条件づけ)については、「古典的条件づけとは?例はパブロフの犬や梅干し?強化や消去とは?」で詳しく解説しています。

オペラント条件づけの用語

オペラント条件づけを説明する用語には意味が分かりにくいものが多いため、関連する用語を確認しておきます。

オペラント行動ある行動が生じた直後の環境の変化によって頻度が変化する行動

例:スキナー箱の実験では、「ブザーが鳴った直後にレバーを押す行動」

弁別刺激行動の手掛かりとなる刺激

例:スキナー箱の実験では、「ブザーの音」

強化刺激

(強化子)

行動の頻度を変化させる刺激

正の強化子(好子):直前のオペラント行動の自発頻度を高めた刺激

負の強化子(嫌子):直前のオペラント行動の自発頻度を弱めた刺激

例:スキナー箱の実験では、「餌が出ること」

随伴ある物事に伴って別の物事が起こること

例:スキナー箱の実験では、「オペラント行動に弁別刺激と強化刺激を与えること」

三項随伴性弁別刺激―反応(オペラント行動)―強化刺激が随伴する関係性のこと

例:スキナー箱の実験では、ブザーの音(弁別刺激)の後にレバーを押す行動(オペラント行動)が起こり、餌が与えられる(強化刺激)

強化オペランド行動の自発頻度が高まること
弱化オペラント行動の自発頻度が弱まること
【無料】心理カウンセラー講座の資料請求

オペラント条件づけの特徴

オペラント条件づけの特徴は、古典的条件づけと類似するものもあれば、独自のものもあります。

獲得

オペラント条件づけでは、反応(オペラント行動)に対して強化刺激(正の強化子)を与えることで、反応の頻度が増加していきます。

消去

オペラント条件づけを行った後、反応を起こさせた後で強化刺激(正の強化子)を呈示しないでいると、反応が徐々に弱まって最終的には消失します。

自発的回復

自発的回復とは、オペラント条件づけの消去により反応が消失させてからスキナー箱などの刺激下に置くと、再び反応が起こる現象です。

復活

復活とは、反応αを強化してから消去した後、反応βを強化して消去した場合、反応αが高い確率で現れる現象です。

反応αを強化していなくても現れることが多く、自動的回復とは区別されています。

般化

般化とは、類似の刺激に対しても同様の反応が起こる(類似刺激に条件づけが転移する)現象です。

弁別

弁別とは、類似の刺激を受けても元の刺激と区別し、反応が起こらない現象です。

反応連鎖

反応連鎖とは、一連の反応が連鎖して起こる現象です。

例えば、スキナー箱の実験におけるネズミのレバーを押す行動は、レバーに触れて押し下げるなど複数の反応が連鎖した結果です。

オペラント条件づけでは、訓練を重ねることで個別の反応を意図的に連鎖させることもできると考えられています。

【無料】心理カウンセラー講座の資料請求

行動随伴性(オペラント条件づけの4パターン)と日常例

オペラント条件づけは、反応(オペラント行動)後に刺激が与えられるか消失するか、刺激が与えられたかまたは消失した結果、反応の頻度が増加したか減少したかによって、4つのパターンに分類されます。

反応が増加反応が減少
強化刺激が与えられる正の強化正の弱化(罰)
強化刺激が消失する負の強化負の弱化(罰)

正の強化の例

正の強化とは、反応(オペラント行動)後に好子(快刺激)が得られ、その反応の自発頻度が増加することです。

例えば、子どもが食事時に食器を運ぶお手伝いをしたら、親から褒められて好きなおかずを一品多めにもらえた場合、親の対応が正の強化となり、子どもはより一層お手伝いをするようになります。

負の強化

負の強化とは、反応後に嫌子(深い刺激)が消失し、その反応の自発頻度が増加することです。

負の強化には逃避と回避の2つがあります。

逃避不快刺激にさらされた状態で反応することにより、不快刺激から逃れようとする
回避反応しないと不快刺激が与えられる場合に、反応して不快刺激を避けようとする

例えば、日常的に親から早く宿題を終わらせるよう叱責されている子どもが、親の叱責を避けるために自ら宿題をするようになる場合や、宿題をしないと親から叱責されるので、叱責される前に宿題を終えてしまう場合が考えられます。

正の弱化(罰)

正の弱化(罰)とは、反応後に不快刺激が与えられることにより、反応の自発頻度が減少することです。

刺激が与えられることで反応の自発頻度が増加する正の強化と対比して、正の弱化と呼ばれます。

例えば、つまみ食いをして親から叱責された後、子どものつまみ食いをする頻度が下がった場合などです。

負の弱化(罰)

負の弱化(罰)とは、反応後に快刺激が消失することにより、反応の自発頻度が減少することです。

刺激が与えられることで反応の自発頻度が減少する正の弱化と対比して、負の弱化と呼ばれます。

例えば、買ってあるお菓子を全部食べて親から数日間のおやつ抜きを宣告された後、たくさんお菓子があっても少しずつ食べるようになった場合などが考えられます。

【無料】心理カウンセラー講座の資料請求

強化スケジュール

強化スケジュールとは、反応(オペラント行動)に対してどのような頻度で強化刺激を与えるかを示すものです。

スキナーは、異なる強化スケジュールが反応に対してどのような影響を及ぼすかについて研究し、以下のとおり分類しました。

強化スケジュールの分類内容
固定比率スケジュール(FR)反応が特定回数あるごとに強化子を与える

※強化子が与えた後に反応のない状態が見られ、その後、再び反応が始まる

変動比率スケジュール(VR)比率リストの中からランダムにスケジュールを選択し、その平均的な比率を数値化して強化子として与える

※反応の頻度が比較的安定しており、強化子を与えた後の反応がない状態が短い

固定時隔スケジュール(FI)一定時間経過後の反応に強化子を与える

※強化後を与えた後に反応休止があり、徐々に反応が増えて、強化子を与える直前に反応が急増する

変動時隔スケジュール(VI)強化後に次の強化子を与えるまでの間隔を強化子によって変動させる

※反応の頻度は比較的安定している

【無料】心理カウンセラー講座の資料請求

公認心理師試験の出題歴

オペラント条件付けは、第1回公認心理師試験に出題されました(正答は赤字)。

問5 オペラント行動の研究の基礎を築いたのは誰か。正しいものを1つ選べ。

①A.Adler

②B.F.Skinner

③E.C.Tolman

④I.P.Pavlov

⑤J.B.Watson

引用:第1回公認心理師試験

問7 条件づけについて、正しいものを1つ選べ。

①貨幣やポイントを強化子とした条件づけを二次条件づけと呼ぶ。

②古典的条件づけは、条件刺激と無条件反応の連合によって成立する。

③オペラント条件づけによる行動変容以前の行動頻度をオペラント水準と呼ぶ。

④連続強化による条件づけは、間歇強化による条件づけよりも消去抵抗が強い。

⑤古典的条件づけにおいては、逆行条件づけは順行条件づけよりも条件反応の獲得が良好である。

引用:第1回公認心理師試験

公認心理師試験については、「公認心理師とは?受験資格と特例措置、試験合格率は?臨床心理士との違いは?」で詳しく解説しています。

まとめ

オペラント条件付けとは

特定の状況下で、動物が自発的に行った行動に対して報酬または罰を与えることにより、その行動を起こす頻度を変える条件づけ

弁別刺激―反応(オペラント行動)―強化刺激の三項随伴性

オペラント条件付けの特徴
  • 獲得
  • 消去
  • 自発的回復
  • 復活
  • 般化
  • 弁別
  • 反応連鎖
行動随伴性と日常例
  • 正の強化
  • 負の強化
  • 正の弱化
  • 負の弱化
強化スケジュール
  • 固定比率スケジュール(FR)
  • 変動比率スケジュール(VR)
  • 固定時隔スケジュール(FI)
  • 変動時隔スケジュール(VI)
強化スケジュール

第1回試験・問5、問7

【参考】

  • グラフィック学習心理学―行動と認知|山内光哉著、春木豊著|サイエンス社