- 天下Web only
横に並んで注文 pic.twitter.com/lQYeyfnsMC
— ねこナビ編集部@VR動画公開中 (@b_ru_ru) 2017年3月30日
這兩隻貓被訓練得很好,背後的機制在心理學上稱為「操作制約」(operant conditioning)。
「操作制約」也稱操作學習、操作制約學習、操作條件反射,由哈佛心理學教授史金納於1938年提出。這項理論是指透過獎賞和懲罰這樣的「刺激─反應」模式,來學習、加強被期望的行為。
影片中兩隻貓只要一按鈴,就能拿到食物,這稱做「正加強」(positive reinforcement),透過「連續漸進」(successive approximation)完成這項學習過程。
一開始,貓咪只要把爪子伸向鈴,就會獲得獎勵。
接下來,貓咪一旦按了鈴,就能獲得零食。
最後,經過好幾個月的學習,貓咪學會了定期去按鈴。
根據國家教育研究院,操作制約可用下式表示:S-R→Sr+。意思是說,如果在某刺激(S)出現時,做了某一反應(R),其結果導致正增強物(Sr+)出現,則以後當該刺激又出現時,該反應(R)再度發生的可能性或頻率就會增加。
例如,貓看到鈴而做出按鈴反應,結果得到食物,則以後當貓看到鈴,再去按鈴的頻率就會比以前多。
這與「古典制約」(巴夫洛夫制約)有細微差異。知名的「巴夫洛夫的狗」唾液制約反射,是把食物看作對狗的非制約刺激(US)、狗的唾液分泌看作非制約反應(UR),並將兩者的關係稱為非制約反射。
根據這項理論,如果在提供食物前幾秒,發出一些作為中性刺激(NS)的聲響,這個聲響會轉變為制約刺激(CS),能夠單獨在沒有食物的狀況下引起作為制約反應(CR)的唾液分泌,這兩者的關係稱做制約反射。
這種刺激及其引發反應的關係,就是「古典制約」。
比較簡單的分別是,古典制約屬被動,是以接近率為原理,用新的連結代替舊的連結;操作制約屬主動,是以效果率為基礎,透過報償或反應後的效果來形成新的連結。
(資料來源:Vox、國家教育研究院、維基百科)