info
資訊
在上一集的節目裡,主持人謝伯讓介紹到美國心理學家史金納(B.F.Skinner)「操作制約學習(operant conditioning)」的基本概念。而在這一集節目裡,則會討論在現實生活當中,「操作制約學習」可以如何對動物與人類的學習造成影響;為何從操作制約理論的觀點來看,不建議透過「體罰」的方式管教小孩?
本集重點:
01:08 操作制約學習理論的四個概念
06:50 操作制約可以做到什麼?以管教小孩為例
10:42 從操作制約學習的角度,談為何不建議體罰
謝伯讓的腦科學世界:https://www.facebook.com/pojanghsieh
【本集節目是由鏡好聽製作播出的《大腦好好玩第四季》】
每隔週四上線全新一集
開啟小鈴鐺、按下追蹤,持續關注最新節目
製作人:余韋達
後製:劉寶苓
圖片:Shutterstock
鏡好聽全新改版上線!想聽愛聽就在鏡好聽,訂閱《鏡好聽》並下載 APP 收聽,只給你最好的聲音。
| 立即訂閱《鏡好聽》:https://www.mirrorvoice.com.tw/mirrorvoice-plus
| 免費下載《鏡好聽》APP:https://mirrormediafb.pros.is/LY67K
| 追蹤《鏡好聽》Facebook:https://facebook.com/mirrorvoice2019
| 追蹤《鏡好聽》Instagram:https://instagram.com/mirror_voice
| 合作、節目建議歡迎來信:voiceservice@mirrormedia.mg
節目內容全文:
在上一集的節目中,我們介紹了美國早期的重要心理學家桑代克(Edward Thorndike)以及行為主義大師史金納(B.F. Skinner)。除此之外,我們也簡單介紹過兩人的理論,分別是桑代克的三個學習定律,以及史金納的操作制約學習理論。
好,根據桑代克的學習第二定律,也就是練習律,我們應該要不斷使用不同的方式來練習這些新知識和新概念,這樣大家才會記得住,才不會左耳進右耳出。所以呢,現在我們就再來用不同的說法,幫大家回顧一下史金納操作制約學習理論中的四個概念,就是正向強化、正向處罰、負向強化、以及負向處罰。
首先我們要記住,強化,就是結果會造成該行為被鼓勵。處罰,則是造成該行為被抑制。
那至於正向和負向,指得則是個體是獲得東西、還是失去東西。當個體在學習的時候,只要是給予東西,增加東西,就是正向。如果是給予個體喜歡的東西,就是正向強化,比方說給糖果,就是正向強化。如果是給予不喜歡的東西,就是正向處罰,比方說給予體罰。
相反的,當個體在學習的時候,只要是移除東西,減少東西,就是負向。移除討厭的東西,就是負向強化,比方說移除環境中的噪音。而移除個體喜歡的事物,就是負向處罰,比方說不給手機、不准打電動等等。
再換句話說,
正向強化,就是加入東西來鼓勵該行為。
負向強化,就是移除東西來鼓勵該行為。
正向處罰,就是加入東西來抑制該行為。
負向處罰,則是移除東西來抑制該行為。
好了,那接下來,我們就來測驗一下大家是不是真的有理解和記住這四個概念。
首先,請大家想一下,如果你想要訓練小狗乖乖地跟在你旁邊散步,你的目標是要讓他乖乖地跟你一起走,不准暴衝。為了達到這個目標,如果你就在小狗表現很好的時候,給予食物,請問這是哪一種操作制約?好,那這一題應該很簡單,給予他喜歡的,所以是「正向」「強化」。
再來,如果小狗不乖開始暴衝的時候,你就停下腳步不走,讓他想走也走不動,請問這是哪一種操作制約?好,由於小狗喜歡散步,但是如果它表現不好,我就移除它喜歡的散步、不讓它散步,所以這是移除它喜歡的事物,既然是移除、就是減少、就是負向,因此是「負向」「處罰」。
再來,如果小狗暴衝的時候,你直接拉扯遛狗繩來讓他的脖子很難受,那這是哪一種操作制約呢?好,答案是,你給予他不喜歡的拉繩動作,既然是給予、就是增加、就是正向,所以這是「正向」「處罰」。
最後,如果小狗乖乖跟著走,表現很好,那你就順其自然,不會硬去拉扯遛狗繩,那這就是負向強化,因為你移除了他不喜歡的拉扯脖子的動作。
・透過操作制約可以做到什麼?
好了,在看完了史金納的研究方法和理論之後,接下來我們再來看看史金納關心的另外一個問題,這個問題就是,透過操作制約,動物或甚至是人類究竟可以學會哪些事情?
關於這個問題,史金納的研究顯示,透過操作制約,動物其實可以學會非常多的事情,比方說,他就曾經成功訓練鴿子用嘴去啄螢幕來玩類似乒乓球的電玩遊戲,而且也可以成功透過操作制約學習,讓鴿子學會用嘴去啄螢幕來操控電玩遊戲中的飛彈走向。史金納在二戰期間,甚至還一度成功把鴿子放在真的飛彈中去操控飛彈的走向,但是,不知道該說是很可惜、還是很幸運,這項計畫後來並沒有受到美國聯邦政府的青睞,所以最後就無疾而終。
不過呢,無論如何,史金納的實驗很明確的顯示出,動物確實可以透過操作制約
,學會非常多的特殊技巧,而其中的一個關鍵,就是透過區辨來達成的。
至於區辨(discrimination),這個概念我們在介紹古典制約學習的時候曾經提過。我們當時講過,如果你要訓練動物透過古典制約學習、來對非常特定的刺激作出反應、然後同時又要避免泛化現象出現的話,那你就應該要在只有當特定刺激出現時才進行刺激配對,但是其他類似刺激出現時則不做刺激配對。比方說特定的高音D出現時才給予食物,但是高音C或高音E都不給食物。如此一來,就可以利用古典制約來達到很好的區辨,而不會出現泛化的現象。
那操作制約也是一樣,只有當動物出現非常特定的行為時,我們才給予獎勵,例如偵測炸彈、偵測毒品、或是馬戲團和動物園的動物表演,都是透過這樣的操作制約來訓練的。
再來,我們來看看操作制約在人類身上的實際應用。舉例來說,在訓練小孩子的行為的時候,原則上我們也可以使用四種操作制約方法來進行訓練,不過呢,目前大部分的專家都會建議,最好的訓練小孩方式,可能是只使用操作制約的其中兩種。那是哪兩種呢,這兩種方式,就是正向強化,和負向處罰。
正向強化,就是在小孩做出好的行為時,就給予獎勵。負向處罰,就是當他做出不好的行為時,就移除他喜歡的東西。
不過呢,我們要附註一提的就是,對於小孩的負向處罰,通常是最難執行的。比方說,大家應該會常常聽到一種帶小孩的建議,就是當小孩以哭鬧的方式來要求他想要的東西時,就不要理他,就讓他哭,也不用責罵,就等到小孩哭完,安靜好好說的時候,才給他想要的。這個做法,原則上沒有什麼太大的錯誤,因為這個做法同時採用了兩種操作制約方式,一種就是小孩哭鬧時不給他想要的,所以是負向處罰,另一種是當他安靜好好說時才給他想要的,所以是正向強化。
不過呢,在實戰的時候,父母常常會做不到這一點。有時候父母在面對小孩哭鬧時,常常會堅持不住,會想說唉呀算了,小孩哭這麼慘,又吵到其他人,所以就給他想要的就好了。但是呢,當父母妥協的時候,其實會出現很不好的後果,因為只要父母一放棄堅持、只要小孩有一次哭鬧的要求成功讓父母妥協,那小孩的哭鬧行為其實就獲得了一次正向強化,因為小孩會發現哭鬧可以獲得獎賞。換句話說,父母只要一屈服,就等於是強化了小孩的哭鬧取求行為。那下次小孩就可會出現更誇張的哭鬧、而且哭鬧的頻率也會增加。
而且更糟的是,當父母放棄堅持並且順從小孩的哭鬧要求的時候,父母自己這種「順從小孩的行為」本身也獲得了負向強化。為什麼會這麼說呢?這是因為當父母順從小孩之後,就會發現小孩馬上就不哭了,所以父母會覺得,誒,那我之前在堅持什麼呢?我只要直接給他她想要的,他就不哭了,那這不是很好嗎?換句話說,當父母做出順從小孩的行為時,惱人的小孩哭聲就沒了,所以父母的順從小孩行為獲得了負向強化,那下次小孩再哭鬧時,父母就可能會更快的放棄堅持、而且也會更頻繁地放棄堅持。
所以小孩和父母的迴圈相互強化行為,就這樣形成了,最後導致小孩一哭鬧,父母就順從,然後一直惡化下去。
所以總而言之,雖然實戰的時候很不容易執行,但是管教小孩,最好是要用正向強化,和負向處罰。
正向強化,就是在小孩做出好的行為時,就給予獎勵。負向處罰,就是當他做出不好的行為時,就移除他喜歡的東西。而且最重要的是,在執行時,一定要堅持,因為只要一沒有堅持,小孩的惡行,就會被強化,而且自己的妥協行為,也會被強化,然後就會前功盡棄、沒完沒了。
・從腦科學看體罰
好,我們現在知道,管教小孩,最好是要用正向強化和負向處罰,那大家最常聽到的正向處罰,特別像是體罰,為什麼不建議這麼做呢?
不建議這麼做的原因,是因為,體罰的缺點可以說是罄竹難書。那我們簡化成以下幾個缺點,第一,是會造成小孩身心受創之外。第二是,是施暴者的行為會被強化,然後產生惡性循環。第三,是成效短暫。第四,是會產生情境規避。第五個缺點,是會產生泛化。第六,則是會有效法效應。
接下來,我們就對這六個缺點來稍微解說一下。
首先,是體罰會造成小孩身心受創。這一點顯而易見,所以就不再多做說明。
再來,第二個缺點,是體罰會造成惡性循環。那這裡的惡性循環什麼意思呢?我們現在知道喔,小小孩的哭鬧,其實哭鬧了一陣子之後、等他自己哭累了就會停止。所以不管你有沒有處理,過了一陣子大概就都會停止,但是呢,有些家長通常會比小孩先忍不住,通常在小孩快要哭累了的時候,大人自己也累了、也煩了,所以就會想要做些什麼事來介入。
那這個時候,如果大人的介入方式是體罰,而且體罰的時間點又剛好是在小孩自己本來就快哭累停止的時候,那這個時候的體罰,就會讓大人以為是因為體罰才導致小孩停止哭鬧,如此一來,大人就會覺得體罰有用,那大人的體罰行為就會獲得正向強化,而下次就繼續變本加厲的體罰。最後就產生了惡性循環。
同樣的,家暴和一些暴力行為,基本上也會因為同樣的原理而獲得正向強化,所以,大家要切記暴力和體罰容易產生的這種後果,以免落入了正向強化的惡性循環之中。
再來,體罰的第三個缺點,通常常見於學校之中,就是體罰通常只有短暫的立即效用,但是卻沒有長效,一但體罰結束,學生很容易就會恢復原狀。
再來,體罰的第四個缺點,就是導致情境規避。也就是說,學生可能會直接避開那些可能會導致體罰的情境,例如如果考試考不好會被體罰,那我就直接請假不要去考試就好,那如果真的發生這種情形的話,體罰就沒有辦法達到讓學生念書的原意。
再來,體罰的第五個缺點,就是可能會讓學生的厭惡感產生泛化現象。也就是說,學生討厭體罰的心態,會泛化到老師還有整個體制身上,那這同樣也無法達成讓學生念書的原意,甚至會出現反效果。
最後,體罰的第六個缺點,就是容易讓學生出現效法現象,讓學生誤以為暴力和權力操控就解決問題的方法,因此對學生來說,其實是一種不好的示範。
好,在聽到這麼多體罰或是處罰的缺點之後,難道處罰真的沒有半點好處嗎?「處罰」,特別是「正向處罰」這種操作制約方式,到底應該要在什麼時候使用,才最能夠促進學習呢?其實喔,正向處罰並非是一無是處,事實上,在自然的情況中,正向處罰通常是非常有效的一種學習方式,特別是在遭遇危險的時候,比方說,一朝被蛇咬,十年怕草繩大家都聽過,基本上這個現象,就是透過正向處罰而確實記住教訓的經典例子。
還有,研究也發現,正向處罰的時候,處罰的嚴厲程度通常不是重點,真正的關鍵,其實是「立即」而且「確定」的處罰。那我們以冒煙的水壺為例,如果你原本不知道冒煙的水壺很燙,那只要你被燙過一次,最多兩次,你馬上就會學會教訓。一般來說,這種學習不需要真的嚴重燙傷、而只需要是稍微燙到、有一點痛,那你就會記得很清楚。
但是相較之下,如果有某個行為,是你每做一百次才會被嚴重懲罰一次,那你可能就不太會學到教訓。所以說,立即且確定的輕微處罰,通常會有最好的學習效果。