甚麼是響片訓練(Clicker Training?)

原文資料由Karen Pryor Clickertraining and Sunshine Books, Inc.授權提供,
譯者:黃薇菁(Vicki)


「響片訓練」是一種特定訓練方法(或教學方式)的泛稱,是一種依據動物學習原理作為的訓練方法。

研究顯示:任何動物(無論狗兒、貓咪、海豚、鸚鵡、馬兒、駱馬或人類)在某項行為產生喜歡的後果時,較可能會學習到重覆這項行為,所以響片訓練者的作法是提供動物所喜歡的後果,用以交換他們所樂見的行為。

我們稱這些後果為「獎勵」(rewards),而這個過程為「強化」(reinforcement),因此,響片訓練是一種依據正加強的訓練方法。



以下回覆人們對響片訓練常見的一些疑問:

A:為什麼響片訓練很有效?

Q:當動物為了看到牠喜見的後果而刻意表現某個行為時,研究學者稱此現象的學習原理為「操作制約」(operant conditioning),接受響片訓練的動物即表現出這種現象。
動物(和人類)可能會把某個動作、某次事件、某個地方、某個人或某個東西與某個後果聯想在一塊兒,不管這個後果是好是壞,當某件事(或某個環境)接連著出現某項後果的情形越常出現,它們之間的關連性就會越強,這種現象的學習原理稱為「古典制約」(classical conditioning),它所學習到的是反射性或自動出現的行為,並不是刻意的行為。

響片訓練初期運用古典制約,當動物已經會為了獲得獎勵而刻意重覆行為時,響片訓練很快便轉變為運用操作制約,透過操作制約的訓練產生目的性的行為,而透過古典制約的訓練則產生習慣性的行為。

表現目的性行為與表現習慣性行為的動物差別甚大。以響片訓練的動物(或以操作制約訓練的動物)會不斷嘗試學習新的行為,牠們在學習過程中很清楚自己所學習到的是什麼行為,而非不自覺地完成這些動作,所以甚至在數年之後牠們依然會牢記這些行為;牠們也發展出自信心,因為牠們能夠操控自己行為的後果,牠們學習時也會興緻勃勃,因為牠們知道自己的行為都會得到很棒的後果。


A:響片的作用是什麼?

Q:響片訓練與其他獎勵訓練方式最主要的不同是,它可以很「精確」地告訴動物哪個行為為牠帶來獎勵,這由一個獨特的聲響達成溝通,當訓練者所樂見的行為出現時,響片聲也同時出現,接著便出現獎勵。
假如動物出現某個行為時沒有響片聲的協助,牠可能並不知道哪個動作帶來了獎勵,或者牠可能誤以為獎勵與某個訓練者並不樂見的行為有所關連。有了響片,訓練者能夠精確「標定」行為,讓動物清楚知道是哪個行為,所以響片訓練者稱響片聲為「事件標定器」(event marker)。響片聲也具有居中連接行為和獎勵的作用,所以也被稱為一種「居中訊號」(bridging signal)。


A:為什麼使用響片,而不用嘴巴發聲代替呢?

Q:對訓練而言,響片比起嘴巴發聲來得強烈有效,因為動物在其他情況下並不會常聽到這個聲音,它代表的意義只有一個:「當你聽到響片聲時,因為你當時正在做某件事,所以你將會得到獎勵。」此外,響片具有立即性,可以在行為發生當時即刻按下,即便動作微妙得稍縱即逝(如:耳朵抽動),也可以利用響片抓得住它。
響片聲不同於嘴巴出聲的地方在於,即便是同一個字,我們也可能因情緒或含意不同而改變發聲的方式,但是響片每次發出的聲音都一樣,它的意義從來不會改變。人類是非常愛說話的動物,我們的狗兒卻大不相同,期望牠們從我們每日呱喋不休、毫無意義的話語中找出有意義的單一字彙有如登天之難,然而響片的意義永遠都很清楚明白,它永遠代表著溝通,而且永遠都帶來好消息。

響片使訓練者能夠與動物明確溝通,這種能力對彼此關係影響深遠,兩者間的互動會增加,而且訓練者和動物成了彼此更有趣、更好玩的同伴。


A:響片訓練怎麼做呢?

Q:訓練者在行為發生當下按下響片──例如:當馬兒抬起腳時,訓練者同時按下響片,或當狗兒坐下時,訓練者便按下響片。按下響片的動作有點兒像是按下相機快門,彷彿把訓練者希望加強的動作「拍攝」了下來,而在「拍攝」之後,訓練者給予動物所喜歡的東西,通常是一小塊食物,但有時也可以利用玩耍、拍撫或其他方式作為獎勵。
動物很快(有時只需要按下兩三次響片)就會把響片聲與牠所喜歡的東西(也就是獎勵)作連結,由於牠會想再度獲得獎勵,於是便會再次重覆響片聲響當時牠所進行的行為。

任何動物都可以依循以下三個步驟進行訓練:

使行為出現
標定這個行為
加強這個行為

A:響片訓練者如何使動物出現行為呢?

Q:響片訓練與傳統訓練不同的地方在於,響片訓練者會等到動物完全了解某個行為之後才會加上「指令」(譯註:響片訓練的原文為cue,此處譯為指令以利中文理解,但其實它的意思只代表著某個訊號,響片訓練並不命令動物,所以不稱此訊號為指令),也就是將行為命名的意思,這個行為的名稱可以是聲音、手勢或任何能夠清楚表達的訊號。如果在動物完整了解讓行為之前就予以命名,這麼做毫無意義。
當動物的某項行為已經被響片加強了多次,牠也頻具自信地重覆這個行為時,顯示牠已了解哪項行為引起了響片聲而出現獎勵,這時牠便已準備好,可以學習該行為加上名稱了,接下來便是「導入指令」的過程。

教導動物某個行為的指令時,訓練者在動物即將出現該行為之前給予這個指令,重覆多次之後,接下來動物只有得到指令之後出現該行為,訓練者才會按下響片給獎勵,假如動物在沒有指令給予之下出現該行為並不會獲得響片聲,於是動物很快便學會注意這個指令是否出現,這個指令的意思是:「如果你現在做出這個行為,響片就會按下,你就會得到獎勵。」


A:假如動物不聽指令怎麼辦?

Q:受過響片訓練的動物會一直想重覆過去曾經被獎勵過的行為。當牠們明白指令的意義,而且也想獲得獎勵時,牠們必定會做出這個行為。
如果牠們不出現這個行為,響片訓練者不會以為牠們「不服從」,相反地他們會省思以下問題:

牠是否了解這個指令的意義?
牠是否只在當初學習指令的環境裡才了解它的意義,但換了新環境就不明白了呢?
牠是否對訓練者的獎勵很有興趣呢?
響片訓練者在回答這些問題之後會調整訓練,確保動物在各種環境下,無論何種干擾存在都能明白該指令的意義,而且達成行為之後牠也感受得到獎勵的意味。


A:為什麼響片訓練者不恩威並施,使用獎勵也使用處罰呢?

Q:任何行為的後果都可能是好,也可能是壞,既然我們會獎勵好的行為,我們也可以處罰我們不樂於見到的行為,為什麼不這麼做呢?
根據研究,處罰或許可以減少某個我們所不樂見的行為,但是通常會併發產生另一個我們所不樂見的行為,以處罰作訓練時所產生的結果無可預料,也很難掌握。

此外,處罰通常並沒有利用到事件標定器,幾乎都是在事後給予,而且極少能與特定行為產生清楚明白的關連,從動物的觀點來看,處罰是個隨機發生、不具溝通意義的事件,所以就改變行為而言,處罰的效果並沒有正加強加上事件標定器的效果來得好。

當響片訓練者專心注意好的行為,而非不好的行為時,他們的感受是自己與動物的關係更加圓融,也獲得了更多回饋。正如同動物的「目的性行為」與「習慣性行為」有所不同,一隻為了獲取獎勵而工作的動物與一隻為了避免處罰而工作的動物在態度及工作熱情上也有著天壤之別


A:如何運用響片訓練去除不好的行為呢?

Q:響片訓練者藉著避免加強不好的行為而使它自然消失,當某個行為對動物來說沒有獎勵時,它終有一天會消失,如果不好的行為一直存在,響片訓練者會研究這個行為,找出這個行為一直被加強的原因,有時行為的本身即具加強的作用,例如吠叫的狗就不像安靜不叫的狗那麼無聊,牠還有件事件可做,所以吠叫即是牠的獎勵。響片訓練者讓狗兒提供好的行為,藉以取代不好的行為,那隻因為無聊而一直叫的狗可能只是單純需要多運動,或者也可以獎勵牠安靜下來休息的行為,再訓練越來越長的休息時間,然後響片訓練者才會加上「安靜」的指令。

A:我們是不是一輩子都必須帶著響片和零食呢?

Q:不是的,一旦動物學會了行為和指令之後,因為動物已經知道這個行為了,響片便無用武之地。響片訓練者要維持這個行為不必使用特別好吃的零食,偶而使用普通的獎勵如拍撫或稱讚即可,已經學會的指令和行為也可以利用生活中的事物作為獎勵,例如狗兒在門口安靜坐著,牠的獎勵就是門會打開讓牠可以出去散步,於是響片和零食便可以保留起來訓練新的行為。

A:任何動物都可以使用響片來訓練嗎?

Q:是的,操作制約原理(響片訓練在科學上的專有名詞)最早時為海豚訓練師廣為利用,因為他們需要的是一種不利用肢體暴力的教導方式,它可以應用於各種動物,也已經成功應用於體型各異的各類物種,包括畜養動物和野生動物、年幼動物和年長動物、各類犬種的成犬和幼犬、貓咪、鳥類、花豹、老鼠、兔子、龍貓(chinchillas)、魚類等不止。
響片訓練者在習得這套訓練之後,他們手中握有一個很有效的工具,讓他們能夠分析行為、針對個別動物調整既有訓練,並且發明出前所未有的新方法,這種變化性使得響片訓練這個工具能夠轉化成新的形式,在不同狀況之下,針對不同的動物都能生效。

同樣的訓練原則也已應用於運動員、舞者、溜冰選手和一些其他人士的訓練上,這類訓練稱為「TAGteach」,它利用響片作為標定訊號,可以更迅速地、更精確地、更正面地教授特定肢體動作。


A:響片訓練是一種訓練方法還是一種訓練哲學?

Q:有時候人們很驚訝響片訓練者對響片訓練竟然如此熱愛及投入,這些響片訓練者剛開始時或許只想學習某種訓犬方法,但是當他們知道響片訓練的基本原理時,他們很快便理解到它同樣可以應用於生活之中,它可以改變人們,使他們不再專注於負面,而著重於正面,這種心態上大轉變當然可能會徹頭徹尾地改變一個人的人生
arrow
arrow
    全站熱搜

    Miko(小米麻) 發表在 痞客邦 留言(0) 人氣()