狗狗训练是如何起作用的

由:汉娜•哈里斯

“Sit"和“;stay"通常是狗学的第一个命令。"width=
“坐”和“呆着”通常是狗狗学会的第一个命令。
汉娜·哈里斯

尽管几千年来,狗一直在帮助人们从事特定的工作,但今天,狗更像家庭成员,而不是员工。根据美国宠物产品制造商协会2005年,美国的宠物主人在这方面的花费估计为39.5美元欧元他们在宠物上的花费是1994年的两倍多。

虽然这代表着幸运狗的黄金时代,但家庭成员的地位也可能要求狗达到一定的行为标准。虽然你可能会从现在大量的狗时尚猜测,狗不是又小又毛茸茸的人。他们有自己的思维方式和做事方式。每年有成千上万只狗被送进动物收容所,或者被永久地关在后院的围栏里,仅仅因为它们表现得像狗。

广告

狗和人可以快乐地生活在一起,但这需要主人努力弥合物种之间的差距,并训练他们的狗在人类社会中举止得体。训练狗有很多不同的方法,就像很多训练师会说他们的方法是唯一“正确”的方法,但现实是有多种方法都是有效的。它们之间的主要区别是它们工作的速度有多快,以及它们对狗和训犬人来说有多愉快。

在这篇文章中,我们将探索大多数犬类训练方法背后的历史和想法,并谈论当今最流行的一种方法:点击器训练。

广告

学习理论

巴甫洛夫的著名的研究"width=
巴甫洛夫的著名的研究

狗的训练主要集中在操作性条件作用.第一个定义这一概念的科学家是B.F. Skinner,他研究了俄罗斯生理学家Ivan Pavlov博士在动物行为方面的工作。在巴甫洛夫开创性的研究中,狗狗们了解到一个刺激(在这个实验中,一个铃铛)意味着它们将要被喂食。巴甫洛夫从两个自然配对的东西——流口水和被喂食——开始,通过在喂食前摇铃铛,添加了第三个成分。经过几次试验,狗狗学会了把铃声和喂食联系起来,并在没有食物的情况下,听到铃声就会流口水。

因为狗狗在被喂食时就会分泌唾液,所以食物是一种无条件刺激.没有条件或特殊训练是必要的,使狗唾液,这是一个无条件反应.相反,铃声通常不会让狗分泌唾液;只有当它们习惯于把铃声和被喂食联系在一起时,它们才会这样做条件刺激.狗的新反应是对刺激的反射,是条件反应

广告

今天我们很多人都看到了这一点,当我们的狗听到门铃的声音就狂吠,有时甚至是门铃响了电视.在这种情况下,狗已经习惯于将铃铛的刺激与即将到来的陌生人联系起来。

当我们看到闪光或者开车时听到警笛声,我们会本能地紧张起来利率可能会增加。我们已经习惯于把警笛的声音与买票的不愉快和紧张的经历联系起来。这是经典条件作用.动物和人都能学会将两件事联系起来,并在预料到第二件事时对第一件事作出反应。这种学习方式是被动的、非自愿的;它发生在学习者没有做任何事情的情况下,而且往往是无意识的。

当巴甫洛夫的工作是处理条件刺激的反射性反应时,斯金纳开始对通过添加一个强化物.强化物可以是奖励或者一个惩罚者.奖励是任何能够增加行动频率的东西;惩罚者是任何降低其发生频率的东西。

当我们因为某种行为而受到奖励时,我们很可能会重复这种行为。当我们因为某种行为受到惩罚时,我们很可能会停下来。这种学习方式是主动的、自愿的;这取决于学习者的行为。

因为强化物的定义是基于它的有效性,所以重要的是要记住,对一个人的奖励可能没有意义,因此对另一个人来说也不是奖励。同样地,在某一情境中算是奖励的东西可能并不存在于其他情境中。

在斯金纳箱里的老鼠"width=
在斯金纳箱里的老鼠

斯金纳证明了动物和人都会为了奖励而做出某些行为。在他对老鼠和鸽子的实验中,斯金纳展示了动物如何学会按杠杆来获得食物奖励。当动物第一次被引入测试箱时,它们会随机移动。当他们不小心压下杠杆时,一粒食物就被分发出去了。他们很快就学会了故意压下杠杆来获得小球。他还的行为通过一步一步的加强,它们会变得更加复杂。斯金纳将他的方法称为“操作性条件反射”,因为动物的行为实际上是对环境(按杠杆)做出反应,以响应预期的结果(获得食物奖励)。

奖励鼓励好的行为,惩罚打击坏的行为,这是我们大多数人本能的做法;这是常识。操作性条件反射在动物训练中有很长的历史,甚至在它被定义之前。康拉德·莫斯特上校在1910年出版了《训练犬:手册》(Training Dogs: A Manual),在斯金纳描述这些原则的几十年前,他就使用了很多斯金纳研究过的原则。莫斯上校的训练方法以今天的标准来看有些苛刻,但他被许多人认为是现代训狗之父。大多数教练和其他教练同时使用奖励和惩罚来塑造和强化期望的行为。

接下来,我们来看看强化物是如何在动物训练中使用的。

广告

强化物

对长尾小鹦鹉和其他作为宠物饲养的鸟类进行手工训练是很重要的。"width=
对长尾小鹦鹉和其他作为宠物饲养的鸟类进行手工训练是很重要的。
汉娜·哈里斯

强化物可以是增加一个新元素,也可以是去除一个现有元素。这个术语有点混乱,但是添加某些事情被称为“积极的”,尽管不一定是“快乐的”或“好的”的意思。"Negative "在这里是the删除也不一定意味着“坏的”。因此,奖励和惩罚可以是积极的或消极的。

给鹦鹉一颗水果作为它的脚是一种好的附加(积极的奖励);一匹马跑得更快以停止马刺的压力是坏事的结局(消极奖励)。尽管“消极奖励”听起来有点矛盾,但删除坏的东西也是一种奖励。

广告

一些常用的积极惩罚器包括冲击项圈、尖项圈和扼流链。"width=
一些常用的积极惩罚器包括冲击项圈、尖项圈和扼流链。
汉娜·哈里斯

有很多方法来教学生用强化物坐着。训练员可以推或引诱狗狗坐起来,或者他可以简单地等待,直到狗狗自己自然地坐起来。一旦狗坐下,训练者可能会提供一个积极的奖励,如口头表扬(“好孩子!”),触觉表扬(轻拍头部),一个喜欢的玩具,或一顿好吃的。一些训练师使用电子项圈等负面奖励对狗进行轻度电击,狗一坐下就会停止电击。狗知道它可以通过坐着来消除电击。出于道德上的原因,许多人对此表示反对。然而,它遵循与操作性条件反射相同的原则。在每一种情况下,狗都会知道,当它听到“坐下”的命令时,它会坐下,它会得到奖励。

许多人在训练时更喜欢用奖励作为强化物。"width=
许多人在训练时更喜欢用奖励作为强化物。
汉娜·哈里斯

强化物几乎可以是任何东西,只要它们对狗有意义。一只狗可能认为零食比玩具更有价值,而另一只狗可能有相反的感觉。强化物是什么并不重要,但出于实际原因,有些强化物比其他的更容易处理。同样的强化物并不是每次都要用到。有些任务可能需要比其他任务更有价值的强化物。正如PetSmart服从训练师丹·奥利里(Dan O’leary)所说,“如果我给你一美元,你可能会跨过椅子。”但你可能不会为了一美元给我洗车打蜡。”类似地,你的狗可能会在相对安静的家里工作,获得某种奖励,但在课堂上可能需要一些更令人满意的东西来保持注意力。

我们将看看驯兽师是如何开发标记或线索来训练狗以外的动物的。

广告

标记

海豚表演"width=
海豚表演
照片由保罗·安德森提供MorgueFile

凯勒和玛丽安·布里兰是B.F.斯金纳的学生,并将他的技术扩展到训练各种不同种类的动物。20世纪50年代,凯勒·布里兰开始为海洋哺乳动物制定训练计划。出于显而易见的原因,为海豚或虎鲸设计一个有效的惩罚器是困难和危险的。立即奖励海洋哺乳动物也很有挑战性,因为它们在水里,而驯兽师通常在一段距离之外的陆地上。

许多同样的问题是训练所固有的.如果一只狗坐下,然后跳起来,旋转,并得到了一个奖励,它可能不知道哪个部分的表演让主人满意。如果驯兽师花了一分钟才把食物拿出来给狗吃,那就更是如此。通常情况下,狗狗会将奖励与它得到奖励前的最后行为配对。所以如果狗坐着,然后跳起来吃东西,它真正被训练做的是跳起来,而不是坐着。

广告

惩罚者也是如此。如果狗从主人身边跑开,玩起了捉迷藏的游戏,主人抓住狗后自然会惩罚它。然而,这只狗在被惩罚之前做的最后一件事是去找主人。因此,当被召唤时,这种行为可能会减少,而不是逃跑。

布里兰通过设计一个标记,或提示,让动物知道自己的表现正确,很快就会得到奖励。布里兰使用经典条件作用将标记信号与奖励配对,这样当动物听到信号时,它就知道自己将获得奖励。然后他使用操作性条件反射来塑造积极奖励的行为。

标记有助于加强正确的行为,因为它是即时的。标记不是奖赏;它仅仅是一个行为正确的信号,以及对回报的承诺。因为海洋哺乳动物天生倾向于通过声音进行交流,所以用哨声作为标记是有意义的。

凯伦·普莱尔(Karen Pryor)在20世纪60年代用同样的正强化技术训练海豚。她意识到这种行为矫正的广泛应用,并在1984年写了《不要射狗》(Don't Shoot the Dog)一书,尽管书名是《不要射狗》(Don't Shoot the Dog),但这本书实际上并不是关于训练狗。它涵盖了使用积极强化来塑造任何人的行为,从宠物猫到困难的青少年。许多企业仍然使用这本书来教他们的员工如何有效管理。

基本金属滴答声经常被用作标记。"width=
基本金属滴答声经常被用作标记。
图片由HowStuffWorks购物者提供

普莱尔用一个金属敲击器作为标记,开始塑造狗和许多其他动物的行为,她的名字是最常与现代敲击器训练联系在一起的。她的技术被其他教练采用,随着互联网的出现,点击器训练迅速传播。

Karen Pryor将点击描述为拍摄你想要的行为;你就在那一刻把它折断了。点击的意思是,“你做了某事,这是正确的事情,你将得到奖励。”

许多新手训练师会犯这样的错误:点击来标记一个行为,但随后却没有在点击之后提供奖励。在没有实际奖励的情况下,狗可能会继续这种行为一段时间,但最终会消失。

接下来,我们将学习如何引入命令。

广告

点击器培训:介绍命令

这只狗正在接受训练,或塑造,通过一个箍。"width=
这只狗正在接受训练,或塑造,来跳过去 一个呼啦圈。
Hannah Harris提供照片

点击器本身并没有意义.就像巴甫洛夫的铃铛一样,狗必须通过经典条件作用知道它的意思是“有好吃的!”为了做到这一点,训练师通过反复点击点击器来“充电”,然后立即提供食物。通过这种方式,狗学会了把遥控器和食物配对。一旦狗知道咔哒一声意味着奖励,它就准备开始学习新的行为。

训练员在引导某种行为的方法上各不相同。一些人主张用食物来引诱狗就位。另一些则只是等着狗同时做出动作。大多数的点击器训练者不提倡用身体把狗推到合适的位置,因为这与点击器训练的无力哲学相反。

广告

一旦狗做出这种行为,时机就很关键。驯兽师必须在他看到他想要的行为的确切时刻发出咔哒声。如果狗躺下,然后在指导手点击之前翻了个身,翻个身被标记为想要的行为,而不是躺下。

如果循序渐进,狗狗可以用点击器训练来学习复杂的行为模式。例如,如果你想训练你的狗跳过一个环,你可能一开始就会在狗走近环的时候对它进行治疗。一旦狗狗能够可靠地走向呼啦圈,只有当它将头伸进呼啦圈的开口,然后只有当它走过呼啦圈时,你才会点击呼啦圈。最后,只有当狗真的跳过圈时,你才会点击。狗狗每学一步,奖励的标准就会越来越高。这是塑造

比起先给出一个命令,然后再告诉狗它的意思,大多数的点击器训练者更喜欢在狗确实做出这个行为之后才给出这个命令。引诱动作(比如把食物拿在狗的鼻子前面,然后把它移到地上,教狗“趴下”)可以通过程式化的动作和消除食物诱惑,转化为手势来发出指令。许多运动鞋感到手势对狗来说,学习语言信号更容易,但有一只对任何一种都有反应的狗是理想的。一旦狗提供了想要的行为,指导手就可以开始使用命令,这样狗就学会了将两者联系起来。最后,处理程序只会在命令请求时单击行为,而不是在自动提供行为时。

这只狗学会了“击掌”的手势。"width=
这只狗学会了“击掌”的手势。
汉娜·哈里斯

重要的是要记住动物是上下文的学习者.这意味着他们可能在一个地方理解命令,但在另一个地方却不理解。当训犬人站着的时候,狗也许能完美地坐着,但当训犬人以坐姿发出命令时,狗就会非常困惑。当训练一个新的命令时,训练者需要添加新的上下文,在必要时进行备份,以帮助狗进行概括。

接下来,我们来看看如何使用点击器训练让你的狗停止某些行为。

广告

点击器培训:消除不良行为

赫克托,一只混合吉娃娃,正等着被扔球。"width=
赫克托,一只混合吉娃娃,正等着被扔球。
汉娜·哈里斯

教孩子要容易得多17、做一件好事要比教它不要做坏事好。当狗做出不受欢迎的行为时,首先要考虑的是狗会得到什么奖励。他肯定得到了奖励否则他不会继续做下去,但有时候奖励很微妙违反直觉的.当狗跳到主人身上,主人把它推开时,被抚摸是对狗的身体奖励,可能比吼叫的惩罚更有力。训导员必须小心,不要因为狗的不良行为而不小心奖励狗。一旦管理者识别并消除了意外的奖励(尽可能地),下一步通常是训练不相容的行为。当主人拿起皮带时,被训练成坐着的狗不能同时跳起来撞倒主人。

点击器是一个训练工具,操作者不应该无限期地使用它。点击器的目的是传达所需的行为。一旦狗理解了命令并可靠地执行它,您就可以消除点击器。你仍然可以奖励狗,但随着时间的推移,你可能会从一个高价值的食物奖励转变为一个不太令人满意的食物奖励,然后可能仅仅是口头奖励。当这种行为完全习得时,奖励可能就没有必要了,尽管狗和人都喜欢工作做得好的反馈。

广告

操作性条件反射是塑造几乎所有动物行为的强大工具,包括狗。对积极强化的关注可以帮助每个人享受培训,加深培训者和学习者之间的联系。标记物的使用有助于准确地定位所需的行为,并大大加快训练过程。当一只狗学不到什么东西时,往往是因为沟通障碍,而不是不愿合作。好的培训师可以帮助解决这些问题。这种训练的唯一真正限制是指导者正确识别有意义的强化物的能力,以及将期望的行为分解成可管理的步骤的能力。

想了解更多关于操作性条件反射的信息,或者想在附近找到点击器培训课程,请查看下一页的有用链接。

广告

更多的信息

相关文章

更大的链接

  • B.F. Skinner基金会http://www.bfskinner.org/Operant.asp
  • Booth-Butterfield,史蒂夫。《史蒂夫实用说服与影响入门》西弗吉尼亚大学传播学系,2005年8月。http://www.as.wvu.edu/~sbb/comm221/primer.htm
  • 遥控器解决方案http://www.clickersolutions.com
  • 服装商)。《骨头会从天而降:加深我们与狗的关系》(Bones Would Rain From the Sky:深化我们与狗的关系)华纳图书,2002年。ISBN 0446525936。
  • 加里·威尔克斯的Click & Treat http://www.clickandtreat.com
  • 格拉斯曼,威廉。“行为主义方法”。瑞尔森大学心理学系。http://www.ryerson.ca/~glassman/behavior.html
  • Karen Pryor Clicker Training http://www.clickertraining.com/home
  • Kilcommons, B.和S. Wilson。“要考虑的爪子:为你和你的家人选择正确的狗。”纽约:华纳图书公司,1999。ISBN 0446521515
  • 学习理论http://www.emtech.net/learning_theories.htm
  • 马丁,G.L.和J. Pear。"行为矫正:什么是行为矫正,怎么做"第七版。纽约:Prentice Hall, 2002年出版。ISBN 0130995843
  • 米勒,P。《积极训练狗的力量》豪厄尔书屋,2001年。ISBN 0764536095
  • 普赖尔,K。“不要射狗!”教学与培训的新艺术。”纽约:班塔姆书店,1984。ISBN 0553380397
  • 桑德斯C.R.《理解狗:与犬伴一起生活和工作》费城:坦普尔大学出版社,1999。1566396905
  • Braslau-Schneck,史黛西。《驯兽师对操作性和经典条件作用的介绍》2003年11月12日。http://www.wagntrain.com/OC/

广告

加载……