狗的训练主要集中在操作性条件作用.第一个定义这一概念的科学家是B.F. Skinner,他研究了俄罗斯生理学家Ivan Pavlov博士在动物行为方面的工作。在巴甫洛夫开创性的研究中,狗狗们了解到一个刺激(在这个实验中,一个铃铛)意味着它们将要被喂食。巴甫洛夫从两个自然配对的东西——流口水和被喂食——开始,通过在喂食前摇铃铛,添加了第三个成分。经过几次试验,狗狗学会了把铃声和喂食联系起来,并在没有食物的情况下,听到铃声就会流口水。
因为狗狗在被喂食时就会分泌唾液,所以食物是一种无条件刺激.没有条件或特殊训练是必要的,使狗唾液,这是一个无条件反应.相反,铃声通常不会让狗分泌唾液;只有当它们习惯于把铃声和被喂食联系在一起时,它们才会这样做条件刺激.狗的新反应是对刺激的反射,是条件反应.
今天我们很多人都看到了这一点,当我们的狗听到门铃的声音就狂吠,有时甚至是门铃响了电视.在这种情况下,狗已经习惯于将铃铛的刺激与即将到来的陌生人联系起来。
当我们看到闪光灯或者开车时听到警笛声,我们会本能地紧张起来心利率可能会增加。我们已经习惯于把警笛的声音与买票的不愉快和紧张的经历联系起来。这是经典条件作用.动物和人都能学会将两件事联系起来,并在预料到第二件事时对第一件事作出反应。这种学习方式是被动的、非自愿的;它发生在学习者没有做任何事情的情况下,而且往往是无意识的。
当巴甫洛夫的工作是处理条件刺激的反射性反应时,斯金纳开始对通过添加一个强化物.强化物可以是奖励或者一个惩罚者.奖励是任何能够增加行动频率的东西;惩罚者是任何降低其发生频率的东西。
当我们因为某种行为而受到奖励时,我们很可能会重复这种行为。当我们因为某种行为受到惩罚时,我们很可能会停下来。这种学习方式是主动的、自愿的;这取决于学习者的行为。
因为强化物的定义是基于它的有效性,所以重要的是要记住,对一个人的奖励可能没有意义,因此对另一个人来说也不是奖励。同样地,在某一情境中算是奖励的东西可能并不存在于其他情境中。
斯金纳证明了动物和人都会为了奖励而做出某些行为。在他对老鼠和鸽子的实验中,斯金纳展示了动物如何学会按杠杆来获得食物奖励。当动物第一次被引入测试箱时,它们会随机移动。当他们不小心压下杠杆时,一粒食物就被分发出去了。他们很快就学会了故意压下杠杆来获得小球。他还的行为通过一步一步的加强,它们会变得更加复杂。斯金纳将他的方法称为“操作性条件反射”,因为动物的行为实际上是对环境(按杠杆)做出反应,以响应预期的结果(获得食物奖励)。
奖励鼓励好的行为,惩罚打击坏的行为,这是我们大多数人本能的做法;这是常识。操作性条件反射在动物训练中有很长的历史,甚至在它被定义之前。康拉德·莫斯特上校在1910年出版了《训练犬:手册》(Training Dogs: A Manual),在斯金纳描述这些原则的几十年前,他就使用了很多斯金纳研究过的原则。莫斯上校的训练方法以今天的标准来看有些苛刻,但他被许多人认为是现代训狗之父。大多数教练和其他教练同时使用奖励和惩罚来塑造和强化期望的行为。
接下来,我们来看看强化物是如何在动物训练中使用的。