能动作用通俗解释:态度、期望、动机与奖赏之间有着能动的相互作用关系

对于学习者来说,谁给他钱、他和此人的关系以及此人给他钱究竟是什么意思,这些都是“奖赏量”的极为重要的决定因态度、期望、动机与奖赏之间有着能动的相互作用。惩罚的作用常识的想法认为,奖赏与惩罚是彼此相反的,并以相似的方式起作用而决定行为。积极的奖赏“说”,“这是正确的反应”,而动机或诱因方面则“说”,“按这样干下去”。

心理学研究发现,十至十六岁的男生在多方选择实验中由于对每一正确反应的金钱酬报从0.1分增加到0.4分,学习速度加快了。可是,当酬报从0.4分增加到0.8分时,学习速度则略为减低了。

类似的实验发现,对于一次正确的反应单纯向被试者宣布“好”之外加上不同数量的金钱作为酬报,则非常微弱地提高了学习的速度或作业的水平。研究发现,用两张可兑现的代价券作为奖赏比用一张券较能促进学习。然而一张券和两张券的效果都不如对于一次正确的反应单纯宣布”好”的效果,大部分以低级动物为被试的有关本课题的研究则指出,在奖赏量和学习速度或作业水平之间有正的相关。

从个别学习者的立场看,“奖赏量”不能直接地从物质的物理数量加以推断。对老鼠说来,不同量食物的有效性将随着老鼠的饥饿状态及其关于食物的先前经验(食物偏好)而异;给予儿童金钱的有效性依赖于儿童的贫、富以及他能用钱(或酬报的钱数)购买的物品是否已得到充分供应。对于学习者来说,谁给他钱、他和此人的关系以及此人给他钱究竟是什么意思,这些都是“奖赏量”的极为重要的决定因态度、期望、动机与奖赏之间有着能动的相互作用。作为信息的奖赏从理论的观点出发,我们指望奖赏在两方面能起促进学习的作用。

奖赏的实施能够作为认可的因素而起作用,它仅仅指明反应(或一系列反应)是“正确”的。如果只是这样在信息方面起作用能动作用通俗解释,那么,“奖赏量”是无关重要的。如果奖赏提供了关于反应是否合适的全面了解,则它将以全或无的方式起作用。如果奖赏是及时的,则不论奖赏多少,都说明反应是“正确”的。在这种情况下,学习动机就不是必然地来自奖赏可能给予满足的那种需要。

学习可能是由那种同奖赏物无关的动机所引起和支持的。奖赏仅仅是关于反应是否合适的报信者。只要“奖赏”根本上是作为信息的来源而起作用,则它的有效性将和它的数量无关。作为诱因的奖赏第二,奖赏在引起动机方面起着促进学习的作用。当饿鼠到达迷津终点得到食物奖赏时,我们预期在饥饿的程度和作为奖赏的食物量之间(在某些范围内)会存在着正关系。

同样,对于一个贫穷的儿童来说,赏钱增加可能意味着对于他的饥饿或声誉需要的满足也增加了,因而在某些范围内动机值与奖赏量之间的正关系是可以预期的。我们知道当动机极其强烈、奖赏甚多或受奖赏的希望甚大时,过分强的动机加上焦虑、紧张和运动失调,可能导致对作业的不利后果。总之,正像动物学习的大部分情况一样,奖赏的取得是支持学习的主要促动力量,我们可以预期“奖赏量”和学习速度之间有正的关系;如果奖赏主要作为“肯定”的符号而起作用,我们就不能预期这种关系的存在。

被试者学到的东西和学习的速度肯定是奖赏模式的函数,这些奖赏或者来自操作本身,或者是在学习过程中人为地施行的。建立和维持一种反应模式的最简单和最敏捷的方法就是每当特定反应出现时立即给予奖赏。然而,也可以每试两次或三次奖赏一次,而且这样做,学习进行得很好能动作用通俗解释,犹如每次都得到强化一样。有人曾经指出,在仅有1/192的反应得到强化的情况下能动作用通俗解释:态度、期望、动机与奖赏之间有着能动的相互作用关系,老鼠的学习仍可能继续进行。

甚至间歇性的强化(奖赏在不规则的时距中施行)也能使受到强化的反应固定下来。如果奖赏施行的时距是随机的而不管作出的是什么样的反应,则学习表现为学习行为的变异性的减少。动物倾向于重复那些紧接在强化之前的反应并在相当长的时间内坚持这些行为。经部分强化达到的习得需要较多的试验次数;但比连续强化达到的习得,需要较少的强化次数。下列事实是很有趣味的:习得的反应,在部分强化的条件下比在每一“正确”反应均加奖赏的情况下消退得慢一些(在不给强化的情况下,反应持续得较长)。

关于在部分强化条件下固定下来的那种反应,其韧性较大的问题有着各种各样的解释。不论怎样解释,部分强化的反应消退较慢,这一事实具有实际应用的意义。奖赏的延迟为了产生最大的效果,奖赏必须在时间上紧接它所要支持的反应。如果奖赏延迟的时间很长,就会出现反应消退(而不是反应固定)的趋势。例如,在以老鼠为被试的实验研究中,有人指出,如果对二次强化的效果加以控制,则奖赏的有效性随着延迟时间的增加而迅速下降,达到多于10秒时间的延迟,实际上造成了奖赏无效。

人类学习中的奖赏延迟同样会减低奖赏的有效性。对于较年轻、较不成熟和智慧较低的学习者,必须使其行为后果和动作极为紧密地连接起来,以便使他成为学习中实际控制的手段或在学习中起支持动机影响的作用。对于年纪较大、较成熟和较聪明的被试者,奖赏虽然相隔较远,但它仍然有效。

新近的一些研究指出,决定延迟奖赏的相对效应的一个重要因素是延迟期中个体的活动。如果低级动物能够保持它的身体方定势),或人类能够在反应和奖赏的时距中把诱因牢记“在,那么时间延迟则是比较无关重要的了。

然而,如果被试者失去“定势”,在延迟过程中一味从事分心的(不相称的)活动,则反应与奖赏之间的时距愈长,奖赏的诱因价值就愈小。惩罚的作用常识的想法认为,奖赏与惩罚是彼此相反的,并以相似的方式起作用而决定行为。奖赏加强行为倾向,而惩罚则削弱这种倾向。心理学家们从这种头脑简单的想法出发,但为证据所迫,于是改变了他们对于赏与罚这两种因素如何影响行为的看法。

我们曾经指出,奖赏具有诱因与信息两方面的成分。积极的奖赏“说”,“这是正确的反应”,而动机或诱因方面则“说”,“按这样干下去”。另一方面,惩罚只能指出所做的反应是不合适的,但并未指出什么样的反应是比较合适的。惩罚所能提供的大部分信息是,“不要重复这种反应,要改变做法”。对于奖赏的合乎逻辑的反应是,重做刚才做出的反应。对于惩罚的明智反应是,做出别的反应一但得不到关于应该做些什么反应的指示。奖赏倾向于通过鼓励来加强反应的重复,把反应定型化;惩罚的作用是增加反应的变异性。

为了免得我们似乎把这一过程过分理智化,还应当指出,不管被试者对情境的知觉或对赏罚意义的了解如何,奖赏和惩罚总要改变他的态度和行为倾向。如果惩罚趋于极端,个体即被迫从整个情境中退出来并回避这种情境。当由于做出错误选择而受到严厉的惩罚时,饥饿的老鼠不是试图寻找正确的选择去获取食物,而是试图爬出迷宫或发狂似地到处乱跑,尝试躲开。

有时极端的惩罚引起了定型作用而不是增加行为的变异性。受到严厉惩罚的个体发狂似地一再继续重复同样的反应能动作用通俗解释,而不顾反应的后果如何。重复惩罚造成回避整个情境的趋势并对这种情境发生厌恶。

许多在文化方面处境不利的儿童对于学校环境的态度显然就是这样。赏与罚对于儿童活动的效果依赖于可选择的各种反应的效用和吸引力以及这些反应在行为方面的可能后果。掌握学习课堂中惯用的教学程序是:把教材教给学生,期望所教的或学生有机会学到的各部分内容实际上都学会了。我们认为,假设对所有的人都采用同样的教学,则过去经验、动机和能力倾向方面的个别差异将产生那种能用常态曲线来描述的成绩差距。

有人假定不是人人都能学习,并根据个别差异来辨明不合格的成绩是正当的,以这种假定为基础进行的教学和教育已经受到重大的责难。从那些关心程序教学人来着,任何行为,不管它的复杂程度如何,看要依靠对一连串较简单的行为进行学习。至少从理论上说,通过分析复杂的行为,认清了一连串的成分行为,并掌握了每一个相继的成分,任何学生都可能掌握那些甚至是最复杂的技能。程序教学正是建立在这样一种想法上,而且对于某些学生的确是非常成功的。

学生学习许多程序单元,如果掌握了一个单元,他就受到正反馈的强化;如果掌握得还不完全,他就受到诊断性的反馈,而且在进入下一个单元之前,他的错误已经得到矫正。很有希望的教学程序业已编制出来,并已有效地应用于大量的学生。程序教学是掌握学习的先驱者,而且至今仍是学习掌握的有益成分。

能动作用通俗解释

为您推荐

发表评论

评论列表6人参与

返回顶部