第5章 奖励与惩罚的妙用

惩罚的威力极其强大,强大到通常无须真正动用。一个大威胁可能比许多小惩罚更有效。惩罚使人们能够从错误中吸取教训,并产生内疚心理。内疚激励人们通过忏悔、道歉、补偿和重申承诺改善与伴侣和朋友的关系,并在工作中发挥激励作用。

不论你想要完善自我还是改造他人,批评的作用都是有限的。如果批评未能产生效果,或者如果你希望避免潜在问题,就需要使用正面或负面的直接激励。也就是说,你要考虑一个最古老的社会科学问题,同时也是最可疑的陈词滥调:胡萝卜还是大棒?

语言学家认为,这一表述可追溯至19世纪中期,当时欧洲和美国有一幅漫画,描绘一名骑师通过在马匹面前摇晃胡萝卜而赢得一场比赛;还有一则被反复转述的故事,借一头驴子谈论育儿之道,这头驴子仅对奖励有反应,而对棍棒无动于衷。1851年,美国一本杂志总结了其中蕴含的所谓民间智慧:“用胡萝卜激励马的实验告诉我们,要引导,不要驱赶。”

但到底有没有人做过这个实验呢?我们从没在肯塔基德比(kentuckyderby)赛马会上见过有谁在获胜的马匹面前挥动胡萝卜。骑师们更喜欢鞭子这一大棒路线,而鞭子也是针对驴子和骡子的传统激励工具。如果19世纪的道德家费心观察一下他们那个时代的赶骡人,是不会发现任何诱人的蔬菜的。南北战争期间拉炮车的人并不是好言好语哄着骡队爬上泥泞的山丘。他们以高超的运鞭技巧和别出心裁的咒骂而闻名,而上级军官也能够容忍,因为赶骡人坚持认为,诅咒动物是这项工作的基本组成部分。

因此,我们从古老的“胡萝卜还是大棒”的故事中得出了一个不同的教训。这些故事真正说明的是,我们渴望相信奖励比惩罚更有效。挥舞胡萝卜比挥舞大棒更让人愉快,所以即使有相反的证据,我们还是会告诉自己挥舞胡萝卜更有效。今天的家长、教师和管理者依然秉持这一信念,尽管研究人员在有关诱因的实验中不断证实“坏”的力量更加强大。另一群专业人员,即神职人员也秉持这一信念,神职人员一直在做有关德性行为动机的实验,而他们开展实验的历史要比心理学家长得多。

在逾三个世纪的时间里,美国的基督教牧师一直在尝试种种方案,试图解决一个老大难问题:如何在周日早晨填满教堂的长椅。这对创建马萨诸塞湾殖民地的狂热清教徒而言并不是什么问题,但他们的虔诚没能延续多久。到18世纪初,他们的后裔已是一群目中无神的人,其他殖民者也是一样。只有五分之一的美国人加入教会。美国人平均每天下肚六杯酒,通常从早餐开始喝,波士顿和费城的人均酒馆数量比阿姆斯特丹还要多。从婚礼后不到9个月出生的婴儿人数判断,在小夫妻当中,发生婚前性行为的人比去教堂的人还要多。神职人员经常哀叹,殖民地陷入了不信神的境地。

然而,1740年在殖民地巡回布道的英国牧师乔治·怀特腓德(georgewhitefield)却在东海岸引起了轰动。从佐治亚州到缅因州,成千上万的农民放下农活,到草地或最近的城镇广场听他布道。在波士顿,他吸引了3万名听众——比全城的总人口还要多。怀特腓德的听众会痛苦呐喊,泪流满面,宣称自己获得重生,回家后更会发誓永不犯罪。

本杰明·富兰克林这样报告他在费城的见闻:“看到居民的礼仪举止迅速发生变化,真是太棒了。他们以前从不思考宗教问题,对宗教漠不关心,而现在似乎整个世界都虔诚信教;傍晚在城里散步时,不论走在哪一条街上,都会听到家家户户在唱赞美诗。”

美国人为什么突然开始虔诚信教了?历史学家曾想方设法解释第一次大觉醒(firstgreatawakening),也就是怀特腓德和乔纳森·爱德华兹(jonathanedwards)等美国牧师引领的这场奋兴浪潮的成因。种种理论将这场浪潮与文化变迁、社会动荡和经济危机联系在一起。但最简单、最有说服力的解释来自罗杰·芬克(rogerfinke)和罗德尼·斯塔克(rodneystark)这两位社会学家,他们研究了教会的兴衰历程,并独立证实了负面效应。

人间地狱

宗教教派起初是一个小团体,是一小群把自己与社会隔绝开来的虔诚信徒,譬如因拒绝遵守英国国教建制而逃离英国的清教徒。但清教徒一旦在马萨诸塞州立足,就不再是局外人,而是成了建制派。该教派发展成为在新英格兰占据主导地位的公理会,而美国圣公会(普世圣公宗的美国分支)则以相同的方式统治其他殖民地。这些主流教会能获得政府补贴,即使不吸引热忱的新成员加入,也一样可以生存。

这些教会的牧师都是接受过良好教育的绅士,而不是凭魅力蛊惑民众之徒。他们的布道优雅而理性,立足于在哈佛和耶鲁学习的那一套崇尚理性主义、鄙视情感主义的神学理论。神学院教导他们把上帝视为遥远、抽象,带有几分仁爱的神灵,与《圣经·旧约》中诅咒罪人下地狱的愤怒形象大相径庭。博学的现代牧师并不利用布道坛宣扬永恒的天谴,甚至不一定相信地狱的存在。

但奋兴运动者相信地狱,而且非常强调。乔治·怀特腓德告诉他的美国听众,不要被否认“地狱磨难之永恒性”(他在佐治亚州进行的一次布道会便以此为名)的现代神学家迷惑。他说,“这群盲人的领袖可悲至极”,并警告说,他们对地狱的否定必然“助长不忠和亵渎”。他敦促罪人们想象自己永远被“肮脏的魔鬼”、“无休止的烧灼”和“蠕虫般缠绕不休的良心自责”折磨。乔纳森·爱德华兹在1741年那场名为“愤怒的上帝掌中的罪人”的著名布道会中详细阐述了这一图景。他摒弃了耶鲁大学教授的那套神学,将康涅狄格州的听众比作悬挂在地狱深渊上方的“令人恶心的虫豸”。

爱德华兹警告说:“呃,罪人!想想你身处的可怕险境。这是一个巨大的愤怒熔炉,一个宽广的无底深渊。你挂在一根细线上,周围燃烧着神圣的愤怒之火,每时每刻都可能把线烧焦,把线烧断。”

那些布道震惊了建制教会。一个公理会牧师协会谴责怀特腓德使出“全套把戏和诡计,让人激情澎湃、热血沸腾”。哈佛大学的教职员工指控他犯有“激情”罪。后来成为耶鲁大学校长的公理会牧师埃兹拉·斯泰尔斯(ezrastiles)抱怨说,奋兴主义者的策略是“严肃、冷静、庄严地把人吓到神经错乱”。主流教会在一些地方运用自己的政治权力阻止奋兴主义者布道,但他们的斗争并未取得成功,特别是在美国独立革命缔造了一个不承认任何官方宗教的国家之后。主流教会一旦失去特权地位和补贴,它们的牧师就不得不参与竞争,而竞争可真是像地狱一样残酷。

作为一种激励策略,火和硫黄(《圣经》中两种惩罚罪人的武器)在第一次大觉醒期间及其后很长一段时间内十分盛行。自18世纪以来,归属教会的信徒在美国人口中所占比例增加了两倍,与欧洲数百年来的世俗化趋势形成鲜明对比。为什么今天有三分之二的美国人属于某一教会,而欧洲则有那么多长椅是空的?芬克和斯塔克在《美国教会的变迁》(thechurchingofamerica)一书中做了精辟的社会学分析,并得出结论认为,这不是因为美国人骨子里更有灵性,也不是因为美国人有特殊的文化焦虑,不同之处在于,欧洲政府一直给予建制教会官方认可和补贴,而美国并未给予任何教会垄断地位。

竞争在18世纪开始之后,信徒人数增加最多的并不是主流教会,而是延续怀特腓德和爱德华兹那套地狱之火传统的卫理公会。卫理公会的布道者并不是由神学院培养出来的,他们通常是不拿报酬、业余布道的地方居民,受前来访问的巡回牧师领导,而这些巡回牧师自己也没受过神学院的训练。卫理公会在18世纪初只是一个很小的教派,到1850年已经发展成为美国最大的宗教教派。之后,他们遇到了主流教会的老问题。随着卫理公会的兴盛,该教派建立了神学院,而这些神学院的毕业生开始宣讲被称为“新学”的较为温和的教义。传统教义的信奉者抱怨说,“这个系统的典型思想是仁爱”。

我们再一次看到,福音无法与地狱较量。到19世纪末,卫理公会不再是美国最大的宗教派别。在竞争中得胜的新秀是惧怕地狱的天主教和浸礼会信徒,他们的教会迅速发展,一直延续到20世纪。最终,这些教会的许多神职人员革新了教义,结果又输给了奋兴布道者,这一次是在20世纪80年代及其后迅速发展的福音派和五旬节派。和以往一样,建制教会也对新兴教派粗暴的神学理论颇有微词。20世纪80年代,主流教会卫理公会的牧师理查德·威尔克主教(bishoprichardwilke)开始敦促他的同僚从竞争中吸取经验教训。

威尔克主教解释说:“吸引大量信徒的教会相信罪、地狱和死亡。耶稣的教导来自他的切身体验,他解释、经历并征服了罪、地狱和死亡。如果没有罪,我们就不需要救世主;如果不需要救世主,我们就不需要牧师。”如果没有邪恶,没有地狱的威胁,牧师就会失去好运,失去意义,失去工作。

基督教在美国的发展史并不是一项受控实验,但数据集十分可观:数亿人暴露在相互竞争的条件之下。他们肯定喜欢听牧师在布道中谈论一个善良、温和的神,但真正让他们挤坐在教堂长椅上的是愤怒的上帝发出的威胁。心理学家阿齐姆·沙里夫(azimshariff)和他的同事已经在更可控的条件下证实了这种效应。

在一项实验中,沙里夫让学生们做数学测试,并要求他们不要利用电脑故障作弊。当然,他动了些手脚,好了解学生究竟有没有作弊。当他寻找区分作弊者和未作弊者的因素时,发现学生的性别和人格测试得分都无关紧要,学生是否信教也不重要——虔诚的学生和其他人一样有可能作弊,关键在于学生如何看待上帝。如果学生用“爱报复”、“可怕”、“爱惩罚”和“愤怒”等字眼形容上帝,则考试作弊的可能性明显低于平均水平;但是如果他们用“宽恕”、“给人安慰”和“仁爱”这样的字眼描述上帝,作弊的可能性就比较大。沙里夫据此撰写的论文题为《凶神造就好人》(meangodsmakegoodpeople),爱德华兹应该会对这个标题点头称道。

沙里夫还将目光投向实验室之外,对几十个国家的犯罪率进行了比较。他对67个国家的近15万人展开调查并进行了回归分析,结果发现,一个国家的凶杀率(最可靠的犯罪晴雨表)与贫困程度或收入差距的关系,远不如与宗教信仰的关系密切。调查中专门问及有关天堂和地狱的问题。在一些国家,相信天堂的人比相信地狱的人多得多,而这些国家的凶杀率往往高于平均水平。许以上天的奖赏显然并不会对当地的杀人犯起到太大的威慑作用。但在另一些国家,似乎确实存在一种超自然的威慑力,因为人们越相信地狱,凶杀率就越低。坏的力量从现世延伸到来世,至少在抑制暴力冲动方面是这样:地狱比天堂更强大。

奖励与惩罚

在乔治·怀特腓德布道三个世纪之后,实验心理学家也迎来了自己的“大觉醒”。那是在20世纪50年代,当时,研究动物如何学习是美国几乎所有心理学系的主要任务。b.f.斯金纳(b.f.skinner)提出的方法和其他类似的关联学习理论占据主导地位。一项普遍接受的原则是,奖励和惩罚必须立即施行。要教会动物不要做某事,就必须在它违反规则之后立即实施惩罚——当时估计的最佳时间是半秒之内。

但后来有一位名叫约翰·加西亚(johngarcia)的年轻心理学家报告了一项不同寻常的发现。加西亚在旧金山一个美国海军实验室工作,当时正在利用老鼠研究辐射的影响,这是原子武器发展之初的一项热门课题。他把老鼠放在房间里,让它们暴露在不同水平的辐射中。房间里的塑料瓶盛有水,但加西亚观察到,老鼠很快就不愿再喝瓶里的水。他猜测,老鼠可能是把塑料瓶里水的味道与辐射造成的恶心感联系在一起(加西亚自己对恶心感很熟悉。第二次世界大战期间,他曾当过陆军航空部队飞行员,但由于饱受晕动症和高原反应的困扰,他不得不放弃飞行)。加西亚开始测试老鼠对各种口味、场景和声音的反应。他让一些老鼠在进入辐射室之前喝它们喜欢的糖水。后来,这些老鼠在受到辐射之后便不再想喝这种甜饮料了。

加西亚的发现引起了轰动。人们原以为联想学习须经过多轮强化(著名的“学习曲线”),但加西亚的老鼠仅经历一次糟糕体验就会避开有甜味的水。人们还以为,只有当强化发生在体验之后的半秒之内时,学习才成为可能,但对加西亚的老鼠而言,即使负面强化(在辐射室经历的恶心感)在喝完水后好几个小时才发生,它们仍然学会了讨厌有甜味的水。许多专家认为加西亚的结果肯定是错的,或者可能是假的,但进一步的研究证实了这种后来被称为“加西亚效应”的现象。即使几小时之后才进行强化,老鼠也能够完成学习,但前提是强化必须为负面。老鼠可以学会厌恶几小时后让它们恶心的食物,但并不会喜欢上一种后来产生良好效果的食物。

人类的大脑和味蕾也会表现出类似的偏差吗?比利时的研究人员让高中生品尝一系列含有中性调味料的液体,这些液体要么加入了糖(学生们喜欢),要么兑入了一种难喝的苦味饮料。一周之后,学生们品尝了更多含有各种中性调味料,但没有加糖或兑入苦味混合物的液体,并为这些液体评分。这一次,学生们讨厌之前与苦味饮料混合的调味饮品,但他们并未对之前加糖的调味饮品表现出任何喜爱。和老鼠一样,这些学生也从坏经历,而不是从好经历中学到了东西。

这种效应解释了为什么人在幼年时经历某种不愉快的饮食体验之后,会永远不再喝某种饮料,比如朗姆酒或玛格丽塔酒。鲍迈斯特在他年幼的女儿身上观察到类似的现象。当她还是个蹒跚学步的孩子时,她什么都敢吃,甚至喜欢吃生鱼。有一次,大人在吃寿司时问她要不要吃婴儿食品,她抗议说:“我不吃宝宝的东西,我想吃寿司。”4岁时,她在父母实验室的一名研究生的婚礼上当花童。婚礼上提供寿司。好几个研究生和新娘的朋友看到一个小女孩喜欢吃寿司都很惊讶,他们不停地给她拿,看她开心吃寿司的模样。但后来她吃得太多了,觉得有点不舒服。从那一天起,她就再也不想吃寿司了。

有一项巧妙的奖惩研究是围绕幼儿和弹珠展开的。研究人员在实验中教这些孩子控制自己的行为,并将弹珠作为奖励。一些孩子一开始拿着一个空罐子,每做出一次正确回应便会拿到一颗弹珠。其他孩子则是一开始拿着满满一罐弹珠,每犯一次错误会损失一颗弹珠。奖惩是完全平衡的,所以如果两个孩子学习速度相同,不论一开始拿到的是空瓶子还是装满弹珠的瓶子,离开时瓶里的弹珠数量会完全相同。但他们的学习效果明显不同。因犯错而受到惩罚的孩子学习速度快得多,所以他们最终得到的弹珠比那些通过奖励学习的孩子要多。

家长和教师担心惩罚会让孩子伤心,但心理学家约瑟夫·福加斯(josephforgas)发现了心情低落带来的意外优势。一项要求受试者回忆在商店看到的物品或描述事件的实验表明,坏心情能够提高记忆力。心情低落的人表达得更准确,这可能是因为他们更为专注;他们的表达也更简洁,只提供相关信息,而不会说废话或无关的内容。当心情低落者被要求评判某人的工作质量时,他们较少因对长相的肤浅印象而产生偏见。在一项测试说谎者的能力的实验中,不快乐的人比快乐的人表现得更好。坏心情使他们不那么容易上当受骗。

失败的滋味不好受,但它提供的信息比成功多。分析考试得高分的原因并不能为你提供太多有用信息,因为你得把试卷每一部分都做好才能得高分。但分析低分试卷会迫使你关注错误之处。欧洲军事史屡屡证明,最强大的军队是前一场战争的失败者,因为失败促使他们进行重组和战略创新,而胜利者只是沉浸在自满之中。奖励使你将注意力转向内心,惩罚则迫使你更加仔细地审视世界并做出改变。

“坏”的适应性好处已经在训练人们预测噪声的实验中得到证明。如果人们不是对噪声无能为力,而是可以采取一些措施防止噪声,他们便会对噪声更加关注。在有关改变动机的研究中,这些益处也得到了证明。大多数人都想减肥,但促使他们采取行动的主要原因是害怕看起来胖,而不是希望看起来苗条。大多数人想要帮助别人,但他们对负面刺激而非正面刺激做出回应的可能性更大。在一项田野实验中,研究人员与红十字会合作发出了两项略有不同的献血呼吁。正面呼吁(要求受众帮助拯救某人的生命)促使一些人响应号召参加了当地的献血活动。但在收到负面呼吁(防止某人死亡)之后,参加人数增加了60%。数十项其他研究表明,公共健康信息(比如呼吁接受癌症或心脏病检查)如果建立在恐惧之上,则公众,尤其是女性响应的可能性会大大增加。如英国作家塞缪尔·约翰逊(samueljohnson)所言,死亡的可能让人聚精会神。

不过,虽然证据非常清楚,民众还是愿意相信胡萝卜比大棒更有效。家长和教育工作者不是认可惩罚的价值,而是朝着相反的方向走,远离曾经十分普遍的严厉惩罚。这种做法对许多学生,特别是对来自弱势家庭的男孩造成了灾难性的后果。教育机构与主流宗教团体一样,仍在继续宣扬福报,尽管这种方式效果不佳。师范院校向教师灌输的理念是,要注重表扬孩子,而不是强调他们的错误,学校也不愿惩罚犯错的老师或学生。

这种理念的盛行在一定程度上缘于20世纪70年代的自尊运动,而自尊运动是心理学史上最令人遗憾的错误之一。研究人员注意到,在许多事业中,高自尊与个人成功存在关联,因此他们得出结论认为,提升自尊将有助于学生成长进步。可惜的是,这些研究人员把因果关系弄反了:成功确实会提高自尊,但自我评价高并不会让人更成功。自尊理论很快就遭到心理学研究者的质疑,但许多教育工作者和所谓的儿童发展专家仍然信奉这种理论。一本广泛使用的给教师的指南阐述了这种权威共识,书中呼吁“减少对竞争和成绩的重视”,鼓励在“友好和相互支持的氛围中”开展合作活动。

因此,孩子们玩的是人人都能拿到奖杯的游戏,游戏中极少出现失败这一选项。许多学区实行“自动升级”政策,允许更多的学生在未掌握基本阅读能力和算术知识的情况下一路读完高中。不让学生不及格和留级复读的理由是为了避免损害他们的自尊。但实际情况果真如此吗?为检验学生的自尊是否会受到影响,心理学家赫伯特·马什(herbertmarsh)对大批德国中学生进行了多年的跟踪调查,并特别关注那些留级复读的学生。事实证明,这些学生留级当年的自尊不仅没有受到影响,反而随成绩的提高而上升,这种改善在此后的若干年里还能继续保持。针对佛罗里达州小学生的一项研究也揭示出类似的益处。

留级复读,与年纪较小的同学一起念书一开始无疑很尴尬,但你会逐渐适应,第二次学习课本肯定也会变得更加简单。因此,你会得到更高的分数,变得更加自信,与自动升级相比,你为下一年级的学习所做的准备也会更加充分。升入不配升的年级并不会让你感觉更好,对学习当然也没有什么助益。

成绩单上那些你不配得的分数对学习也毫无帮助,但既然学校不愿惩罚学生,打高分已经成为常态。许多学校取消了f级,有些学校完全取消了评分。老师的评分标准比过去宽得多。近几十年来,高中成绩一直在上升,现在的平均成绩是b,但这并不是因为学生越来越聪明。学生在标准化考试中的得分并没有随平时学习成绩的上升而上升。如果学校仍然对学生进行排名,那么整体成绩的上涨就不那么重要了,但大多数高中连班级排名也取消了。

这些宽松的政策对来自富裕和受过良好教育的家庭的学生影响较小,因为这些学生和他们的父母(以及他们的家庭教师)一直瞄准进入精英大学的长期目标。他们学习很努力,因为他们知道自己会因在sat(美国高考测试)和其他标准化考试中得不到好成绩而受到惩罚。但其他学生则受到了损害。

1980年,美国的大学里有一半是男生,但今天女生与男生的比例已接近3∶2,因为有太多男生学业一塌糊涂。教师们哀叹,男孩总把时间浪费在玩电子游戏而不是做功课上。但他们不应该简单地指责男孩,而应该考虑一下游戏为何如此吸引人。游戏玩家是通过争夺积分和争取更高排名来学习。游戏不是通过避免失败来保护他们的自尊心,而是让他们一再被杀死,被迫从头开始。这些惩罚使他们能够从错误中吸取教训,最终得分超过其他玩家而获得成功。如果学校为他们提供同样的激励,他们也会在学校里认真学习。

男孩比女孩成熟得晚,所以男孩的自制力建立得较慢,而对于由单亲(经常负担过重)指导和管教的男孩来说,建立自制力显得尤为困难。研究人员一再发现,单亲家庭对男孩产生的负面影响比对女孩更大。如果学校的管教也不严格,男孩更容易在学业上面临困难。传统教育者依靠明确的规则和惩罚让男孩坚持正道,强调竞争而非合作,因为他们知道,这是激励男孩的最好方式之一。

一些美国教育家尝试了类似的策略,以帮助低收入少数族裔社区的男孩和女孩。在学校逐渐接受“人人拿奖杯”理念的过程中,黑人和拉丁裔学生与白人和亚裔学生之间的成绩差距越来越大,令这些改革人士感到警惕。在20世纪七八十年代,全美阅读和数学测试中的族裔成绩差距一直在缩小,但在90年代又有所扩大。到90年代末,西班牙裔十二年级学生的平均得分与白人或亚裔八年级学生相同,非裔美国人十二年级学生的平均得分就更低了。为什么这么多少数族裔学生会落后四年之多?学者和学校管理人员为这种差距找了各种借口,将其归咎于校长和教师无法控制的社会、政治和经济因素。