棉花糖实验最初并不是被设计成一个“测试”。事实上,我一直对大多数试图预测真实生活中可能发生的未来行为的心理测试充满质疑。我经常会指出一些性格测试里的诸多偏颇之处,我自己也从来没有创造出一个完美的测试。我和我的学生设计这个实验并不是为了去测试孩子们的表现有多优秀,而是为了弄清楚,如果他们想要延迟满足,或者当他们想要延迟满足时,是什么促使他们做到的。我没有任何理由来期待一个学龄前儿童为了棉花糖或者饼干而等待的时间长短,可以为预测他们数年后的发展情况提供任何有价值的东西,尤其是这种试图通过早期心理测试去预测之后长期的生命历程的尝试,已经被许多实践证明明显失败。
然而,在棉花糖实验开始多年后,我才开始思考孩子们在实验中的表现是否与他们日后的表现有所关联。我的女儿们也在必应幼儿园就读,多年后我时常会问起她们那些从幼儿园里出来的孩子们都表现如何。与系统性的后续追踪不同的是,这只是一次晚餐时段的闲聊:“黛比怎么样了?”“山姆最近在做什么?”当这些孩子成长为青年时,我开始要求她们根据这些人在社交和学业上的表现,从0~5分进行打分。由此我才发现,这些孩子在棉花糖实验中的表现和我的女儿们对他们取得的进步的简单打分之间可能存在某种关联。通过把这些评分与棉花糖实验中的原始数据进行对比,我发现了其中很明显的相关性,并且我意识到我和我的学生们必须认真地研究这种相关性。
那是在1978年,菲利普·K.皮克(Philip K.Peake,目前是史密斯学院的高级教授)刚刚成为我在斯坦福大学的研究生。他工作严谨,常常不知疲倦地与其他研究生搞研究,尤其和安东内特·蔡斯及鲍勃·蔡斯的工作关系非常亲密。皮克在设计、启动以及从事延迟满足这一实验研究的过程中,发挥了很大的作用,这一研究日后变成了斯坦福的纵项研究。1982年,我们的研究小组开始投放问卷给那些可以联系到的曾经参与过实验的学龄前儿童的家长、老师及学业导师。我们的问题涉及了可能与冲动控制有关的全方位的行为及性格,其中既包括孩子们计划与思考未来的能力,也涵盖了应对个人和社会问题的技能和效率(比如他们和同事相处得怎样),以及与其学业表现有关的问题。
在1968—1974年进入斯坦福大学必应幼儿园的孩子们中,有超过550位参与了棉花糖实验。我们在实验后对这些被试做了样本追踪,并通过多种方式对他们进行了评估,这样的评估大约每10年进行一次。2010年,他们大约都到了40岁;2014年,我们继续收集了他们的相关信息,包括职业发展、婚姻状况、身体情况、财力以及精神健康状况。这些发现从一开始就让我们感到惊讶,现在仍然如此。
青春期:更有竞争力和更好的学习成绩
在首期的跟踪研究中,我们给被调查者的家长们以邮件的形式发去了一小部分问卷,问他们:“如果把您的孩子与他周围的伙伴们进行比较,比如同学或者其他同年龄段的孩子,您觉得您的孩子表现如何?”他们被要求按1~9的等级进行打分(代表着从“非常差”到“表现一般”到“非常好”)。我们也从孩子们的老师那里获得了他们在学校里有关认知技能及社交技能的类似评分。
青少年后,在面对困境时往往能够展现出更强的自控力,不为诱惑所动,更容易集中注意力,更加聪明、独立、自信,并相信自己的判断力。他们在面对压力时比起那些没有坚持多长时间的孩子来说更加不容易垮掉,也更加不容易变得唠叨、行为混乱或是重复一些不成熟的表现。同样的,他们的规划能力也更强,当被激励时,他们更加有能力向目标发起冲击。他们做事也更加用心,更有能力使用及回应自己的动机,他们面对挫折时不会轻易做出妥协。简而言之,他们公然反抗成为那种典型的执拗的问题青少年(这是大多数处在青春期的孩子们留给社会的普遍刻板印象),至少在他们的父母和老师的眼里是这样。
那些在棉花糖实验里能够坚持更长时间的孩子在过了数年成长为一个为了能够准确测试出孩子们的真实学习情况,我们要求他们的父母在可能的情况下提供他们在SAT考试中的英语和定量成绩。SAT是美国的大学申请考试中的一项常规测试。为了评估父母提供的成绩的可靠性,我们同时联系到了组织SAT考试的机构——教育测试服务中心。总体来看,那些能够坚持更长时间的学龄前儿童大都获得了更好的SAT成绩,而其中,那些坚持时间最短的孩子(最后三名)比起那些坚持时间最长的孩子(前三名),总体分数整整差了210分。