埃斯蒂斯的生平和理论
作者:王凯瑜
(一)、埃斯蒂斯的生平及简介
1、简介
威廉姆•埃斯蒂斯 [William Kaye Estes 1919.06.17],美国心理学家和认知科学家,现代数学心理学(Mathematical Psychology)的奠基者之一,主要从事对人类和动物学习的研究以及对学习、记忆和决策的数学模型的发展。
2、生平
1919年出生于美国明尼苏达州明尼阿波利斯市。后就学于明尼苏达大学,主修心理学。1940 年获该校文学士学位。毕业后在斯金纳门下工作。1941年埃斯蒂斯和斯金纳提出了他们的焦虑分析,并介绍了空调的情绪反应(CER)的范例。1943年获哲学博士学位。 1944-1946 年供职于美国部队医药管理部门。1946-1962 年执教于印第安纳大学并晋升为心理学教授。1950年 提出了他的刺激抽样理论,在《心理学评论》报上发表《学习统计理论走向》的文章。1962-1968 年转任斯坦福大学心理学教授。1968-1979 年受聘于洛克菲勒大学任心理学教授。1979 年起任哈佛大学教授。 从哈佛大学退休后,他回到布卢明顿,印第安纳州 ,在那里他仍然活跃在学术界,并担任名誉教授。
3、奖项和荣誉
曾任《比较心理学和生理心理学》杂志编辑、行为科学高级研究中心会员,曾荣获国家科学奖
1962年获美国心理协会杰出研究贡献奖
1963年沃伦实验心理学家学会奖章,并被提名的国家科学院
1992年美国心理学基金会心理科学终身成就金奖
1997年他的“基本理论的学习” 获得美国国家科学奖章
(二)、埃斯蒂斯的主要著作
《现代学习理论》
《学习理论和心智发展》
并主持主编《学习和认知过程手册》
(三)、埃斯蒂斯的主要理论和思想
基本观点是:
有机体的学习和操作是一个随机的过程,是可以用概率论加以分析的系列;
有机体的反应是由多种不同的因素决定的,因而能作的最好的反应预测,实际上是一种随机预测。预测一个补试将出现什么反应,是指在每次尝试的几种反应中,每一种反应可能发生的概率是多少;
作用于个体的情境是复杂的,个体总是对情境中的所有刺激的一部分而非单个刺激做出反应,这种刺激反应遵从因接近而联结的原则。
后来工作:
1970年学习理论和心理发展
1991年的统计模式行为研究
1994年的分类和认知
1、刺激抽样理论(Stimulate Sampling Theory)的由来
行为主义与赫尔原始强化论的影响,深化了“刺激——反应”的联系主义。其基本观点是:有机体的学习是通过用新的适应性行为来对付刺激情境这一方式来进行的,而在这刺激环境中,有机体从前的行为多半是不适当的。强化的条件将决定在一个特定的情境中什么行为是适应性的。他认为有机体所学习的是对外部事件或事件序列的内部表象,联想就是在这些事件表象之间形成的。事件可以是刺激(S),反应(R)或是有强化作用的结果(O),即一个经历“S—R—O”序列的有机体将学会所有要素配对的联系,即S—R、S—O和R—O。
受到古斯里的接近联系从统计学角度看操作:
刺激抽样理论明确地把学习和操作看作一个或然的(随机的)过程。一个随机的过程就是一个可以用概率论加以分析的序列。例如小白鼠走迷津就是一个反应序列,就是一个或然的过程,通过多次试验,可以给出一个正确和错误的序列。决定论者认为,动物做出选择的那一刻我们可以知道外部刺激情境的变化、动物的注意和动机变化的各个因素,那么动物做出选择也是势在必行的,那么就是可以预测的。也有另一种观点认为,行为是由很多各不相同又不可预测的因素决定的,所以我们能作的最好的行为预测其实是一种或然的预测。而学习的统计理论显然是属于后者。它的主要因变量是在一直特定学习理论条件下受试在某一时刻各种反应发生的概率。实验中概率尝试序列会发生变化,随试验次数增多,正确反应的概率也递增。
2、刺激抽样理论(SST)的基本假设
1)刺激情境
刺激情境:刺激要素的全部环境中各个独立变化成分或方面所构成的全域。
刺激的随机变化的两个根源:由实验过程中环境的偶然变化引起的;由受试本身的变化引起的。
试验抽样:每个要素被抽取的概率=抽样数目/刺激要素的全域。
2)反应联系和系统状态
在具体操作中,每一刺激要素是和一个反应相依存的。只要列出各种刺激要素以及当时与每一要素相联系的有关反应,就能刻画我们情境中的受试的素质特征。这种一览表在理论上就是这个系统的状态。对受试来说,刺激要素在整个学习过程中所引起的联想是有变化的,所以我们说,系统的状态也岁尝试次第而变化。
设P代表与A1反应相联系的刺激要素,那么1-P就代表其余的与A2反应联系的刺激要素。这时,系统状态就可归结为P。
3)操作与强化规则
任何尝试中的操作是由该次尝试中被体验到的或被抽样到的那些要素决定的。任何一种反应的概率等于在该次尝试中与该种反应相联系的那些抽样要素的比例。抽取一个刺激样品,在反应发生之后,受试得到有一定强化作用的结果。正是这一结果改变该次尝试中抽样要素的条件联系,从而改变了系统的状态。
关系。即结果与一个反应建立联系,还必须是与其他反应没有联系才能建立的。也体现SST中抽样刺激与受到强化的反应的条件联系是“全或无”式的。
强化规则:实践试验的结果会使受到奖励的正确反应同愈来愈多的从全域中抽样出来的刺激要素发生联系,而同时错误的反应就同这些刺激要素脱离4)基本学习方程的推导
强化事件的作用使得刺激比例的变化过程:
反应的概率等于在该次尝试中与该种反应相联系的抽样要素在刺激情境中的比例,这种比例由于反应得到强化而在各次尝试中发生变化。例:
如果一条学习曲线在开始的几次训练试验中上升得很快,而后来的试验中上升得越来越慢,就是负加速的。
设P和1-P分别为A1与A2反应相联系的刺激要素的比例, Pn表示在第n次尝试中做出反应时与A1相联系的要素比例, Θ表示某一刺激要素在任何一次尝试中被抽样的概率,如果每次尝试都以对A1反应的E1强化结束,那么学习方程为:Pn+1=(1-Θ)Pn+Θ 。也可以推导出一般方程式:Pn=1-(1-P1)(1-Θ)n-1
3、刺激抽样理论(SST)的应用
1)概率学习
典型实验:让被试预测每次试验发出亮光的是左边的灯还是右边的灯,被试预测“是左灯”(A1)或“是右灯”(A2)后,主试随即开亮左灯(E1)或右灯(E2)。实验的共同特征是,事件是在一个随机的序列中发生的,通常被试得不到任何信息帮助他预测哪一事件会发生。所谓概率学习,就是这种情境中的学习。E1或 E2事件决定了什么东西得到强化而与做出哪个预测反应无关。条件作用仅仅依赖实验结束时的E事件,而不是E事件与被试的预测反应相一致。设π为强化事件E1在第n次实验中发生的概率,而1-π为E2在第n次实验中发生的概率。如果E1事件发生,则 会增大;如果 E2事件发生,则Pn会减小。
方程表示,随着训练的进行,被试预测的E1的概率会接近π,即E1事件发生的客观概率。当n增大, =π。范例:买马时A马与B马比赛,A马四局有三局赢,那么下一场可能会有3/4的人会买它赢。
2)概率学习的变式
宾得和费尔德曼:匹配原则能预测使用单一刺激成分的测试中的反应频率,而这些因子在先前的训练中是刺激模式的组成部分。
萨佩斯:被试的反应和强化事件在整个过程中是不同的,在此过程中,被试可以做出的反应总数在原则上是无限的。让被试始终处于一种“反应状态”,不是A1,就是A2,看被试在A1反应状态保持多久。得到,被试处于A1状态中消耗的时间比例将汇聚起来渐渐接近π,且这种渐进与给予E1或E2强化的频率无关。
奈马克和舒福特、比奇:要求被试根据每次的试验情况,估计E1事件不是将在下次实验中发生的概率,就是在过去一系列实验中已经发生过的概率。这些估计在不断练习后都开始接近π。
3)序列统计学
序列统计学提供了有关学习过程的一个重要的信息来源。它测定在第n+1次试验中被试的反应在多大程度上受到他在前次或前几次实验中所做的反应和所受的强化影响,或者只受这两者中一方的影响。被试在第n次,第n-1次…中所经历的事件,对被试在第n+1次试验中的反应概率有重大影响。比如我们预期,A1反应概率在发生了E1事件之后进行的试验中会增大,在E2事件后会减小。相反地,还有一种近因逆效应或称赌徒的谬误,就是被试认为,在E1事件发生延续时间越长,为了保持比例平衡,就越有可能预备E2事件。
4)自然恢复与遗忘
埃斯蒂斯认为自然恢复与遗忘之间有密切关系,他试图把反应概率中的自然变化归因于两次实验之间的、刺激环境中的随机变化。他提出,在某一时刻刺激全域中只有一部分被抽样到,其余部分在这一时刻是抽样不到的。随着时间推移,另一些刺激要素也变得有效时便能抽样到,而先前能抽样到的要素会暂时抽样不到。这就可以解释被试会受实验室条件的变化而产生变化。
刺激变化的波动理论,解释了遗忘和恢复曲线的那种常见的形状,也解释了当恢复或消退实验继续进行时这些曲线的相应变化。埃斯蒂斯还把这个理论应用到有关倒摄干扰和前摄干扰的遗忘实验中。从该理论的模型来看,研究干扰与研究一个先被条件制约,然后被消退的CR(条件反应)的自然恢复,没有什么不同。
5)刺激的辨认
在简单的辨别学习中,随机交替地呈现S1和S2,使A1反应受到S1刺激要素的强化,或A2受到S2强化。根据一般的条件制约和消退的规律,S1和S2不同的要素很容易分别与A1、A2联系起来,但交叉区的共同要素却很难分辨。要根据这个模型获得最佳作业,必须借助选择性注意使这些会引起混乱的要素不起作用。鲍尔也据此提出自己的模型。
6)动机
早期:埃斯蒂斯根据剥夺会使机体内部的刺激源活跃起来(如不给水喝会引起口渴),来研究内驱力水平对作业的效应,他还假定,这些内驱力刺激在刺激总体中的比重随剥夺的延续而增长。内驱力刺激理论还有一个处理关于内驱力辨别的研究结果的自然方法。在内驱力辨别中,动物学习,根据它某一时刻经受的内驱力水平的类别或强度做出不同的反应。促进内驱力的操作有赖于增大刺激源的强度,刺激源会同某一工具性反应相联系。埃斯蒂斯用一种类似于我们对这些外部内驱力所作的直觉的解释,来解释由剥夺引起的内部驱力。
后期:反应是由不同的能辨别的刺激输入和一个正驱力的输入一起引发的。起初只是由剥夺引起的内部条件和一个外部的无条件刺激,由于强化的相依条件,反应产生强化物,强化物又引发完备行为,完备行为又反过来激活正的内驱力机制,这一机制又使内驱力激活,与来自强化环境的外部刺激联系起来。这个方法也可解释条件抑制。这与赫尔的诱因动机理论极其相似。
4、少量要素模型
重要假设:
某一实验里的几个能得到的刺激要素只有一个可能被抽到,最好把这个抽样要素看做在某一实验中起作用的一个完型或刺激模式;
这个刺激模式在训练的开始是中性的,不对任何实验反应有条件联系;
强化只能在一些实验中而不是在其他的实验中产生条件作用。、
例子:假定一个单一刺激的模式构成一个眨眼的经典条件作用情境,这个在每次试验中都被抽到的模式开始时是中性的,不对眨眼产生条件作用。即CR的最初概率为零。CS在条件作用的开始几次实验中没有引起条件反应,但在每次实验结束时给予吹气(无条件刺激)会使CR受到这个刺激模式的强化作用。对某个被试来说,条件作用在某一次试验中起作用了。US结果使这个单一刺激模式对CR产生条件作用。
注意单一要素模型预测的组平均学习曲线与SST的多量要素模型所预测的曲线的区别:多量要素模型认为每一个被试都有一条渐进的学习曲线,单一要素模型则认为每一个被试都表现出多级功能,只有当所有被试的曲线上升时,每一个被试的曲线才会平缓上升。
(四)埃斯蒂斯理论的发展