"认知革命"与"第二代认知科学"刍议
李其维
华东师范大学心理与认知科学学院,上海 200062
心理学报 2008,40(12):1306~1327
DOI:10.3724/SP.J.1041.2008.01306
编者按:《"认知革命"与"第二代认知科学"刍议》一文系统地阐述了作者对当代认知科学领域研究状况的观点,对其庞大而复杂的研究领域进行了宏观的把握和整体的思考。在认知科学领域中,大部分科研工作者往往可能只是致力于某一具体课题的实际研究工作,而未必会对相关的哲学问题进行广泛思考。因此本刊刊登此文,希望它能提供一些新的思考角度。需要指出的是,尽管认知哲学属于认知科学学科群的构成成分,但认知科学的核心部分不是一门思辨的学问,而是一门实证的科学。整个认知科学领域近年来所表现出的在宏观研究趋势上的变化,实际上是这个领域中新涌现的诸多关键性的研究生长点共同作用的结果,而这些研究生长点的产生,虽然不排除哲学思考的作用,但主要是在多学科多层次多手段相互交叉渗透、相互支撑发展的背景之下,由解释和预测那些原有体系所无法解释和预测的行为和心理的重要方面(如学习、决策、社会认知、心理健康等)的需要所促成的。比如,相对于那些基于语言文字描述的理论而言,能更加细致准确地表达关于信息加工过程的假设,并能够对于人的行为操作(如反应时和正确率)给出清晰量化的模拟或预测,因而更加便于理解、使用和证伪。而随着脑功能成像技术的成熟,能够精确地模拟或预测在特定的信息加工过程中人脑内各个功能区域信号变化(如核磁共振功能成像信号变化)的计算模型业已出现,这就大大改善了以往只依靠行为层面的反应时和正确率两个简单指标来检验理论模型的状况,从而促成新的研究生长点。再比如,借助于严密的实验设计,目前的行为遗传学研究已经克服了羊纯依靠变差分析以及其它统计手段来探讨遗传环境相互作用对某种行为或心理障碍的影响的局限;而由于分子遗传学的引入,人们已经意识到遗传对行为的影响是通过众多影响微弱的基因产生的,在各基因位点之间,以及基因位点与环境因素之间存在着复杂的相互影响和作用,借助于基因芯片等分子生物学手段来探索行为的基因基础正在成为一个新的研究方向。因此,从认知科学的实际发展历程来看,不同思路不同研究途径之间的关系乃是从不同的方面相互支持、相互补充、协同发展的关系。至于"第二代认知科学"这一提法是否合理,抑或第一代和第二代认知科学的区别只是研究视角的差异,我们认为这些问题值得进一步探讨。
摘要
以计算隐喻为核心假设的传统认知心理学以及联结主义心理学均不能克服离身心智( disembodied mind) 的根本缺陷,当代认知心理学正面临着新的范型转换。以具身性和情境性为重要特征的第二代认知科学将日受重视,并促使认知神经科学进入新的发展阶段。作者认为在身心关系上应该坚持生理只是心理的必要条件,而非充分条件的立场,克服生理还原论的危险;应该重新审视基于二元论的生理机制这种说法;心理学传统中的科学主义和人文主义有可能在第二代认知科学强调认知情境性的基础上达成某种融合;第一代认知科学对意识的研究是不成功的,因为对知觉、注意、记忆、思维等心理过程的研究不能代替意识的研究,同时还应避免以意识内容的研究取代心理学研究的倾向。第二代认知科学中的动力系统理论关于变量(因素)之间的偶合( coupling)关系完全不同于变差分析中的变量之间的交互作用关系,其动力系统模式可能更有助于破解意识的产生(涌现)之谜,并引发心理学研究的方法论的变革新潮。第二代认知科学的兴起将启发人们对身心关系、生理还原论、意识研究在心理学中的地位、人工智能对心智完全模拟的可能性等重大问题重新思考。
认知神经科学;认知革命;第二代认知科学;具身认知;动力系统理论
关键词分类号 B84 -09
第二代认知科学 (second generation cognitive science)这一提法自认知语言学家拉考夫 (G. Lakoff)和约翰森 (M. Johnson)在他们的名著《肉身的哲学:具身心智及其对西方思想的挑战》 Philosophy in the Flesh: The Embodied mind and its challenge to Westem thought , 1999) [1]中首次出现,至今几近十年。国内学者(特别是一些科学哲学家和语言学家)在一些著述中对之已多有涉及,不过心理学家们似乎未予足够关注 [2 -4J。众所周知,目前的主流认知心理学是上世纪五六十年代一场认知革命后的产物。因此,第三代认知科学某种意义上则是对前次革命成果"认知心理学"的第二次革命以 o这后一革命是否有理,端赖于我们对认知心理学的成败得失,特别对其核心与基础假设有所分析后才能回答。
1 认知科学:时代精神(zeitgeist)的产物
1.1从米勒的“认知科学六角形”说起
认知科学的创立者之一米勒(Miller,G. A.) 2””3年在其回忆文章《认知革命:一种历史的视角》 (The cognitive revolution:A historical perspective)中指出[5],认知科学作为一个跨学科的学科群发端于上世纪5”年代,它是随着“心理学、人类学和语言学对自己重新界定”以及计算机科学和神经科学的介入而发展起来的,是近代科学发展史上最重要的事件之一。它是一种时代精神(zeitgeist)的产物。这一时代精神其影响所及并不限于心理学——当然这并不动摇心理学在其中的主导地位,因为毕竟“认知”本是心理学的主题。米勒认为认知科学至少涉及6个学科:心理学、语言学、神经科学、计算机科学、人类学和哲学,并且认为其中又以心理学、语言学和计算机科学为“核心”学科,其他3门学科则为“辅助”学科。当然也有人不同意这种主、辅之分。笔者以为这种划分反映了米勒对传统认知心理学之“计算”基础的某种坚持。这6门学科构成一个六角形,而其每一顶点都可以联结起来形成一个跨学科的新领域。米勒在文中写道:他在1978年曾受斯隆基金会(Alfred P. Sloan Foundation)的委托,领衔主持撰写过一份总结认知科学发展现状的研究报告,认为“15个可能的联系都可以用许多研究事例来说明”,而且至少在当时“就已看到其中11个联系已得到有效的巩固”(见图1)。[5]
米勒的报告据说当时因为没有取得与会者的共识而未能出版,主要原因是“不同领域的专家不愿对其它领域的研究成果作出任何判断”。但米勒显然仍认为认知科学六角形的划分和构成是适当的,并且仍对“人工智能”最终实现“人的智能”的完全模拟的立场有所坚持。我们稍感遗憾的是米勒在此文中对认知神经科学这一新兴学科着墨不多,尽管“认知神经科学”这一名称就是他在当年此份报告中首次提出的[5]。在此文最后,他写道:“那种建立一个可以展示人类心智的计算能力和表征能力及其在人脑中实现之结构和功能的统一科学的最初梦想,对我而言还是有着难以抵抗的吸引力”。明于此,难怪米勒至今仍把计算机科学而不是神经科学视为认知科学核心学科之一了。
笔者尝试列出这11门新的学科,它们是:1)心理(认知)哲学;2)认知的计算机模拟、人工智能;3)神经控制论(即米勒所指“使用由计算机科学提出的科学概念去模拟神经科学中阐明的大脑功能”);4)脑进化;5)人类语言学;6)语言哲学;7)心理(认知)语言学;8)神经心理学或认知神经科学;9)神经语言学;10)认知人类学;11)计算机语言学。
1.2心理学、语言学和人类学中的认知革命
对应于米勒前述的三大核心学科,其三大标志性成果的问世堪称重大事件。正是有了这三大成果,认知科学的整体形象才受世人瞩目。
首先,在心理学中,随着对行为主义的革命成功,心理过程研究重回心理学而诞生了信息加工认知心理学。有关认知心理学的重大成就,具备一般专业知识的读者大多耳熟能详,此处不赘。认知心理学对心理学中各领域研究的冲击是全方位的,以致于在这些领域的研究中,“认知派”几成主流;其次,在语言学中,则迎来了乔姆斯基理论的闪亮登场,转换生成语法渐居主导地位;再次,随着计算机技术的发展,人工智能研究蓬勃发展,且从业者大多信心膨胀:似乎实现人工智能全面模拟人的智能的目标指日可待。
认知革命不仅发生于心理学领域,其影响所及还达于许多相邻的学科。如语言学和人类学也产生了类似的认知革命,这正是前引米勒关于认知科学的产生是随着心理学、人类学和语言学对自己“重新界定”而到来之意。所谓重新界定,就是明确了新的研究方向和研究主题。
以乔姆斯基语言理论为代表的“语言学革命”与心理学的认知革命几在同时,且互为友军。乔姆斯基反对行为主义认为“语言是通过学习形成的习惯”这一立场,代之以由转换规则构成的所谓“心理语法”来说明人们理解语言的能力。他认为儿童生来就具有一种天赋的“语言获得装置”。顺便提及,皮亚杰在“思维(逻辑)先于语言”这一意义上同意乔氏的观点,但认为这种语言获得装置不是先验的而是源于后天的感知—运动能力。乔氏的转换生成语法对语言学本身以及对计算机(科)学和心理学均产生了深刻的影响。
乔氏的语言理论在对心智本质的看法上与信息加工认知心理学是一脉相承的:一方面,它有别于传统语言学而把研究视角转向了深层的语言结构,探索由深层向表层的转换机制。这与其说是语言学研究,不若说是与心理学结盟的共同研究,因为它有赖于心理学为这种转换机制提供支持。乔姆斯基把语言看作是认知系统的一部分,并企图通过语言现象,探索其背后的深层的认知规律。另一方面,乔氏的语言理论又主张这些“结构”是一种不限于自然语言的形式理论,它们可以设置于所有的自然的或人工的语言之中,各种语言只不过是这些结构设置的不同的表现而已,形式语言结构是一种与实现载体无关因而也与人无关的所谓“纯形式”,所谓语法就是无意义符号的操作规则。在对“纯形式”的追求上,乔氏语言学与信息加工心理学是荣辱与共的。
在人类学中,上世纪60年代后也经历了一场所谓“心理学转向”。这种转向接受认知心理学和结构语言学的双重影响,从较早的侧重民俗模式的研究以及更早的所谓“民族科学”(ethnoscience)阶段的研究,转向探讨心智、语言和文化的关系。其重要特征是把文化理解为一种观念、规则和概念的系统。在这种文化系统中,它们享有共同的符号和意义。于是,伴随着心理学转向的是对文化的转向,即从早期文化人类学对文化相对性的注意转而企图建立所谓普遍的认知图式。当然,人类学与语言学对这些认知图式的关注点有所不同。例如,关于范畴研究,人类学并不研究这些范畴是如何围绕原型(proto-types)组织起来并影响记忆和推理的(这是认知语言学家的工作),而是研究认知图式如何与行为发生联系的,并且认为这些图式不具有什么“原型”的含义,而是一种高度一般化的文化-知识的结构。两者的共同特点都是在向心理学靠拢,或与心理学结为同盟。至此,人类学和语言学一样,都步入了认知时代,发展到了认知人类学和认知语言学的新阶段。
1.3普遍的理性形式:认知革命的追求目标
无论是信息加工心理学还是同时经历了“心理学转向”的早期认知语言学和认知人类学,都在追求一种普遍的理性形式。这就是当时的所谓“时代精神”。就其哲学根源来说,从近处而言,它们都派生于英美的分析哲学的客观主义以及逻辑实证论;从历史渊源来说,则是严格笛卡尔二元论和霍布斯的思维“形式操作论”。
英美分析哲学对推理(理性、思维)的基本立场是:人类的推理能力独立于感知和身体运动;推理是一种“自治的”能力。所谓“自治”,就是可以与身体相分离。语言的句法也是“自治的”,因而语言符号具有任意性,且符号本身是无意义的,意义来自符号之间的关系或来自符号与外物的对应(意义为外部世界的内部表征)。而且不认为它们与主体的身体经验有什么关系,因而所有意义都是非隐喻性的——即没有任何意义是基于隐喻和主体想象的。
从功能角度看,心智被视为一种抽象的计算程序。霍布斯则将之简化为“一切推理都包含在心灵的两种活动——加和减里面”(《十六-十八世纪西欧各国哲学》,第61页)。他提出“所有推理只能是计算”的观点:思想就是对无意识存储于心智中的符号进行形式操作。可以说这一思想是信息加工心理学“思维即计算”的直接思想源泉。笛卡尔则更早就提出了心智的表征理论:关于外部世界的所有知识都是通过表示外部事物的心理客体而获得的。这种心理客体既然可被操作,显然就具有表征的涵义,即它们是“表征外部客体的”,因此,所谓“思想”就是这些表征通过推理或心理过程的操作。笛卡尔的这种有关心智表征的观点显然是后来信息加工心理学的原型。
正是受笛卡尔-霍布斯关于心智的“表征”和“计算”的思想的启示,以及稍后的控制论和信息论的直接激励,信息加工认知心理学便打出了“认知革命”的旗帜,把盛行一时的行为主义推向历史。在心理学的这一重要变革之际,更由于计算机科学的崛起,为认知心理学提供了可直接类比的认知模型:似乎一切认知过程都可在计算机上见到其“孪生的兄弟”,于是人的智能实现了与人工智能的合流。至于认知语言学和认知人类学,由于它们各自也都完成了向信息加工认知心理学靠拢并分别从不同的角度追求各自的普遍理性形式的“心理学转向”,而且都不排斥计算机科学的援手,因而此时它们在某种意义上都成了信息加工认知心理学的同盟军。于是,从更宏观的视野观察之,一个由跨学科领域共同介入的新的综合性学科“认知科学”应时而生。依笔者浅见,在认知科学中,各个介入的学科扮演着不同的角色:认知哲学提供了哲学指导思想,不管认知科学的从业者们的自觉立场如何,无疑认知科学与哲学认识论问题的关系较之一般的心理学领域更为密切;认知心理学在认知科学群体中起到牵头和核心的作用,因为毕竟认知科学的主题是认知,所有相关学科都是为了一个共同的目标——揭示认知秘密而走到一起的;语言学和人类学均为认知心理学的友军,它们都是从心理的角度,以语言和文化为切入点来展开研究,即:既依赖于认知心理学的指引,又以各自的成果对认知心理学提供支持;计算机科学与认知的交汇所形成的人工智能学科是认知科学学科群中的一门具有特殊重要性的学科。就认知研究而言,“人工智能”必须为“人的智能”服务,其结果必须能对“人的智能”的研究有所助益才有价值,否则它就只是一门新兴的应用技术学科而已。在这个意义上,不能说它是真正关于认知的研究;相反,其发展却有赖于认知心理学关于“人的智能”的研究为其提供方向的指导;神经科学与认知心理学乃至整个心理学的关系不言自明。认知研究与神经科学研究的结合所产生认知神经科学将在我们后面谈到的第二代认知科学的具身认知的旗帜下大有作为。
自我理解模式的文化差异等都是近来学者们的兴趣所在。有些研究结果还获得神经科学研究的支持,由此产生了所谓文化神经科学的新领域。我国学者朱滢关于文化对自我以及亲密他人的表征的影响研究即属此类[5]。他发现西方人独立型自我是由独特的神经机制所调控,这说明西方人自我与中国人自我在神经水平上也是不同的。当然,我们可以把这视为长时间的文化(环境)与脑相互作用的结果。与文化心理学相结合的当代认知人类学表现出与那种弱化环境影响而追求抽象理性普遍形式的传统认知心理学的疏离。
但是,除了人工智能因以模拟人的智能作为自己的追求,因而必须要坚守“认知即计算”的立场之外,无论认知心理学还是认知人类学和认知语言学似乎都不必恪守这一基本假设;认知神经科学则更与“计算”无关。放弃这一假设的认知心理学、认知人类学和认知语言学以及认知神经科学都是属于第二代认知科学的成员,而仍然囿于这一假设以追求普遍抽象的理性形式为目标者,我们可认为它们仍属传统认知科学或第一代认知科学的营垒。实际上,在这些学科内部近年来都产生了进一步的、或曰第二次的“心理学转向”。例如,认知语言学的新转向突出表现在意义(语义)的新观点上,即强调语义的主观性。不再把语义仅仅理解为使语句表达之命题成真的充分必要条件(又称真值条件),认为它还跟主体的认知状态有关,因而它是一种“主客观统一的语义观”:语义被理解为是概念化(conceptualization)即心理经验的各种结构和过程,一个表达式的语义就是说者或听着大脑中激活的概念。当代认知人类学也从传统民族志的现象描述转向人们关于周围世界概念背后结构的研究,于是产生所谓新民族志。新民族志更深地与文化心理学相结合,因为文化作为“知识体系”,与人的思维和行为息息相关,它是理解人的行为的概念模式。与文化有关的认知模式和认知系统,是认知人类学的当前热点。在此意义上,认知人类学与文化心理学的内容有密切联系。例如关于价值观系统对行为的影响、至于心理学的第二次认知革命则是本文的重点,其直接产物就是属于第二代认知科学的具身认知心理学(详见本文第二部分)。并且,它与当代认知语言学和认知人类学以及认知神经科学等一起,共同构成第二代认知科学的完整图景。
1.4第一代认知科学的根本缺陷:从“加工即计算”到“离身心智论”
第一代认知科学当然功不可没。认知可计算性曾经铸就了它的辉煌,迎来了长达数十年的主流认知心理学的蓬勃发展。心理的“符号及其表征”的思想,已成为几代心理学家开展信息加工过程研究的工作语言。实际上,当代绝大多数的认知心理学家如今仍浸淫其中。“符号及其表征”成为这一学术共同体皈依的圭臬。
第一代认知科学家如果只在“符号及其表征”的范围内自弹自唱自得其乐,只要不进一步作“心理类同于计算机”的刚性比喻从而种下“心理可以物理化”的种子倒也无妨。但如果把这种“可以”的立场再向前推进,主张“可以并应当(关键在‘应当’——引者注)建立心理过程的计算模型(计算机程序)”[6],那么这无疑是心理学家的自套枷锁了!
这种“可以并应当”的强要求将会导致严重后果。因为,如果把心理理解为加工程序,其逻辑后承就是计算机也有与人一样的心理,甚至意识。说到底,第一代认知科学信奉的是心智的“硬件无关说”或“离身心智论”。由于决定心智的只是程序,于是离身的心智表现在人脑上,就是人的智能;表现在电脑上,就是人工智能。在第一代认知科学家眼中或在他们企望实现的最终目标中,人工智能是等同于人的智能或人工智能是能完全模拟人的智能的。换言之,人工智能和人的智能只是具有相同智能的两个物种而已。某些心理学家可能辩解说他们并未采取这种极端的立场,但只要坚持上述“可以并应当”的主张,那么这种结论的导出则是必然的。第一代认知科学的最大成功和最大失误均在于对符号表征及其计算的假设过于依赖,以致于把“人的智能”与“人工智能”完全等同起来,模糊了心与物的界限。
概言之,在第一代认知科学看来,基于计算隐喻,心智被认为是按某种程序(算法)对符号进行的操作(计算)。计算要遵循某种算法(algorithm),用精确语言写成的算法就是程序。第一代认知科学的任务就是去为各种心智活动构建各种算法和程序——如果能够顺利实现的话[7]。模型则是程序的最粗略的框架。要使你所构建的心理模型能在计算机上实现,把它计算机程序化是不可免却的步骤。
1.5第一代认知科学的“难以用武”之地
以人工智能完全模拟人的智能首先将遇到的难题是环境与背景知识的形式化。计算主义的成功或许可以使我们能去模拟人类信息加工的某种简略过程,得到某种信息加工的一般规律。如此,则不失为一种坦白。但计算主义以及在此基础上形成的人工智能却永远不能复制特定主体的具体心理过程,因为后者必然涉及此时心智活动的大量环境和背景知识,甚至与更宏大的社会文化环境和背景相联系。它们的多样性和特殊性几乎是无穷尽的,并且其中绝大部分是不能先行符号化然后再通过推理(计算)获得的。我们无法为它们提供形式化的理论,也无法为它们的变化找到确切的变换规则(程序)。
有些逻辑主义者(如P.J.H ayes,R.Schank, D.McDemot, R.Reiter等人)曾做过且迄今仍不放弃如下的努力:他们企图“通过借助经典和非经典的演绎推理的形式实现对整个知识的把握”[8],即为日常生活的非形式知识提供形式化理论,通过恰当的编程来表达和处理这些知识。他们的最高愿望是通过建立这样一种所谓的“极小常识系统”或“微型世界”,然后演绎出整个知识体系。但逻辑主义者无法跳出计算主义的窠臼,因为关键在于所谓“基于文化环境的对真实世界的大量背景知识”是个外延和内涵均不确定的集合[8]。哪怕一个极细小的问题,它也可能涉及到大量的背景知识,因而将不可避免地会遇到“指数组合爆炸”问题,即使人工神经网络也难以摆脱这一困境[9]。(下面在关于“计算复杂性”一节还将进一步分析这一问题)。哪怕把问题局限于求解某个小范围的专家系统,其背景知识中的大部分也不是基于逻辑推理(计算)获得的。专家之所以为专家而不是一架精良的机器,原因盖出于此。
早在上世纪70年代,德雷福斯(H ubert Dreyfus)在《计算机不能做什么》一书的再版序言中就指出,人工智能研究者所说的常识知识问题其实并不仅是一个如何表征知识的问题,还涉及到“知道如何做的问题”以及兴趣、感觉、动机等主体经验成分。要求计算机将后者转换成知识并作为巨大复杂的信念系统以符号表征出来,他认为是无望的。他的兄弟S.德雷福斯(Stuart Dreyfus)在进一步对个体技能获得的阶段特征加以分析后指出:技能获得在开始时通常会学习和应用抽象的规则,但在技能学习的高级阶段,这些规则所起的作用越来越小,越来越表现为以具体情境为基础的直觉判断,而后者是无法进行形式化处理的。