跳至内容

认知科学是什么

📝 认知科学(Cognitive Science)诞生于1950年代的"认知革命"——当行为主义心理学拒绝研究心灵内部运作时,来自哲学、心理学、语言学、计算机科学、神经科学和人类学的研究者联合起来,把"心智"(mind)重新带回了科学的中心舞台。认知科学不是一门单一的学科,而是一个围绕心智本质这一共同问题的跨学科联盟。

认知革命的历史背景

理解认知科学,需要先理解它所反抗的对象。20世纪上半叶,心理学的主流范式是行为主义(behaviorism)。John B. Watson(约翰·华生,1878-1958)在1913年的宣言式论文《行为主义者眼中的心理学》中主张:心理学应该成为一门纯粹的行为科学——只研究可观察的刺激(stimulus)和反应(response),不研究任何"心理"过程,因为心理过程不可观察、不可测量、不能成为科学的对象。B.F. Skinner(伯拉斯·弗雷德里克·斯金纳,1904-1990)将这一纲领推向极致,在《言语行为》(Verbal Behavior, 1957)中试图将人类语言完全解释为操作性条件反射(operant conditioning)的产物——语言行为与按压杠杆获取食物的老鼠在原理上没有本质区别。

行为主义在1950年代遭遇了来自多个方向的同时打击,这些事件共同构成了所谓的**“认知革命”**(Cognitive Revolution)。

Noam Chomsky(诺姆·乔姆斯基,1928-)在1959年发表了对 Skinner《言语行为》的毁灭性书评,这篇书评被广泛认为是认知革命的标志性文本之一。Chomsky 的核心论证是:语言能力不可能仅靠强化学习来解释。第一,刺激的贫乏(poverty of the stimulus):儿童在语言发展过程中接触到的语言材料是有限的、碎片化的、充满错误的,但他们却能够产生和理解无限数量的从未听过的新句子。第二,语言的创造性(creativity of language):正常的语言使用不是对之前听到的句子的模仿和重复,而是不断地创造新的句子——一个五岁的孩子说出的大多数句子都是这个孩子之前从未听过的。第三,语法规则的抽象性:语法规则不能被描述为"刺激-反应"链条——“John is eager to please"和"John is easy to please"的表面结构相同,但深层语法关系完全不同(前者中 John 是 please 的主语,后者中 John 是 please 的宾语)。Chomsky 的结论是:语言能力需要一种内在的、先天的语法知识——这直接引入了行为主义试图排除的"心理结构"概念。

George Miller(乔治·米勒,1920-2012)在1956年发表了著名的论文《神奇数字7±2》,证明人类的工作记忆(short-term memory / working memory)存在容量限制——大约能同时处理7(加减2)个"组块”(chunks)的信息。这个发现的重要性在于:它表明人类的认知系统具有可以被科学研究的内部结构——不仅仅是"刺激进来、反应出去"。Miller 后来回忆说,1956年9月11日在麻省理工学院举行的信息理论研讨会,是他意识到"认知革命正在发生"的时刻——那次会议上同时出现了关于语言学(Chomsky)、人工智能(Newell & Simon)和认知心理学(Miller 本人和 Bruner)的突破性报告。

Allen Newell(艾伦·纽厄尔,1927-1992)和 Herbert Simon(赫伯特·西蒙,1916-2001)在1956年创建了逻辑理论家(Logic Theorist)——第一个能够自动证明数学定理的计算机程序,随后又开发了通用问题求解器(General Problem Solver, GPS)。这些程序的重要性不仅在于技术成就,更在于其理论含义:如果一台机器可以通过操作符号来"推理"和"解决问题",那么也许人类的心智也是一种符号操作系统——心智就是计算(mind is computation)。这个计算隐喻(computational metaphor)——心智如同软件,大脑如同硬件——成为了认知科学的主导范式,深刻地塑造了此后数十年的研究方向。

六大支柱学科的详细展开

认知科学的独特之处在于它的跨学科性——六个学科从各自的角度研究同一个对象(心智),相互补充又相互制约。

认知心理学

认知心理学是认知科学的经验核心——它通过精心设计的实验来揭示人类认知过程的内部机制。研究的对象包括:知觉(perception)——大脑如何将感官信息组织成对外部世界的有意义表征;注意力(attention)——认知系统如何在海量信息中选择性地处理某些信息而忽略其他;记忆(memory)——信息如何被编码、储存和提取,包括工作记忆、长期记忆、情景记忆和语义记忆的区分;决策(decision-making)——人如何在不确定条件下做出选择。Daniel Kahneman(丹尼尔·卡尼曼,1934-2024)和 Amos Tversky(阿莫斯·特沃斯基,1937-1996)关于认知偏差和启发式的研究表明,人类的认知系统不是一台理性的计算机,而是一个充满"快捷方式"和系统性偏差的系统——这一发现对经济学、法学和公共政策产生了深远影响。

哲学(心智哲学)

哲学在认知科学中扮演的角色是概念分析和基础审查——追问认知科学的基本概念(如"表征"“计算"“理解"“意识”)究竟意味着什么,以及这些概念是否经得起严格的分析。心智哲学的核心问题包括:心身问题——心理状态与物理状态之间的关系是什么?意向性(intentionality)——心理状态如何能够"关于"或"指向"外部世界中的事物?意识——为什么物质过程会伴随主观体验?他心问题——如何知道其他存在者(人或机器)是否有心智?这些问题不仅是哲学家的抽象思辨——它们直接影响认知科学的研究设计和理论解释。例如,如果"理解"不能被还原为信息处理(Searle 的中文房间论证试图表明这一点),那么认知科学用计算模型来解释"理解"就面临原则性的困难。

语言学

Chomsky 的转换生成语法(Transformational-Generative Grammar)将语言学从对语言现象的描述提升为对心智结构的探索。Chomsky 的核心洞见是:语言能力(competence)不是一组习得的行为模式,而是一个内在的、先天的语法知识系统——普遍语法(Universal Grammar, UG)。不同语言的表面差异巨大,但其深层结构遵循共同的原则。儿童之所以能够在有限的语言输入基础上如此迅速地习得语言,是因为他们天生具备这个语法框架——语言习得不是"白纸上画画”,而是用环境中的语言数据来"设定"先天语法框架的参数。

认知语言学则从另一个角度探索语言与心智的关系——George Lakoff(乔治·莱考夫,1941-)和 Mark Johnson(马克·约翰逊,1949-)论证抽象思维深深植根于身体经验的隐喻结构,挑战了语言是纯粹抽象符号操作的观点。

神经科学

神经科学为认知科学提供了物质基础——认知过程最终是在大脑中实现的,理解大脑的结构和功能是理解心智的必要条件。从早期的损伤研究(如 Broca 发现左额叶损伤导致语言产生障碍、Wernicke 发现左颞叶损伤导致语言理解障碍),到当代的功能性磁共振成像(fMRI)和脑电图(EEG)技术,神经科学越来越精确地描绘了认知功能的脑机制。

但神经科学与认知科学之间存在一个根本的张力:**理解大脑是否等于理解心智?**一些研究者(如 Patricia Churchland)持"消除性唯物主义”(eliminative materialism)立场,认为成熟的神经科学最终将取代心理学概念——“信念"“欲望"“意识"等概念将像"燃素"一样被科学淘汰。另一些研究者则认为,心理层面的描述具有不可还原的解释力——即使完全理解了一个神经元网络的活动,仍然需要心理层面的概念来说明这个网络在"做什么”(如"识别面孔"或"规划路线”)。

人工智能

人工智能在认知科学中的角色是双重的。一方面,AI 是认知理论的检验工具——如果一种关于认知过程的理论可以被实现为计算机程序并产生类似人类的行为,这就增强了该理论的可信度。另一方面,AI 的成功和失败本身就是关于心智本质的重要证据。早期的符号 AI(GOFAI, Good Old-Fashioned AI)在逻辑推理和博弈方面取得了成功,但在模式识别和常识推理方面遭遇了瓶颈——这被解释为符号处理方式对心智的捕捉是不完整的。联结主义(神经网络)和当代深度学习在模式识别方面的巨大成功则引发了新问题:这些系统在"做认知"还是在做一种完全不同的东西?

人类学

文化人类学为认知科学提供了一个经常被忽视但至关重要的维度:认知的文化差异。认知科学的许多发现基于西方(通常是美国大学生)被试的实验——但这些发现在多大程度上是普遍的?Richard Nisbett(理查德·尼斯贝特,1941-)的研究表明,东亚文化和西方文化中的人在基本的认知模式上存在系统性差异——东亚人倾向于关系性整体性思维(关注物体与背景的关系),西方人倾向于分析性类别性思维(关注物体本身的属性)。这些差异不是"谁更聪明"的问题,而是不同文化环境培养了不同的认知策略。

计算隐喻的力量与局限

计算隐喻——心智是一种信息处理系统——是认知科学最成功也最受争议的核心假设。

计算隐喻的力量在于:它为心智研究提供了一套精确的、可形式化的分析工具。在行为主义时代,“思维"是一个模糊的概念,无法被科学地研究。计算隐喻将"思维"重新定义为"信息处理”——输入(感觉数据)、处理(认知操作)、输出(行为)——使其成为可以被建模、模拟和实验验证的对象。认知心理学的大量发现(如工作记忆的容量限制、注意力的过滤机制、决策中的启发式)都是在计算隐喻的框架内取得的。

计算隐喻的局限同样明显。第一,情感和动机的边缘化:计算隐喻将心智建模为一个冷冰冰的信息处理系统,而情感、动机、欲望——这些在人类心智中起核心作用的因素——被处理为"干扰"或"附加模块”,而非认知的内在组成部分。Antonio Damasio(安东尼奥·达马西奥,1944-)的研究表明,情感不是理性的对立面,而是理性决策的必要条件——情感处理受损的患者(如腹内侧前额叶受损)在做简单的日常决策时陷入瘫痪,尽管他们的逻辑推理能力完好。

第二,身体和环境的忽视:计算隐喻将认知局限于"头颅之内"——但越来越多的证据表明,认知过程深深地依赖于身体状态和环境结构。这一批评催生了"具身认知"(embodied cognition)和"延展心智"(extended mind)等替代范式。

第三,意识的遗漏:计算隐喻解释了信息处理,但完全回避了一个根本问题——为什么某些信息处理过程伴随着主观体验?一台计算机可以处理信息但(据所知)没有体验——如果心智只是计算,意识从何而来?

联结主义的挑战

1980年代兴起的联结主义(connectionism)对经典计算主义提出了来自认知科学内部的挑战。David Rumelhart(大卫·鲁梅尔哈特,1942-2011)和 James McClelland(詹姆斯·麦克利兰,1948-)在1986年出版的《并行分布式处理》(Parallel Distributed Processing, PDP)是联结主义的奠基之作。

联结主义的核心主张是:认知不是按照规则操作符号(如经典计算主义所说),而是大量简单处理单元之间的并行分布式处理——更接近大脑神经网络的运作方式而非计算机程序的运行方式。经典计算主义处理的是离散的符号(如"猫"“在"“垫子上”),联结主义处理的是分布在整个网络中的激活模式——没有一个单独的单元代表"猫”,“猫"的概念是整个网络的一个特定激活模式。

联结主义在解释某些认知现象时表现出经典计算主义所缺乏的优势:容错性(graceful degradation)——部分网络损坏不会导致功能完全丧失(类似于大脑损伤后的部分功能保留);模式识别——识别手写体、面孔等"模糊"的模式;学习——通过调整连接权重来从经验中学习,而非需要预先编程。

Jerry Fodor(杰里·福多,1935-2017)和 Zenon Pylyshyn(泽农·皮利希恩,1937-2022)在1988年的著名论文中对联结主义发起了反击,论证联结主义无法解释思维的系统性(systematicity)和组合性(compositionality):一个能理解"John loves Mary"的系统必然也能理解"Mary loves John”——这种系统性需要符号式的组合结构来解释。这场"符号主义vs联结主义"的争论塑造了认知科学此后数十年的理论地貌,至今尚未完全解决。

认知科学的核心问题

认知科学围绕几个根本性的问题展开研究,这些问题相互关联但各有侧重。

表征问题:心智如何表征(represent)外部世界?经典计算主义说通过离散的符号;联结主义说通过分布式的激活模式;具身认知说通过身体与环境的交互。这个问题不仅是技术性的——它关系到"心智与世界的关系"这个哲学的核心问题。

计算问题:心智做什么样的"计算"?是规则应用(如逻辑推理)?是模式匹配(如面孔识别)?是概率推断(如贝叶斯推理)?还是所有这些的某种组合?不同的认知任务可能涉及不同类型的计算。

意识问题:为什么信息处理会伴随主观体验?这被 David Chalmers 称为意识的"困难问题"——它可能超出了当前认知科学范式的解释能力。

学习问题:心智如何从经验中获取新知识?先天因素(如 Chomsky 的普遍语法)和后天学习(如联结主义的权重调整)各自在多大程度上贡献于认知能力的发展?

语言问题:语言能力是一个独立的认知模块(如 Chomsky 所主张)还是一般认知能力的一部分?语言是否塑造了思维(语言相对论 / Sapir-Whorf 假说)?

💭 延伸思考

  • 大语言模型(Large Language Models, LLM)如 GPT 系列在语言任务上的表现已经令人印象深刻——但它们是在"做认知科学所说的认知"吗?它们没有身体(违背具身认知)、没有意识体验(意识问题)、不操作离散符号也不像人类那样学习(挑战经典计算主义和联结主义的简单版本)。LLM 的成功是否意味着认知科学需要一种全新的理论框架?
  • 认知科学的六大支柱是否遗漏了某些重要的视角?例如,社会学和政治学对"认知如何被权力结构和社会制度塑造"的研究,是否应该被纳入认知科学的版图?