具身认知
📝 具身认知(Embodied Cognition)是对认知科学"计算主义"正统范式的最有力挑战之一。传统认知科学将身体视为心智的"外壳"——感觉器官负责输入,运动器官负责输出,真正的"认知"发生在大脑这台计算机内部。具身认知彻底颠覆了这个图景:认知不是发生在大脑里的抽象符号操作——身体、行动和环境是认知过程的内在组成部分。
哲学基础:Merleau-Ponty 的身体现象学
具身认知的哲学根源可以追溯到法国现象学家 Maurice Merleau-Ponty(莫里斯·梅洛-庞蒂,1908-1961)。在其主要著作《知觉现象学》(Phénoménologie de la perception, 1945)中,Merleau-Ponty 对笛卡尔式的心身二元论发起了系统性的批判。
Descartes(笛卡尔)将世界分为两种截然不同的实体:心灵(res cogitans, 思维之物)和身体(res extensa, 广延之物)。心灵是非物质的、不占据空间的、进行思维的实体;身体是物质的、占据空间的、遵循物理定律的实体。认知(思维、判断、推理)完全属于心灵——身体只是心灵用来与外部世界互动的工具。传统认知科学虽然抛弃了非物质心灵的概念(用大脑取代了灵魂),但保留了笛卡尔的基本框架:认知 = 脑内计算,身体 = 输入/输出装置。
Merleau-Ponty 的核心论点是:身体不是心灵的工具,身体本身就是认知的主体。他引入了身体图式(body schema / schéma corporel)的概念:人通过一种前反思的、非表征性的方式"知道"自己的身体在空间中的位置和可能的动作——这种知识不是大脑中的"表征",而是身体本身的一种"智慧"。一个经验丰富的打字员不需要"思考"每个手指的位置——她的手指"知道"键盘。一个技艺高超的网球运动员不需要"计算"球的轨迹和击球角度——他的身体直接"回应"球的运动。
Merleau-Ponty 用幻肢(phantom limb)现象来说明身体图式的独特地位。截肢后的患者经常报告仍然能"感觉到"失去的肢体——不仅是疼痛,还有位置感和运动感。这不能被简单地解释为"大脑中的错误表征"——它揭示了身体图式是一种不能被还原为脑状态的存在方式。身体图式不是大脑对身体的"模型"——它是身体本身的存在模式。
Merleau-Ponty 还通过分析工具使用来阐明身体与认知的关系。当一个盲人使用手杖行走时,手杖不是一个外部对象——它被整合进了盲人的身体图式中,成为身体的"延伸"。盲人不是"用手感知手杖然后推断地面的状况"——他通过手杖直接"触摸"地面,正如正常人通过手指直接"触摸"物体而非通过皮肤上的压力传感器推断物体的存在。这个分析预示了几十年后 Clark 和 Chalmers 的"延展心智"论题。
Lakoff 和 Johnson:概念隐喻理论
George Lakoff(乔治·莱考夫,1941-)和 Mark Johnson(马克·约翰逊,1949-)在《我们赖以生存的隐喻》(Metaphors We Live By, 1980)中提出了一个革命性的主张:隐喻不是语言的修辞装饰,而是人类思维的基本认知机制——抽象概念在根本上是通过身体经验的隐喻来理解的。
Lakoff 和 Johnson 提出了概念隐喻(conceptual metaphor)的理论。概念隐喻是一种系统性的跨域映射——用一个具体的、基于身体经验的源域(source domain)来理解一个抽象的目标域(target domain)。几个核心的例子可以说明这种映射的系统性。
“争论是战争”(ARGUMENT IS WAR):这个概念隐喻塑造了人们谈论和思考争论的整个方式——“攻击对方的论点"“捍卫自己的立场"“摧毁对方的论证"“赢得辩论”。这些不是随意的修辞——它们反映了一个系统性的认知结构:争论被理解为一种战斗,其中有攻击方和防御方、策略和武器、胜利和失败。但想象一下一种文化,在这种文化中"争论是舞蹈”——争论的参与者不是对手而是舞伴,目标不是战胜对方而是共同创造一种美丽的思想运动。在这样的文化中,关于争论的思维方式和实践将会完全不同。
“时间是运动的物体”/“时间是我们穿越的空间”(TIME IS A MOVING OBJECT / TIME IS SPACE WE MOVE THROUGH):时间——一个高度抽象的概念——被系统地通过空间和运动的经验来理解。“时间飞逝”(time flies)——时间是一个运动的物体,飞过观察者身边。“面对未来”(face the future)——时间是一条道路,人面朝前方(未来)行走。不同语言中的时间隐喻存在显著差异:普通话中的时间隐喻常常使用上/下维度(“上个月"“下周”),而英语使用前/后维度(“the week ahead"“looking back”)。Lera Boroditsky(莱拉·博罗迪茨基,1976-)的实验研究表明,这些隐喻差异不仅是语言差异——它们影响了说话者对时间关系的实际认知加工。
“理解是抓住”/“知道是看见”(UNDERSTANDING IS GRASPING / KNOWING IS SEEING):这些隐喻揭示了抽象认知概念与身体动作之间的深层联系。“抓住要点”(grasp the point)、“触及问题核心”(get in touch with the issue)——理解被概念化为一种物理上的抓取。“看清形势”(see the situation clearly)、“观点”(point of view)、“洞见”(insight)——知识被概念化为视觉经验。这些隐喻不是任意的——它们反映了人类认知从身体经验向抽象思维延伸的基本路径。
Lakoff 和 Johnson 的理论对传统认知科学的挑战是根本性的:如果抽象思维在根本上依赖于身体经验的隐喻结构,那么没有身体的系统(如传统的 AI 或纯文本处理的语言模型)能否真正"理解"抽象概念?一个从未有过"抓取"经验的系统能否真正"抓住"一个想法的含义?
具身认知的实验证据
具身认知不仅是一套哲学主张——它得到了大量实验研究的支持。
身体状态影响认知判断
John Bargh(约翰·巴奇,1955-)和同事在2008年发表了一项著名的实验。被试被要求短暂地握住一杯咖啡(有些人握热咖啡,有些人握冰咖啡),然后阅读一段关于某个虚构人物的描述并评价该人物的性格。结果:握热咖啡的被试更倾向于将目标人物评价为"温暖的”(warm),而握冰咖啡的被试更倾向于评价为"冷淡的”(cold)。身体上的温度体验直接影响了对他人性格的社会判断——“温暖"不仅是一个身体感觉,也是一个社会评价概念,两者通过身体经验被联结在一起。
需要指出的是,这项研究属于社会心理学中的"启动效应”(priming effect)研究,其可重复性在"重复性危机”(replication crisis)中受到了质疑。Chabris 等人(2019)的大规模重复实验未能复制 Bargh 的原始结果。这并不意味着身体状态对认知完全没有影响,但提醒研究者对具体的效应量和边界条件保持审慎。
Strack 的面部反馈实验
Fritz Strack(弗里茨·斯特拉克)和同事在1988年进行了经典的面部反馈假说(facial feedback hypothesis)实验。被试被要求用嘴咬住一支笔——这迫使面部肌肉做出类似微笑的动作——然后评价漫画的有趣程度。与用嘴唇夹住笔(抑制微笑动作)的对照组相比,咬笔组的被试报告漫画更有趣。这个结果支持了具身认知的核心主张:不仅情感导致身体表达(开心→微笑),身体表达也反过来影响情感体验(微笑→感到更开心)。认知和身体是双向影响的,而非单向的脑→身体通路。
同样需要注意的是,Strack 本人参与的一项2016年大规模重复研究(涉及17个实验室)未能复制原始效应。这引发了关于面部反馈效应是否存在、在什么条件下存在的持续争论。后续的元分析(meta-analysis)表明,面部反馈效应可能确实存在,但效应量比原始研究显示的要小得多。
运动与抽象思维
Thomas Wilson 和 Diane Pecher 等人的研究表明,思考涉及特定方向的概念时,身体倾向于做出相应方向的动作。例如,思考"积极"或"权力"等概念时,被试的身体倾向于向上的姿态;思考"消极"或"服从"等概念时,倾向于向下的姿态。更有趣的是,这种效应是双向的——被要求做出向上的动作(如将一个物体从低处移到高处)的被试,更快地处理积极概念;做出向下动作的被试,更快地处理消极概念。这支持了"好是上,坏是下”(GOOD IS UP, BAD IS DOWN)这一概念隐喻有实际的认知效应。
延展心智论题
Andy Clark(安迪·克拉克,1957-)和 David Chalmers(大卫·查默斯,1966-)在1998年的论文《延展心智》(“The Extended Mind”)中提出了具身认知阵营中最激进的主张:认知过程不局限于头颅之内——外部工具和环境可以成为认知系统的组成部分。
Clark 和 Chalmers 用一个思想实验来阐明这个论题。想象两个人,Inga 和 Otto。Inga 想去现代艺术博物馆——她回忆了一下,想起博物馆在53街,然后前往。Otto 患有轻度阿尔茨海默症,他依赖一个笔记本来补偿记忆缺陷——他翻开笔记本,查到博物馆在53街,然后前往。Clark 和 Chalmers 论证:Inga 脑中的记忆和 Otto 笔记本中的记录在功能上是完全等价的——都存储了"博物馆在53街"这个信息,都在需要时被检索并指导行为。如果 Inga 脑中的记忆算是她"信念"的一部分,那么 Otto 笔记本中的信息也应该算是他"信念"的一部分——心智延展到了头颅之外。
这个论题被称为认知等价原则(Parity Principle):如果一个过程在外部世界中的运作方式与它在头颅内部运作时被认定为"认知过程"的方式相同,那么就应该把它视为认知过程——不管它发生在哪里。
延展心智论题在哲学界引发了激烈争论。Fred Adams(弗雷德·亚当斯)和 Kenneth Aizawa(肯尼斯·相�的)在2001年的论文中提出了耦合-构成谬误(coupling-constitution fallacy)的批评:仅仅因为一个外部过程与认知过程耦合(因果性地关联),不意味着它构成(是…的一部分)认知过程。Otto 的笔记本因果性地影响了他的行为——但这不等于说笔记本是他心智的一部分,正如一个人的视力因果性地依赖于眼镜,但眼镜不是视觉系统的一部分。
Clark 回应说,区分"耦合"和"构成"正是需要论证的问题——不能预设认知只能发生在脑内然后以此为前提来反驳延展心智。在智能手机时代,延展心智论题获得了新的紧迫性——人们将越来越多的认知功能"外包"给手机(记忆、导航、计算、甚至社交判断),手机是否已经成为人类认知系统的一部分?
具身 AI 与机器人认知
具身认知对人工智能研究产生了深远影响,催生了具身AI(Embodied AI)这一研究方向。
Rodney Brooks(罗德尼·布鲁克斯,1954-)在1990年代提出了行为主义机器人学(behavior-based robotics)的纲领,直接挑战了 GOFAI 的方法。Brooks 的核心主张是:智能不需要表征——一个与环境直接交互的简单行为系统可以展现出看似"智能"的复杂行为。他的昆虫机器人(如六足行走机器人 Genghis)没有世界的内部模型——它们通过简单的感知-动作回路(如"碰到障碍物→转向")与环境实时交互,涌现出复杂的适应性行为。Brooks 著名的口号是:“世界是自身最好的模型”(The world is its own best model)——为什么要费力地在内部建构一个世界模型,当世界本身就在那里可以被直接感知?
当代的具身 AI 研究则试图将具身认知的洞见与深度学习的力量结合起来。Google DeepMind 的机器人研究、Tesla 的 Optimus 人形机器人等项目都体现了一个核心理念:真正的通用智能可能需要身体与环境的交互——纯粹基于文本和图像的训练可能不足以产生对物理世界的深层理解。
对具身认知的批评与回应
具身认知面临几个重要的批评。
第一,效应的可重复性问题。如前所述,具身认知的一些标志性实验(如 Bargh 的热咖啡实验、Strack 的笔实验)在大规模重复研究中未能被稳健地复制。批评者认为,具身认知的经验基础可能比其倡导者声称的更脆弱。支持者的回应是:重复失败可能反映的是效应对上下文条件的敏感性(即效应是真实的但受到许多调节变量的影响),而非效应不存在。
第二,概念的模糊性。“具身"这个概念被不同的研究者以非常不同的方式使用——从相对温和的主张(“身体状态影响认知过程”——这几乎无人否认)到极端激进的主张(“不存在脱离身体的认知表征”——这与大量认知科学发现相矛盾)。缺乏一个统一的、可检验的理论框架是具身认知运动的主要弱点。
第三,抽象思维的挑战。即使承认许多日常认知深深植根于身体经验,人类也有能力进行高度抽象的思维——数学证明、逻辑推理、形而上学思辨。这些思维活动似乎超越了身体经验的隐喻结构。Lakoff 和 Johnson 会论证连数学概念也有身体基础(如"数轴"是空间隐喻),但批评者认为这种分析过度延伸了隐喻理论的解释范围。
💭 延伸思考
- 如果概念隐喻塑造了思维,不同语言中不同的隐喻体系(如用"上/下"vs"前/后"来表达时间)是否导致了不同的思维方式?这与 Sapir-Whorf 假说(语言相对论)有何关系?强版本(语言决定思维)几乎没有支持者,但弱版本(语言影响思维)得到了越来越多的实验支持。
- 在日益数字化的世界中,人类越来越多地通过屏幕而非身体与环境互动。如果具身认知是正确的——如果身体经验是认知的基础——那么这种"去身体化"的生活方式是否会对人类的认知能力和方式产生深层影响?