语言学是什么
📝 语言学 (linguistics) 并非"学习外语"的技艺,而是以科学方法研究人类语言本身的学科。语言学追问的问题包括:语言的内部结构遵循什么规则?儿童为何能在短短几年内掌握母语的复杂语法?语言如何随时间演变?语言与思维、社会权力之间存在怎样的互动关系?从 Ferdinand de Saussure 到 Noam Chomsky,语言学在一个多世纪里经历了多次范式革命,至今仍是认知科学、人工智能和社会研究的核心交叉地带。
语言学的学科界定
语言学的研究对象是"语言"(language),但"语言"本身的含义并不自明。日常用法中的"语言"可以指具体的某种语言(英语、法语、日语),也可以指人类区别于其他物种的抽象语言能力。语言学关注的核心问题是后者——人类语言能力的本质、结构和功能。
语言学与外语学习的关系类似于物理学与工程学的关系:前者研究基本原理,后者关注应用实践。一位语言学家未必能流利地说五种语言,正如一位声学专家未必是优秀的音乐家。语言学的目标是描述和解释语言现象,而非教授语言技能。
语言学还区分于文学研究和修辞学。文学批评关注语言的美学功能,修辞学关注语言的说服功能,而语言学关注语言的结构与认知基础。三者存在交叉,但学科旨趣不同。
Saussure 的结构主义奠基:langue 与 parole
现代语言学的起点通常被定位于 Ferdinand de Saussure(索绪尔,1857-1913)。Saussure 在日内瓦大学的讲稿经学生整理后于 1916 年出版为《普通语言学教程》(Cours de linguistique générale),这部著作奠定了 20 世纪语言学的基本范式。
Saussure 提出了几对关键对立概念,其中最具影响力的是 langue(语言系统)与 parole(言语行为) 的区分:
| 概念 | 含义 | 类比 |
|---|---|---|
| Langue | 一个语言社区共享的抽象语言系统——语法规则、词汇库、语音规则的总和 | 类似棋类的规则体系 |
| Parole | 个体在具体情境中的实际言语行为——特定的话语、口误、即兴表达 | 类似具体的每盘棋局 |
Saussure 主张语言学应当研究 langue 而非 parole。语言系统是社会性的、稳定的、可系统描述的;言语行为则是个体性的、偶然的、无穷变化的。这一区分为语言学提供了明确的研究对象。
Saussure 的另一核心主张是语言符号的任意性 (arbitrariness of the sign)。语言符号由"能指"(signifier,语音形象) 和"所指"(signified,概念) 组成,两者之间没有自然的联系——“tree"这个声音与树这种植物之间不存在内在的必然关系。不同语言用完全不同的声音指称同一事物(英语 tree、法语 arbre、日语 ki),证明了这种任意性。
案例:Saussure 的"棋局类比”。 Saussure 将语言比作国际象棋:棋子的物质属性(木制还是象牙制)无关紧要,重要的是棋子在规则系统中的位置和关系。同理,语言单位的意义不取决于声音的物理特性,而取决于它在整个语言系统中与其他单位的差异关系。“bat"之所以有意义,不是因为 /b/ 这个声音有什么内在含义,而是因为它与 “cat"“hat"“bit"“but” 等词构成了系统性的对比。这种"关系决定意义"的思想后来深刻影响了整个结构主义思潮。
Chomsky 的认知革命:普遍语法与先天论
1957 年,Noam Chomsky(乔姆斯基,1928-)发表《句法结构》(Syntactic Structures),引发了语言学史上最深刻的范式转换——从结构主义描写转向生成语法 (generative grammar) 的认知取向。
Chomsky 的核心主张可以概括为三个论题:
第一,语言能力是天生的。 人类大脑内置了一套"普遍语法”(Universal Grammar, UG)——所有人类语言共享的深层结构原则。具体语言的语法是普遍语法经"参数设定”(parameter setting) 后的特殊实例。正如所有人类都有两条腿但走路姿态各异,所有人类语言都遵循 UG 但表面形式不同。
第二,刺激贫乏论证 (poverty of the stimulus)。 儿童接收到的语言输入充满错误、不完整和片段化,但几乎所有正常儿童都能在 4-5 岁前掌握母语的核心语法。这种"输入贫乏但输出丰富"的现象表明,语言习得不能仅靠外部输入和一般学习机制来解释——必须假设大脑预装了语言专属的认知结构。
第三,语言是独立的认知模块。 语言能力不是一般智力的副产品,而是一个独立的、专门化的认知系统。证据之一来自"双重分离”(double dissociation) 现象:某些患者智力正常但语言严重受损(如特定语言障碍 SLI),另一些患者智力极低但语言流畅(如 Williams 综合征)。
案例:“刺激贫乏"的经典证据。 儿童在习得语言的过程中会产生从未从成人那里听到的规则性错误——例如英语儿童说 “goed” 而非 “went”,“mouses” 而非 “mice”。这类"过度规则化”(overregularization) 错误证明儿童并非简单模仿成人语言,而是在积极地推断和应用语法规则。如果语言习得纯粹依赖模仿,就不应该出现这种系统性的创造性错误。
案例:尼加拉瓜手语的自然发生。 1980 年代,尼加拉瓜的聋人儿童被集中在特殊学校中。这些儿童此前没有接触过任何正式手语,但在互相交流的过程中自发地创造了一套完整的手语系统——尼加拉瓜手语 (ISN),具备完整的语法结构。这一案例被 Chomsky 的支持者视为普遍语法存在的有力证据:即使没有外部语言模型,人类的语言本能仍然驱动着语法系统的创造。
围绕 Chomsky 的学术争论
Chomsky 的理论在语言学界引发了持续至今的激烈争论。
支持一方认为:普遍语法是解释语言习得速度和跨语言共性的最佳理论。全球数千种语言虽然表面差异巨大,但在深层结构上呈现出惊人的共性(如所有语言都区分名词和动词,都有递归结构),这些共性指向某种先天的语言蓝图。
反对一方的批评来自多个方向。功能主义语言学家(如 Michael Tomasello)认为,语言习得可以通过更一般的认知机制——模式识别、统计学习、社会互动——来解释,不需要假设专门的"语言器官”。认知语言学家(如 George Lakoff)强调语言与身体经验和一般认知能力的深层关联,反对语言模块的独立性。类型学家(如 Nicholas Evans 和 Stephen Levinson)在 2009 年的论文中挑战了"语言普遍性"的实证基础,指出所谓的语言共性被夸大了——语言之间的差异远比 Chomsky 阵营承认的更大。
当代争论的新维度:大语言模型。 GPT 系列等大语言模型 (LLM) 仅通过统计学习就展现出了惊人的语法能力,没有任何"先天语法"。这是否构成对普遍语法论证的反驳?支持者反驳说,LLM 的训练数据量远超任何儿童接收的输入量,且 LLM 缺乏真正的语言"理解"。但批评者指出,LLM 至少证明了"仅凭统计学习就能产生语法行为"是可能的。
语言学的主要分支
语言学包含多个相互关联的子领域,每个分支关注语言的不同层面:
| 分支 | 研究对象 | 核心问题 |
|---|---|---|
| 语音学 (phonetics) | 语言声音的物理特性 | 声音如何产生、传播、感知? |
| 音韵学 (phonology) | 语音在语言系统中的功能 | 哪些声音差异在特定语言中区分意义? |
| 形态学 (morphology) | 词的内部结构 | 词由什么单位组成?如何构词? |
| 句法学 (syntax) | 句子的结构规则 | 词如何组合成合法的句子? |
| 语义学 (semantics) | 语言表达的意义 | 词和句子的意义如何确定? |
| 语用学 (pragmatics) | 语境中的语言使用 | 同一句话在不同语境中为何有不同含义? |
| 社会语言学 (sociolinguistics) | 语言与社会的关系 | 语言变异如何与社会结构关联? |
| 历史语言学 (historical linguistics) | 语言的历时变化 | 语言如何演变?语言间的亲缘关系如何确定? |
| 心理语言学 (psycholinguistics) | 语言的认知加工 | 大脑如何产出和理解语言? |
这些分支之间不存在截然的界限。例如,社会语言学与语用学在研究语言使用的社会规范方面有大量重叠;历史语言学与音韵学在研究语音变化方面密切交叉。
语言的设计特征
Charles Hockett(霍凯特)在 1960 年代提出了人类语言区别于动物交流系统的一组"设计特征"(design features):
| 特征 | 说明 | 动物交流系统的对比 |
|---|---|---|
| 离散性 (discreteness) | 有限的声音单位组合成无限的表达 | 蜜蜂舞蹈是连续的,非离散的 |
| 能产性 (productivity) | 可以创造和理解从未听过的新句子 | 猿类手语只能组合有限的固定表达 |
| 位移性 (displacement) | 可以谈论不在场的事物——过去、未来、假设 | 蜜蜂舞蹈有一定位移性,但极有限 |
| 双层结构 (duality of patterning) | 无意义的单位(音素)组成有意义的单位(语素/词) | 动物信号通常不具备这种双层组织 |
动物交流系统可能具备其中某些特征——蜜蜂舞蹈有位移性,鸟类鸣叫有一定的能产性——但没有任何已知的动物交流系统同时拥有所有这些特征。特别是能产性和双层结构的组合使人类语言成为一个开放的、可无限扩展的符号系统。
案例:Washoe 与 Kanzi 的手语实验。 1960-1990 年代,研究者试图教授黑猩猩 Washoe 和倭黑猩猩 Kanzi 使用手语或符号系统。这些灵长类动物学会了数百个符号,能组合简单的双词或三词表达(如"give banana"“more tickle”),但始终未能展现出人类语言的递归句法结构。这一系列实验的结论是:非人灵长类具备一定的符号使用能力,但人类语言的完整设计特征——特别是递归性和系统性的句法——在动物界没有真正的对应物。
语言学的方法论
语言学研究采用多种方法论路径。描写语言学 (descriptive linguistics) 致力于如实记录和描述特定语言的结构,不做价值判断(不区分"正确"和"错误"的用法)。理论语言学 (theoretical linguistics) 构建抽象模型来解释语言的深层规律。实验语言学 借用心理学和神经科学的实验方法来测试关于语言加工的假说。计算语言学 (computational linguistics) 用算法和统计模型处理自然语言数据。
语言学的一个核心方法论原则是描写主义 (descriptivism) 而非规定主义 (prescriptivism)。语言学家不规定人们"应该"怎么说话,而是研究人们"实际上"怎么说话。“ain’t"在标准英语中被视为"错误”,但对语言学家而言,它是英语某些方言中完全合法的、有规则可循的语法形式。
💭 延伸思考
- Saussure 将语言学的研究对象限定为 langue(语言系统),Chomsky 将其限定为"语言能力"(competence) 而非"语言运用"(performance)。两位奠基者都选择了"理想化"的研究对象而排除了混乱的现实用法。这种策略为语言学带来了科学严谨性,但是否也导致了对真实语言现象的系统性忽视?
- 大语言模型的出现是否从根本上挑战了 Chomsky 关于"语言能力必须是先天的"这一论证?如果纯粹的统计学习能够产生类似语法行为的输出,“刺激贫乏"论证的力量是否被削弱了?
- 全球约 7000 种语言中超过 40% 面临消亡风险。语言多样性的丧失对语言学理论本身意味着什么?如果未来只剩几百种语言,关于"语言普遍性"的研究是否还有足够的实证基础?
📚 参考文献
- Saussure, F. de (1916). Cours de linguistique générale. Payot. 现代语言学的奠基文本,提出 langue/parole 区分和符号任意性原则。
- Chomsky, N. (1957). Syntactic Structures. Mouton. 生成语法的开山之作,将语言学从行为主义描写转向认知科学取向。
- Hockett, C. F. (1960). The origin of speech. Scientific American, 203(3), 88-97. 提出人类语言设计特征的经典论文。
- Evans, N., & Levinson, S. C. (2009). The myth of language universals. Behavioral and Brain Sciences, 32(5), 429-448. 对语言普遍性假说的系统性挑战,引发广泛辩论。
- Tomasello, M. (2003). Constructing a Language: A Usage-Based Theory of Language Acquisition. Harvard University Press. 基于使用的语言习得理论,挑战先天论的主要替代方案。