研究设计
📝 研究设计是连接研究问题与研究结论的蓝图——它决定了数据如何收集、分析和解释。不同的设计类型(实验、准实验、相关、案例、比较)各有适用范围,混合方法和因果推断策略则为复杂研究问题提供了更灵活的框架。
研究设计的定义与功能
研究设计(research design)是一项研究的总体策略框架——它规定了如何将研究问题转化为可操作的研究步骤,如何收集和分析数据,以及如何从数据中得出有效的结论。
研究设计不等于研究方法。方法(methods)是收集和分析数据的具体技术(问卷、访谈、统计分析等);设计是这些方法的组织架构——它决定了在什么时间、以什么顺序、对什么样本、用什么方法收集什么数据。一个研究可以使用相同的方法但采用完全不同的设计,得出截然不同的结论。
好的研究设计应该同时追求两种效度:内部效度(internal validity,因果推断的可靠性——观察到的效应确实是由假设的原因造成的,而非其他因素)和外部效度(external validity,结果的可推广性——在其他人群、其他情境中是否仍然成立)。两者之间往往存在张力——高度控制的实验室实验内部效度强,但外部效度可能弱;自然场景中的观察研究外部效度好,但内部效度可能差。
实验设计
真实验设计(True Experimental Design)
真实验的三个核心特征:随机分配(random assignment)、干预/处理(treatment)、对照组(control group)。
随机分配是关键——它保证了实验组和对照组在所有已知和未知的变量上大致相同,使得任何结果差异都可以归因于处理本身。
经典实验设计(pretest-posttest control group design):
实验组: 前测 O₁ → 处理 X → 后测 O₂
对照组: 前测 O₃ → → 后测 O₄
效果 = (O₂ - O₁) - (O₄ - O₃)Solomon 四组设计增加了两个没有前测的组,用来检测前测本身是否影响了结果(前测效应)。
📝 案例:RAND 健康保险实验。 1974-1982 年,RAND 公司进行了可能是社会科学史上最大规模的真实验:将约 7700 人随机分配到不同的健康保险计划(从免费到高自付比例),观察保险方案对医疗服务使用和健康结果的影响。实验发现:免费医疗使医疗服务使用增加了约 30%,但对大多数人的健康结果没有显著改善(低收入人群和有慢性病的人群除外)。这项耗资数亿美元的实验为美国医疗政策提供了数十年的政策依据,也展示了 RCT 在社会政策评估中的巨大价值和高昂成本。
准实验设计(Quasi-experimental Design)
当随机分配不可行(伦理或实践原因)时,准实验设计通过其他方式尽可能接近因果推断。
非等组对照设计:使用已有的分组(如不同学校的学生),无法随机分配,但可以尽量选择相似的对照组并控制已知的混淆变量。
断点回归设计(Regression Discontinuity Design, RDD):利用政策的"门槛"——分数刚好在门槛上下的个体几乎是随机的,因此可以比较门槛两侧的结果差异来估计处理效果。例如,奖学金的分数线是 80 分——得 80 分和得 79 分的学生在能力上几乎没有差异,但一个获得了奖学金,另一个没有。
中断时间序列设计(Interrupted Time Series):在干预之前和之后收集多个时间点的数据,观察干预是否改变了趋势。适用于评估政策变化的效果(如新交通法规对事故率的影响)。
双重差分法(Difference-in-Differences, DID)
DID 比较两个维度的差异:干预前后的差异(时间维度)× 干预组与对照组的差异(组间维度)。
📝 案例:Card 和 Krueger 的最低工资研究。 1994 年,经济学家 David Card 和 Alan Krueger 利用新泽西州提高最低工资(而邻近的宾夕法尼亚州未提高)这一"自然实验",采用双重差分法研究最低工资对就业的影响。他们比较了新泽西快餐店提高前后的就业变化,减去宾夕法尼亚同期的变化。结论是:提高最低工资并未导致就业减少——这一发现挑战了经济学教科书中"最低工资必然减少就业"的标准结论,引发了数十年的学术争论。DID 方法的关键假设是"平行趋势"——如果没有干预,两组的变化趋势应该相同。
非实验设计
相关研究/横截面研究(Cross-sectional Study)
在一个时间点上收集多个变量的数据,分析变量之间的关系。优势是实施简便、成本低。核心局限是无法建立因果方向——教育水平与收入正相关,但无法判断是教育导致高收入还是高收入家庭的子女更容易获得教育。
纵向研究(Longitudinal Study)
在多个时间点上追踪同一群体,观察变量如何随时间变化。面板研究(panel study)追踪同一组个体,趋势研究在不同时间点抽取同一总体的不同样本。纵向研究可以建立时间先后关系(因果推断的必要条件之一),但成本高、样本流失严重。
案例研究(Case Study)
对单个案例(一个组织、一个事件、一个社区、一个人)的深入调查。案例研究的价值不在于统计代表性,而在于分析深度——通过密切关注一个案例的复杂性,产生对因果机制的洞见。
案例选择策略对研究结论有决定性影响:
| 策略 | 逻辑 | 示例 |
|---|---|---|
| 典型案例 | 选择最具代表性的案例 | 研究"典型的"中产阶级社区 |
| 偏差案例 | 选择不符合理论预期的案例 | 为什么某个贫困社区犯罪率异常低? |
| 最可能/最不可能案例 | 选择理论最应该/最不应该成立的案例 | 如果民主理论在最不利条件下仍成立…… |
| 关键案例 | 选择具有决定性意义的案例 | 如果连这种情况都不支持理论,则理论有严重问题 |
比较研究(Comparative Study)
系统地比较两个或多个案例(国家、组织、时期)的异同,以识别模式和因果机制。最相似系统设计(Mill 差异法的应用)选择在大多数方面相似但在关键变量上不同的案例;最不相似系统设计(Mill 契合法的应用)选择在大多数方面不同但在结果变量上相同的案例。
混合方法设计
混合方法研究(mixed methods research)在同一项研究中结合定量和质性方法。Creswell 和 Plano Clark 提出了四种基本设计:
| 设计类型 | 结构 | 适用场景 |
|---|---|---|
| 汇聚设计 | 定量和定性同时进行,结果对比 | 从不同角度验证同一发现 |
| 解释性序贯设计 | 先定量 → 再用质性解释定量结果 | 统计发现了模式但不知道原因 |
| 探索性序贯设计 | 先质性 → 再用定量验证质性发现 | 领域了解不足,需先探索 |
| 嵌入式设计 | 一种方法为主,另一种辅助 | 在实验中嵌入访谈以理解参与者体验 |
混合方法面临的根本挑战是认识论整合:如果定量和定性方法基于不同的本体论和认识论假设(实证主义 vs 建构主义),简单地"混合使用"在逻辑上是否一致?实用主义(pragmatism)提供了一种回答:放弃抽象的哲学争论,根据研究问题的需要选择最合适的方法——“什么有效就用什么”。批判实在论提供了另一种回答:社会现实既有客观维度也有意义维度,不同方法分别适合研究不同维度。
📝 案例:Lieberman 的"嵌套分析"。 政治学家 Evan Lieberman 提出了一种系统的混合方法策略——“嵌套分析”(nested analysis)。第一步,进行大样本统计分析(如跨国回归)以识别总体模式。第二步,根据统计分析的结果,策略性地选择案例进行深度质性研究——可能选择符合模型预测的"典型案例"(验证因果机制),也可能选择偏离模型预测的"异常案例"(发现遗漏的因素)。第三步,将质性发现反馈到统计模型中,修正和深化理论。这种设计使定量的广度和质性的深度系统地互补。
因果推断的核心逻辑
因果推断是社会科学研究设计的终极目标之一。从"相关"到"因果"需要满足三个条件:
- 共变(covariation):原因和结果之间存在系统性关联
- 时间先后(temporal precedence):原因在结果之前发生
- 排除替代解释(elimination of alternatives):排除第三变量和反向因果
不同的研究设计在满足这三个条件上的能力各异。RCT 通过随机分配自动排除替代解释,因此因果推断力最强。观察性研究则需要依赖统计控制、自然实验或理论论证来排除替代解释。
反事实框架(counterfactual framework,也称 Rubin 因果模型)提供了因果推断的形式化定义:X 对 Y 的因果效应 = Y(在 X 存在时) - Y(在 X 不存在时)。问题在于:对于同一个个体,无法同时观察到 X 存在和 X 不存在两种状态——这就是因果推断的根本问题。所有因果推断方法本质上都是在用不同的策略估计这个不可观察的反事实。
💭 延伸思考
- 随机对照实验被称为因果推断的"金标准",但在社会科学中许多重要问题无法用 RCT 研究。是否存在"银标准"?准实验方法在多大程度上可以替代 RCT?
- 案例研究常被批评为"样本量为 1,无法推广"。这种批评是否公平?案例研究的推广逻辑与统计推广有何本质区别?
- 混合方法是否真的实现了"两全其美",还是在两种方法上都做了妥协?
📚 参考文献
- Creswell, J. W., & Creswell, J. D. (2018). Research Design: Qualitative, Quantitative, and Mixed Methods Approaches (5th ed.). Sage. 研究设计的综合教材。
- Shadish, W. R., Cook, T. D., & Campbell, D. T. (2002). Experimental and Quasi-Experimental Designs for Generalized Causal Inference. Houghton Mifflin. 实验和准实验设计的权威论述。
- Yin, R. K. (2018). Case Study Research and Applications (6th ed.). Sage. 案例研究设计的经典指南。
- Morgan, S. L., & Winship, C. (2015). Counterfactuals and Causal Inference (2nd ed.). Cambridge University Press. 反事实框架与因果推断方法。
- Lieberman, E. S. (2005). “Nested Analysis as a Mixed-Method Strategy for Comparative Research.” American Political Science Review, 99(3). 嵌套分析方法的经典论文。