我常与一些优秀的自然科学工作者们聊天,聊天的时候经常发现两个问题:

  1. 许多人都会想知道为什么经济学家处理实验效果或在政策评估的时候使用的方法与自然学科有所不同。
  2. 另一些人则是希望知道为什么经济学家们非常看中政策评估中所采用的计量方法,比如说为什么基于大数据训练的机器学习方法无法回答这类问题。

事实上做政策评估的实证研究是大多数经济学家们觉得最有兴趣的事情之一了。因为对于政策效果的评估哪怕是在大数据方法盛行的今天,如果不懂得计量经济学的原理,大部分人恐怕很难胜任这项工作。比如说下面这些问题:

  • 失业补助是否有助于找工作?
  • 收入税会不会影响劳动供给?
  • 给学生补助贷款是否会影响学生的毕业率?

如果单纯从数据本身出发,无论使用预测能力多强的模型,事实上很难从中找出因果线。是因为我们观察到的数据来自于人们的自然选择,而并非实验室的结果。如果简单地那两组人的平均数去比较得到的结果很可能是拿苹果去和香蕉做比较。

比如说我们在数据中发现贷款额度和毕业率呈现负的关系,那事实上只是因为有钱人不需要贷款,而有钱人因为从小收到的教育更好所以更容易毕业。贷款额度在这里只是体现了教育资源的分配不平等而已。

政策评估有什么用呢?

  • 监督作用:政策运行是否如我们预想的那般?
  • 判断作用:政策是否有效,究竟起到多大作用?
  • 建议作用:未来我们应当如何做?

上面的这些问题的回答许多人会说:要回答也不是很难得事情,许多社会科学家或者服务于咨询行业的人,会通过访问调查的方式(Qualitative Evaluation)来找到答案。

1. 受访者的意见是不是真的有代表性?

2. 我们无法建立反事实分析:相对于那些政策受益者而言,如果政策不存在的话,他们究竟会如何做?(比如说:那些因为贷款补助去上学的人如果没有贷款是不是就真的不去上学了?)

回答这些问题的关键在于找到政策与结果之间的因果关系,而我们观测到的数据有些时候是实验研究,另一些时候则是观察性研究(这一点流行病学和经济学非常接近)。许多问题也被两个学科共同关注,例如吸烟是否真的会导致癌症发病率的上升,规律地去体检是不是会让人变得更健康等等。

一个经典的例子是墨西哥从1997开始的精准扶贫(PROGRESA)项目。项目使得满足条件的贫困家庭可以接收到一定的补助,但是条件是孩子要定期上学,家庭成员定期到医疗中心接受检查。其目的是通过精准扶贫提高教育和健康水平,实现短期的扶贫效果。

那么学生究竟会不会真正收益于这样的政策,增加入学率并且提高健康水平,改善饮食结构呢?这就是经济学家和健康营养学家们关注的问题了。

推荐阅读:

相关文章