关于第一章第三小节的读书笔记

3. Casual bayesian networks

3.1 DAG by Casuality

1) 相关关系的不可靠性

在上一节也说到了, 在利用相关关系构建DAG的时候, 其结果是及其依赖于 variable order 的.

那么, 对于一组变数, 利用相关性去建模的话会得到很多种不同的 DAG 图.

-> 因此因果的作用就在于能在一开始决定 order, 使得 DAG 只有一个

2) 因果关系的重要性

  • 不需要性的情况:

在某些情形下, 人对外界做出的判断甚至是不用经过概率的, 只是利用到了因果关系. (6.1.4)

对于这种情形, 一般的利用概率图去做的模型是无法做到的.

  • 相关性是因果的副产物

这个是显而易见的, 正因为有了因果性, 两个变数的概率之间才有了联系, 也就是概率上的相关.

3) 基于因果的DAG的稳健性

在收到外界的影响时, 基于因果的DAG会受到比较小的影响.

比如, 前面的喷水器的例子中, 如果我们设定一下雨就关闭喷水器的话. 那么, 我们需要做如下修改:

  • 增加 x_2, x_3 之间的连接.
  • 修改 P(x_3|x_1,x_2) 之间的分布形式

若 order 不定的, 那么就需要针对不同的 DAG 设置不同的 P(x_3|x_1,x_2) .

3.2 Causal Networks as Oracles for Interventions

1) Causal DAG 的特点

1> 模块性

由于 parent-child 之间的稳定以及自治的物理机制. 在不改变其他变数之间分布的情况下, 单独改变一个 parent-child 之间的分布是有可能的 ( conceivable ) .

2> Informative

一般 DAG : 可以知道一个 event 在之后观测数据中的概率.

因果 DAG : 可以知道在收到外部影响下, 概率的变化.

所以 : Caual DAG is informative than probilities model.

2) Intervention的例子

1> 对比例子

现在通过一个例子来同时解释 intervention 以及 上面的 Causal DAG 的特点.

  • 喷水器例子的概率图模型:

  • 喷水器例子的因果图(with intervention)模型:

2> 分析

  • Intervention:

下面的因果中给出的 intervention 就是 X_3=on .

  • 模块性:
  • 在概率模型中, 我们需要根据 X_3=on 作为条件去查询其条件概率, P(x_1,x_2,x_4,x_5|X_3=on) . 并且, 由于 x_1,x_3 之间是非独立的, 因此我们会推测出, Season 多是干旱的季节.
  • 在因果模型中, 我们将其定义为 intervention, P(x_1,x_2,x_4,x_5|do(X_3=on)) . 即, 将 X_1->X_3 去掉. 相比于上面的概率模型, 这里不需要对 P(x_1) 的概率进行改变.

这就是因果模型的模块性.

3> Assumption

上面其实用到了一个假设, 就是 do(X_3=on) 对其父节点没有做出影响.

即 : 因果图中的节点会根据 autonomy(自主权) 去对 intervention 做出反应.

3) Causal Bayesian Network 的定义:

P(v) 是一个定义在变数集 V 上的概率分布.

P_*= P_x(v) 是一个定义在 intervention do(X = x) 上的概率分布, 其中 Xsubseteq V .

G (Causal Bayesian Network) 是与 P_* 相兼容 (compatible) 的图, 当且仅当下面的三个条件被满足:

  1. P_x(v) is Markov relative to G ;

这个就是指, 因果贝叶斯网路应该符合概率图模型的标准. (不同点是不需要对变数进行 order)

  1. P_x(v_i)=1  for all V_iin X whenever v_i is consistent with X=x

也就是说, 对于被干涉的部分, 其概率 $X=x$ 一定是等于1.

  1. P_x(v_i | pa_i) = P(v_i | pa_i) for all V_i
otin X whenever pa_i is consistent with X = x .

即, 被干涉变数的父节点的概率分布是不变的. 并且注意的一点:

这里讲干涉的分布形式成功转换为了正常的概率分布形式

4) Causal Bayesian Network 的性质:

  • Truncated factorization

也就是说, 若一个节点的子节点全是被干涉节点, 我们可以忽略这个节点.

并且, 我们只需要考虑被干涉节点的子节点及其非干涉的父节点即可.

  • Property 1

  • Property 2

disjoint就是排反, 即 S 与 {V_i,PA_i} 之间没有交集.

  • Property 3

被干涉变数在 DAG 中变成了 root 节点.

3.3 Causal Relationships and Their Stability

1) 反向利用因果关系

可以通过对某个变数进行干涉后, 观测其他变数的变化情况以决定 causal effect. 而被干涉变数就是 causal influence.

具体来说, 如果想要检测 X_jX_i 的关系, 我们需要首先对 X_i 进行干涉.

那么, 按照上面的理论, 只有 X_i 的子孙才会被这个干涉所影响. 只要看, X_j 的分布前后有无变化即可.

2) Stability

这里作者给出了一个哲学上的观点:

因果关系是 ontological (存在论) 的, 即真实的因果关系不会根据环境(do-operator)的变化而变化. 即使我们队知识的认识(概率分布)发生了变化.

概率关系是 epistemic (认识论) 的, 我们对事物的认识(概率分布)会随著环境的变化(do-operator)而变化.

这个解释太棒了.

推荐阅读:

相关文章