[第一章] 1.3 Casual bayesian networks
关于第一章第三小节的读书笔记
3. Casual bayesian networks
3.1 DAG by Casuality
1) 相关关系的不可靠性
在上一节也说到了, 在利用相关关系构建DAG的时候, 其结果是及其依赖于 variable order 的.
那么, 对于一组变数, 利用相关性去建模的话会得到很多种不同的 DAG 图.
-> 因此因果的作用就在于能在一开始决定 order, 使得 DAG 只有一个
2) 因果关系的重要性
- 不需要性的情况:
在某些情形下, 人对外界做出的判断甚至是不用经过概率的, 只是利用到了因果关系. (6.1.4)
对于这种情形, 一般的利用概率图去做的模型是无法做到的.
- 相关性是因果的副产物
这个是显而易见的, 正因为有了因果性, 两个变数的概率之间才有了联系, 也就是概率上的相关.
3) 基于因果的DAG的稳健性
在收到外界的影响时, 基于因果的DAG会受到比较小的影响.
比如, 前面的喷水器的例子中, 如果我们设定一下雨就关闭喷水器的话. 那么, 我们需要做如下修改:
- 增加
之间的连接.
- 修改
之间的分布形式
若 order 不定的, 那么就需要针对不同的 DAG 设置不同的 .
3.2 Causal Networks as Oracles for Interventions
1) Causal DAG 的特点
1> 模块性
由于 parent-child 之间的稳定以及自治的物理机制. 在不改变其他变数之间分布的情况下, 单独改变一个 parent-child 之间的分布是有可能的 ( conceivable ) .
2> Informative
一般 DAG : 可以知道一个 event 在之后观测数据中的概率.
因果 DAG : 可以知道在收到外部影响下, 概率的变化.
所以 : Caual DAG is informative than probilities model.
2) Intervention的例子
1> 对比例子
现在通过一个例子来同时解释 intervention 以及 上面的 Causal DAG 的特点.
- 喷水器例子的概率图模型:
- 喷水器例子的因果图(with intervention)模型:
2> 分析
- Intervention:
下面的因果中给出的 intervention 就是 .
- 模块性:
- 在概率模型中, 我们需要根据
作为条件去查询其条件概率,
. 并且, 由于
之间是非独立的, 因此我们会推测出, Season 多是干旱的季节.
- 在因果模型中, 我们将其定义为 intervention,
. 即, 将
去掉. 相比于上面的概率模型, 这里不需要对
的概率进行改变.
这就是因果模型的模块性.
3> Assumption
上面其实用到了一个假设, 就是 对其父节点没有做出影响.
即 : 因果图中的节点会根据 autonomy(自主权) 去对 intervention 做出反应.
3) Causal Bayesian Network 的定义:
是一个定义在变数集 V 上的概率分布.
是一个定义在 intervention
上的概率分布, 其中
.
(Causal Bayesian Network) 是与
相兼容 (compatible) 的图, 当且仅当下面的三个条件被满足:
is Markov relative to
;
这个就是指, 因果贝叶斯网路应该符合概率图模型的标准. (不同点是不需要对变数进行 order)
whenever
is consistent with
也就是说, 对于被干涉的部分, 其概率 $X=x$ 一定是等于1.
=
for all
whenever
is consistent with
.
即, 被干涉变数的父节点的概率分布是不变的. 并且注意的一点:
这里讲干涉的分布形式成功转换为了正常的概率分布形式
4) Causal Bayesian Network 的性质:
- Truncated factorization
也就是说, 若一个节点的子节点全是被干涉节点, 我们可以忽略这个节点.
并且, 我们只需要考虑被干涉节点的子节点及其非干涉的父节点即可.
- Property 1
- Property 2
disjoint就是排反, 即 S 与
之间没有交集.
- Property 3
被干涉变数在 DAG 中变成了 root 节点.
3.3 Causal Relationships and Their Stability
1) 反向利用因果关系
可以通过对某个变数进行干涉后, 观测其他变数的变化情况以决定 causal effect. 而被干涉变数就是 causal influence.
具体来说, 如果想要检测 和
的关系, 我们需要首先对
进行干涉.
那么, 按照上面的理论, 只有 的子孙才会被这个干涉所影响. 只要看,
的分布前后有无变化即可.
2) Stability
这里作者给出了一个哲学上的观点:
因果关系是 ontological (存在论) 的, 即真实的因果关系不会根据环境(do-operator)的变化而变化. 即使我们队知识的认识(概率分布)发生了变化.
概率关系是 epistemic (认识论) 的, 我们对事物的认识(概率分布)会随著环境的变化(do-operator)而变化.
这个解释太棒了.
推荐阅读: