[第一章] 1.3 Casual bayesian networks
關於第一章第三小節的讀書筆記
3. Casual bayesian networks
3.1 DAG by Casuality
1) 相關關係的不可靠性
在上一節也說到了, 在利用相關關係構建DAG的時候, 其結果是及其依賴於 variable order 的.
那麼, 對於一組變數, 利用相關性去建模的話會得到很多種不同的 DAG 圖.
-> 因此因果的作用就在於能在一開始決定 order, 使得 DAG 只有一個
2) 因果關係的重要性
- 不需要性的情況:
在某些情形下, 人對外界做出的判斷甚至是不用經過概率的, 只是利用到了因果關係. (6.1.4)
對於這種情形, 一般的利用概率圖去做的模型是無法做到的.
- 相關性是因果的副產物
這個是顯而易見的, 正因為有了因果性, 兩個變數的概率之間才有了聯繫, 也就是概率上的相關.
3) 基於因果的DAG的穩健性
在收到外界的影響時, 基於因果的DAG會受到比較小的影響.
比如, 前面的噴水器的例子中, 如果我們設定一下雨就關閉噴水器的話. 那麼, 我們需要做如下修改:
- 增加 之間的連接.
- 修改 之間的分布形式
若 order 不定的, 那麼就需要針對不同的 DAG 設置不同的 .
3.2 Causal Networks as Oracles for Interventions
1) Causal DAG 的特點
1> 模塊性
由於 parent-child 之間的穩定以及自治的物理機制. 在不改變其他變數之間分布的情況下, 單獨改變一個 parent-child 之間的分布是有可能的 ( conceivable ) .
2> Informative
一般 DAG : 可以知道一個 event 在之後觀測數據中的概率.
因果 DAG : 可以知道在收到外部影響下, 概率的變化.
所以 : Caual DAG is informative than probilities model.
2) Intervention的例子
1> 對比例子
現在通過一個例子來同時解釋 intervention 以及 上面的 Causal DAG 的特點.
- 噴水器例子的概率圖模型:
- 噴水器例子的因果圖(with intervention)模型:
2> 分析
- Intervention:
下面的因果中給出的 intervention 就是 .
- 模塊性:
- 在概率模型中, 我們需要根據 作為條件去查詢其條件概率, . 並且, 由於 之間是非獨立的, 因此我們會推測出, Season 多是乾旱的季節.
- 在因果模型中, 我們將其定義為 intervention, . 即, 將 去掉. 相比於上面的概率模型, 這裡不需要對 的概率進行改變.
這就是因果模型的模塊性.
3> Assumption
上面其實用到了一個假設, 就是 對其父節點沒有做出影響.
即 : 因果圖中的節點會根據 autonomy(自主權) 去對 intervention 做出反應.
3) Causal Bayesian Network 的定義:
是一個定義在變數集 V 上的概率分布.
是一個定義在 intervention 上的概率分布, 其中 .
(Causal Bayesian Network) 是與 相兼容 (compatible) 的圖, 當且僅當下面的三個條件被滿足:
- is Markov relative to ;
這個就是指, 因果貝葉斯網路應該符合概率圖模型的標準. (不同點是不需要對變數進行 order)
- whenever is consistent with
也就是說, 對於被干涉的部分, 其概率 $X=x$ 一定是等於1.
- = for all whenever is consistent with .
即, 被干涉變數的父節點的概率分布是不變的. 並且注意的一點:
這裡講干涉的分布形式成功轉換為了正常的概率分布形式
4) Causal Bayesian Network 的性質:
- Truncated factorization
也就是說, 若一個節點的子節點全是被干涉節點, 我們可以忽略這個節點.
並且, 我們只需要考慮被干涉節點的子節點及其非干涉的父節點即可.
- Property 1
- Property 2
disjoint就是排反, 即 S 與 之間沒有交集.
- Property 3
被干涉變數在 DAG 中變成了 root 節點.
3.3 Causal Relationships and Their Stability
1) 反向利用因果關係
可以通過對某個變數進行干涉後, 觀測其他變數的變化情況以決定 causal effect. 而被干涉變數就是 causal influence.
具體來說, 如果想要檢測 和 的關係, 我們需要首先對 進行干涉.
那麼, 按照上面的理論, 只有 的子孫才會被這個干涉所影響. 只要看, 的分布前後有無變化即可.
2) Stability
這裡作者給出了一個哲學上的觀點:
因果關係是 ontological (存在論) 的, 即真實的因果關係不會根據環境(do-operator)的變化而變化. 即使我們隊知識的認識(概率分布)發生了變化.
概率關係是 epistemic (認識論) 的, 我們對事物的認識(概率分布)會隨著環境的變化(do-operator)而變化.
這個解釋太棒了.
推薦閱讀: