關於第一章第三小節的讀書筆記

3. Casual bayesian networks

3.1 DAG by Casuality

1) 相關關係的不可靠性

在上一節也說到了, 在利用相關關係構建DAG的時候, 其結果是及其依賴於 variable order 的.

那麼, 對於一組變數, 利用相關性去建模的話會得到很多種不同的 DAG 圖.

-> 因此因果的作用就在於能在一開始決定 order, 使得 DAG 只有一個

2) 因果關係的重要性

  • 不需要性的情況:

在某些情形下, 人對外界做出的判斷甚至是不用經過概率的, 只是利用到了因果關係. (6.1.4)

對於這種情形, 一般的利用概率圖去做的模型是無法做到的.

  • 相關性是因果的副產物

這個是顯而易見的, 正因為有了因果性, 兩個變數的概率之間才有了聯繫, 也就是概率上的相關.

3) 基於因果的DAG的穩健性

在收到外界的影響時, 基於因果的DAG會受到比較小的影響.

比如, 前面的噴水器的例子中, 如果我們設定一下雨就關閉噴水器的話. 那麼, 我們需要做如下修改:

  • 增加 x_2, x_3 之間的連接.
  • 修改 P(x_3|x_1,x_2) 之間的分布形式

若 order 不定的, 那麼就需要針對不同的 DAG 設置不同的 P(x_3|x_1,x_2) .

3.2 Causal Networks as Oracles for Interventions

1) Causal DAG 的特點

1> 模塊性

由於 parent-child 之間的穩定以及自治的物理機制. 在不改變其他變數之間分布的情況下, 單獨改變一個 parent-child 之間的分布是有可能的 ( conceivable ) .

2> Informative

一般 DAG : 可以知道一個 event 在之後觀測數據中的概率.

因果 DAG : 可以知道在收到外部影響下, 概率的變化.

所以 : Caual DAG is informative than probilities model.

2) Intervention的例子

1> 對比例子

現在通過一個例子來同時解釋 intervention 以及 上面的 Causal DAG 的特點.

  • 噴水器例子的概率圖模型:

  • 噴水器例子的因果圖(with intervention)模型:

2> 分析

  • Intervention:

下面的因果中給出的 intervention 就是 X_3=on .

  • 模塊性:
  • 在概率模型中, 我們需要根據 X_3=on 作為條件去查詢其條件概率, P(x_1,x_2,x_4,x_5|X_3=on) . 並且, 由於 x_1,x_3 之間是非獨立的, 因此我們會推測出, Season 多是乾旱的季節.
  • 在因果模型中, 我們將其定義為 intervention, P(x_1,x_2,x_4,x_5|do(X_3=on)) . 即, 將 X_1->X_3 去掉. 相比於上面的概率模型, 這裡不需要對 P(x_1) 的概率進行改變.

這就是因果模型的模塊性.

3> Assumption

上面其實用到了一個假設, 就是 do(X_3=on) 對其父節點沒有做出影響.

即 : 因果圖中的節點會根據 autonomy(自主權) 去對 intervention 做出反應.

3) Causal Bayesian Network 的定義:

P(v) 是一個定義在變數集 V 上的概率分布.

P_*= P_x(v) 是一個定義在 intervention do(X = x) 上的概率分布, 其中 Xsubseteq V .

G (Causal Bayesian Network) 是與 P_* 相兼容 (compatible) 的圖, 當且僅當下面的三個條件被滿足:

  1. P_x(v) is Markov relative to G ;

這個就是指, 因果貝葉斯網路應該符合概率圖模型的標準. (不同點是不需要對變數進行 order)

  1. P_x(v_i)=1  for all V_iin X whenever v_i is consistent with X=x

也就是說, 對於被干涉的部分, 其概率 $X=x$ 一定是等於1.

  1. P_x(v_i | pa_i) = P(v_i | pa_i) for all V_i
otin X whenever pa_i is consistent with X = x .

即, 被干涉變數的父節點的概率分布是不變的. 並且注意的一點:

這裡講干涉的分布形式成功轉換為了正常的概率分布形式

4) Causal Bayesian Network 的性質:

  • Truncated factorization

也就是說, 若一個節點的子節點全是被干涉節點, 我們可以忽略這個節點.

並且, 我們只需要考慮被干涉節點的子節點及其非干涉的父節點即可.

  • Property 1

  • Property 2

disjoint就是排反, 即 S 與 {V_i,PA_i} 之間沒有交集.

  • Property 3

被干涉變數在 DAG 中變成了 root 節點.

3.3 Causal Relationships and Their Stability

1) 反向利用因果關係

可以通過對某個變數進行干涉後, 觀測其他變數的變化情況以決定 causal effect. 而被干涉變數就是 causal influence.

具體來說, 如果想要檢測 X_jX_i 的關係, 我們需要首先對 X_i 進行干涉.

那麼, 按照上面的理論, 只有 X_i 的子孫才會被這個干涉所影響. 只要看, X_j 的分布前後有無變化即可.

2) Stability

這裡作者給出了一個哲學上的觀點:

因果關係是 ontological (存在論) 的, 即真實的因果關係不會根據環境(do-operator)的變化而變化. 即使我們隊知識的認識(概率分布)發生了變化.

概率關係是 epistemic (認識論) 的, 我們對事物的認識(概率分布)會隨著環境的變化(do-operator)而變化.

這個解釋太棒了.

推薦閱讀:

相关文章