資訊理論(2)——熵的唯一性定理
前言
在資訊理論(1)——熵、互信息、相對熵中,我們給出了熵的公理化定義:
在這一文中,我們給出Shannon熵的公理化約定,並通過這個約定來推導出熵的形式的唯一性。
熵的唯一性定理
對於熵,Shannon公理化地規定了它的性質:
1.熵是連續的;即 ,在 上連續2.熵在等概率的時候,應該是單調函數;即當 時,若 ,則有 ,其物理意義就是信息量越大,編碼長度越大。3.熵具有可加性;即 其中 ,這一個性質需要特別說明一下,這個性質的物理含義就是,獨立地觀察n個事件所獲取的信息 ,等價於先對前m個事件合併觀察所得到的信息 加上這m個事件按概率出現的時候所觀察得到的信息
這個數學化的表達可能會讓人暈眩,不過不要緊,我們先完成數學推導,後面再用真實的例子說明這三個公理化性質的。
熵的唯一性定理推導
首先,我們設隨機變數 ,則容易得出:
,然後分成M組,每組N個後,有:
,利用公理的性質3化簡後有:
由上述推導,易得:
取 ,並構造 ,利用公理的性質2,易得
利用 式有:
對 兩邊取對數有:
有:
令 ,有
即 ,取 即為熵的基本形式。
然後,我們設隨機變數 ,通過等概分佈湊出所服從分佈:
不妨設
對於 有:
利用 式的結果有:
,取
至此,Shannon熵的唯一性被推導出來!
熵的公理化性質舉例說明
公理化性質1——熵是連續的
為了簡單起見,我們不妨設隨機變數 ,由熵的定義我們有:
當p為未知數時,可以知道 為連續函數。
公理化性質2——熵在等概率的時候,應該是單調函數
不妨設 ,則有:
故
公理化性質3——熵具有可加性
由上面討論有 ,知 ,下面改變觀察方法:
故 ,即觀察的方法不影響信息量的獲取。
推薦閱讀: