隨機變數(Random Variable)X是一個映射,把隨機試驗的結果與實數建立起了一一對應的關係。而期望與方差是隨機變數的兩個重要的數字特這。

期望(Expectation, or expected value)是度量一個隨機變數取值的集中位置或平均水平的最基本的數字特徵;

方差(Variance)是表示隨機變數取值的分散性的一個數字特徵。 方差越大,說明隨機變數的取值分布越不均勻,變化性越強;方差越小,說明隨機變數的取值越趨近於均值,即期望值。

離散型隨機變數

期望: E(X)=sum_{i=1}^{n} x_{i} p_{i}

方差: D(X)=sum_{i=1}^{n}left[x_{i}-E(X)
ight]^{2} p_{i}

連續型隨機變數:

期望: E(X)=int_{-infty}^{infty} x f(x) mathrm{d} x

方差: D(X)=int_{-infty}^{infty}[x-E(X)]^{2} f(x) mathrm{d} x

一、期望和方差的運算性質

  1. 期望運算性質:

(1)E(c)=c,其中c是常數;

(2) E(c X)=c E(X) ;(3) E(X+Y)=E(X)+E(Y) ;(4) E(X-Y)=E(X)-E(Y) ;(5)設X,Y是相互獨立的隨機變數,則有 E(X Y)=E(X) E(Y)

註:上述公式都可以根據期望的定義運算可得,下證(5):

E(XY)=sumlimits_{1leq i,jleq n}x_iy_jP(x=x_i,y=y_j)=sumlimits_{1leq i,jleq n}x_iy_jP(x=x_i)P(y=y_j)

=sumlimits_{1leq ileq n}x_iP(x=x_i)(sumlimits_{1leq jleq n}(y_jP(y=y_j))=sumlimits_{1leq ileq n}x_iP(x=x_i)E(Y)

=E(Y)cdotsumlimits_{1leq ileq n}x_iP(x=x_i)

=E(X)E(Y)

2. 方差的運算性質:

(1) D(c)=0 ,其中c是常數;

(2) D(c X)=c^{2} D(X) ,其中c是常數;(3) D(X+a)=D(X) ,其中a為常數;(4) D(c X+a)=c^{2} D(X) ,其中a,c是常數;(5)設X,Y是相互獨立的隨機變數,則 D(X pm Y)=D(X)+D(Y) .

註:上述公式都可以根據方差的定義運算可得,下證(5):

D(X+Y)=E[X+Y-(E(X)+E(Y))]^2=E[X-E(X)+Y-E(Y)]^2

=E[X-E(X)]^2+E[2(X-E(X))(Y-E(Y))]+E[Y-E(Y)]^2

=D(X)+D(Y)+2E[X-E(X)]cdot E[Y-E(Y)]

=D(X)+D(Y)+2(E(X)-E(X))cdot(E(Y)-E(Y))

=D(X)+D(Y)

得證,上述推導還是藉助了期望運算性質(5)。

要注意的是無論是 X+Y 還是 X-Y ,當X,Y相互獨立時,都是 D(X)+D(Y)

3. 期望與方差的聯繫:

D(X)=Eleft(X^{2}
ight)-[E(X)]^{2}

下證上述公式:

egin{aligned} D(X) &=E[X-E(X)]^{2}\&=Eleft[X^{2}-2 X cdot E(X)+(E(X))^{2}
ight] \ &=Eleft(X^{2}
ight)-2 E(X) cdot E(X)+[E(X)]^{2}\&=Eleft(X^{2}
ight)-[E(X)]^{2} end{aligned}

註:在計算離散型隨機變數的方差時可以藉助這個公式來簡化運算。

二、抽樣分布

X_1,X_2,ldots,X_n 是獨立同分布的,滿足Eleft(X_{i}
ight)=mu, Dleft(X_{i}
ight)=sigma^{2}, i=1,2,3, cdots, n

則隨機變數overline{X}=frac{1}{n} sum_{i=1}^{n} X_{i} ,滿足 E(X)=mu, D(overline{X})=frac{sigma^{2}}{n}

下證:

E(overline{X})=Eleft(frac{1}{n} sum_{i=1}^{n} X_{i}
ight)=frac{1}{n} sum_{i=1}^{n} Eleft(X_{i}
ight)=frac{1}{n} cdot  n{mu}=mu

D(overline{X})=Dleft(frac{1}{n} sum_{i=1}^{n} X_{i}
ight)=frac{1}{n^{2}} sum_{i=1}^{n} Dleft(X_{i}
ight)=frac{1}{n^{2}} n sigma^{2}=frac{sigma^{2}}{n}

註:抽樣分布是推斷統計的基礎,而這些結論的理論基礎就是隨機變數期望與方差的運算性質。

三、區別Y=X+X與Z=2X

對於隨機變數X滿足:

首先我們來計算一下E(X)與Var(X)

E(X)=0cdotfrac{1}{4}+1cdotfrac{1}{4}+2cdotfrac{1}{4}+3cdotfrac{1}{4}=frac{3}{2}

Var(X)=E(X^2)-(E(X))^2=frac{14}{4}-frac{9}{4}=frac{5}{4}

那麼Y=X+X與Z=2X有什麼區別呢?看著好像X+X=2X呀,E(Y),Var(Y)與E(Z),Var(Z)是否一樣?

其實這是兩個完全不同的隨機變數,以下給出Y與Z的分布:

比如

P(Y=6)=P(X=3,X=3)=P(X=3)P(X=3)=frac{1}{16}

P(Z=6)=P(X=3)=frac{1}{4}

註:Y=X+X,X的取值0,1,2,3與另一個X的自由組合;而Z=2X只是把X的值擴大2倍。

E(Y)=E(X+X)=E(X)+E(X)=3

Var(Y)=Var(X+X)=Var(X)+Var(X)=frac{5}{2}

E(Z)=E(2X)=2E(X)=3

Var(Z)=Var(2X)=4Var(X)=5

統計是一門神奇的科目,如果懂得其中的道理真的是非常有趣~~

想了解更多數學知識可參閱

雙木止月Tong:國際數學競賽及課程?

zhuanlan.zhihu.com
圖標

微信訂閱號:數你好看


推薦閱讀:
相关文章