Bazinga:一點思考www(以及下篇的數學基礎)?

zhuanlan.zhihu.com
圖標

在已經寫過的一篇文章中,我們討論了這樣的微分方程

y+py+qy=0 .

我曾經提到過可以用係數矩陣解一個微分方程組,其中該微分方程的一個解的形式是 y(t)=e^{lambda t},其中 lambda 是矩陣的特徵值. 因為係數矩陣是一個 2	imes2 的矩陣,所以一般我們會有兩個特徵值 lambda_{1}
elambda_{2} . 其中我的一個疑惑是為什麼當 lambda_{1}=lambda_{2} 的時候,會出現一個新的滿足該方程的解 te^{lambda t} . 在上文中我給了一個讓人無法吐槽但是又不爽的證明——我把解帶到方程裡面發現是成立的.

上次有朋友看了我的文章後跟我吐槽:長腦子的人都知道可以帶進去好嗎?於是我開始思考為什麼這個解會產生. 我希望了解這個解的產生的動機(當時的數學家/物理學家是怎麼想到的?憑直覺猜到的嗎?那為什麼會這麼猜呢?)以及合理性(我們知道即使特徵值一樣,第一次得到的解 e^{lambda t} 也是滿足的,為什麼它不能張成解集空間呢?如果答案是兩個解,那麼說明解集空間是二維的,這樣兩個解才能張成解集空間,那麼為什麼即使在特徵值相等的情況下,解集空間還是2維的呢?)

以下是我的一點思路及理解


先構造一個特徵值相等的矩陣微分方程. 我們知道如果讓 mathbf{u}=left[ egin{array}{l}{y^{prime}} \ {y}end{array}
ight] , 那麼微分方程 frac{d^{2} y}{d t^{2}}+p frac{d y}{d t}+q y=0 可以寫成 frac{d mathbf{u}}{d t}=left( egin{array}{cc}{-p} & {-q} \ {1} & {0}end{array}
ight) mathbf{u} . 現在構造一個特徵值相等的矩陣 frac{d mathbf{u}}{d t}=left( egin{array}{cc}{-2} & {-1} \ {1} & {0}end{array}
ight) mathbf{u} . 則其中的一個解為 y(t)=e^{-t} ,讀者可自行驗證.

那麼該微分方程就變成了 frac{d^{2} y}{d t^{2}}+2 frac{d y}{d t}+y=0 . 接下來我們來研究這個方程到底對輸入值 y 做了什麼.

核心思路是把微分方程看作一個線性變換.

考慮一個一階微分方程 y+ky=0

我們定義 S=D+kI .其中 D 為微分運算元,相當於對函數求導,而 I 相當於單位運算元,即不對函數做任何變化,那麼 S(y)=(D+kI)(y)=D(y)+kI(y)=frac{dy}{dt}+ky .

那麼同理,一個二階的微分方程可以看作是兩個一階運算元 S 相乘的結果. 即 S^{(2)}=S circ S

egin{aligned} S^{(2)}(y) &=S circ(D(y)+k I(y)) \ &=D(D(y)+k I(y))+k I(D(y)+k I(y)) \ &=mathrm{D}^{(2)}(y)+2 k D(y)+k y end{aligned}

對應的方程為 frac{d^{2} y}{d t^{2}}+2 k frac{d y}{d t}+k y ,令 k=1 就得到了 frac{d^{2} y}{d t^{2}}+2 frac{d y}{d t}+y

這裡需要說明的是運算元 S,S circ S 都是線性的,證明附在後面.

假設我們的函數 y 性質很好,無限可微,我們定義向量空間 V 包含了所有這樣的函數 y : mathbb{R} 
ightarrow mathbb{R} ,運算元 S 定義了一個線性變換 S: V
ightarrow V . 其中滿足 y+ky=0 的函數從 operatorname{ker} S 被映射到了0.

同樣,一個二階的運算元 Scirc S 也定義了一個線性變換 Scirc S:V
ightarrow V . 此時 operatorname{ker} S 被映射到了 mathbf{0} 點, mathbf{0}inoperatorname{ker} S , operatorname{ker} S 又一次被映射成了 mathbf{0}

但是在圖上我們發現了一個事情,最後被映射成 mathbf{0} 的實際上不僅僅是 	ext { ker } S , 因為 	ext { ker } S 在第一次線性變換 S 後就直接變成了一個點 mathbf{0} ,但是實際上我們感興趣的是 operatorname{ker} S circ S ,也就是圖上橙色的部分. 於是我們找到了一個合理的解釋,因為 operatorname{ker} S=left{c e^{-lambda t} | c in mathbb{R}
ight} . 但是我們有理由相信 operatorname{ker} Scirc S 中包含 operatorname{ker} S 中沒有的元素,所以我們希望找到第二個解.

一個合理而自然的問題是:第二個解滿足什麼樣的條件?

1)它必須在 operatorname{ker} Scirc S 中(廢話),也就是說經過 Scirc S 這樣的線性變換後要等於 mathbf{0} .

2)它通過一次線性變換 S 必須在 operatorname{ker} S 中;

現在我把這段話翻譯成微積分的語言:

1)必須滿足 y+2y+y=0

2) y+ky 要等於 ce^{-t} 這樣的形式

對於一個熟悉微積分的人來說應該不難猜,這樣的函數就是 te^{-t} . 驗證過程如下:

egin{aligned}(D+I)left(t e^{-t}
ight) &=Dleft(t e^{-t}
ight)+Ileft(t e^{-t}
ight) \ &=left(-t e^{-t}+e^{-t}
ight)+left(t e^{-t}
ight) \ &=e^{-t} end{aligned}

所以以上就是這個解產生的動機. 通過把微分方程和廣義向量空間、線性代數等知識聯繫起來,我們發現滿足方程 y+py+qy=0 的解不一定只有 e^{lambda t} 這一種形式. 於是通過廣義向量空間,我們認為有必要尋找第二種解,而且我們知道了這個解滿足一定條件,於是就可以猜出來了. 所以我們得出結論

operatorname{ker} S circ S=left{mu e^{lambda t}+eta t e^{lambda t} | mu, eta, lambda in mathbb{R}
ight}

也就是說方程 y+py+qy=0 的解是 y(t)=c_{1} e^{lambda t}+c_{2} t e^{lambda t} .


下面附上一些證明.

Lemma 1. 所有無限可微的函數 f : mathbb{R} 
ightarrow mathbb{R} 組成一個向量空間 V .

證明:設 f,gin V . 由於 f,g 都是可微的,所以 f+g 也是可微的. 同時,由於 f 可微, cf 也是可微的. QED.

Lemma 2. 微分方程運算元 S, Scirc S 是線性變換.

證明:首先很明顯微分運算元 D=frac{d}{dt} 是線性的. S=D+kI . 那麼 S(f+g)=(D+kI)(f+g)=D(f+g)+kI(f+g)=D(f)+kI(f)+D(g)+kI(g)=S(f)+S(g) .另外 S(cf)=(D+kI)(cf)=D(cf)+kI(cf)=cD(f)+ckI(f)=cS(f) . 所以運算元 S 是線性的. 既然 S 是線性的,那麼兩次線性變換 S circ S 也是線性的. QED.

Lemma 3. 微分方程 y+ky=0 的解具有唯一形式 e^{-k t} .

證明:假設 x(t) 是一個任意的解, 對 x(t)e^{kt} 求導

frac{d}{dt}(x(t)e^{kt})=x(t)e^{kt}+kx(t)e^{kt}=-kx(t)e^{kt}+kx(t)e^{kt}=0

所以 x(t)e^{kt}=c ,即 x(t)=ce^{-kt}

QED.

這裡說一下一個很重要的定理,我嘗試證明. 目前的證明方法有些不嚴謹,在和老師討論之前決定先發上來,到時討論結束後會修改.

Theorem 1. 已知線性變換 S,T . operatorname{dim}(operatorname{ker} S)=m , operatorname{dim}(operatorname{ker} T)=n . 已知 left{v_{1}, v_{2}, ldots, v_{m}
ight}operatorname{ker} S 的一組基, left{w_{1}, w_{2}, ldots w_{n}
ight}operatorname{ker} T 的一組基. 則 operatorname{dim}(operatorname{ker} T circ S)=m+n

證明:

假設線性變換 S,T 都是可逆的.

從已知條件得 Sleft(v_{1}+v_{2}+ldots v_{m}
ight)=0 , Tleft(w_{1}+w_{2}+ldots w_{n}
ight)=0 .所以

[egin{array}{l} T(S({v_1} + {v_2} + ... + {v_m}) + ({w_1} + {w_2} + ...{w_n}))\  = T(S({v_1} + {v_2} + ... + {v_m})) + T({w_1} + {w_2} + ...{w_n})\  = T(0) + 0 = 0 end{array}]

所以

[egin{array}{l} T(S({v_1} + {v_2} + ... + {v_m}) + ({w_1} + {w_2} + ...{w_n})) = 0\  = T(S({v_1} + {v_2} + ... + {v_m} + {S^{ - 1}}{w_1} + {S^{ - 1}}{w_2} + ... + {S^{ - 1}}{w_n}))\  = T circ S({v_1} + {v_2} + ... + {v_m} + {S^{ - 1}}{w_1} + {S^{ - 1}}{w_2} + ... + {S^{ - 1}}{w_n}) end{array}]

現在只需證明 operatorname{ker} T circ S 的一組基是 (left{v_{1}, v_{2}, ldots, v_{m}, S^{-1} w_{1}, S^{-1} w_{2}, ldots, S^{-1} w_{n}
ight}) 就得證了. 現在需要證明 (left{v_{1}, v_{2}, ldots, v_{m}, S^{-1} w_{1}, S^{-1} w_{2}, ldots, S^{-1} w_{n}
ight}) 是線性無關的. 用反證法來證明,假設這些向量是線性相關的,也就是說 [{S^{ - 1}}{w_i} = c{v_j}] . 那麼 (w_{i}=S S^{-1} w_{i}=S c v_{j}=cleft(S v_{j}
ight)=0) . 然而 w_{i}
e0 ,矛盾. 所以 (left{v_{1}, v_{2}, ldots, v_{m}, S^{-1} w_{1}, S^{-1} w_{2}, ldots, S^{-1} w_{n}
ight}) 是線性無關的,構成核的一組基. 最後得到 operatorname{dim}(operatorname{ker} T circ S)=m+n

QED.


References

[1]Algebra, Michael Artin, China Machine Press, 2ed.

[2]Introduction to Linear Algebra, Gilbert Strang, Wesley Cambridge Press, 5ed


推薦閱讀:
相关文章