Bazinga:一点思考www(以及下篇的数学基础)?

zhuanlan.zhihu.com
图标

在已经写过的一篇文章中,我们讨论了这样的微分方程

y+py+qy=0 .

我曾经提到过可以用系数矩阵解一个微分方程组,其中该微分方程的一个解的形式是 y(t)=e^{lambda t},其中 lambda 是矩阵的特征值. 因为系数矩阵是一个 2	imes2 的矩阵,所以一般我们会有两个特征值 lambda_{1}
elambda_{2} . 其中我的一个疑惑是为什么当 lambda_{1}=lambda_{2} 的时候,会出现一个新的满足该方程的解 te^{lambda t} . 在上文中我给了一个让人无法吐槽但是又不爽的证明——我把解带到方程里面发现是成立的.

上次有朋友看了我的文章后跟我吐槽:长脑子的人都知道可以带进去好吗?于是我开始思考为什么这个解会产生. 我希望了解这个解的产生的动机(当时的数学家/物理学家是怎么想到的?凭直觉猜到的吗?那为什么会这么猜呢?)以及合理性(我们知道即使特征值一样,第一次得到的解 e^{lambda t} 也是满足的,为什么它不能张成解集空间呢?如果答案是两个解,那么说明解集空间是二维的,这样两个解才能张成解集空间,那么为什么即使在特征值相等的情况下,解集空间还是2维的呢?)

以下是我的一点思路及理解


先构造一个特征值相等的矩阵微分方程. 我们知道如果让 mathbf{u}=left[ egin{array}{l}{y^{prime}} \ {y}end{array}
ight] , 那么微分方程 frac{d^{2} y}{d t^{2}}+p frac{d y}{d t}+q y=0 可以写成 frac{d mathbf{u}}{d t}=left( egin{array}{cc}{-p} & {-q} \ {1} & {0}end{array}
ight) mathbf{u} . 现在构造一个特征值相等的矩阵 frac{d mathbf{u}}{d t}=left( egin{array}{cc}{-2} & {-1} \ {1} & {0}end{array}
ight) mathbf{u} . 则其中的一个解为 y(t)=e^{-t} ,读者可自行验证.

那么该微分方程就变成了 frac{d^{2} y}{d t^{2}}+2 frac{d y}{d t}+y=0 . 接下来我们来研究这个方程到底对输入值 y 做了什么.

核心思路是把微分方程看作一个线性变换.

考虑一个一阶微分方程 y+ky=0

我们定义 S=D+kI .其中 D 为微分运算元,相当于对函数求导,而 I 相当於单位运算元,即不对函数做任何变化,那么 S(y)=(D+kI)(y)=D(y)+kI(y)=frac{dy}{dt}+ky .

那么同理,一个二阶的微分方程可以看作是两个一阶运算元 S 相乘的结果. 即 S^{(2)}=S circ S

egin{aligned} S^{(2)}(y) &=S circ(D(y)+k I(y)) \ &=D(D(y)+k I(y))+k I(D(y)+k I(y)) \ &=mathrm{D}^{(2)}(y)+2 k D(y)+k y end{aligned}

对应的方程为 frac{d^{2} y}{d t^{2}}+2 k frac{d y}{d t}+k y ,令 k=1 就得到了 frac{d^{2} y}{d t^{2}}+2 frac{d y}{d t}+y

这里需要说明的是运算元 S,S circ S 都是线性的,证明附在后面.

假设我们的函数 y 性质很好,无限可微,我们定义向量空间 V 包含了所有这样的函数 y : mathbb{R} 
ightarrow mathbb{R} ,运算元 S 定义了一个线性变换 S: V
ightarrow V . 其中满足 y+ky=0 的函数从 operatorname{ker} S 被映射到了0.

同样,一个二阶的运算元 Scirc S 也定义了一个线性变换 Scirc S:V
ightarrow V . 此时 operatorname{ker} S 被映射到了 mathbf{0} 点, mathbf{0}inoperatorname{ker} S , operatorname{ker} S 又一次被映射成了 mathbf{0}

但是在图上我们发现了一个事情,最后被映射成 mathbf{0} 的实际上不仅仅是 	ext { ker } S , 因为 	ext { ker } S 在第一次线性变换 S 后就直接变成了一个点 mathbf{0} ,但是实际上我们感兴趣的是 operatorname{ker} S circ S ,也就是图上橙色的部分. 于是我们找到了一个合理的解释,因为 operatorname{ker} S=left{c e^{-lambda t} | c in mathbb{R}
ight} . 但是我们有理由相信 operatorname{ker} Scirc S 中包含 operatorname{ker} S 中没有的元素,所以我们希望找到第二个解.

一个合理而自然的问题是:第二个解满足什么样的条件?

1)它必须在 operatorname{ker} Scirc S 中(废话),也就是说经过 Scirc S 这样的线性变换后要等于 mathbf{0} .

2)它通过一次线性变换 S 必须在 operatorname{ker} S 中;

现在我把这段话翻译成微积分的语言:

1)必须满足 y+2y+y=0

2) y+ky 要等于 ce^{-t} 这样的形式

对于一个熟悉微积分的人来说应该不难猜,这样的函数就是 te^{-t} . 验证过程如下:

egin{aligned}(D+I)left(t e^{-t}
ight) &=Dleft(t e^{-t}
ight)+Ileft(t e^{-t}
ight) \ &=left(-t e^{-t}+e^{-t}
ight)+left(t e^{-t}
ight) \ &=e^{-t} end{aligned}

所以以上就是这个解产生的动机. 通过把微分方程和广义向量空间、线性代数等知识联系起来,我们发现满足方程 y+py+qy=0 的解不一定只有 e^{lambda t} 这一种形式. 于是通过广义向量空间,我们认为有必要寻找第二种解,而且我们知道了这个解满足一定条件,于是就可以猜出来了. 所以我们得出结论

operatorname{ker} S circ S=left{mu e^{lambda t}+eta t e^{lambda t} | mu, eta, lambda in mathbb{R}
ight}

也就是说方程 y+py+qy=0 的解是 y(t)=c_{1} e^{lambda t}+c_{2} t e^{lambda t} .


下面附上一些证明.

Lemma 1. 所有无限可微的函数 f : mathbb{R} 
ightarrow mathbb{R} 组成一个向量空间 V .

证明:设 f,gin V . 由于 f,g 都是可微的,所以 f+g 也是可微的. 同时,由于 f 可微, cf 也是可微的. QED.

Lemma 2. 微分方程运算元 S, Scirc S 是线性变换.

证明:首先很明显微分运算元 D=frac{d}{dt} 是线性的. S=D+kI . 那么 S(f+g)=(D+kI)(f+g)=D(f+g)+kI(f+g)=D(f)+kI(f)+D(g)+kI(g)=S(f)+S(g) .另外 S(cf)=(D+kI)(cf)=D(cf)+kI(cf)=cD(f)+ckI(f)=cS(f) . 所以运算元 S 是线性的. 既然 S 是线性的,那么两次线性变换 S circ S 也是线性的. QED.

Lemma 3. 微分方程 y+ky=0 的解具有唯一形式 e^{-k t} .

证明:假设 x(t) 是一个任意的解, 对 x(t)e^{kt} 求导

frac{d}{dt}(x(t)e^{kt})=x(t)e^{kt}+kx(t)e^{kt}=-kx(t)e^{kt}+kx(t)e^{kt}=0

所以 x(t)e^{kt}=c ,即 x(t)=ce^{-kt}

QED.

这里说一下一个很重要的定理,我尝试证明. 目前的证明方法有些不严谨,在和老师讨论之前决定先发上来,到时讨论结束后会修改.

Theorem 1. 已知线性变换 S,T . operatorname{dim}(operatorname{ker} S)=m , operatorname{dim}(operatorname{ker} T)=n . 已知 left{v_{1}, v_{2}, ldots, v_{m}
ight}operatorname{ker} S 的一组基, left{w_{1}, w_{2}, ldots w_{n}
ight}operatorname{ker} T 的一组基. 则 operatorname{dim}(operatorname{ker} T circ S)=m+n

证明:

假设线性变换 S,T 都是可逆的.

从已知条件得 Sleft(v_{1}+v_{2}+ldots v_{m}
ight)=0 , Tleft(w_{1}+w_{2}+ldots w_{n}
ight)=0 .所以

[egin{array}{l} T(S({v_1} + {v_2} + ... + {v_m}) + ({w_1} + {w_2} + ...{w_n}))\  = T(S({v_1} + {v_2} + ... + {v_m})) + T({w_1} + {w_2} + ...{w_n})\  = T(0) + 0 = 0 end{array}]

所以

[egin{array}{l} T(S({v_1} + {v_2} + ... + {v_m}) + ({w_1} + {w_2} + ...{w_n})) = 0\  = T(S({v_1} + {v_2} + ... + {v_m} + {S^{ - 1}}{w_1} + {S^{ - 1}}{w_2} + ... + {S^{ - 1}}{w_n}))\  = T circ S({v_1} + {v_2} + ... + {v_m} + {S^{ - 1}}{w_1} + {S^{ - 1}}{w_2} + ... + {S^{ - 1}}{w_n}) end{array}]

现在只需证明 operatorname{ker} T circ S 的一组基是 (left{v_{1}, v_{2}, ldots, v_{m}, S^{-1} w_{1}, S^{-1} w_{2}, ldots, S^{-1} w_{n}
ight}) 就得证了. 现在需要证明 (left{v_{1}, v_{2}, ldots, v_{m}, S^{-1} w_{1}, S^{-1} w_{2}, ldots, S^{-1} w_{n}
ight}) 是线性无关的. 用反证法来证明,假设这些向量是线性相关的,也就是说 [{S^{ - 1}}{w_i} = c{v_j}] . 那么 (w_{i}=S S^{-1} w_{i}=S c v_{j}=cleft(S v_{j}
ight)=0) . 然而 w_{i}
e0 ,矛盾. 所以 (left{v_{1}, v_{2}, ldots, v_{m}, S^{-1} w_{1}, S^{-1} w_{2}, ldots, S^{-1} w_{n}
ight}) 是线性无关的,构成核的一组基. 最后得到 operatorname{dim}(operatorname{ker} T circ S)=m+n

QED.


References

[1]Algebra, Michael Artin, China Machine Press, 2ed.

[2]Introduction to Linear Algebra, Gilbert Strang, Wesley Cambridge Press, 5ed


推荐阅读:
相关文章