d2y/dx2中的d2是什么,它和dx2有什么区别,为什么不用dy2?


mathrm{d}^2 就是一阶微分运算元 mathrm{d} 作为映射与自身的复合 mathrm{d} circ mathrm{d} ,也就是二阶微分运算元咯(当然前提是它得存在)

为啥要写成类似于乘方的形式呢?因为映射的复合 Box circ Box 在如下意义上类似于乘法运算 Box 	imes Box

如果运算符 circ 的两边都是线性映射并且支持加法和数乘,那么 circ 是个双线性运算符

也就是说对于任意标量 lambda 及线性映射 f,f_1,f_2,g,g_1,g_2 可以证明:

egin{align} (lambda f_1 + f_2) circ g = lambda (f_1circ g) + f_2 circ g \ f circ (lambda g_1 + g_2)= lambda (f circ g_1) + f circ g_2 end{align}

(这公式瞧著是不是跟小学乘法长得一模一样?)

这个微分运算元 mathrm{d} 是个线性映射,自然就可以把 mathrm{d} circ mathrm{d} 视作连乘,从而写成乘方的模样 mathrm{d}^2


上面解释的是 mathrm{d}^2 这种记法的由来,下面再解释下 mathrm{d}^2 具体的含义,以一维欧氏空间 mathbb {R} 上的函数为例

首先 y=f(x) 表示一个 mathbb {R}mathbb {R} 的映射:

f: x mapsto y

比如斜率 k 的线性函数 g: x mapsto y=kx,这里自变数 x 和因变数 y 自然都是实数 x, y in mathbb{R}

线性函数简单好算,而且可以自然地定义线性函数之间的加法和数乘,也就是说所有线性函数构成了一个线性空间,这个线性空间记作 mathfrak{L} (mathbb{R};mathbb{R}) ,站在分号左边的是自变数所属集合,站在分号右边的是因变数所属集合(奇怪,一个是实数集,另一个也是实数集。。

一般的函数 f 自然不见得是线性的,没那么简单好算,比如算 sin(0) 简单,算 sin(0.1) 就挠头啦

这时微分运算元 mathrm{d} 哧溜一下冒出来站到 f 的左边:「让俺来帮你捯饬一下,包管算起来 so easy」

于是呢就整出个新函数叫做 mathrm{d}f,它把非线性的 f 尽量给线性化;这种线性化自然只能是局部的,不可能说对 x_1x_2 我都拿同一个线性函数来凑乎,那样算起来是简单但误差可就大了去了

所以这个新函数 mathrm{d}f 应该给不同的自变数 x 配上不同的线性函数 g,让函数 f 在 x 附近长得跟函数 g 差不离,换言之 mathrm{d}f 是这样一个映射:

 mathrm{d}f: x mapsto g

这里自变数是实数 x in mathbb{R},因变数是线性函数 g = mathrm{d}f(x) in mathfrak{L}(mathbb{R};mathbb{R})

所谓差不离就是说对于挨著 x 足够近的数 x+h,用函数 f 算出来的数和用函数 g 算出来的数也足够近;当然这里得抠掉本底 f(x) 先,也就是说函数 g 拟合的不是函数 f 本身,而是 f 在 x 处的差分函数 Delta f_x

egin{align} Delta f_x(h) = f(x+h) - f(x) \  = g(h) + o(h) \  = mathrm{d}f(x)(h)  + o(h) \ end{align}

记号 o(h) 指代一个相对增量 h 的高阶小量,即 lim_{h 	o 0} frac{o(h)}{h} = 0

记号 mathrm{d}f(x)(h) 意思是用函数 mathrm{d}f 作用到变数 x 得到一个值(又是一个函数!),再用该值作用到增量 h 得到的数;嫌括弧多了脑壳疼的话,也可以记成 mathrm{d}f_x(h),其实就是把表示差分运算元的大 Delta 改成了表示微分运算元的小 mathrm{d}

写到这里,我要划个重点啦:

函数 fmathrm{d}f 乃是不同道上混的,前者是从 mathbb {R}mathbb {R} 的映射,函数值是个数 f(x) in mathbb{R} ;后者是从 mathbb {R}mathfrak{L} (mathbb{R};mathbb{R}) 的映射,函数值是个函数 mathrm{d}f_x in mathfrak{L}(mathbb{R};mathbb{R}),称为 f 在 x 处的微分


从线性拟合的角度看,mathrm{d}f_x(h) 给出了差分 Delta f_x(h) 的一阶线性组分,余项 o(h) 给出了剩余的高阶非线性组分;高阶非线性组分的贡献自然远小于线性组分,因此我们习惯于把它忽略掉

但是如果我们需要考察函数 f 在 x 处更细微的性状呢?比如已知 x 是极值点,即 mathrm{d}f_x = 0 ,这时函数 f 的性状就完全被余项所主导,要想知道 x 是极大值点还是极小值点,就必须进一步考察下这个余项是个啥样子,比如看看能否用平方项来拟合它;平方虽然没线性函数那么简单,但也还是相当 easy 啦,这对我们把握函数 f 的性状自然大有助益

我们之前从差分函数入手,得到了一阶拟合形式;那么为得到平方项这样的二阶拟合形式,自然的想法是可以从二阶差分函数入手,也就是去琢磨差分函数的差分

问题来了:这个差分的差分该写?

我们看到 Delta 把一个 mathbb {R} 上的映射:

f: x mapsto f(x)

变成另一个 mathbb {R} 上的映射:

Delta f : x mapsto Delta f_x

其中因变数 Delta f_x 也是一个 mathbb {R} 上的映射:

Delta f_x : h mapsto f(x+h) - f(x)

那么只需把函数 f 替换成函数 Delta f,自然就得到了差分函数 Delta f 的差分:

Delta^2f : x mapsto Delta^2 f_x

其中因变数 Delta^2 f_xmathbb {R} 上的映射:

Delta^2 f_x : h mapsto Delta f_{x+h} - Delta f_x

注意到右侧的 Delta f_{x+h} - Delta f_x 本身又是 mathbb {R} 上的映射,这意味著 Delta^2 f_x 可以视为增量 h_1, h_2 的 二元函数:

Delta^2 f_x (h_1,h_2) = Delta f_{x+h_1}(h_2) - Delta f_x(h_2)

把右边在 x+h_1 处的一阶差分项展开,再做些简单的加减组合,我们可以把 Delta^2 f_x 重新表示成在 x 处的一阶差分项的组合:

Delta^2 f_x (h_1,h_2) = Delta f_x(h_1+h_2) - (Delta f_x(h_1)+Delta f_x(h_2))

顺便说句,从这个组合形式很容易看出二阶差分是个对称二元函数,亦即:

Delta^2 f_x (h_1,h_2) = Delta^2 f_x (h_2,h_1)

二阶差分也可以理解为函数 f 在下图矩形顶点上的有向和:

Delta^2 f_x (h_1,h_2) = f(x+h_1+h_2) - f(x+h_1) - f(x+h_2) + f(x)

我们现在得到了二阶差分的形式,那么它的意义是什么?

注意到依照线性函数的定义,对线性形式 mathrm{d}f_x 我们一定有如下恒等式:

mathrm{d} f_x(h_1+h_2) = mathrm{d} f_x(h_1)+mathrm{d} f_x(h_2)

这样,如果我们把二阶差分组合表达式中的 Delta f_x 都替换成 mathrm{d}f_x,那么二阶差分项就没啦

换言之,如果非线性余项 o(h) 消失,则二阶差分项也跟随消失,两者密切相关,由此确认了我们之前用二阶差分来分析余项的思路是可行滴

让我们把余项显式地写出来,记作 r_x(h)

Delta f_x(h) = mathrm{d}f_x(h)  + r_x(h)

代入二阶差分组合表达式,得到完全由余项构成的二阶差分形式:

Delta^2 f_x (h_1,h_2) = r_x(h_1+h_2) - (r_x(h_1)+r_x(h_2))

可以想到,如果余项具有平方项的形式,比如说 r_x(h) = h^2 ,那么上式的右侧就等于 2h_1h_2 ,这是一个关于增量 h_1, h_2 的二重线性函数:这东西非常简单,基本上可以看作是两个一元线性函数的乘积,处理起来 so easy~~

一般的余项自然不会刚好是个平方项,二阶差分自然也不会刚好就是个二重线性函数;但就像我们之前可以试著拿线性函数去拟合一阶差分,假如我们运气好,这个余项虽不是平方项但也差不离了,那我们也可以拿某个二重线性函数去拟合这个二阶差分,换言之:

Delta^2 f_x (h_1,h_2) = mathrm{d}^2f_x(h_1,h_2) + o(h_1h_2)

这里记号 o(h_1h_2) 如前,也是指代一个相对 h_1h_2 的高阶小量,即 lim_{(h_1,h_2) 	o 0} frac{o(h_1h_2)}{h_1h_2} = 0

记号 mathrm{d}^2f_x(h_1,h_2) 是个关于自变数 h_1, h_2 的二重线性函数;我们这里只讨论自变数仅限于一维欧氏空间 mathbb {R} 上的简单情形,因此 mathrm{d}^2f_x(h_1,h_2) 一定可以写成某个常数乘以 h_1h_2 的形式;另外前面我们讲过二阶差分 Delta^2 f_x 关于两个自变数是对称的,可以推断 mathrm{d}^2f_x 一定也是对称的,亦即:

mathrm{d}^2 f_x (h_1,h_2) = mathrm{d}^2 f_x (h_2,h_1)

所有二重线性函数自然地也构成了一个线性空间,这个线性空间记作 mathfrak{L} (mathbb{R}, mathbb{R};mathbb{R}) (这里站在分号前有两个 mathbb {R} ,因为有两个自变数)

相应地,我们就迎来了一个新映射:

 mathrm{d}^2f : x mapsto mathrm{d}^2f_x

这里自变数是实数 x in mathbb{R},因变数是二重线性函数 mathrm{d}^2f_x in mathfrak{L}(mathbb{R},mathbb{R};mathbb{R})

继续划重点啦:

函数 mathrm{d}^2ffmathrm{d}f 又不一样,这是个从 mathbb {R}mathfrak{L} (mathbb{R},mathbb{R};mathbb{R}) 的映射,函数值是个二元函数 mathrm{d}^2f_x in mathfrak{L}(mathbb{R},mathbb{R};mathbb{R}),称为 f 在 x 处的二阶微分


我们现在来算个微分的具体实例,并借此说明记号 mathrm{d}x 以及 mathrm{d}^2x 的确切含义

考虑最简单的 mathbb {R}mathbb {R} 的恒等映射:

I: x mapsto y = x

那么 I 在任意 x 处的一阶差分则是:

Delta I_x : h mapsto I(x+h) - I(x) = (x+h)-x = h

也就是说 Delta I_x 同样是 mathbb {R}mathbb {R} 的恒等映射,因此有 Delta I_x = I

套用前面对微分的定义,注意到 I 本身就是线性函数,那么不难知道恒等映射在任意 x 处的微分都等于自身:

mathrm{d}I_x = Delta I_x = I

我们习惯于用 y=f(x) 来表示映射,也因此习惯地把 f 的微分用 y 来标记,亦即 mathrm{d}y equiv mathrm{d}f_x

(这个习惯其实不太好,因为 y=f(x) 里的 y 是一个数,而 mathrm{d}y 里的 y 其实是指函数 f ,不仔细的话容易弄混,而且缺少下标来指明是在何处的微分)

对于恒等映射,因为因变数 y 就等于自变数 x ,在这种标记习惯下我们就有了:

mathrm{d}x = mathrm{d}y = mathrm{d}I_x = I

(同样需要注意记号 mathrm{d}x 里的 x 并不是指代某个特定的数,而是指恒等映射;mathrm{d}x 同样并不是指代某个特定的数,而是指恒等映射在某处的微分——这个微分正好也是恒等映射)

由此,当我们说函数 y = f(x) 的微分是 mathrm{d}y = f(x) mathrm{d}x 时,其确切含义是指在 x 处给定的如下线性函数:

mathrm{d}f_x : h mapsto (f(x) mathrm{d}x)(h) = f(x) (mathrm{d}x(h)) = f(x) I(h) = f(x)h

(一些教材因此也经常把记号 mathrm{d}x 同增量 h 等同起来,这个就非常容易混淆了,也是招致各种误解的来源)

现在我们已经说清了记号 mathrm{d}x 的含义:恒等映射在某处的微分——也就是恒等映射自己


那么 mathrm{d}^2x 是啥含义呢?

它应该被理解为 mathrm{d}(C(x)mathrm{d}x) ,其中 C(x) = 1 是常函数

有人大概要问了:你干嘛这么多此一举的写个 C(x) 来又让它等于1,直接写 mathrm{d}(mathrm{d}x) 不好么?

(留个尾巴,下回再写,叉会儿腰~~


谢邀。

第一个小问,

frac{d^2}{dx^2}二阶微分运算元,它把 R 映射到R线性空间 mathscr{F}(R,R) 上,

这个空间的元素是域 R 上的线性函数

d^2 其实是你理解的不完整,不能拆开看,应该是 d^2xd^2y

微积分中类似的残疾概念很多,比如极值与最值,微分与导数,定积分与不定积分,、

第一类换元积分法与第二类换元积分法。

实际上不应该分开的。为什么分开了?

因为第一代,第二代中国数学教育家们制定微积分知识点大纲的时候,

为了方便初学者学习而拆开的。

第二个小问,需要知道微分的概念。

微分/切映射: df_x:Delta x
ightarrow df(x)

因为 d^2y
e dy^2 ,所以 frac{d^2}{dx^2}y
efrac{d^2}{dx^2}y

详细一点: d^2y=d(dy)=d(f(x)dx)=(f(x)dx)dx

=(f(x)dx+f(x)(dx))dx

=f(x)(dx)^2=f(x)d^2x

dy^2=(y^2)dx=(2y)dx

d^2y
e dy^2

因为 dx^2=d^2x ,所以 frac{d^2}{d^2x}=frac{d^2}{dx^2}

直观地说,

数学上,微分描述的是空间上的线性变化过程,

0阶微分描述1维空间上的线性变化过程,就是函数本身,

1阶微分描述2维空间上的线性变化过程,1维空间上曲线的单调性,

2阶微分描述3维空间上的线性变化过程,2维空间上曲线的凹凸性,

阶数 >2 的微分是高阶微分,

n阶微分描述n+1维空间上的线性变化过程。

物理上,时间作为1个特殊维的空间,

用1阶微分运算元 frac{d}{dt} 描述1维空间上线性运动的变化过程/速度。

用2阶微分运算元 frac{d^2}{d^2t} 描述2维空间上线性运动的变化过程/加速度。

cdots

同理,高阶无限小量在高维空间上的任意一组对偶的对象上是线性的,

可以用高阶微分代替。

如果你要问,为什么要这么写?

有些人会说习惯啊,规定啊,约定啊这种直觉理由,

但作为一个初学者,这种直觉的说法并不能解释这种写法的动机,理解起来很难受。

实际上,它可能是用分母上的形式表象二阶微分的完整性,

用分子上的形式表象二阶微分的分割性。

所以分母上不用 dx^2 ,而分子上必须用 d^2y


d2y是二阶微分 dx2是两个一阶微分的积


不邀自来(??????) ?

大一的时候咱也和题主一样傻傻分不清,后来发现其实挺容易区分的(?&> &)

简单来说:

d2x指x的二阶微分,即d(dx)

d(x2)是x2的微分,即2xdx

(dx)2是x微分的平方,也记为dx2

记住以上就很简单啦(′▽`)ノ?

至于d2y/dx2,题主就不要管那么多啦,直接看成对y=f(x)的二阶微分就成~


推荐阅读:
查看原文 >>
相关文章