对于一个任意的计数过程,我们记时间区间 [t_1, t_2], t_2 ge t_1 ge 0 内事件发生次数为 n 的概率为 p([t_1, t_2]_{n}) . 假设事件发生过程是一个时间平稳独立增量过程,也就是满足以下条件:

1. p([t_1, t_2]_{n}) = f_{n}(t_2 - t_1) ,意味著在时间区间 [t_1, t_2], t_2 ge t_1 ge 0 内事件发生 n 次的概率只依赖于发生次数 n 和时间段的长度 t_2 - t_1 .

2. p([0, t]_{n}, [t, t+s]_{m}) = p([0, t]_{n})p([t, t+s]_m), t, s ge 0, m, n ge 0 ,意味著不重合的时间段内事件发生次数是相互独立的。

为了得到时间区间 [0, t] 内事件发生 n 次的概率,我先把时间区间 [0, t] 切割为 N 段,每个时间段长度为 Delta t = frac{t}{N} . 然后做如下操作:

  1. 随机选择一个指标 i = {1, 2, ...., N-1} ,将区间 [0, t] 切割为两部分 [0, iDelta t], [iDelta t, t] ,这个事件发生的概率为 p = frac{1}{N-1} approx frac{Delta t}{t}
  2. 要求区间 [0, iDelta t] 内事件发生 k 次,区间 [iDelta, t] 内事件发生 n - k 次。这个事件发生的概率为 p = p([0, iDelta t]_{k})p([iDelta t, t]_{n - k})
  3. 遍历所有可能的 i, k

给定 i, k ,我们就得到一个复合事件,记作 U^{k}_{i} = [0, iDelta t]_{k}cap[iDelta t, t]_{n - k}cap{指标选择在i } . 复合事件中每一个事件都独立,所以有

p(U^{k}_{i}) = p( [0, iDelta t]_{k}) p([iDelta t, t]_{n - k}) p(i)

对于不同的 i, k ,该复合事件互斥,因为你一旦将切割点选择在 i ,你就不可能把它选择在 j 
e i 处。所以我们有

egin{align} p([0, t]_{n}) = sum_{i = 1}^{N-1}sum_{k =  0}^{n}p([0, iDelta t]_{k})p([iDelta t, t]_{n - k})frac{1}{N-1} \  approx sum_{i = 1}^{N-1}sum_{k =  0}^{n}p([0, iDelta t]_{k})p([iDelta t, t]_{n - k})frac{Delta t}{t} end{align}

N
ightarrowinfty 时,上面的方程变为

f_{n}(t) =frac{1}{t} sum_{k = 0}^{n}int_{0}^{t} f_{k}(	au)f_{n - k}(t - 	au) d	au, nge 0

做拉普拉斯变换得到

-frac{d}{dp}hat{f}_{n}(p)  = sum_{k = 0}^{n} hat{f}_{n - k}(p) hat{f}_{k}(p)

求解这个方程即可。如果假设初始条件 hat{f}_{n}(0) = frac{1}{lambda}, lambda > 0, n ge 0 ,那么可以解得 hat{f}_{n}(p) = frac{lambda^n}{(p + lambda)^{n+1}} . 求逆变换得到 f_{n}(t) = frac{(lambda t)^n e^{-lambda t}}{n!} . 这正是泊松分布。


我们来看一下正确的步骤应该是怎样子的,题目中两个条件是正确的,但接下来不对

我们根据这两个条件,实际上可以得到两个不一样的式子:

p([0,t]_n) = sum_{k=0}^{n} p([0,s]_k)p([s,t]_{n-k})

这个式子里的s是固定的,固定找一个点将区间分开,然后分别考虑两个区间上的出现次数,再求和。

第二种是让s恰好是「最后一次事件发生的时间点」,这个就比较有技巧了,得到的式子是这样的:

p([0,t]_n) = int_0^t p([0,s]_{n-1})frac{partial p([s,t]_0)}{partial s}{
m d}s

只对n &>= 1的情况生效。这个式子看来是需要进一步解释一下的,对于任意的s,我们考虑 [s, s + Delta_s] 的一个小区间,则最后一次事件恰好落入这个区间的概率,可以表示为:

(1 - p([s,s+Delta s]_0))p([s+Delta s, t]_0)

能看明白这个式子吗?它代表 [s, s+Delta s]至少有一次事件发生(注意不要误用为恰好有一次,最后一次落在区间内,不代表倒数第二次、倒数第三次不在区间内),且右端点之后没有事件发生。展开然后运用独立增量的条件可以得到

(1 - p([s,s+Delta s]_0))p([s+Delta s, t]_0)

= p([s+Delta s, t]_0) - p([s,s+Delta s]_0)p([s+Delta s, t]_0)

= p([s+Delta s, t]_0) - p([s,t]_0)

如果把区间划小,这里的差分就可以用偏微分来代替。进一步用时不变的条件,就可以改写为:

f_n(t) = int_0^t f_{n-1}(s)frac{partial f_0(t-s)}{partial s}{
m d}s

= -int_0^t f_{n-1}(s)f_0(t-s){
m d}s

因为是一元函数,所以偏微分可以改用导数表示。

题目中列出的两个式子都是不对的,把两个关系混了起来,然后随便凑了一下量纲,能得到最后的结果,完全是因为泊松过程中 f_0 的特殊性,它的导数和自身只差一个常系数。

下面就是愉快的推导时间了,将第一个式子代入s = t = 0,得到

f_n(0) = sum_{k=0}^{n} f_k(0)f_{n-k}(0)

n = 0时有 f_0(0) = f_0^2(0)f_0(0) = 0f_0(0) = 1 ,其中 f_0(0) = 0 时不难得到任意 f_n(0) = 0 ,这与概率的定义矛盾(应有 sum_0^{+infty} f_n(0) = 1 ),因此 f_0(0) = 1 ,根据概率定义一定有 f_n(0) = 0 (n > 0)

我们再重新将第一个式子代入n=0,得到

p([0,t]_0) = p([0,s]_0)p([s,t]_0)

f_0(t) = f_0(s) f_0(t-s)

因为概率总在0和1之间,因此很容易得到 f_0 是单调不增的,如果存在一个 f_0(t) = 0(t>0) ,则容易得到 f_0(frac{t}{2^k}) = 0 ,再结合单调性得到 f_0(t) = 0 (t > 0) ,可以进一步推出 f_n(t) = 0 ,与概率定义矛盾。因此应当有 f_0(t) > 0

这样对前式取对数之后是个柯西方程,再根据f0对数的单调性,可以知道它的解一定是正比例函数,因此有

ln f_0(t) = -lambda t

f_0(t) = e^{-lambda t}

再代入前面的积分关系式,得到

f_n(t) = -int_0^t f_{n-1}(s)f_0(t-s){
m d}s

= lambda int_0^t f_{n-1}(s) e^{-lambda(t-s)}{
m d}s

接下来就不难用数学归纳法得到具体形式了,我们先推导一下f1作为例子:

f_1(t) = lambda int_0^t e^{-lambda s} e^{-lambda(t-s)}{
m d}s

= lambda t e^{-lambda t}

剩下的只要用数学归纳法就可以了

注意:我们在推出积分关系式时没有证明 f_0 是可导的,这里步骤不严谨,但只需要将它调整到解柯西方程之后就严谨了,按照这个顺序书写只是为了叙述方便。另外,积分关系式的推导中还隐含用到了 f_n(Delta s) (n > 1)f_1(Delta s) 的高阶无穷小这一未证明的结论,严格来说也是需要补充证明的,留作思考题。


我们来补充一下,如果只用第一个关系式的话,能否推导出整个形式呢?

先改写一下形式:

f_n(t+s) = sum_{k=0}^{n} f_k(t)f_{n-k}(s)

f0的情况我们前面处理了,我们先看一下f1:

f_1(t+s) = f_0(t)f_1(s) + f_1(t)f_0(s)

先代入一个特殊值s=t,有

f_1(2t) = 2f_0(t)f_1(t)

因为我们没有假定f任意的特征,所以这里我们必须要先想办法证明f1的特征(连续,可导等),否则会难以使用我们常用的工具;当然如果你满足于工程数学的严谨性(i.e.完全没有严谨性),这一步可以跳过。

我们已经知道 f_0(t) = e^{-lambda t} ,则一定存在 t_0 > 0 ,使得 f_0(t_0) > frac{2}{3} 。这样对于任意 0 < t < t_0 ,有 f_1(t) = 2f_0(frac{t}{2})f_1(frac{t}{2}) ge frac{4}{3} f_1(frac{t}{2})

f_1(frac{t}{2}) le frac{3}{4} f_1(t)

进一步有

f_1(frac{t}{2^k}) le left(frac{3}{4}
ight)^kf_1(t) le left(frac{3}{4}
ight)^k

区间每次缩小,区间内的函数值得上限也跟著按比例缩小,用极限的epsilon-delta定义很容易验证得到

lim_{t
ightarrow 0^+} f_1(t) = 0 = f_1(0)

接下来,由于

f_1(t+s) = f_1(t) f_0(s) + f_0(t)f_1(s)

对s两边同时取极限得到

lim_{s
ightarrow 0+}f_1(t+s) = f_1(t)left(lim_{s
ightarrow 0+}f_0(s)
ight) + f_0(t)left(lim_{s
ightarrow 0+}f_1(s)
ight) = f_1(t)

lim_{s
ightarrow t^+}f_1(s)  = f_1(t)

反过来用 f_1(t) = f_1(t-s)f_0(s) + f_0(t-s)f_1(s)

变形得到

f_1(t-s) = frac{f_1(t) - f_0(t-s)f_1(s)}{f_0(s)}

对s取极限得到

lim_{s
ightarrow 0^+}f_1(t-s) = f_1(t)

合起来有

lim_{s
ightarrow t}f_1(s)  = f_1(t)

即f1连续

然后变形一下最初的表达式:

frac{f_1(t+s) - f_1(t)f_0(s)}{f_1(s)} = f_0(t)

frac{frac{f_1(t+s)}{f_0(s)f_0(t)} - frac{f_1(t)}{f_0(t)}}{frac{f_1(s)}{f_0(s)}} = 1

又有 f_0(s)f_0(t) = f_0(s+t) ,因此令 g(t) = frac{f_1(t)}{f_0(t)} ,则有

g(s+t) = g(t) + g(s)

又一次出现柯西方程,根据g的连续性,得到g(t)是正比例函数,即

frac{f_1(t)}{f_0(t)} = mu t

具体解出 mu 必须使用 sum_{k=0}^{+infty} f_k(t) = 1 的归一化条件,方法是用前面的递推式证明 lim_{t
ightarrow0+} frac{f_{k+1}(t)}{f_k(t)} = 0 ,代入归一化条件之后求极限,具体步骤可以自己推一下。剩下的阶数也可以用类似的方法,注意到每一阶都跟f1一样只有两个不确定的项,其他都已经是确定的表达式,只要运用数学归纳法就可以了。


自己回答一下自己问的问题。我已经按照题目描述的思路完成了泊松过程的推导,详情见文章:

李恩志:路径积分法推导泊松过程?

zhuanlan.zhihu.com图标

求和的式子不对,每个求和项不是互斥的。

后面dt/t似乎多余了


推荐阅读:
相关文章