|
战巡
Posted at 2025-3-25 19:14:03
如果不知道这个结果,还真不好做
但知道这个结果,其实可以看出它和泊松过程的相关性
这里明显可以看到它用到了这样一个公式:对任意$X\ge 0$的随机变量,均有
\[E(X)=\int_0^{+\infty}(1-F_X(x))dx\]
其中$F_X(x)$为$X$的CDF
(别问我这个怎么证明,这是概率论的基础题...)
此处我们引入新变量:时间$t$,假设你平均每单位时间$t$内,进行一次抽样,并且可以认为你抽样数量,服从泊松分布,即在单位时间$t$内,你抽样的数量$X(t)\sim POI(t)$,概率为
\[P(X(t)=k)=\frac{t^k}{k!}e^{-t}\]
则你抽到第$i$种样本的数量$X_i(t)\sim POI(p_it)$
这就是个典型的泊松过程,而泊松过程和指数分布是有关联的:如果在时刻$t_1$有$X_i(t_1)=0$,而时刻$t_2$有$X_i(t_2)=1$,则其时间间隔$t_2-t_1$满足
\[t_2-t_1\sim EXP(p_i)\]
由于一开始就有$X_i(0)=0$,这就显示,第$i$种样本首次出现的时间$t_i$,服从
\[t_i\sim EXP(p_i)\]
注意,第$i$种样本啥时候出现和第$j$种样本啥时候出现,是独立的,毕竟对任意$i$而言,其他样本有没有出现对第$i$个有没有出现没有影响,每次抽样都是独立的
这就表示$t_i$也是相互独立的,现在我们要求所有样本全部出现过所需的时间,也就是求$T=\max\{t_1,t_2,...,t_n\}$的分布
则有
\[P(T\le t)=P(t_1\le t)P(t_2\le t)...P(t_n\le t)\]
即$CDF$:
\[F_T(t)=F_{t_1}(t)F_{t_2}(t)...F_{t_n}(t)\]
注意$t_i\sim EXP(p_i)$,就有
\[F_{t_i}(t)=1-e^{-p_it}\]
即
\[F_T(t)=\prod_{i=1}^n(1-e^{-p_it})\]
\[E(T)=\int_0^{+\infty}(1-F_T(t))dt=\int_0^{+\infty}\left(1-\prod_{i=1}^n(1-e^{-p_it})\right)dt\]
最后,我们知道$X(t)\sim POI(t)$,即
\[X|T\sim POI(T)\]
\[E(X|T)=T\]
故此
\[E(X)=E[E(X|T)]=E(T)=\int_0^{+\infty}\left(1-\prod_{i=1}^n(1-e^{-p_it})\right)dt\]
|
|