|
战巡
发表于 2022-10-19 11:40
本帖最后由 战巡 于 2022-10-19 11:54 编辑 正态分布的范围是全实数,你要是强行限定了范围是$[0,1]$,那就不是正态分布了,你之前的$\mu$和$\sigma$都没有意义了
如果你是用的$N(0,1)$生成一大堆随机数,然后踢掉$[0,1]$以外的数据,剩下的数据的分布,叫做“截断正态分布”(Truncated Normal),其均值本来就不是$0$,而是
\[\frac{\frac{1}{\sqrt{2\pi}}-\frac{1}{2\pi e}}{\Phi(1)-\frac{1}{2}}\approx0.45986\]
方差也不是$1$,而是
\[1-\frac{\frac{1}{\sqrt{2\pi e}}}{\Phi(1)-\frac{1}{2}}-\left(\frac{\frac{1}{\sqrt{2\pi}}-\frac{1}{\sqrt{2\pi e}}}{\Phi(1)-\frac{1}{2}}\right)^2\approx 0.079652\]
对于位于$x\in[a,b]$的截断正态分布而言,假设其原正态分布为$N(\mu,\sigma^2)$,则有该截断正态分布的密度函数为
\[f(x)=\frac{1}{\sigma}\frac{\phi(\frac{x-\mu}{\sigma})}{\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})}\]
其中
\[\phi(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}\]
即为标准正态分布的密度函数
\[\Phi(x)=\int_{-\infty}^x\phi(t)dt\]
即为标准正态分布的累积分布函数
有其均值为
\[E(X)=\mu+\frac{\phi(\frac{a-\mu}{\sigma})-\phi(\frac{b-\mu}{\sigma})}{\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})}\sigma\]
方差为
\[Var(X)=\sigma^2\left[1+\frac{\frac{a-\mu}{\sigma}\cdot\phi(\frac{a-\mu}{\sigma})-\frac{b-\mu}{\sigma}\cdot\phi(\frac{b-\mu}{\sigma})}{\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})}-\left(\frac{\phi(\frac{a-\mu}{\sigma})-\phi(\frac{b-\mu}{\sigma})}{\Phi(\frac{b-\mu}{\sigma})-\Phi(\frac{a-\mu}{\sigma})}\right)^2\right]\]
说实话我这里没完全理解你到底想用什么去估计什么,我建议你把问题写成完整的数学问题,或是把你的原版问题拿上来看看
反正我从没听说谁去用一个截断正态的数据去估计原版正态的,更没听说过谁家的随机数生成器在生成正态数据的时候还得限定区间,简直离大谱 |
|