|
O-17
发表于 2023-6-10 10:41
事实上有分组数据方差公式
$$
s^2=p_x\cdot s_x^2+p_y\cdot s_y^2+p_xp_y\cdot(\overline{x}-\overline{y})^2
$$
其中 $\overline{x},\overline{y}$ 是平均数, $s_x^2,s_y^2$ 是方差, $p_x,p_y$ 是两组数据的权重 (即数据个数, 例如 $x$ 有 2 个数据, $y$ 有 3 个数据, 那 $x$ 的权重就是 2/5 , $y$ 的权重就是 3/5 )
可以尝试自己证明上式.
(下面写不下去了...)
那么这里把 $x_1,x_6$ 视作第一组数据 $A$ , 把 $x_2,x_3,x_4,x_5$ 视作第二组数据 $B$, 它们合并视为第三组数据 $C$ , 有
$$
s_C^2=\frac13s_A^2+\frac23s_B^2+\frac29(\overline{x}-\overline{y})^2
$$
现在欲比较 $s_B$ 与 $s_C$
$$
s_C^2-s_B^2=\frac13(s_A^2-s_B^2)+\frac29(\overline{A}-\overline{B})^2
$$
而
\begin{align*}
s_A^2&=\frac12\left(x_1-\frac{x_1+x_6}2\right)^2+\frac12\left(x_6-\frac{x_1+x_6}2\right)^2
\\&=\frac{x_1^2+x_6^2}{2}-\left(\frac{x_1+x_6}2\right)^2\\s_B^2&=\frac14\sum_{i=2}^{5}{\left(x_i-\frac{x_2+x_3+x_4+x_5}4\right)^2}
\\&=
\frac{x_2^2+x_3^2+x_4^2+x_5^2}{4}-\left(\frac{x_2+x_3+x_4+x_5}{4}\right)^2\\
s_A^2-s_B^2&=\frac{2x_1^2+2x_6^2-x_2^2-x_3^2-x_4^2-x_5^2}{4}+\left(\frac{x_2+x_3+x_4+x_5}{4}\right)^2-\left(\frac{x_1+x_6}2\right)^2
\\&=\frac18\sum_{i=2}^{5}(x_1-x_i)(x_1+x_i)+\frac18\sum_{i=2}^{5}(x_6-x_i)(x_6+x_i)+\left(\frac{x_2+x_3+x_4+x_5}{4}\right)^2-\left(\frac{x_1+x_6}2\right)^2
\end{align*}
不会写了...我代数一拖四, $x_1\leqslant x_2,x_3,x_4,x_5\leqslant x_6$ 这个条件不会用.
感觉可以推广:
样本数据 $x_1,x_2,\ldots,x_n$ , 其中 $x_1\leqslant x_2\leqslant \cdots\leqslant x_n$ , 则 $x_1,x_2,\ldots,x_n$ 的方差大于等于 $x_p,x_{p+1},\ldots,x_q~(1\leqslant p\leqslant q\leqslant n)$ 的方差.
还是可以先用我的方法 (前半部分感觉还是有点用的) 转化成比较 $x_1,x_2,\ldots,x_{p-1},x_{q+1},\ldots,x_n$ 的方差与 $x_p,x_{p+1},\ldots,x_q$ 的方差. |
|