|
楼主 |
战巡
发表于 2020-7-9 20:05
4、2020年全国卷I,文科17
这个第一问没啥好说的,第二问我却看到了出题的智障们似乎又打算让学生们干一种极其不负责任的混账事——只简单比较均值的大小就下结论...
这个问题特么想起来就来气!以往的高考统计题中我已经喷过好几次了,都是些啥玩意,谁告诉你们可以简单比较一下两个样本的均值大小就下结论说哪个样本所在的总体均值更大或更小的?
事情要都这么简单,我们学统计的早特么下岗了,还用混么?
说过无数次了,比较两个均值的大小,需要进行假!设!检!验!这是个有可能很复杂的过程,不是特么简单拿两个样本均值一减就完事的,不能这样下结论!
为什么不能?很简单的一个例子,比如说我要比较男性和女性的平均智商,收了随机抽取的男女各100人的数据,然后分别算个均值,假设是男性$101$,女性$100$,好,现在你直接拿两个样本均值相减,得到男性比女性智商高的结论。
结果你的结论发表后有人不爽,又重复了一次这个过程,又收一遍随机抽取的男女各100人的数据,这回变成女性$101$,男性$100$,于是乎这人得到的结论正好跟你相反。
那问题就来了,谁对啊?一个事实怎么可能有两种截然相反的结论呢?
看到问题所在了吧?你们的数据都是抽样得来的,抽样意味着随机性,你两个样本均值都是随机变量,当然有可能今天这个比那个大,明天那个比这个大,你要想得到一个可靠的结论,就必须想办法尽可能排除掉这种随机性带来的影响,着就是假设检验的过程。
当然由于随机性不可能完全被排除,因此也就有了假设检验中显著性系数(第一类错误率)$\alpha$的设定,只要这个$\alpha$控制在一个预定的可以接受的范围内,我们就承认结果的可靠性。
那这个问题应该怎么做呢?
我可以告诉你,这个问题看起来简单,其实挺复杂的,因为实际上我们是在做两个多项分布的均值比较,而这样的问题并没有一个统一的简单做法,我不得不采用比较通用的办法,比如似然比检验(Likelihood Ratio Test)。
首先我们要简化这个问题,按照题意,甲分厂做出一件$A,B,C,D$产品,分别收入$65,25,-5,-75$,而乙分厂分别收入$70,30,0,-70$,假设甲厂造出四种产品概率分别为$p_1,p_2,p_3,p_4$,乙为$q_1,q_2,q_3,q_4$,这里面$p_1+p_2+p_3+p_4=1=q_1+q_2+q_3+q_4$。
然后确定零假设:$H_0$:两分厂均值相等,也就是$65p_1+25p_2-5p_3-75p_4=70q_1+30q_2-70q_4=\frac{40\cdot 65+20\cdot 25-20\cdot 5-75\cdot 20+28\cdot 65+17\cdot 30-21\cdot 70}{200}=12.5$。
而另一边当然是$H_a$:两分厂均值不等。
接下来我们要分别在$H_0$和$H_a$成立的情况下,对$p_1$到$p_4$和$q_1$到$q_4$进行估计,这里用最大似然估计(MLE)好了。
首先在$H_0$的情况下,对甲分厂有
\[l(X)=\ln(n!)+x_1\ln(p_1)+x_2\ln(p_2)+x_3\ln(p_3)+x_4\ln(p_4)-\ln(x_1!x_2!x_3!x_4!)\]
带入数据变成
\[l(X)=\ln(100!)+40\ln(p_1)+20\ln(p_2)+20\ln(p_3)+20\ln(p_4)-\ln(40!20!20!20!)\]
这里要在$65p_1+25p_2-5p_3-75p_4=12.5, p_1+p_2+p_3+p_4=1$的限制条件下求这玩意的最大值,这个过程比较复杂,毕竟涉及拉格朗日乘数,而且解出来还是三次的,很不好看,我就略过求最大值的过程了,直接告诉你们结果,是:
\[\hat{p_1}=0.3821,\hat{p_2}=0.1978,\hat{p_3}=0.2032,\hat{p_4}=0.2169\]
\[l(X)=\ln(100!)+40\ln(0.3821)+20\ln(0.1978)+20\ln(0.2032)+20\ln(0.2169)-\ln(40!20!20!20!)=-6.91868\]
同理,对乙分厂,有
\[l(Y)=\ln(100!)+28\ln(q_1)+17\ln(q_2)+34\ln(q_3)+21\ln(q_4)-\ln(28!17!34!21!)\]
要在$70q_1+30q_2-70q_4=12.5$,$q_1+q_2+q_3+q_4=1$的条件下求上面的最大值,会得到
\[\hat{q_1}=0.2978,\hat{q_2}=0.1732,\hat{q_3}=0.3356,\hat{q_4}=0.1934\]
以及
\[l(Y)=\ln(100!)+28\ln(0.2978)+17\ln(0.1732)+34\ln(0.3356)+21\ln(0.1934)-\ln(28!17!34!21!)=-6.96527\]
由于两个分厂事件是独立的,会有总对数似然值
\[l(H_0)=l(X)+l(Y)=-13.8839\]
而在$H_a$下的似然值就很容易算了,此时
\[\hat{p_1}=0.4,\hat{p_2}=\hat{p_3}=\hat{p_4}=0.2\]
\[\hat{q_1}=0.28,\hat{q_2}=0.17,\hat{q_3}=0.34,\hat{q_4}=0.21\]
则有
\[l(X)=\ln(100!)+40\ln(0.4)+20\ln(0.2)+20\ln(0.2)+20\ln(0.2)-\ln(40!20!20!20!)=-6.80602\]
\[l(Y)=\ln(100!)+28\ln(0.28)+17\ln(0.17)+34\ln(0.34)+21\ln(0.21)-\ln(28!17!34!21!)=-6.83584\]
然后
\[l(H_a)=l(X)+l(Y)=-13.6419\]
最后计算卡方检验统计量:
\[\lambda=-2[l(H_0)-l(H_a)]=-2(-13.8839+13.6419)=0.484168\]
问题是,在$H_0$情况下,$\lambda\sim \chi^2(2)$,如果令$\alpha=0.05$,其临界值为$\chi^2_{0.95}(2)=5.99>>\lambda$!
因此,最后结论:不!显!著!
两个分厂没有统计意义上的显著区别!
为什么会出现这样的结果?其实从数据中是可以预期的,因为虽然甲均值为$15$,乙均值为$10$,看起来差距挺大的,但实际上由于$A,B,C,D$各组之间的收益差距非常大,导致这些均值估计量的方差奇大无比,会很大的受到样本随机性的影响。
举个例子,我就稍微调整一个数据,比如乙分厂,假设再做一次同样的试加工,我让它$A$变成$30$,而$D$变成$19$,其余不变,那马上你的均值估计就变成
\[\frac{30\cdot 90+17\cdot 30-19\cdot 70}{100}=12.8\]
而你们想想看,这两组样本数据的差异其实并不是很大,在一次试验中这个多一点,那个少一点,都是很有可能出现的事,但对均值的估计影响如此之大,如此之不稳定,你们还相信可以就这么简单比较均值大小然后得出的结论么? |
|