|
楼主 |
战巡
发表于 2018-6-13 17:38
2、 2017全国卷I文科19
第一眼看到的公式就特喵不对,都吐槽了多少年了,样本方差公式下面是$n-1$,不是$n$,有无偏估计为毛要用有偏估计,你们吃饱了撑着是吧?
\[s=\sqrt{\frac{1}{16-1}\sum_{i=1}^{16}(x_i-\bar{x})^2}\]
这个地方再特喵搞错你们就等着大学概统挂科吧!
然后再继续看题目,第一问,求相关系数,我可以姑且勉强当你是对的,毕竟抽样次序不是一个连续变量,只是个数字而已,这里用皮尔逊相关并不好,更推荐的是Kendall $\tau$统计量,但我可以不纠结这个问题。
然而后面问题特喵就大发了,什么叫“是否可以认为零件尺寸不随生产过程的进行系统的变大或变小”?你是想比较是否无关是吧?
那好,我问你两个问题,第一,相关系数为0是否意味着无关?!我随便举个栗子,数据(-1,1),(0,0),(1,1),你算下来皮尔逊相关就为0,但它却存在这严格的$y=x^2$这样一个关系,你说它是不是无关?
退一万步讲,即便你是要考察相关系数是否为0好了,那第二个问题,请问高中生做得出来么?!你出题的是不是二逼的以为直接比较相关系数和0就算完事了?那我告诉你,最后算出来相关系数如下
你来告诉我,这样的相关系数算大还是算小?你来告诉我接下来怎么下结论?!
你说这样的相关系数接近0么?-0.177看起来的确不大,但我告诉你很多算下来显著的相关系数就这么大,你怎么解释?
那到底要如何下这个结论?还是那句话,统计学家不是特喵看个数比个大小就能下结论拉倒的,必!须!做!检!验!皮尔逊相关有相应的检验方法,那就是用Fisher变换,令样本相关系数为r,变换后的统计量有
\[Z=arctanh(r)=\frac{1}{2}\ln(\frac{1+r}{1-r})\sim N(0, \frac{1}{n-3})\]
这个的证明我不写了,很明显是超出高中范围的东西,这里带进去有
$Z=-0.1793$
还在方差为$\frac{1}{13}$的情况下,还达不到显著,因此认为相关系数为0。
但如果我样本量足够大呢?比如样本量200,最后算下来就是显著的,那你就得说这两个东西有关!
所以综上,你们觉得高中生做得出来么?!你不是逗人玩么?! |
|