|
战巡
发表于 2024-2-6 13:00
作为统计学家,说几个点
1、
画个散点图,你这的数据明显就不是线性的,也不是分段线性的,明摆着就是一个曲线,线性拟合本身就是错误的
至于该用什么模型拟合,我不知道,你可以尝试用多项式,比如$\hat{y}=b_0+b_1x+b_2x^2+b_3x^3$,至于能到多少次你就都试试吧,肯定是越高越准确,但也要小心过拟合的问题
也可以试试指数类的模型,或者对其中一项做变换,比如取对数之类的
2、
行业内幕你不知道的话其实是很难办的,你这里只有访客数一个数据,但它后台计算这个指数的时候很可能不止用到这一个数据,如果你没有其他数据,那这些只能当做模型误差来处理,显然是不准确的
3、
我们上课的时候教授一再强调:回归线外延,是无法保证准确性的
简单的说,就是把回归线直接延伸到数据范围以外,这种预测是没有任何保障可言的,比如你的数据里$x\in (0,450W)$,那么你做完的模型对于$(0,450W)$里面的任何一个点,都有把握进行预测,但对于$x<0$或$x>450W$,则毫无保障,随时可能翻车
重点:不管是什么样的模型,都会出现上述情况! |
|