|
战巡
Posted 2019-5-30 01:38
回复 1# cheng
很困难的对吧?因为从一开始就是错的!
你不懂就算了,看来你们的所谓领导也不懂,简直蛮干!
线性回归的要求是什么?自变量因变量都得是连续变量,而且等间隔,啥意思?就是你1和2,2和3,3和4之间的差距得相等,你这里等么?
0到1,差2000,1到2,只差1500,越后面越乱
何况你的标签不是个连续变量,是个分类变量
看到分类变量最自然的想法是什么?线性回归么?别逗了,是逻辑回归(Logistic regression)
逻辑回归得出来的结果是某一个自变量情况下因变量被归入任意给定类的概率,一般选概率最大的那个为预测值,因此最后的预测值就是分类本身,而不会给出浮点数这么搞笑的东西
当然你这里标签还是个顺序分类变量,需要用顺序逻辑回归
具体的我懒得讲,太多,给你本书好了,在附件里,好好读5、6、7三章,尤其第7章,你需要的东西在那里
[Alan_Agresti(auth.)]_Categorical_Data_Analysis,_S(b-ok.xyz).part1.rar
(900 KB, Downloads: 2271)
[Alan_Agresti(auth.)]_Categorical_Data_Analysis,_S(b-ok.xyz).part2.rar
(900 KB, Downloads: 2384)
[Alan_Agresti(auth.)]_Categorical_Data_Analysis,_S(b-ok.xyz).part3.rar
(900 KB, Downloads: 2334)
[Alan_Agresti(auth.)]_Categorical_Data_Analysis,_S(b-ok.xyz).part4.rar
(900 KB, Downloads: 2247)
[Alan_Agresti(auth.)]_Categorical_Data_Analysis,_S(b-ok.xyz).part5.rar
(15.34 KB, Downloads: 2079)
|
|