找回密码
 快速注册
搜索
查看: 89|回复: 3

[函数] 关于电商平台指数换算求教

[复制链接]

1

主题

2

回帖

17

积分

积分
17

显示全部楼层

guandide 发表于 2024-2-5 15:39 |阅读模式
电商平台有一个访客数,现在只能自己看自己的真实访客数,但是在看其他品牌的访客数的时候行业会通过一个指数换算加密 进行了一个换算,  我们现在尝试通过EXCEL里的截距斜率 能够保证数据准确性在90%以上  但是指数在不同范围的截距和斜率 不一样 比如     
访客指数区间        访客数换算
100以下        =0.04448*访客指数+0.07869
100-5W        =0.01498*访客指数+5.7548
5W-450W        =0.01593*访客指数-84.1655
这些事基于我们已经知道的精准访客数对应访客指数换算出来的  但是超过450W的因为没有精准数据没法换算 想问下出现这种问题应该采用哪种方法进行求解更精准一些

1

主题

2

回帖

17

积分

积分
17

显示全部楼层

 楼主| guandide 发表于 2024-2-5 15:42
数据源参考
本店访客指数        本店访客数
4425334        72820
3871467        62973
3436848        55348
3210078        51408
3196271        51169
2856887        45328
2250733        35070
1255334        18816
1216935        18207
1165708        17397
1118367        16651
1075074        15971
947111        13974
939574        13857
920162        13556
873343        12832
806733        11807
741687        10812
734603        10704
730730        10645
710361        10335
634164        9181
633302        9168
572038        8247
568633        8196
547975        7887
526530        7567
514106        7382
513703        7376
450827        6885
441933        6743
404774        6152
391955        5949
384617        5833
383541        5816
381705        5787
370103        5604
365594        5533
323374        4871
319530        4811
312603        4703
304124        4571
301809        4535
301680        4533
290990        4367
289184        4339
287829        4318
264479        3957
252725        3776
244263        3646
240547        3589
224931        3350
217527        3237
216871        3227
206296        3066
203532        3024
199515        2963
191204        2837
184131        2730
175718        2603
174856        2590
162029        2397
157632        2331
138644        2047
128974        1903
119206        1758
118599        1749
112046        1652
111505        1644
103784        1530
103717        1529
97471        1437
95839        1413
94003        1386
92301        1361
87873        1296
87600        1292
82959        1224
79337        1171
70434        1041
67757        1002
66315        981
62604        927
61916        917
61022        904
57304        850
53858        800
49856        742
46196        689
45781        683
43708        653
43639        652
42878        641
39282        589
38105        572
37137        558
36998        556
36375        547
35268        531
33953        512
33261        502
32568        492
31530        477
30561        463
29108        442
28554        434
28347        431
27724        422
25787        394
25372        388
25165        385
23713        364
23368        359
22056        340
20400        316
18058        282
17921        280
16821        264
16203        255
15175        240
14901        236
14422        229
14217        226
13943        222
13397        214
12034        194
11083        180
10136        166
9798        161
8923        148
7985        134
7651        129
7451        126
7318        124
7252        123
7185        122
6920        118
6259        108
6193        107
6061        105
5733        100
5341        94
5080        90
4821        86
4369        79
4305        78
4177        76
4049        74
3730        69
3477        65
3351        63
2975        57
2913        56
2789        54
2604        51
2482        49
2421        48
2360        47
2238        45
2058        42
1998        41
1938        40
1761        37
1702        36
1585        34
1469        32
1355        30
1298        29
1129        26
1074        25
1019        24
964        23
910        22
857        21
803        20
751        19
699        18
647        17
597        16
547        15
498        14
449        13
402        12
356        11
311        10
267        9
225        8
184        7
146        6
110        5
77        4
47        3
23        2
6        1

27

主题

1010

回帖

1万

积分

积分
12585

显示全部楼层

战巡 发表于 2024-2-6 13:00
作为统计学家,说几个点

1、
画个散点图,你这的数据明显就不是线性的,也不是分段线性的,明摆着就是一个曲线,线性拟合本身就是错误的
至于该用什么模型拟合,我不知道,你可以尝试用多项式,比如$\hat{y}=b_0+b_1x+b_2x^2+b_3x^3$,至于能到多少次你就都试试吧,肯定是越高越准确,但也要小心过拟合的问题
也可以试试指数类的模型,或者对其中一项做变换,比如取对数之类的


2、
行业内幕你不知道的话其实是很难办的,你这里只有访客数一个数据,但它后台计算这个指数的时候很可能不止用到这一个数据,如果你没有其他数据,那这些只能当做模型误差来处理,显然是不准确的

3、
我们上课的时候教授一再强调:回归线外延,是无法保证准确性的
简单的说,就是把回归线直接延伸到数据范围以外,这种预测是没有任何保障可言的,比如你的数据里$x\in (0,450W)$,那么你做完的模型对于$(0,450W)$里面的任何一个点,都有把握进行预测,但对于$x<0$或$x>450W$,则毫无保障,随时可能翻车
重点:不管是什么样的模型,都会出现上述情况!

1

主题

2

回帖

17

积分

积分
17

显示全部楼层

 楼主| guandide 发表于 2024-2-7 14:07
战巡 发表于 2024-2-6 13:00
作为统计学家,说几个点

1、

感谢指点,这个问题其实在天猫行业内是有一些专门做数据的公司实现了一键转化,转化准确度很高,基本上是100%准确的,但是近期平台管控这类第三方插件已经失效,通过指数大概能看清楚走势,但是没法精确分析,我再根据您的提示尝试下看看能不能找出里面的规律

手机版|悠闲数学娱乐论坛(第3版)

GMT+8, 2025-3-4 19:18

Powered by Discuz!

× 快速回复 返回顶部 返回列表