ADVERTISEMENT
返回
  • 浏览过的版块

1
ADVERTISEMENT
Huaren
等级大校
威望7
贴子6153
魅力6301
注册时间2014-12-01

xiaomaomiaomiao

查看全部

对数据分析/Data Science有兴趣的mm,帮我看看这个案例吧

2372

4

2016-05-27 02:35:46

对于1)你说的scale实际指units单位不同的情况,先normalize一下啊。至于用哪种normalization,得先看看你的每一个indicator的分布情况(这个可以画histogram图简单看看),比如是Gaussian的还是Poissonian的还是无章法的等等,都有相对应的方法。btw,我对涉及生活的数据分析没啥兴趣,只是针对楼主的提问瞎说两句。
Huaren
等级大校
威望7
贴子6153
魅力6301
注册时间2014-12-01

xiaomaomiaomiao

查看全部

2016-05-27 03:24:21

回复 [url=http://forums.huaren.us/showtopic.aspx?topicid=2019764&postid=71788336#71788336]2楼xiaomaomiaomiao的帖子[/url]


有按比例normalize到0-1之间,最大数变成1。还有啥normalize方法? 另外就是weight比较麻烦, 太主观

callmemissmaybe 发表于 5/27/2016 3:07:45 AM [url=http://forums.huaren.us/showtopic.aspx?topicid=2019764&postid=71788430#71788430]

[/url]

我刚才举了几个例子的。比如高斯分布,normalize之后最大数不是1而是看具体在几个sigma. Normalize要根据每个变量的不同分布来选择方法。举例,如果某个或某些变量是高斯分布却按比例去normalize对最后的打分很可能有比较大的影响。

Weight根据已有的信息我就没办法了,但是如果你有以往的数据,也许可以试着做machine learning. 当然首先要看你们看重的是什么。比如说你们最看重partners给你们带来的经济效益,那么效益高的打分应该也高,可以去regression analyse一下这些变量与效益的关系来寻找更合理的weights,至少可以以此为参考调整原先的weights. 这个有待讨论。
初始化编辑器...

到底了