ADVERTISEMENT
返回
  • 浏览过的版块

1
ADVERTISEMENT
Huaren
等级三等兵
威望--
贴子138
魅力947
注册时间2015-01-16

callmemissmaybe

只看楼主

对数据分析/Data Science有兴趣的mm,帮我看看这个案例吧

2374

4

2016-05-27 02:09:47

LZ做数据分析多年,觉得用得很广的use case就是如何用多个KPI (key performance indicators)综合起来做绩效评估。数据分析很多时候是在做有效的ranking, 以此来对个体和总体做评估。我自己目前的解决办法感觉技术含量低一些,求针对此案例的有效数据分析方法来提高一下分析的技术水平,可以是数据模型或者是有效的数据图形,主要求思路和方法,有类似问题的书籍或案例链接也可以。

案例:Network里有几百个partners, 每个partner有自己的performance KPI, 比如TAT (turnaround time), error rate等等, 每个KPI的scale未必相同,有的是0-1百分比%,有的是以时间(days)计算,有的以美元计cost., 看各个business partners的performance, 打分排名,分出好中差,然后给各个等级提发展建议。

问题:
1) 怎么样才能建立一个简单有效的评估(打分)模型来衡量每个厂商的表现?以此来评估我们整个network是否健康。
2) 如何给各个partner提发展建议,知道每个的长处短处,制定每个的optimization strategy

对于1)我一般是给各个partners打一个综合score, 问题就是各个KPI的scale不同,有的0-1, 有的以时间计算。还有比较tricky的就是每个KPI在business里比重不同,于是在算最后综合score的时候需要乘以每个KPI的比重。综合score = KPI_1 weight * KPI_1 + KPI_2 weight * KPI_2.....问题就是weight也是非常的主观,完全就是通过问business stake holder个人感觉哪个最重要就给高weight.

对于2) 我一般就是算每个KPI 25%, 50%(median), 75%三个benchmark数值, 看看该partner的各项指标到底在全体partner中排在哪个区间,主要对落在50%甚至75%以后的
KPI进行建议其改进。

对于1)和 2)如何改进?如何提高分析的技术含量,我觉得自己的解决方案太浅显了。求mm们指点迷津!
Huaren
等级大校
威望7
贴子6153
魅力6301
注册时间2014-12-01

xiaomaomiaomiao

只看他

2016-05-27 02:35:46

对于1)你说的scale实际指units单位不同的情况,先normalize一下啊。至于用哪种normalization,得先看看你的每一个indicator的分布情况(这个可以画histogram图简单看看),比如是Gaussian的还是Poissonian的还是无章法的等等,都有相对应的方法。btw,我对涉及生活的数据分析没啥兴趣,只是针对楼主的提问瞎说两句。
Huaren
等级三等兵
威望--
贴子138
魅力947
注册时间2015-01-16

callmemissmaybe

只看楼主

2016-05-27 03:07:45

回复 [url=http://forums.huaren.us/showtopic.aspx?topicid=2019764&postid=71788336#71788336]2楼xiaomaomiaomiao的帖子[/url] 有按比例normalize到0-1之间,最大数变成1。还有啥normalize方法? 另外就是weight比较麻烦, 太主观
Huaren
等级大校
威望7
贴子6153
魅力6301
注册时间2014-12-01

xiaomaomiaomiao

只看他

2016-05-27 03:24:21

回复 [url=http://forums.huaren.us/showtopic.aspx?topicid=2019764&postid=71788336#71788336]2楼xiaomaomiaomiao的帖子[/url]


有按比例normalize到0-1之间,最大数变成1。还有啥normalize方法? 另外就是weight比较麻烦, 太主观

callmemissmaybe 发表于 5/27/2016 3:07:45 AM [url=http://forums.huaren.us/showtopic.aspx?topicid=2019764&postid=71788430#71788430]

[/url]

我刚才举了几个例子的。比如高斯分布,normalize之后最大数不是1而是看具体在几个sigma. Normalize要根据每个变量的不同分布来选择方法。举例,如果某个或某些变量是高斯分布却按比例去normalize对最后的打分很可能有比较大的影响。

Weight根据已有的信息我就没办法了,但是如果你有以往的数据,也许可以试着做machine learning. 当然首先要看你们看重的是什么。比如说你们最看重partners给你们带来的经济效益,那么效益高的打分应该也高,可以去regression analyse一下这些变量与效益的关系来寻找更合理的weights,至少可以以此为参考调整原先的weights. 这个有待讨论。
Huaren
等级上士
威望1
贴子1294
魅力2969
注册时间2011-12-08

最爱梵高

只看他

2016-05-27 11:42:49


我刚才举了几个例子的。比如高斯分布,normalize之后最大数不是1而是看具体在几个sigma. Normalize要根据每个变量的不同分布来选择方法。举例,如果某个或某些变量是高斯分布却按比例去normalize对最后的打分很可能有比较大的影响。

Weight根据已有的信息我就没办法了,但是如果你有以往的数据,也许可以试着做machine learning. 当然首先要看你们看重的是什么。比如说你们最看重partners给你们带来的经济效益,那么效益高的打分应该也高,可以去regression analyse一下这些变量与效益的关系来寻找更合理的weights,至少可以以此为参考调整原先的weights. 这个有待讨论。


xiaomaomiaomiao 发表于 5/27/2016 3:24:21 AM [url=http://forums.huaren.us/showtopic.aspx?topicid=2019764&postid=71788477#71788477]

[/url]
正解 normalize data + regression analysis
初始化编辑器...

到底了