ADVERTISEMENT
有耐心的话,他那篇东西是可以逐条辩驳的,就和GRE的AW一样,但是自然也没有人想去这么做。
最重要的是,aptget没有提供原始数据和源代码,学过心理/生物/统计学或者对data analysis深谙一些的人都知道you can present data in anyway you want to enhance your story,尤其是在大量数据的情况下。
所以现在发文章一般会强行要求公布源代码,或者要求资源提供数据。
按照他的聪明程度,他这篇文章的意图其实就很明显了。
其实如果从学术的角度来看,有觉得这是一个可以讨论的话题 - 如何去证明或者反证在网上的两个(或者以上)虚拟的identity是不是可以追踪到同一个实体的人。
aptget的文章里有给出一个subset,但是没有很全面和彻底。
我比较nerdy,大家都不和我认真讨论问题,真寂寞。。。
linger25 发表于 6/20/2014 5:46:49 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371077#63371077][/url]
我写了一个批驳的。也只是批驳文字部分。他那堆破图看都看不清,乱七八糟一堆字叠在一起,实在没有讨论价值。
从统计学的角度上其实是可以的。在每个条件下,算特殊事件的概率和随机正常概率比较。
比如两个骰子同时为6的概率正常为1/36(3%左右),但是某一次赌场连续十次都是两个六。
当特殊事件发生几率和正常值偏差过大,你可以算赌场作弊的概率和没有作弊的概率,就可以得出比如99.999..%的机率下赌场是作弊的。
然后当在几个相互尽量独立的事件上都算出这样高概率,基本就可以确认。
linger25 发表于 6/20/2014 5:57:27 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371256#63371256][/url]
hahahahaha
从统计学的角度上其实是可以的。在每个条件下,算特殊事件的概率和随机正常概率比较。
比如两个骰子同时为6的概率正常为1/36(3%左右),但是某一次赌场连续十次都是两个六。
当特殊事件发生几率和正常值偏差过大,你可以算赌场作弊的概率和没有作弊的概率,就可以得出比如99.999..%的机率下赌场是作弊的。
然后当在几个相互尽量独立的事件上都算出这样高概率,基本就可以确认。
linger25 发表于 6/20/2014 5:57:27 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371256#63371256][/url]
你这说的啥啊,刚刚去随便看了一下,那人基本上就是一派胡言,他要能用统计证明才奇怪了,一共只有三个id,样本就不够,你想把rejection region设为几?不过我不了解这件事情,不想妄言。
是的,他只计算了特殊事件(连这个都没有给出原始数据和代码),更不用说去给出模型世界的基础概率,all the priors and conditional probs。比如mitbbs抽样1W个ID,确认期中多少个是独立用户ID,算出独立用户ID之间的活动重复性机率,算出相同人员小号间的机率。其实rejection region无论0.05,0.001的都是可以manipulate的,用CI的开始多起来的,个人更倾向用converging high prob/stats更有说服力一些
现在已经不在讨论那篇文章了,从一开始就说了aptget很知道自己在做什么,目的根本不在说理,就不谈这篇和统计学毫无干系的文章了。
只是是纯学术上来讨论如何去正确计算出两个(或者以上)虚拟的identity是不是属于同一个实体人的概率,从而可以确认谁是谁的小号。 - 我去找social infomatics的同学聊这个话题了~~~
对了对了,implecation MM!
我以前一起搞音乐社团的同学前几天和张楚一起聊天商量事情了,他本身是做厂牌和音乐这一样的。他告诉我的时候挺激动了。哈哈哈,本人相当随和啊。
是的,他只计算了特殊事件(连这个都没有给出原始数据和代码),更不用说去给出模型世界的基础概率,all the priors and conditional probs。比如mitbbs抽样1W个ID,确认期中多少个是独立用户ID,算出独立用户ID之间的活动重复性机率,算出相同人员小号间的机率。其实rejection region无论0.05,0.001的都是可以manipulate的,用CI的开始多起来的,个人更倾向用converging high prob/stats更有说服力一些
现在已经不在讨论那篇文章了,从一开始就说了aptget很知道自己在做什么,目的根本不在说理,就不谈这篇和统计学毫无干系的文章了。
只是是纯学术上来讨论如何去正确计算出两个(或者以上)虚拟的identity是不是属于同一个实体人的概率,从而可以确认谁是谁的小号。 - 我去找social infomatics的同学聊这个话题了~~~
linger25 发表于 6/20/2014 6:35:35 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371712#63371712][/url]
关键是我们俩在论坛上熟。比如说有一阵,mitbbs可以看见别人的发帖回帖列表,我就自然的去回坑王的一些帖子了。那这个东西就没法用统计学来搞了。
如果真的刻意藏小号,也没人能发现。如果有人故意模仿一个ID的小号,被模仿者也很难否认。
当然如果有谁闲到无聊去具体看我和坑王分别发过的贴的内容,那差异肯定是很明显的。
如果真的刻意藏小号,也没人能发现。如果有人故意模仿一个ID的小号,被模仿者也很难否认。
当然如果有谁闲到无聊去具体看我和坑王分别发过的贴的内容,那差异肯定是很明显的。
我要是早点去灌水,估计也是林林的马甲。。。哈哈哈
初始化编辑器...
到底了
ADVERTISEMENT
Hot Deals
All Deals30% 折扣的MUBVIEW室内安全摄像头,适合宠物和婴儿监控
省40%!完美旅行收纳解决方案,轻松整理行李
Tarte Cosmetics 11.11美妆特卖 – 全场$11或$16
Calvin Klein 秋冬特卖 高达40%折扣+额外20%折扣
Nordstrom Rack 曼戈女装促销活动额外75折
SOREL 长周末促销 - 低至五折
Kipling联名小黄人系列限时折扣高达60%
MANGO女装 全场30%折扣
娇兰美妆特卖 – 高达20%折扣!
HOKA 新款特惠 - Bondi 8 $132
Tommy Hilfiger 儿童服饰特卖高达 70% 折扣
今日限定:J.Crew Factory大促销 全场五折 + 满$125额外75折
省25%,享受Geek Chef四片式吐司机,超宽插槽和双控面板设计
ADVERTISEMENT