显示热门

深色模式

字体大小|

搜索
ADVERTISEMENT
返回
  • 浏览过的版块

1234
Huaren
等级版主
威望10
贴子4582
魅力5785
注册时间2011-03-07

linger25

只看他

2014-06-20 17:57:27

你说的这个我问题我之前在这里发帖说过。结论就是从逻辑上无法严谨证明两个id不是一个人在使用。所以根本没法辩解。
MilkLover 发表于 6/20/2014 5:47:58 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371102#63371102]

[/url]


从统计学的角度上其实是可以的。在每个条件下,算特殊事件的概率和随机正常概率比较。
比如两个骰子同时为6的概率正常为1/36(3%左右),但是某一次赌场连续十次都是两个六。
当特殊事件发生几率和正常值偏差过大,你可以算赌场作弊的概率和没有作弊的概率,就可以得出比如99.999..%的机率下赌场是作弊的。
然后当在几个相互尽量独立的事件上都算出这样高概率,基本就可以确认。


Huaren
等级上士
威望1
贴子1233
魅力1420
注册时间2013-09-10

EricDolphy

只看他

2014-06-20 18:07:07


有耐心的话,他那篇东西是可以逐条辩驳的,就和GRE的AW一样,但是自然也没有人想去这么做。
最重要的是,aptget没有提供原始数据和源代码,学过心理/生物/统计学或者对data analysis深谙一些的人都知道you can present data in anyway you want to enhance your story,尤其是在大量数据的情况下。
所以现在发文章一般会强行要求公布源代码,或者要求资源提供数据。
按照他的聪明程度,他这篇文章的意图其实就很明显了。

其实如果从学术的角度来看,有觉得这是一个可以讨论的话题 - 如何去证明或者反证在网上的两个(或者以上)虚拟的identity是不是可以追踪到同一个实体的人。
aptget的文章里有给出一个subset,但是没有很全面和彻底。

我比较nerdy,大家都不和我认真讨论问题,真寂寞。。。


linger25 发表于 6/20/2014 5:46:49 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371077#63371077]

[/url]
我写了一个批驳的。也只是批驳文字部分。他那堆破图看都看不清,乱七八糟一堆字叠在一起,实在没有讨论价值。
Huaren
等级版主
威望9
贴子4551
魅力4999
注册时间2007-04-30

downtowntrain

只看楼主

2014-06-20 18:19:16



从统计学的角度上其实是可以的。在每个条件下,算特殊事件的概率和随机正常概率比较。
比如两个骰子同时为6的概率正常为1/36(3%左右),但是某一次赌场连续十次都是两个六。
当特殊事件发生几率和正常值偏差过大,你可以算赌场作弊的概率和没有作弊的概率,就可以得出比如99.999..%的机率下赌场是作弊的。
然后当在几个相互尽量独立的事件上都算出这样高概率,基本就可以确认。




linger25 发表于 6/20/2014 5:57:27 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371256#63371256]

[/url]
hahahahaha
Huaren
等级列兵
威望--
贴子37
魅力40
注册时间2014-04-17

张楚

只看他

2014-06-20 18:22:10



从统计学的角度上其实是可以的。在每个条件下,算特殊事件的概率和随机正常概率比较。
比如两个骰子同时为6的概率正常为1/36(3%左右),但是某一次赌场连续十次都是两个六。
当特殊事件发生几率和正常值偏差过大,你可以算赌场作弊的概率和没有作弊的概率,就可以得出比如99.999..%的机率下赌场是作弊的。
然后当在几个相互尽量独立的事件上都算出这样高概率,基本就可以确认。




linger25 发表于 6/20/2014 5:57:27 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371256#63371256]

[/url]

你这说的啥啊,刚刚去随便看了一下,那人基本上就是一派胡言,他要能用统计证明才奇怪了,一共只有三个id,样本就不够,你想把rejection region设为几?不过我不了解这件事情,不想妄言。

Huaren
等级版主
威望10
贴子4582
魅力5785
注册时间2011-03-07

linger25

只看他

2014-06-20 18:35:35


你这说的啥啊,刚刚去随便看了一下,那人基本上就是一派胡言,他要能用统计证明才奇怪了,一共只有三个id,样本就不够,你想把rejection region设为几?不过我不了解人家的事情,不想妄言。


张楚 发表于 6/20/2014 6:22:10 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371549#63371549]

[/url]

是的,他只计算了特殊事件(连这个都没有给出原始数据和代码),更不用说去给出模型世界的基础概率,all the priors and conditional probs。比如mitbbs抽样1W个ID,确认期中多少个是独立用户ID,算出独立用户ID之间的活动重复性机率,算出相同人员小号间的机率。其实rejection region无论0.05,0.001的都是可以manipulate的,用CI的开始多起来的,个人更倾向用converging high prob/stats更有说服力一些

现在已经不在讨论那篇文章了,从一开始就说了aptget很知道自己在做什么,目的根本不在说理,就不谈这篇和统计学毫无干系的文章了。

只是是纯学术上来讨论如何去正确计算出两个(或者以上)虚拟的identity是不是属于同一个实体人的概率,从而可以确认谁是谁的小号。 - 我去找social infomatics的同学聊这个话题了~~~
Huaren
等级版主
威望10
贴子4582
魅力5785
注册时间2011-03-07

linger25

只看他

2014-06-20 19:18:33

对了对了,implecation MM! 我以前一起搞音乐社团的同学前几天和张楚一起聊天商量事情了,他本身是做厂牌和音乐这一样的。他告诉我的时候挺激动了。哈哈哈,本人相当随和啊。
Huaren
等级上士
威望1
贴子1233
魅力1420
注册时间2013-09-10

EricDolphy

只看他

2014-06-20 19:49:18


是的,他只计算了特殊事件(连这个都没有给出原始数据和代码),更不用说去给出模型世界的基础概率,all the priors and conditional probs。比如mitbbs抽样1W个ID,确认期中多少个是独立用户ID,算出独立用户ID之间的活动重复性机率,算出相同人员小号间的机率。其实rejection region无论0.05,0.001的都是可以manipulate的,用CI的开始多起来的,个人更倾向用converging high prob/stats更有说服力一些

现在已经不在讨论那篇文章了,从一开始就说了aptget很知道自己在做什么,目的根本不在说理,就不谈这篇和统计学毫无干系的文章了。

只是是纯学术上来讨论如何去正确计算出两个(或者以上)虚拟的identity是不是属于同一个实体人的概率,从而可以确认谁是谁的小号。 - 我去找social infomatics的同学聊这个话题了~~~


linger25 发表于 6/20/2014 6:35:35 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63371712#63371712]

[/url]
关键是我们俩在论坛上熟。比如说有一阵,mitbbs可以看见别人的发帖回帖列表,我就自然的去回坑王的一些帖子了。那这个东西就没法用统计学来搞了。

如果真的刻意藏小号,也没人能发现。如果有人故意模仿一个ID的小号,被模仿者也很难否认。
当然如果有谁闲到无聊去具体看我和坑王分别发过的贴的内容,那差异肯定是很明显的。
Huaren
等级版主
威望10
贴子4582
魅力5785
注册时间2011-03-07

linger25

只看他

2014-06-20 20:45:30

关键是我们俩在论坛上熟。比如说有一阵,mitbbs可以看见别人的发帖回帖列表,我就自然的去回坑王的一些帖子了。那这个东西就没法用统计学来搞了。

如果真的刻意藏小号,也没人能发现。如果有人故意模仿一个ID的小号,被模仿者也很难否认。
当然如果有谁闲到无聊去具体看我和坑王分别发过的贴的内容,那差异肯定是很明显的。



EricDolphy 发表于 6/20/2014 7:49:18 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=1641200&postid=63372533#63372533]

[/url]

我要是早点去灌水,估计也是林林的马甲。。。哈哈哈
初始化编辑器...

到底了