显示热门

阅读顺序

深色模式

字体大小|

搜索
ADVERTISEMENT
返回
  • 浏览过的版块

1
ADVERTISEMENT
Huaren
等级大校
威望22
贴子17028
魅力17450
注册时间@2013-08-09

callmemissmaybe

查看全部

问mm们一个统计建模中covariate的问题

15390

27

2017-03-29 18:44:03

最近学校在上一些R统计课,social science的统计课,有些概念问题搞得不是很懂。比如把学生分成两组,independent variable是一个categorical variable(参加了某实验的和没有参加),dependent variable是学生的最近一次数学成绩, 目标是分析参加实验和没参加对于数学成绩的影响。
一般建linear regression的时候会加上一些covariate, 一般是continuous variable,比如学生之前的数学成绩,或是学生年龄等不受实验控制的变量。在实际建模中,对covariate的选择有什么要求,如果covariate对DV(dependent variable)的影响比IV(independent variable)还大,反客为主了怎么办。为了有助于选择到底放入哪些covariate, 用什么模型可以分析出covariate和dependent variable之间到底有什么关系,关系有多大?
Huaren
等级大校
威望22
贴子17028
魅力17450
注册时间@2013-08-09

callmemissmaybe

查看全部

2017-03-29 19:09:01

可以先用correlation matrix简单看看各个variable之间有多大联系。model selection有很多方法,看你想设计多么复杂都行。至于你说的反客为主,不太理解,是说其他因素更加重要吗?问题是在现实问题中,很可能就是别的因素更加重要啊。尊重事实就是尊重模型。
四处停停走走 发表于 3/29/2017 6:47:53 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=2150514&postid=74482599#74482599]

[/url]
谢谢mm回答。我是想问有好多可以选择的covariates, age, gender, 还有很多个体差异的变量可以加,那怎么选择加哪些以及哪些重要呢?如果covariate之间自己就有correlation怎么办?
Huaren
等级大校
威望22
贴子17028
魅力17450
注册时间@2013-08-09

callmemissmaybe

查看全部

2017-03-29 20:25:25

回复 [url=http://forums.huaren.us/showtopic.aspx?topicid=2150514&postid=74482581#74482581]1楼callmemissmaybe的帖子[/url]

你说的confounding variable 吗?一般要涉及到control study吧
timeflies2015 发表于 3/29/2017 7:39:46 PM [url=http://forums.huaren.us/showtopic.aspx?topicid=2150514&postid=74482858#74482858]

[/url]
我在想一般linear regression或者anova 做出来的结果都可以是controlling confounding variable的,之后再用前面mm所说的backward或者forward selection来选var. 但如果普通的correlation matrix就很难看出来,要用上partial correlation才可以control confounding variable. 至于var之间互相关联,就是共线性问题,不知道怎么排查共线性。
初始化编辑器...

到底了