在学习特征选择模块中找到了用于特征选择的F_regression技术。我无法理解它所使用的原则。给出的描述是-
单变量线性回归检验
快速线性模型,用于测试单个回归器的效果,对许多回归者来说是顺序的。这分三个步骤完成:
1.兴趣回归和数据回归为正交wrt常量回归。2.计算了数据与回归元之间的相互关系。它被转换成F分数,然后转换成p值.
我无法理解这一点,请有人用门外汉的术语来解释这一点。
发布于 2016-07-26 20:10:22
文档中的语言有点迟钝。我相信“数据”指的是回应。首先,选择的回归器和响应相对于其余的回归器被正交化。这减少了任何可能存在的多重共线性。然后,计算了所选择的回归量与响应之间的相关性。在单变量设置中,相关系数是R^2的平方根,可以用F统计量来表示模型的总体显着性(另见https://stats.stackexchange.com/questions/56881/whats-the-relationship-between-r2-and-f-test)。接下来,将相关转换为F-统计量,计算相应的p值,并返回F和p。如果有多个回归者,则对所有的回归者一次只做一次。
https://stackoverflow.com/questions/37747182
复制相似问题