01模型简介
随着海量电子病历的挖掘,影像学、基因组学等数据进入医学统计分析,经常会面临对高维变量特征选择的问题,Lasso回归是在线性回归模型的代价函数后面加上L1范数的约束项的模型,它通过控制参数lambda进行变量筛选和复杂度调整,被广泛的用到医学领域。
目前较好用的拟合广义线性模型的R包是glmnet,由Lasso回归的发明人,斯坦福统计学家 Trevor Hastie 领衔开发。
下面结合一个线性回归的例子,和大家分享一下如何运用R软件进行Lasso回归。
02加载数据
#### 加载包和读取数据
library(glmnet)
load(file="Lineartest")
data <- Lineartest
###### 分别存储 自变量和因变量
x <- as.matrix(data[,1:6])
y <- data[,7]
03采用glmnet() 建模
alpha1_fit <- glmnet(x,y,alpha=1,family="gaussian")
plot(alpha1_fit,xvar="lambda",label=TRUE)
01模型简介随着海量电子病历的挖掘,影像学、基因组学等数据进入医学统计分析,经常会面临对高维变量特征选择的问题,Lasso回归是在线性回归模型的代价函数后面加上L1范数的约束项的模型,它通过控制参数lambda进行变量筛选和复杂度调整,被广泛的用到医学领域。 目前较好用的拟合广义线性模型的R包是glmnet,由Lasso回归的发明人,斯坦福统计学家 Trevor Hastie 领衔开发。 ...