如何使randomForest模型更小?

我一直在用700万行数据(41个特征)训练R中的randomForest模型.这是一个示例调用:

myModel< – randomForest(RESPONSE~.,data = mydata,ntree = 50,maxnodes = 30) 我认为只有50棵树和30个终端节点,“myModel”的内存占用量会很小.但它在转储文件中是65兆.该对象似乎持有培训过程中的各种预测,实际和投票数据. 如果我只想要森林怎么办呢?我想要一个小的转储文件,我可以稍后加载,以便快速做出预测.我觉得森林本身不应该那么大…… 任何人都知道如何剥夺这个傻逼到我能做出预测的事情吗?

最佳答案 试图摆脱将评论作为评论发布的习惯……

?randomForest建议不要使用带有大量变量的公式接口…如果不使用公式接口,结果会有什么不同吗? ?randomForest的Value部分还告诉您如何关闭一些输出(重要性矩阵,整个森林,邻近矩阵等).

例如:

myModel <- randomForest(mydata[,!grepl("RESPONSE",names(mydata))],
  mydata$RESPONSE, ntree=50, maxnodes=30, importance=FALSE,
  localImp=FALSE, keep.forest=FALSE, proximity=FALSE, keep.inbag=FALSE)
点赞