我在R中建模声明频率(poisson distr).我正在使用gbm和xgboost包,但似乎xgboost没有偏移参数来考虑曝光?
在gbm中,人们会将曝光考虑在内,如下所示:
gbm.fit(x = train,y = target, n.trees = 100,distribution = "poisson", offset = log(exposure))
如何用`xgboost实现同样的目标?
PS:我不能将曝光用作预测器,因为每次观察到声明时都会创建新的遮挡物.
最佳答案 创建xgboost矩阵后,可以使用setinfo和base_margin属性设置偏移量,例如:
setinfo(xgtrain, "base_margin", log(d$exposure))
你可以看到我在这里问的类似问题的完整例子:XGBoost – Poisson distribution with varying exposure / offset