scikit-learn中交叉验证的一个标准错误规则

我正在尝试使用grisSearchCV来学习scikit-learn中的一些模型,我想使用“一个标准错误”规则来选择最佳模型,即从分数在一个范围内的模型子集中选择最简约的模型最佳分数的标准误差.有没有办法做到这一点? 最佳答案 您可以使用以下方法计算验证分数均值的标准误差:

from scipy.stats import sem

然后访问拟合的GridSearchCV对象的grid_scores_属性.此属性在scikit-learn的master分支中已更改,因此请使用交互式shell来内省其结构.

至于选择最简约的模型,模型的模型参数并不总是具有自由度解释.参数的含义通常是模型特定的,并且没有高级元数据来解释它们的“简约”.您必须根据具体情况为每个模型类编码解释.

点赞