问1:特征选择的常用方法有哪些? 答1:信息增益、卡方、基尼系数、信息增益率 问2:信息增益的公式是什么? 答2:IG(T)=H(C)-H(C|T) H(C)=-∑p(Ci)log(p(Ci)) H(C|T)=∑p(Ti…
标签:特征选择
spark之特征选择
特征选择 坊间传言:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。因此特征工程显得尤为重要,本文主要介绍特征选择方面工作,后续将会有特征预处理方面的。 peason特征选择 Pearson相关系数(P…
问1:特征选择的常用方法有哪些? 答1:信息增益、卡方、基尼系数、信息增益率 问2:信息增益的公式是什么? 答2:IG(T)=H(C)-H(C|T) H(C)=-∑p(Ci)log(p(Ci)) H(C|T)=∑p(Ti…
特征选择 坊间传言:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。因此特征工程显得尤为重要,本文主要介绍特征选择方面工作,后续将会有特征预处理方面的。 peason特征选择 Pearson相关系数(P…