一、相关概念 在特征选择中涉及到两个过程,一个是子集搜索,一个是子集评价。已知的特征空间的维度,需要去遍历多有可能的子集显然不现实。所以一个可行的做法是,先产生一个候选的子集,然后对该子集进行评价,之后根据这个评价继…
标签:特征选择
特征选择的三种方法、基本概念
一、相关概念 在特征选择中涉及到两个过程,一个是子集搜索,一个是子集评价。已知的特征空间的维度,需要去遍历多有可能的子集显然不现实。所以一个可行的做法是,先产生一个候选的子集,然后对该子集进行评价,之后根据这个评价继…
关于特征选择的一些思考
问1:特征选择的常用方法有哪些? 答1:信息增益、卡方、基尼系数、信息增益率 问2:信息增益的公式是什么? 答2:IG(T)=H(C)-H(C|T) H(C)=-∑p(Ci)log(p(Ci)) H(C|T)=∑p(Ti…
PCA(Principal Component Analysis)主成分分析
今天给大家说说主成分分析这个玩意~那么,首先来说说它是干嘛用的吧,它是就来做特征选择(Feature Selection),或者说降维(Dimension…
spark之特征选择
特征选择 坊间传言:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。因此特征工程显得尤为重要,本文主要介绍特征选择方面工作,后续将会有特征预处理方面的。 peason特征选择 Pearson相关系数(P…