按学习方法分类
监督学习
有训练集(
包含数据及其分类
)及测试集(有数据没分类
)从二元分类(
支持向量机
)到多元分类
增强学习
机器学习的结果会有相应的奖励与惩罚
机器学习的目标就是将奖励最大化(
类似运筹学
)
无监督学习
没有训练集也没有奖励与惩罚
主要由聚类(
K-均值、混合高斯、层次聚类、最大期望算法
)和降维(因子分析、主成分分析、独立成分分析、隐马尔科夫模型
)两大类
小结
数据挖掘的算法主要有分类、聚类、预测、关联四种,分类就属于监督学习,聚类属于无监督学习。
reference
Big Data Analytics Beyond Hadoop