数据挖掘

数据挖掘,是从大量数据中挖掘出隐含的,先前未知的。对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。

1,数据挖掘的基本任务

利用分类与预测,聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法。

数据挖掘建模过程:

《数据挖掘》
《数据挖掘》

1-1, 定义挖掘的目标

针对具体的数据挖掘应用需求,首先要明确你的目标。

分析应用领域,弄清用户需求。

要充分发挥数据挖掘的价值,必须对目标有一个清晰明确的定义。

1-2 ,数据取样

从业务系统中抽取出一个与挖掘目标相关的样本数据子集。

  • 相关性
  • 可靠性
  • 有效性

确保你的原始数据的准确性。

《数据挖掘》
《数据挖掘》

1-3 数据探索

拿到样本数据集后,我们可以先对样本进行预先探索

  • 是否达到我们原来设想的要求,
  • 样本中有没有什么明显的规律和趋势
  • 有没有出现从未设想过的数据状态
  • 属性之间有什么相关性

《数据挖掘》
《数据挖掘》

1-4 ,数据预处理

由于采样数据中常常包含许多噪声、不完整,甚至不一致的数据,对数据挖掘所涉及的数据对象必须进行预处理。

《数据挖掘》
《数据挖掘》

1-5 挖掘建模

样本抽取完成并经预处理之后,接下来要考虑的问题是:

本次建模属于数据挖掘应用中的那类问题,

  • 分类,聚类,关联规则,时序模式,智能推荐
  • 选用哪种算法进行模型构建

《数据挖掘》
《数据挖掘》

1-6,模型评价

从模型中寻找到最好的模型。

根据业务对模型进行解释和应用。

    原文作者:聂红波
    原文地址: https://zhuanlan.zhihu.com/p/28824307
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞