机器学习-监督学习与无监督学习

2019年5月11日 170次阅读来源: 大大的赞

写在前面：五一小长假临近结束的最后一天对上周新学的机器学习的内容进行下总结，一方面巩固下新知识，另一方面为迎接节后依然繁重的工作准备一个良好的心态基础。上一篇的总结中讲到先从吴恩达老师的机器学习的斯坦福公开课开始对机器学习的基础性知识进行下了解，果不其然，“不允许这么牛逼的人存在”，哈哈哈😁，新手到大神之路，灰常漫长，课程的理论知识如果不做总结的话，极易懵逼！在此，进行总结，讲道理，好记性不如烂笔头，多写写没有坏处！

现在开始（第一课内容）：

1、机器学习的定义：

机器学习是人工智能的一个分支，目标是赋予机器一种新的能力。即专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

机器学习的应用很广泛，例如大规模的数据挖掘（网页点击数据，医疗记录等），无人驾驶飞机、汽车，手写手别，大多数的自然语言处理任务，计算机视觉，图像识别，推荐系统等

2、什么是监督学习？

监督学习是对具有概念标记（分类）的训练样本进行学习，以尽可能对训练样本集外的数据进行标记（分类）预测。这里，所有的标记（分类）是已知的。因此，训练样本的岐义性低。

监督学习是训练神经网络和决策树的最常见技术。这两种技术（神经网络和决策树）高度依赖于事先确定的分类系统给出的信息。分类、回归都是监督学习的内容。

栗子1—-房屋价格预测-回归(Regression): 预测连续的输出值（价格)

《机器学习-监督学习与无监督学习》房屋价格预测

栗子2—-乳腺癌（良性，恶性）预测问题-分类(Classification):预测离散的输出值(0, 1)

《机器学习-监督学习与无监督学习》乳腺癌（良性，恶性）预测

《机器学习-监督学习与无监督学习》多个特征示例

3、什么是无监督学习？

对没有概念标记（分类）的训练样本进行学习，以发现训练样本集中的结构性知识。这里，所有的标记（分类）是未知的。因此，训练样本的岐义性高。常见的无监督学习算法有聚类。

《机器学习-监督学习与无监督学习》聚类分析示例

在无监督学习中，我们已知的数据，看上去有点不一样，不同于监督学习的数据的样子，即无监督学习中没有任何的标签或者是有相同的标签。针对数据集，无监督学习就能判断出数据有两个不同的聚集簇。无监督学习算法可能会把这些数据分成两个不同的簇。所以叫做聚类算法，它能被用在很多地方。

无监督学习有着大量的应用。它用于组织大型计算机集群。第二种应用就是社交网络的分析。还有市场分割。许多公司有大型的数据库，存储消费者信息。所以，你能检索这些顾客数据集，自动地发现市场分类，并自动地把顾客划分到不同的细分市场中，你才能自动并更有效地销售或不同的细分市场一起进行销售。最后，无监督学习也可用于天文数据分析，这些聚类算法给出了令人惊讶、有趣、有用的理论，解释了星系是如何诞生的。这些都是聚类的例子，聚类只是无监督学习中的一种。

    原文作者：大大的赞
    原文地址: https://www.jianshu.com/p/c83fae735665
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。