利用Python实现四种机器学习技术!

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

机器学习技术VS。算法

虽然本教程专门讨论Python的机器学习技术,但我们很快就会转向算法。但在我们开始关注技术和算法之前,让我们先看看它们是否是同一回事。

A 技术是解决问题的方法。这是一个相当通用的术语。但当我们说我们有一个算法,我们的意思是,我们有一个输入,并希望从它得到一个特定的输出。我们已经明确规定了实现这一目标所应遵循的步骤。我们将不遗余力地说,一个算法可以使用多种技术来获得输出。

加群:700341555获取Python入门学习资料+机器学习入门学习资料!

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!
《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

现在我们已经区分了这两种技术,让我们来了解更多关于机器学习技术的内容。

用Python实现机器学习技术

机器学习回归

这,这个,那,那个字典会告诉你,倒退就是回到以前的状态-通常是欠发达的状态。在统计书籍中,你会发现回归是衡量一个变量的平均值和其他值的对应值是如何相互关联的。但让我们谈谈你将如何看待它。

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

回归中庸

查尔斯·达尔文的同父异父表亲弗朗西斯·加尔顿(Francis Galton)观察了几代人对甜豌豆的大小。他得出的结论是,让大自然去做它的工作会产生一系列的大小。但是,如果我们有选择地培育大小的甜豌豆,它就能制造出更大的豌豆。随着大自然的方向盘,更大的豌豆开始产生较小的后代随着时间的推移。对于豌豆,我们有一个不同的大小,但是我们可以将这些值映射到一条特定的线或曲线上。

另一个例子:猴子和股票

1973年,普林斯顿大学教授伯顿·麦基尔(Burton Malkiel)在他的书中宣称,华尔街的随机漫步这是一本畅销书,并坚持认为蒙着眼睛的猴子可以通过向报纸的财经版面扔飞镖,在挑选投资组合方面做得同样出色。在这样的选股比赛中,猴子打败了专业人士.但这是一次或两次。随着足够的事件,猴子的表现下降,它倒退到平均水平。

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

什么是机器学习回归?

在这幅图中,这条线最适合用点标记的所有数据。使用这条线,我们可以预测x=70的值(有一定程度的不确定性)。

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

回归作为一种机器学习技术,其基础是监督学习。我们用它来预测一个连续的数值目标,从我们已经知道的数据集值开始。它比较已知值和预测值,并将预期值和预测值之间的差异标记为误差/残差。

机器学习中的回归类型

我们通常观察到两种回归:

  • 线性回归:当我们可以用直线表示目标和预测器之间的关系时,我们使用线性回归,如下所示:

Y=P1x+P2+e

  • 非线性回归:当我们观察到一个目标和一个预测器之间的非线性关系时,我们不能将它表示为一条直线。

机器学习分类

什么是机器学习分类?

分类是数据挖掘允许我们预测数据实例的组成员资格的技术。它预先使用有标记的数据,并接受监督学习。这意味着我们训练数据,并期望预测它的未来。我们所说的“预测”,是指我们将数据分类为它们可以属于的类。我们有两种属性:

  • 输出属性,或者依赖属性。
  • 输入属性,或者是独立属性。

分类方法

  • 决策树归纳:我们从标记为元组。它有内部节点、分支和叶节点。内部节点表示对属性、分支、测试结果、叶节点和类标签的测试。涉及的两个步骤是学习和测试,这些步骤都是快速的。
  • 基于规则的分类:这种分类是基于一组IF-然后规则。一项规则指的是:

若条件则结论

  • 按反向传播分类:神经网络学习,通常称为连接主义学习,建立联系。反向传播是一种神经网络学习算法,是目前最流行的学习算法之一。它迭代地处理数据,并将目标值与要学习的结果进行比较。
  • 懒惰的学生:在懒惰的学习方法中,机器存储训练元组并等待测试元组。这支持增量学习。这与早期的学习方法形成了鲜明的对比。

ml分类示例

让我们举个例子。我们是来教你不同种类的密码的。我们向您介绍ITF条形码、码93条形码、QR码、Aztecs码和数据矩阵等。通过大多数示例之后,现在轮到您识别当我们向您展示一段代码时的代码类型。这是监督学习,我们使用部分的例子-训练和测试。

注意每种类型的恒星是如何在曲线的另一边结束的。

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

聚类

聚类是一种无监督的分类。这是一种探索性数据分析,没有标签数据可用。通过聚类,我们将未标记的数据分离为有限的和离散的数据结构集,这些数据结构是自然的和隐藏的。我们观察到两种聚类-

  • 硬聚类:一个对象属于单个集群。
  • 软聚类:一个对象可能属于多个集群。

在聚类中,首先选择特征,然后设计聚类算法,然后对聚类进行验证。最后,我们解释了结果。

回想一下上面的例子。你可以把这些代码组合在一起。QR代码,Aztec和数据矩阵将在一个组中;我们可以称之为2D代码。ITF条形码和代码39条形码将分组为“一维代码”类别。这就是集群的样子:

《利用Python实现四种机器学习技术!》 同事利用Python实现四种机器学习技术!

异常检测

异常是指偏离其预期方向的东西。有了机器学习,有时,我们可能想发现一个离群点。一个这样的例子就是每小时检测一张牙医账单85份填充物。这相当于每个病人42秒。另一种方法是只在周四才能找到一张特定的牙医账单。这种情况引起怀疑,异常检测是突出这些异常的一个很好的方法,因为这不是我们要特别寻找的东西。

所以,这都是关于Python的机器学习技术。希望你喜欢我们的解释!

    原文作者:浪里小白龙q
    原文地址: https://www.jianshu.com/p/5da7dbba51ba
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞