机器学习：监督、无监督和强化学习

2019年5月11日 175次阅读来源: 大数据周刊

一旦我们开始深入研究后面的概念人工智能(艾)和机器学习(Ml)我们遇到了大量有关这方面研究的术语。理解这一术语以及它如何影响与ml有关的研究，对于理解研究者和数据科学家已经进行的研究，使人工智能进入现在的状态有着很长的路要走。

在本文中，我将向您提供一个全面定义，在更广泛的领域中，监督、无监督和增强学习的全面定义。机器学习你一定遇到过这些条款，同时徘徊于有关人工智能进展的文章以及的在推动这一成功方面所发挥的作用。理解这些概念是一个给定事实，并且不应以任何代价来损害。这里我们详细讨论这些概念，同时确保您花时间理解这些概念的时间会有所回报，并且您不断地意识到在这个过程中正在发生什么，朝着一个人工智能社会。

监督、无监督和强化机器学习基本上是描述如何让机器或算法丢失在数据集上。这些机器也将被预期为学习这个过程中有用的东西。监督、无监督和强化学习引领着未来机器的未来，预期将是光明的，并且将随着时间帮助人类做日常事情。

《机器学习：监督、无监督和强化学习》监督学习

在深入研究有关监督学习的技术细节之前，必须给出一个简单而简单的概览，这些概述可以由所有读者理解，不管他们在这个日益增长的领域中的经验。

通过监督学习，您将您的算法输出输入到系统中。这意味着，在监督学习中，机器在开始工作之前已经知道了算法的输出，或者学习它。这个概念的一个基本例子就是学生学习课程从老师那里。学生知道他/她从课程中学到了什么。

随着算法的输出，系统需要做的就是工作从输入到输出所需的步骤或过程。该算法正在通过培训引导机器的数据集。如果进程处于混乱状态，并且算法产生的结果与所期望的完全不同，那么培训数据是它的一部分，它引导算法回到正确的路径。

目前，监督机器学习占了世界各地系统使用的大多数ml。输入变量(X)用于通过使用一个算法来连接输出变量(Y)。所有输入、输出、算法和场景都是由人类提供的。通过两种类型的问题来看待它，我们可以更好地理解监督学习。

分类分类问题分类所有形成输出的变量。通过分类形成的这些类别的例子包括人口数据，例如婚姻状况、性别或年龄。用于这种服务状态的最常用模型是支持向量机。支持向量机是用来定义线性决策边界的。

回归*可以将其归类为回归问题的问题包括输出变量作为实数设置的类型。此问题的格式通常遵循线性格式。

《机器学习：监督、无监督和强化学习》无监督学习

既然我们现在知道了有关监督学习的基本细节，那么就应该跳到无监督学习中去。无监督学习的概念并不是普遍且经常被用作监督学习。事实上，这个概念已经被用于仅在有限数量的应用程序中尚未使用。

尽管没有监督学习还没有得到更广泛的实施，但是这种方法形成了机器学习的未来及其可能性。我们总是谈论解放运动在未来带来无限的机会，但却未能掌握所作陈述背后的细节。每当人们谈论计算机和机器，发展能够以无缝方式“自学”的能力，而不是我们人类必须做的荣誉，他们就意味着指非监督学习过程中所涉及的过程。

在无监督学习过程中，系统没有具体的数据集，对大多数问题的结果都是未知的。简单术语中，人工智能系统和ml目标在进入操作时是盲目的。该系统具有其完美且庞大的逻辑操作，以指导它的前进方向，但是缺乏适当的输入和输出算法使得这个过程更加具有挑战性。不可思议的是，整个过程听起来很不可思议，无监督学习能够通过输入数据和所有计算机系统中存在的二进制逻辑机制来解释和找到无限数量数据的解决方案。该系统完全没有参考数据。

既然我们期望读者们现在有一个无监督学习的基本意象，那么通过一个例子来使理解更简单就很有意义了。只要考虑一下我们有一个数字图像，它有各种各样的颜色几何形状。这些几何形状需要根据颜色和其他分类特征来匹配成组。对于遵循监督学习的系统来说，整个过程有点太简单了。这个过程非常简单，因为你只需教计算机所有有关数字的细节。你可以让系统知道所有四个侧面的形状都被称为正方形，而其他八面都是所谓的octagons等。我们还可以教系统解释颜色，并了解如何将光线被划分出来。

然而，在无监督学习过程中，整个过程变得更加棘手。无监督学习系统的算法与其监督对应者的输入数据相同(在我们的例子中，数字图像显示形状不同颜色)。

一旦输入数据，系统就能从手头的信息中学习到所有的信息。事实上，系统本身就是为了识别分类问题，以及形状和颜色的差异。在与当前问题相关的信息中，无监督学习系统将识别所有相似对象，并将它们组合在一起。它将给这些对象的标签将由机器本身来设计。技术上来说，必然会有错误的答案，因为有一定程度的概率。然而，就像人类工作的方式一样，机器学习的力量在于它能够识别错误，学习从他们那里，最终做出更好的估计下一次左右。

《机器学习：监督、无监督和强化学习》强化学习

强化学习是机器学习的另一部分，它在如何帮助机器学习进步方面获得了很多声望。在大学里学习心理学的读者能够更好地与这个概念相关联。

强化学习从无监督学习的概念中产生了推动作用，并给软件agent和机器提供了一个高度控制的范围，以确定上下文中理想行为是什么。这种链接是为了使机器的性能最大化而形成的，以帮助它成长。这里需要简单的反馈信息，告诉机器它的进展情况，帮助机器学会它的行为。

强化学习不是简单的，而且是由很多不同的算法解决的。事实上，在强化学习中，agent根据结果的当前状态决定最佳动作。

强化学习的增长导致了各种算法的产生，帮助机器学习他们正在做的结果。既然我们现在对强化学习有了基本的理解，那么我们就可以通过对强化学习与我们之前深入研究的监督和无监督学习概念进行比较分析来得到更好的把握。

1.监督与强化学习的关系

在监督学习中，我们有一个外部监督者，他们对环境有足够的知识，并与上级分享学习，从而形成更好的理解和完成任务。但是由于我们存在问题，代理可以自己执行这么多不同类型的子任务来实现总体目标，所以主管的存在是不必要的和不切实际的。我们可以拿出国际象棋游戏的例子，玩家可以在那里玩数万步以达到最终目标。为这个目的创建知识库可能是一个非常复杂的任务。因此，在这些任务中，计算机必须学会如何自己管理事务。因此，机器能够从自己的经验中学习更可行和更有针对性。一旦机器开始从自己的经验中学习，它就可以从这些经验中获得知识，以便在未来的行动中实现。这可能是强化与监督学习概念之间最大和最迫切的区别。在这两种学习类型中，输出和输入之间都存在某种映射。但是在强化学习的概念中，有一个示范性的奖励功能，不同于监督学习，让系统了解其进展的正确路径。

2.强化与无监督学习

强化学习基本上有一个映射结构，引导机器从输入到输出。然而，无监督学习却没有出现这种特征。在无监督学习中，机器专注于定位模式而不是映射以实现最终目标的底层任务。例如，如果机器的任务是向用户推荐一个好消息更新，那么增强学习算法将寻求从用户那里获得定期反馈。然后通过反馈建立一个声誉良好的知识图表，所有新闻相关文章，谁可能喜欢。相反，一个无监督学习算法将尝试查看其他许多文章，用户已经阅读，类似于这一篇，并建议一些符合用户喜好的东西。

机器学习领域是无止境的。你可以去拜访我youtube频道了解更多关于人工智能的世界以及未来如何使用机器中的数据来决定未来。

    原文作者：大数据周刊
    原文地址: https://www.jianshu.com/p/347a36d9f4e3
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。