“拨开迷雾看人工智能”系列——监督学习

2019年5月11日 147次阅读来源: 智能加研究院

《“拨开迷雾看人工智能”系列——监督学习》

2016年12月，在AlaphaGo战胜世界围棋冠军李世石的9个月后，“人工智能”的风潮已经势如破竹般席卷全球，在这一领域里几乎任何科技的进展，媒体们都喜欢把它包装成为人工智能技术的较大进步；以“机器将要代替人力”为主的AI威胁论也在不断引发学术界和科技界的讨论，仿佛科幻电影中的未来世界很快将要来临一样。

让我们拨开一层层的迷雾来一看究竟，现今，人工智能将转变很多产业，但它不是万能的魔法，电影中的科幻场景离现实中的AI相距甚远，哪怕是未来几十年后，也未必能够看到它们的实现。

《“拨开迷雾看人工智能”系列——监督学习》

开始写作这个专栏，就是期望暂时不要被夸大事实的媒体所影响，真正来了解我们身边的人工智能产品，看看AI在今天究竟能做些什么；对不同的行业和业务，会带来怎样的影响和转变；想在一领域创业的伙伴们，应该如何探索新的机会……

本着学习的心态，务实的态度，理性的思考，大胆的推断，也许人工智能的市场如汪洋般浩瀚，但我们也要从中找出那一根可以落地的尖针。这就是智能时代我们想要不断探索实现的目标。

下面我们先来谈一谈，现阶段人工智能的主要形式——监督学习。

监督学习与无监督学习

所谓监督学习，形象来讲，是指我们把已经知道的知识教给机器，让机器设计出一个模型，然后“举一反三”。举个例子，比如我们已经知道英语如何翻译成中文，于是拿了大量的英翻中的句子训练机器，直到机器“学会”了如何翻译，这时再把新的英语句子输入给机器，它就能够正确地输出翻译结果，这就是监督学习。

《“拨开迷雾看人工智能”系列——监督学习》

与之相对应的，叫无监督学习。我们有问题，但不知道答案，于是交给机器，它们按照问题的性质自动分成很多类别，每一类的问题都相类似（专业术语叫做聚类）。比如Google新闻，每天会搜集大量的新闻，然后把它们全部聚类，就会自动分成娱乐、科技、政治等几十个不同的类别，每个类别内的新闻都具有相似的内容结构，这就是无监督学习。

介于以上二者之间的，叫半监督学习，即有一部分问题我们知道答案，另一部分则不知道，且不知道的部分可能大于知道的部分。这就要求机器在我们引导的情况下，通过已知的部分推测未知的部分，找到较好的分类结果。

我们目前能接触到的人工智能还处于初级阶段，几乎都是监督学习模式：即输入数据（A）然后快速生成简单的回应（B）来完成。比如面部识别可以先用海量的图片训练机器识别人脸，当再次给出新图片时，它能够正确识别出人脸及长相；同理，语音识别就是用大量声音片段训练机器转译成文本，之后当再给机器新的声音时，它能够正确把语音转换文本。

《“拨开迷雾看人工智能”系列——监督学习》

这些技术听上去很简单，但这些仅靠输入A和输出B的应用已经在改变许多产业，比如Google Translate对翻译行业带来冲击，语音助手对搜索行业将产生影响，智能问答机器人对客服行业的颠覆等等，因为它背后的基础研究是前面几十年的结果。未来随着科技的进步，当半监督学习和无监督学习技术越来越成熟时，我们将能够借助人工智能解决更多难题。

小结：

今天我们讲了监督学习、无监督学习和半监督学习，以及介绍了目前大多数的人工智能都属于从A->B的监督学习模式。

你所在的行业中，有符合从A->B模式的例子吗？或许你可以尝试用人工智能的思维来解决其中的问题。

预告：

下一篇文章，我们会介绍人工智能的两大核心：数据和算法，如果你感兴趣，请留意关注微信公众号：智能加研究院

《“拨开迷雾看人工智能”系列——监督学习》

    原文作者：智能加研究院
    原文地址: https://www.jianshu.com/p/eed2fe342381
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。