对人工智能的简单理解

简单介绍人工智能

2015年,Google公司研发的人工智能机器人AlphaGo战胜了韩国围棋世界冠军李世石,成为了世界上第一个击败人类围棋选手的人工智能机器人。自此,人工智能这个词语逐渐走进了普通人的生活。然而,随着各大媒体铺天盖地的报道,似乎又给”人工智能“这项技术增添了几分神秘的色彩。下面,仅从个人的角度出发简单描述一下什么是人工智能,以及人工智能两个比较热门的方向——机器学习和深度学习。

维基百科对于人工智能的定义如下:
人工智能(英语:Artificial Intelligence,缩写为AI)亦称智械、机器智能,指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。

人工智能在一般教材中的定义领域是“智能主体(intelligent agent)的研究与设计”,智能主体指一个可以观察和感知周围环境并作出行动以达致目标的系统。人工智能的研究是高度技术性和专业性的,研究的领域都极其深入并且基本上互不干扰,因此人工智能的研究范围可以说是非常广泛的。总的来说,人工智能的研究范围主要包括以下七个方面,分别是知识,自动规划,机器学习,语言处理,计算机视觉,机器人学和强人工智能。对于人工智能的研究和实现方法,就目前来看,应用得最广泛的应该是机器学习。
机器学习(英语:Machine Learning)简单点理解就是分析和设计一些让计算机可以”自动“学习的算法。人类将收集和整理好的数据集输入到电脑里面去,通过设计一些算法(如人工神经网络等),让计算机在这些数据中自动分析找到规律,并利用这些规律对未知的数据进行预测。其中,机器学习的应用范围主要是数据挖掘,预测,推荐系统等。那么,既然说到了机器学习,就不得不提到它的一个重要分支——深度学习。

深度学习(英语:Deep Learning)是机器学习的一个分支学科,它是在机器学习的基础上发展起来的。从某种意义上来说,深度学习也是机器学习,这种说法是基于深度学习的内部机理来阐述的。早期的人工神经网路结构是比较简单的,后来随着计算机运算能力的提升,人们在高性能计算机的支持下,开始设计出越来越复杂的神经网络,与早期相比,后者的模型结构复杂度发生了翻天覆地的变化。于是,人们将其命名为”深度学习“。可以这样理解,深度学习是后神经网络时代“。深度学习主要应用范围包括计算机视觉,语言处理等,当然也可以用于推荐系统。

可以用一张图来简要地划分一下人工智能的范畴

《对人工智能的简单理解》

机器学习和深度学习的区别与联系

不管是机器学习还是深度学习,其本质都是计算机要从外界输入进来的数据中找到内在的规律,“自动”生成一个模型,然后对未知的数据进行预测。那计算机是怎么从外界输入进来的数据中找到规律呢?其实,计算机和我们人类的学习方法存在一定的相同之处,都是通过根据数据的特征来进行学习。前面提到,机器学习主要应用范围是数据挖掘,预测和推荐系统等,像这种类型的数据,其实我们都可以把他们转换成用数学的方式来表示。举个简单的例子,假如我们要写一个电影推荐算法,我们可以根据用户的性别,年龄,喜欢的电影类型,曾经给哪些电影打过高分等个人信息,将这些个人信息转换成用数字的方式来表示,比如用数字0表示男性用户,1表示女性用户,对于年龄,用0表示小于10岁的用户,用1表示10-15岁的用户,用2表示16-24岁的用户,以此类推,对于电影类型,用0表示喜剧,1表示科幻剧,2表示爱情剧,3表示恐怖剧等,假设有一个用户叫小明,性别男,20岁,喜欢科幻片,所以用数据的方式来表示他就是[0,2,1]。根据后台记录信息显示,他给一部名字叫《复仇者联盟4》的电影打出了9.5分的高分(假设满分为10分)。我们从后台数据抽取了所有给《复仇者联盟4》电影打出9分以上的用户,并分析他们的个人信息,然后发现这些用户的特征普遍都是(男性,年龄介于10-30岁之间,爱好科幻电影)。因此,我们可以得出一个结论,用户特征为男性,年龄介于10-30岁之间,喜欢电影类型是科幻剧的,有很大概率会喜欢看《复仇者联盟4》这部电影。基于上述分析,服务器后台就会给没有看过《复仇者联盟4》这部电影的用户推荐这部电影。当然了,这只是一个很简单的机器学习的案例,如果想要更精准的电影推荐算法,需要收集的用户信息远远不止这些了。质量越高的数据,训练出来的算法模型准确度就越高。

说完机器学习,我们来看一下深度学习。前面提到,深度学习的主要应用场景为计算机视觉,语言处理等。计算机视觉一个很重要的方向就是图像分类,顾名思义就是对图像进行准确分类,让计算机能很好地识别一些物体,比如猫,狗,汽车,飞机等。首先我们要做的还是特征提取,不过,现在问题来了,对于这些物体图片,我们要用一个什么样的特征去描述它们呢?比如说我们要识别车类中的小汽车,卡车,摩托车,大货车等,如果我们像机器学习一样给小汽车标上数字0,卡车标数字1,摩托车标数字2,大货车标数字3,然后让计算机像用器学习的方法对它们进行学习分类,这样做虽然是行得通的,但是这样做的准确率并不会很高,因为计算机在对它们进行学习的时候没能很好地学习到这些车类图片的特征,计算机并不知道根据什么特征来判断这是一辆小汽车,什么样的车才是一辆卡车。机器学习在这种场景中貌似遇到了瓶颈。

可能有人会提出根据车的某些部位来判断车的类型。没错,我们可以教计算机根据车的某些部位来分别车的类型。那么,我们该怎么告诉计算机个各种类型的车的某些部位的特征呢?其实我们不用专门地去告诉计算机各种类型的车的部位的特征,我们可以使用深度学习中一个非常著名的算法模型——卷积神经网络算法,通过卷积神经网络,计算机可以自主地学习到各种类型的车的特征(不需要人为干预),然后根据这些特征来进行分类。训练过程具体点说就是将样本图片输入到卷积神经网络算法模型中后,模型会从样本中提取基本的特征(图像的像素)。之后,随着模型的逐步深入,从这些基本特征中组合出了更高层的特征,比如线条、简单形状(如汽车轮的边缘等)。此时的特征可能还是抽象的,我们无法想象将这些特征组合起来会得到什么。简单形状可以被进一步组合,在模型越深入的地方,这些简单形状也逐步地转化成更加复杂的特征(特征开始具体化,比如看起来更像一个摩托车的车轮而不是车身),这就使得不同类别的车更加可分。这是,我们就可以认为卷积神经网络已经完成了特征的提取,接下来我们将这些提取到的特征再经理类似于机器学习算法中的人工神经网络中,经过不断地反复训练,就可以得到一个比较满意的解果了。

下面用一张图来表示传统机器学习与深度学习之间的差异(图源于《TensorFlow深度学习算法原理与编程实践》)

《对人工智能的简单理解》

我们可以看到机器学习和深度学习的主要区别就是机器学习需要先经过人工特征提取后才能进行学习,而深度学习只需要把数据输入到计算机中,计算机会使用卷神经网络对数据进行多次特征提取后,对提取到的特征进行学习。可以说,深度学习是基于机器学习的基础上发展的,同时深度学习又高于机器学习。

    原文作者:TongHuYouthTeam
    原文地址: https://segmentfault.com/a/1190000020029246
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞