【AI科技大本营导读】AI 在经历了一波浪潮之后,走到了最重要的一个环节:落地。传统企业如何搭上 AI 的顺风车,助力企业升级呢?UCloud 实验室研发总监叶理灯认为人工智能落地主要分为三个步骤:一个是 Build搭建,一个是 Train训练,一个是 Deploy部署。
AI火爆原因
2017年人工智能非常火,到底原因是什么呢?UCloud 实验室研发总监叶理灯在一次小型媒体见面会上发表了自己的看法。
第一,AI火爆有一定的前奏,首先是技术上的进步,深度神经网络的提出和计算能力发展带来AI的爆发。
第二,开源框架降低了学习和应用的门槛,例如 TensorFlow 等。
第三,媒体的宣传。2016 年AlphaGO 带来一些平民化的认知,这是人工智能的第三波浪潮。第一波,第二波是 20 世纪 50 年代,70 年代,一波一波地持续推进AI科技发展的进程。
为什么这次AI的话题爆发会这么持久?或者说它的应用离普通百姓比较近呢?叶理灯认为,这一波主要基于深度学习,深度神经网络的发展。
第一,算法的发展。
第二,计算能力提高。云计算,以及芯片硬件的发展,给计算能力提供很好的支持,因此落地比较容易。
第三,资源支持。很多大厂,像谷歌会提出一些开发的框架,比如说 TensorFlow,将人工智能机器学习的门槛降低,使得本次浪潮中在AI实用性上做得比较好。
第四,计算机视觉的成熟。人脸识别,包括 iPhone Face ID等人工智能技术在图像识别上最成熟的应用。
在叶理灯看来,人工智能的发展主要依赖于三个要素:数据;算法;计算能力。
首先是数据。有一个说法叫有多少个人工就有多少个智能。在一波机器学习的浪潮中,从机器学习分类可分为监督学习和非监督学习,90% 有实用意义的机器学习都是监督学习,监督学习意味着训练模型,事先给数据打标签,打标签是一个体力活,数据量越大,数据出来的精度就越高,所以为什么说有多少人工就有多少智能。举个例子来说,鉴黄,假设你要做一个鉴黄模型,鉴别这张图片是黄色的还是性感的还是普通的,需要找很多图,并且一张一张进行人工的标记。
接下来是算法和大量的计算能力。有一个理论叫“火箭理论”,如果把人工智能当火箭的话,那么数据是火箭的原料,计算能力就是引擎,算法就是引擎的控制器。
AI与云计算的关系
为什么说云计算跟人工智能的落地有很大的关系?
首先,随着云计算的发展,很多互联网企业的创业基本上都是在云计算上,因此越来越多的数据是在云计算上产生的,数据的生产和消费都在云计算上。因此,在云计算上做机器学习的训练和 Inference 是非常自然的一件事情。
另外一点,在观察了很多家 AI 公司之后,叶理灯称明确感觉到 AI 分为两波浪潮:上下半场。上半场是很多初创型企业借人工智能浪潮去创业。下半场从去年下半年开始,很多传统行业觉得人工智能对提高生产效率有很大的帮助,他们开始建专门的团队,或者引进有AI能力的公司来帮他们去提高生产效率。举个例子:传统的纺织行业,以前去判断布是否合格,是人工去看的,现在会有专门的算法公司给他们做算法,通过计算机视觉,通过图片去判断布织的是否合格,这明显就提高了效率,降低了人力成本。
同时人工智能跟目前的区块链有点类似,它只是一门技术,它不是一个行业,也就是说这个东西要落地的话,一定要跟行业结合起来,渗透到行业里面去,这才是人工智能的价值所在。
例如,金融领域的算法做的是 Case by Case,这个领域的公司多数不会选择做一个通用的 AI ,因为他们觉得当前这个阶段做通用的AI价值不大,一是每个行业面临的问题是不一样的,没有一套通用的解决方案,第二,他们觉得人工智能一定要从炒概念这一点跳出来,结合行业具体的问题去通过 AI 的算法去解决。
AI落地三步骤
人工智能落地有三个步骤,一个是 Build搭建,一个是 Train训练,一个是 Deploy部署。
Build,是指根据目前遇到的问题去找对应的算法或者定义对应的算法,将算法用到自己的数据中列一个模型出来,这个模型要变成在线服务才能产生价值。比如刚才提到的鉴黄模型,总得放在线上,拿一张新的图片的时候,它变成一个服务,才能去鉴定这个图片到底是色情的还是普通的。
AI落地除了以上三个步骤外,还有很重要的一点,就是AI的系统。企业要把AI落地,其实是要搭建一套AI的系统。每个行业的IT水平参差不齐,有些公司可能去买一些硬件和计算机自己搭一套。对于没有能力自己搭建AI系统的公司,云计算是一个很好的辅助手段。云计算在这方面已经很成熟了,包括基础设施的建设,包括软件架构的建设,可以帮企业去落地。
叶理灯介绍 UCloud 是一个中立的平台,企业宗旨是上不碰应用,下不碰数据。UCloud 专门提供一些易用的 AI 平台,把上述提到的 AI 落地三步骤的后两个步骤包含进来,包括 AI 训练,模型推理。
在合作伙伴合作方面,UCloud与英特尔进行了深度的合作。UCloud采用英特尔至强系列处理器,利用英特尔提供的CPU能力、虚拟化能力、Caffe、针对AVX指令集的优化和针对机器学习的库等等。同时,UCloud和英特尔已经联手提供了很多定制化方案,让用户能够享受到强大性能的产品和高效率服务。
除此之外,UCloud还会去引入 AI 算法公司。目前 UCloud 平台上有8万多家企业,这些企业可能需要 AI 的能力,他们自己没有能力建设的时候,会有专门的 AI 公司提供相应的 AI 能力。这些AI能力中包括OCR 识别(Optical Character Recognition,光学字符识别),比如目前一些快递公司会拍一张快递单,直接把地址抽出来就是 OCR 。
在“ AI 训练”和 “AI 在线推理”上,叶理灯举例称,例如互联网金融P2P行业,为了加快客户的放贷速度,客户会在网站上提供个人资料,包括身份证、以前的信贷记录,此前靠人工去判断。现在UCloud会做一个算法,去识别图片里的文字,再做语义识别,判断这个人的信用到底怎么样。一些拥有自己的算法和模型的AI 公司,可以方便地把AI 模型搬到 UAI-Inference 这个产品上,这样相当于把这个模型变成一个在线服务, UCloud 对外提供接口,系统直接把UCloud的接口迁入他们的系统里面去,加快P2P行业公司的放贷速度。
UCloud服务某“在线论坛”公司。UCloud的AI在线服务给他们做什么呢?UCloud训练模型,这个模型用来识别这个论坛上的用户头像,甄别这个头像到底是不是一个人,如果没有头像会提醒他做什么,有头像的话会识别头像里面的内容,然后给他们推荐相关内容和服务。
叶理灯还在媒体见面会上介绍 UCloud 优势:海量的计算资源,基于英特尔处理器搭建。英特尔产品成本很低,性能很高,同时英特尔也做了很多软件优化工作,包括基于机器学习的特点框架,利用英特尔 Caffe,专门用于计算机视觉的框架,根据他们的指令集做了优化。
举个例子,在识别图片里面文字的时候,如果用未经框架优化的普通的CPU来识别,时间应该是几十秒,但是经过英特尔Caffe框架优化完成之后,变成一秒钟,这个提升是非常大的。