导读
我们认为艺术基本上是人类事业,但近几年我们发现,机器也可以理解创造力。机器算法可以评估唱片公司和电影公司的音乐和影片。一位音乐教授甚至创建一个程序写出了广受好评的作品。
矛盾的是,研发出能够进行艺术创作的机器算法是人类能力的又一突破。与传统的挖掘机和从事汽车制造的机器不同,进行艺术创作的算法需要去理解一些甚至人类自己都很难表达的东西。这就是谷歌Magenta项目的意图:研发能够进行艺术和音乐创作的机器学习工具。
Magenta是建立在机器学习工具库TensorFlow基础上的。谷歌最近在其发布了开源技术,允许任何人下载源代码。为了了解为什么谷歌会开放这些最先进最核心的技术,我采访了谷歌公司的高管。
理解TensorFlow
为了理解什么是TensorFlow,试想一下拿着工具箱来到你家进行修理的管道工。有一些工具使用起来很简单,比如扳手和填缝抢,但别的工具就非常专业了,这些工具是为了能让他在有限的空间中修理一些特殊管道和装置而专门设计的。
TensorFlow的工作原理就类似如此。比如说,有些工具能够识别音频和图像,有些工具能分析语句,通过理解句子中词语之间的关系来探究句子的含义。通过结合这些工具,TensorFlow允许开发者建立高度智能化的产品。
让我们回到刚才管道工的例子,来理解如何使用TensorFlow。大部分管道工的工作都是比较简单的,比如疏通水槽和马桶。但时不时的,他也会遇到困难。当这种情况发生时,他也许得花上一整天或更多的时间去找出问题或解决问题。
如果有人想要研发一款智能管道工帮手软件,他就可以运用TensorFlow里的工具,去分析数据库中上百万的零件和技术手册。不过,就像真人管道工助手一样,谷歌的算法也不会马上就知道它们要寻找什么。它们必须接受训练。
训练机器算法
人工智能的概念并不是最近才有,而是起源于1965年。当时,在美国达特默斯(Dartmouth)有一系列的相关会议,很多行业先驱都有参与,包括Marvin Minsky和信息论之父Claude Shannon。他们对于这个项目非常有激情,并认为他们可以在20年内解决问题。但显然他们没能做到。事实证明,人类的知识不是能够通过简单的被编码进由逻辑语句连接的规则中来概括的。然而计算机科学家们试图在机器中存入很多专业知识,但这并不代表着机器能够理解。简单来说,建立在逻辑规则上的系统不能够实现人工智能。
像TensorFlow这样的人工智能系统,与传统系统最大的不同点,就是它能够学习。谷歌也公开了他们训练算法的方法,这样一来,即便对于人工智能没有专业的了解,开发者们也可以创建实用的程序。
让我们再一次回到智能管道工帮手软件的例子,在对软件系统进行了上千次图像训练,并接受了人类专家的指导后,这个系统就可以开始识别管道工具的重要属性了。这个系统可能不太完美,但它可以帮助人类缩小选项,节约了大量时间。这个软件里还可以包含反馈功能,这样的话它就可以不断从错误中学习。
这样的技术并不简单,也需要时间来实现,但是谷歌的这些技术显然有着巨大的潜能。虽然这些技术不能创造出无所不知无所不能的机器人,但却为人类更高效地与机器合作提供了巨大的可能。
开放TensorFlow
TensorFlow当然是极有价值的技术。机器学习本来就位于计算机科学的前沿,而谷歌是少数在这个领域拥有这种高端能力的公司之一。那么,它为何将代码向公众开放,任何人,包括竞争对手都可以看到?
决定开放源代码是Jeff Dean的主意。他觉得公司的创新努力被常规科学的缓慢节奏所阻碍:谷歌的研究人员写了一篇文章,几个月后该文章会在学术会议上讨论一番,再过几个月别的一些人在此基础上再写一篇文章。
Dean看到,如果将TensorFlow开源,将大大加速这一过程。与其等待下一篇文章或者下一次学术会议,谷歌的研究人员可以实时地与科学界的同道们积极合作,谷歌之外的牛人也可以改进源代码,同时,通过更加广泛地共享机器学习技术,可以为该领域募集到更多技术天才。
“将这个系统开源以后,我们可以与大学或者创业公司的研究人员合作,他们给了我们新的想法来改进我们的技术。自从我们做出开源的决定以后,代码运行更快了,能做的事更多了,弹性更强了,也更方便了。” Rajat Monga,TensorFlow的负责人如是说。
从传统的观点来看,谷歌开放其机器学习工具源代码的决定似乎有些奇怪。我们无法想象可口可乐公布它著名的配方,而很多科技公司像苹果,以产品和处理过程的保密性著称,即使是谷歌,在许多事情上,比如它的搜索算法,也是捂得紧紧的。
然而,世界在改变。以前,成功最可靠的路径是优化价值链。通过磨炼内部流程和规模化,你可以同时提高对客户和供应商的议价能力,创造更高的效率。如此你建立起可持续的竞争优势。
原作者: Andrea Woroch
来源: 大数据文摘