本文首次发表于译言网,翻译自Technet.com,为[机器学习]系列文章之一。
发表地址:http://article.yeeyan.org/view/propiram/442033
这篇博客文章由微软研究院的杰出科学家John Platt所撰写。
大家好,我是John Platt。在微软,我从事于建立和使用机器学习技术(略称ML)的算法,至今已有17年之久。因为机器学习技术最近变得非常流行,所以经常有人问我:“什么是机器学习?你用它来做什么?”
我非常高兴来回答这些疑问,因为事实证明,机器学习技术的应用已经广泛地渗入到微软庞大的产品群之中——也得益于此,使得微软成为一个趣味性强、影响力广的地方来研究机器学习技术(这就如同一个孩子身临糖果屋一般)。
一般而言,机器学习技术可将数据集(由数据所组成的集合)转换为称为“模型”的许多软件,它能够表示数据集并概括,以对新数据进行预测。介于机器学习技术被如此广泛地应用,我认为将机器学习的应用进行粗略地分类大有裨益。机器学习技术可以被应用于如下三种不同方式:
- 数据挖掘:机器学习技术可以被人们使用以从大型数据库中获得见解。
- 统计工程:机器学习技术可以被用于将数据转换为,对不确定性数据做出决策的软件。
- 人工智能:机器学习技术可以被用于模拟人类思维,来创造出能够(如人类一样)看、听、理解的电脑。
在微软,我们在这三种途径上都应用了机器学习技术。例如:
对抗恶意软件
微软恶意软件防护中心,与微软研究院一道,已经使用机器学习技术来开发出能够自动监测出恶意软件的软件,并用来帮助分析师了解恶意软件的发展状况。你能通过Dennis Batchelder的博客条目来阅读这方面的更多内容。
建立搜索引擎
微软的搜索引擎Bing是一个能够解读你的查询信息、快速遍历网页、然后返回对你有帮助的信息的一个非常复杂的系统。由于Bing拥有如此高额的流量,我们必须使用自动化决策方案,使之能够处理自然语言的不确定性与不明确性。我们已经利用机器学习技术开发出许多Bing的组件,它们能够协同工作以形成一个高质量的搜索引擎。机器学习技术有助于搜索的一个特别形式是搜索结果排序:几年前,来自微软研究院的一个团队使用我们已经开发出的算法,在一个排序竞赛上获胜。
赋予电脑以视觉和听觉
微软在计算机视觉与语音识别两方面,一直于技术的各个阶段起推动作用。在Kinect中能够识别你手势的软件正是由机器学习技术所开发。微软的语音识别系统是基于深度学习技术,它是以大脑结构为灵感的机器学习模型的一个形式。我们还运用机器学习技术开发出一个实时的对话翻译器。
看这些令人兴奋的应用程序,我意识到现在对机器学习技术而言,正是一个具有魔力的时期。许多研究人员与开发人员一直稳定地致力于这些应用长达数年。得益于摩尔定律和互联网,我们现在拥有标记数据与运算能力,使用机器学习技术开发出卓越的软件。我期望为其他开发者们提供我们的算法和工具,使他们能够发挥他们的创造力开发出属于他们自己的卓越的各项应用产品。
在我下一篇文章中,我将谈及近二十年,机器学习技术在微软是如何演变发展的。我非常期望能够以这个博客为契机,同我们的读者进行深层互动!
John Platt