微软开源人工智能工具和深度学习框架

微软机器视觉、语音处理、视频检索人工智能开源工具和深度学习框架。

本文介绍了微软在人工智能领域的领先成果、产品线,开源人工智能框架和工具。读者可以运用这些工具快速开发机器视觉、语音处理、视频检索等丰富的人工智能应用。

作者:张子豪(同济大学微软学生俱乐部)

微信公众号:人工智能小技巧

本文配套B站视频:用微软Custom Version识别水果图片:不用写代码,三分钟做一个人工智能小应用

发布于2018-11-7

[TOC]

本文中的部分图片来自学堂在线慕课:微软人工智能-深度学习框架和工具

开篇语

提起微软,大家首先想到的就是世界首富比尔盖茨以及Windows操作系统等微软产品,近几年,微软大规模部署人工智能领域,开发了一系列基于人工智能技术的产品和深度学习开源框架,并致力于开源社区的建设。微软在2018年10月底完成了对全球最大开源代码托管网站Github的收购。2018年2月,本文作者在宾夕法尼亚大学沃顿商学院聆听了微软新总裁Satya Nadella的演讲,并在慕课网站学堂在线学习了慕课:微软人工智能-深度学习框架和工具 ,遂撰写本文对微软AI产品线及开源生态做一个介绍。

《微软开源人工智能工具和深度学习框架》 2018年2月微软总裁在沃顿商学院讲座

ResNet深度残差卷积神经网络

ResNet在2015年ImageNet比赛分类任务中获得第一名,在图像分类方面已超过人眼。ResNet共有152层,但它不仅仅靠深度取胜,而是通过残差学习的方法训练模型,通过“跨层抄近道”的方法减少参数数量,简单而实用。衍生出ResNet50和ResNet101旁支,Alpha zero(只训练8个小时就打败了AlphaGo的下棋机器)也使用了ResNet。

ResNet的作者何恺明是2003年广东省理科高考状元,本科毕业于清华大学,博士毕业于香港中文大学,曾在微软亚洲研究院孙剑领导的研究组实习。何恺明在图像去雾领域也成果颇丰。

《微软开源人工智能工具和深度学习框架》 ResNet
《微软开源人工智能工具和深度学习框架》 ResNet

科普文:大白话讲解卷积神经网络工作原理

视频:三分钟走进卷积神经网络

视频:大白话讲解卷积神经网络工作原理

语音识别工具Switchboard

Switchboard能够识别堪比英语专八水平的电话音频中的每个单词

《微软开源人工智能工具和深度学习框架》 语音识别

微软AI产品线

微软已经将人工智能应用部署在自己的产品中,比如语音识别小助手Cortana、Office 365,你也可以用微软提供的GPU服务器和FPGA服务器训练深度学习模型。

《微软开源人工智能工具和深度学习框架》 微软AI产品
《微软开源人工智能工具和深度学习框架》 微软AI产品线

微软认知服务 Cognitive Service

Cognitive Services为开发者提供计算机视觉、自然语言处理、语音翻译、搜索等各领域应用程序接口(API),开发者只需要简单调用API即可。

《微软开源人工智能工具和深度学习框架》 微软Cognitive Service

轻松上手计算机视觉—Custom Vision

官方主页https://www.customvision.ai

用微软的开源计算机视觉开发工具Custom Vision快速开发图像分类小应用。初学者不需要有任何深度学习、图像处理的算法知识,小学生都能快速上手。

B站视频:用微软Custom Version识别水果图片

《微软开源人工智能工具和深度学习框架》 Custom Vision

视频剪辑师的福音—Video Indexer

官方主页http://videoindexer.ai

Video Indexer是非常强大的视频和音频处理工具,用户只需上传视频或音频,即可得到关键词分析、时间线字幕、视频中出现的名人及其讲话时段、情绪分析、关键帧以及带字幕和字幕翻译的视频。

《微软开源人工智能工具和深度学习框架》 视频样本
《微软开源人工智能工具和深度学习框架》 字幕
《微软开源人工智能工具和深度学习框架》 翻译

微软开源人工智能框架CNTK

与其它开源人工智能框架(比如谷歌的Tensorflow、Facebook的Caffe,以及Keras、Torch、Theano)相比,微软的开源人工智能框架CNTK最大的优势就是训练速度快、分布式和并行计算性能好。同时,CNTK也支持各种操作系统,提供各种编程语言的开发工具。

《微软开源人工智能工具和深度学习框架》 微软开源人工智能框架CNTK
《微软开源人工智能工具和深度学习框架》 CNTK收敛速度
《微软开源人工智能工具和深度学习框架》 CNTK并行计算能力

CNTK通过减少数据传输量、传输次数,通过异步处理和管道机制权衡训练和传输代价,加速深度学习模型训练。

《微软开源人工智能工具和深度学习框架》 CNTK的并行计算能力
《微软开源人工智能工具和深度学习框架》 CNTK支持的编程语言

收购开源代码托管网站Github

《微软开源人工智能工具和深度学习框架》 微软收购Github

微软人工智能最新进展

微软研究院在业内号称“AI界的黄埔军校”,以下是微软研究院机器学习组最新进展总结。

《微软开源人工智能工具和深度学习框架》 微软人工智能新进展

分布式机器学习平台DMTK

Multiverso参数服务器开源框架,CNTK异步快速训练的幕后功臣。

高效的机器学习工具

  • LightGBM:数据竞赛利器
  • LightLDA:超大规模主体模型训练世界纪录保持者
  • LightRNN:大规模文本模型训练

新的监督学习范式:对偶学习

利用两种语言互相翻译,互相提供翻译标注数据。例如中文翻译成日语,再翻译回中文,与中文原文做比对,进行模型训练。再例如由图像生成文字,再由文字生成图像。使用对偶学习可以用更少的数据训练模型,节省人工标注数据的成本。

微软亚洲研究院

《微软开源人工智能工具和深度学习框架》 微软亚洲研究院

微软研究院在业内号称“AI界的黄埔军校”,从中涌现出众多当今互联网界泰山北斗级人物,从谷歌传奇李开复,到百度总裁张亚勤、金山CEO张宏江、微软必应产品负责人沈向洋、现任微软亚洲研究院院长洪小文、IBM“深蓝”之父许峰雄、“阿里云”之父王坚、今日头条副总裁马维英、商汤科技创始人汤晓鸥、2015年ImageNet冠军孙剑、何恺明,百度高级副总裁王海峰、小米总裁林斌、海尔集团CTO赵峰、科大讯飞副总裁李世鹏……

2018年,微软亚洲研究院成立二十年。

微软亚洲研究院20年20人

同济大学微软学生俱乐部

《微软开源人工智能工具和深度学习框架》 同济大学微软学生俱乐部

参考文献与扩展阅读

Custom Vision

Video Indexer

学堂在线慕课:微软人工智能-深度学习框架和工具

用Microsoft Custom Vision技术识别点东西吧

科普文:大白话讲解卷积神经网络工作原理

B站视频:不用写代码,三分钟做一个人工智能小应用

视频:三分钟走进卷积神经网络

视频:大白话讲解卷积神经网络工作原理

微软亚洲研究院

微软亚洲研究院20年20人

作者介绍:

张子豪,同济大学在读研究生。微信公众号人工智能小技巧运营者。致力于用人类能听懂的语言向大众科普人工智能前沿科技。目前正在制作《说人话的人工智能视频教程》、《零基础入门树莓派趣味编程》等视频教程。西南地区人工智能爱好者高校联盟联合创始人,重庆大学人工智能协会联合创始人。充满好奇的终身学习者、崇尚自由的开源社区贡献者、乐于向零基础分享经验的引路人、口才还不错的程序员。

说人话的零基础深度学习、数据科学视频教程、树莓派趣味开发视频教程等你来看!

微信公众号:人工智能小技巧

Github代码仓库:TommyZihao

个人主页:www.python666.org

同济大学开源软件协会

同济大学微软学生俱乐部

西南人工智能爱好者联盟
重庆大学人工智能协会

    原文作者:人工智能小技巧
    原文地址: https://www.jianshu.com/p/8c6e619d97d8
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞