【干货】GitHub上最流行的28个开源机器学习项目

1. TensorFlow

GitHub项目地址:

https://github.com/tensorflow/tensorflow

TensorFlow是谷歌发布的第二代机器学习系统。

2. Scikit-Learn

GitHub项目地址:

https://github.com/scikit-earn/scikit-learn

Scikit-Learn是用于机器学习的Python模块,它建立在SciPy之上。

3. Caffe

GitHub项目地址:

https://github.com/BVLC/caffe

Caffe是由神经网络中的表达式、速度、模块化产生的深度学习框架。

4. PredictionIO

GitHub项目地址:

https://github.com/PredictionIO/PredictionIO

PredictionIO是面向开发人员和数据科学家的开源机器学习服务器。它支持事件采集、算法调度、评估,以及经由REST APIs的预测结果查询。

5. Brain

GitHub项目地址:

https://github.com/harthur/brain

Brain是JavaScript中的神经网络库。

6. Keras

GitHub项目地址:

https://github.com/fchollet/keras

Keras是极其精简并高度模块化的神经网络库,在TensorFlow或Theano上都能够运行,是一个高度模块化的神经网络库,支持GPU和CPU运算。

7. CNTK

GitHub项目地址:

https://github.com/Microsoft/CNTK

CNTK(Computational Network Toolkit )是一个统一的深度学习工具包,该工具包通过一个有向图将神经网络描述为一系列计算步骤。

8. Convnetjs

GitHub项目地址:

https://github.com/karpathy/convnetjs

ConvNetJS是利用Javascript实现的神经网络,同时还具有非常不错的基于浏览器的Demo。

9. Pattern

GitHub项目地址:

https://github.com/clips/pattern

Pattern是Python的一个Web挖掘模块。

10. NuPIC

GitHub项目地址:

https://github.com/numenta/nupic

NuPIC是一个实现了HTM学习算法的机器智能平台。

11. Theano

GitHub项目地址:

https://github.com/Theano/Theano

Theano是一个Python库,它允许使用者有效地定义、优化和评估涉及多维数组的数学表达式,同时支持GPUs和高效符号分化操作。

12. MXNet

GitHub项目地址:

https://github.com/dmlc/mxnet

MXNet是一个兼具效率和灵活性的深度学习框架。它允许使用者将符号编程和命令式编程相结合,以追求效率和生产力的最大化。

13. Vowpal Wabbit

GitHub项目地址:

https://github.com/JohnLangford/vowpal_wabbit

Vowpal Wabbit是一个机器学习系统,该系统推动了如在线、散列、Allreduce、Learning2search、等方面机器学习前沿技术的发展。

14. Ruby Warrior

GitHub项目地址:

https://github.com/ryanb/ruby-warrior

Ruby Warrior通过设计了一个游戏使得Ruby语言和人工智能学习更加有乐趣和互动起来。

15. XGBoost

GitHub项目地址:

https://github.com/dmlc/xgboost

XGBoot是设计为高效、灵活、可移植的优化分布式梯度Boosting库。它实现了Gradient Boosting框架下的机器学习算法。

16. GoLearn

GitHub项目地址:

https://github.com/sjwhitworth/golearn

GoLearn是Go语言中“功能齐全”的机器学习库,简单性及自定义性是其开发目标。

17. ML_for_Hackers

GitHub项目地址:

https://github.com/johnmyleswhite/ML_for_Hackers

ML_for_Hackers是针对黑客机器学习的代码库,该库包含了所有针对黑客的机器学习的代码示例(2012)。

18. H2O-2

GitHub项目地址:

https://github.com/h2oai/h2o-2

H2O使得Hadoop能够做数学运算!它可以通过大数据衡量统计数据、机器学习和数学。

19. neon

GitHub项目地址:

https://github.com/NervanaSystems/neon

neon是Nervana基于Python语言的深度学习框架,在诸多常见的深层神经网络中都能够获得较高的性能,比如AlexNet、VGG或者GoogLeNet。

20. Oryx 2

GitHub项目地址:

https://github.com/cloudera/oryx

开源项目Oryx提供了简单且实时的大规模机器学习、预测分析的基础设施。它可实现一些常用于商业应用的算法类:协作式过滤/推荐、分类/回归、集群等。

21. Shogun

GitHub项目地址:

https://github.com/shogun-toolbox/shogun

Shogun是一个机器学习工具箱,由Soeren Sonnenburg 和GunnarRaetsch(创建,其重点是大尺度上的内核学习方法,特别是支持向量机SVM(Support Vector Machines)的学习工具箱。

22. HLearn

GitHub项目地址:

https://github.com/mikeizbicki/HLearn

HLearn是由Haskell语言编写的高性能机器学习库,目前它对任意维度空间有着最快最近邻的实现算法。

23. MLPNeuralNet

GitHub项目地址:

https://github.com/nikolaypavlov/MLPNeuralNet

MLPNeuralNet是一个针对iOS和Mac OS系统的快速多层感知神经网络库,可通过已训练的神经网络预测新实例。

24. Apache Mahout

GitHub项目地址:

https://github.com/apache/mahout

Mahout是Apache Software Foundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。

25. Seldon Server

GitHub项目地址:

https://github.com/SeldonIO/seldon-server

Seldon是一个开放式的预测平台,提供内容建议和一般的功能性预测。

26. Datumbox – Framework

GitHub项目地址:

https://github.com/datumbox/datumbox-framework

Datumbox机器学习框架是用Java编写的一个开源框架,该框架的涵盖大量的机器学习算法和统计方法,并能够处理大尺寸的数据集。

27. Jubatus

GitHub项目地址:

https://github.com/jubatus/jubatus

Jubatus库是一个运行在分布式环境中的在线机器学习框架,即面向大数据数据流的开源框架。

28. Decider

GitHub项目地址:

https://github.com/danielsdeleo/Decider

Decider是另一个Ruby机器学习库,兼具灵活性和可扩展性。

    原文作者:一米见方文化
    原文地址: https://zhuanlan.zhihu.com/p/27971054
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞