Awesome Data Science in Python | 一文整理Python常用数据科学第三方模块

1. 机器学习

EDA

特征工程

模型解释

通用

自动化机器学习

2. 统计方法

通用

  • StatsModels:通用概率派
  • Scipy:含常见分布、统计量计算
  • pyro:基于pyTorch的通用统计模型库
  • Edward:基于tensorflow的通用统计模型库

贝叶斯

  • PyStan:贝叶斯模型(stan实现)
  • pymc3/pymc4(还在pre-release版本):贝叶斯模型(theano/tensorflow实现)

3. 特殊算法集

时间序列

  • pyflux:实现常用时间序列模型
  • Prophet:基于强解释的GAM(线性可加模型)

生存模型

聚类

网络

GBM

4. 可视化

5. NLP

通用

主题模型

常用Embedded集

6. ETL

7. 因果推理

8. 符号运算

    原文作者:三次方根
    原文地址: https://segmentfault.com/a/1190000019493924
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞