很久没写过博客了,一重开就给自己挖了这么一个大坑……
最近一段时间看了《机器学习实战》这本书,感觉写得不错,认真看了看。关于这本书的书评及购买事宜请移步豆瓣、京东、亚马逊等网站,这里不多说。不过有一点,感觉这本书有个很好的地方是给出了各个算法的Python实现代码和讲解,要求不高的话可以拿来用了(懒)。在这里想好好写写从这本书中学到的东西,文中的代码和主要内容也将均来自这本书。
目录
第一部分 分类
第4章 基于概率论的分类方法:朴素贝叶斯
第5章 Logistic回归
第6章 支持向量机
第7章 利用Adaboost元算法提高分类性能
第二部分 利用回归预测数值型数据
第8章 预测数值型数据:回归
第9章 树回归
第三部分 无监督学习
第10章 利用K-均值聚类算法对未标注数据分组
第四部分 其他工具
第13章 利用PCA来简化数据
第14章 利用SVD简化数据
第15章 大数据与MapReduce
本书的主页:https://www.manning.com/books/machine-learning-in-action
书中的代码和所使用的数据集可以在主页或者这里(作者的GitHub版本库)找到。
书中有的代码均使用Python 2.7,并广泛使用了NumPy模块,若干章中还使用了Matplotlib模块进行绘图。可以安装Python 2.7的官方发行版,然后依次安装NumPy和Matplotlib模块(需要解决依赖)。在这里推荐直接安装Python发行版Anaconda,已经内置了很多科学计算所需的模块,可直接使用。