文章未经允许,不可转载
tips:读《深入浅出数据分析》后再看这系列文章,~_~
写在前面
当初在学习数据分析的时候,看到网上都推荐了一本书《深入浅出数据分析》,书中的用到的工具是R和Excel。读完后觉得书写的真心不错,但是我以前只学了VB6.0(大二,学校指定)、C(大三,备战计算机三级)、Matlab(研一,数值分析课)、Java(研二,理解面向对象)和Python(研三,转行),现在用到最多的也是Python,边读书边实操是比较好的,所以我把大部分章节用到R和用到Excel的地方用Python写了一遍。如果你只懂Python,电脑没有安装R和Excel,那么你只用懂Python就行
需要强调三点:
- 这系列中用到的所有源文件,可以去官方下载,也可以直接到github上下载,地址https://github.com/duohappy/Python_head_first_data_analysis
- 安装好numpy、pandas、matplotlib、scipy、scikit-learn和jupyter notebook,所有的代码均在jupyter notebook上测试通过,务必先了解下jupyter notebook的用法
- 我对有些内容思考不深,所以也不会怎么写,>_<,以后会写哪些文章,看看我的这篇博文,duohappy博客的现在和将来
是的,文章用到了数据分析很常用的四个库,是不是觉得很有意思。~_~
文章的知识点
- Python-深入浅出数据分析-最优化
- 书中使用Excel来实现的,但是太繁琐
- 线性规划基础(没有也行)
- 了解scipy
- 如果你正在学最优化之类的课程,用单纯形法解解看或者直接画图就可以解了
- Python-深入浅出数据分析 – 数据图形化
- pandas和matplotlib基础
- Python-深入浅出数据分析-主观概率
- 了解条件概率
- pandas和matplotlib基础
- Python-深入浅出数据分析-直方图
- matplotlib需要的更多一点,当然pandas也要
- Python-深入浅出数据分析-线性回归
- 了解scikit-learn
如果你想进阶下numpy和pandas,可以看看我的另一篇博文熟悉numpy和pandas
写在后面
只是提供一种实现思路,其实代码可不只有一种,如果你有更好的想法,欢迎随时和我交流,:)