大数据技术及算法学习清单

基础

数据结构与算法

大数据技术

离线计算

hive sql
spark sql
可重点研究下hadoop map reduce原理及spark框架
http://dblab.xmu.edu.cn/blog/…

实时计算

重点掌握flink,大厂基本是flink这套搞实时计算,未来趋势
推荐加入钉钉 flink社区群,里面有大量视频和课件
推荐博客:http://www.54tianzhisheng.cn/…

消息队列

掌握kafka

存储

hdfs、hbase、ES、Redis

这几大组件掌握原理,能使用,重点选一个框架研究吧,推荐flink,比较看实时计算发展

机器学习

首推李宏毅的机器学习课程
https://www.jiqizhixin.com/ar…
网易云课堂NG的机器学习课程和深度学习课程
《python机器学习实战》
李航《统计学习方法》
花书《深度学习》
若是方向搞大数据技术,这块前期做了解即可,把基础组件搞扎实再扩充这块知识面

数据及算法服务

spring boot、dubbo

    原文作者:dataliu
    原文地址: https://segmentfault.com/a/1190000020087123
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞