倾情大奉送–Spark入门实战系列 – shishanyuan – 博客园
http://www.cnblogs.com/shishanyuan/p/4699644.html
这一两年Spark技术很火,自己也凑热闹,反复的试验、研究,有痛苦万分也有欣喜若狂,抽空把这些整理成文章共享给大家。这个系列基本上围绕了Spark生态圈进行介绍,从Spark的简介、编译、部署,再到编程模型、运行架构,最后介绍其组件SparkSQL、Spark Streaming、Spark MLib和Spark GraphX等。文章内容的整理一般是先介绍原理,随后是实战例子,由于面向的是入门读者,在实战中多截图,还请谅解。为了大家实验方便,在这里把实验相关的测试数据和安装包放在百度盘提供下载 地址为http://pan.baidu.com/s/1o7HpDEy 密码:9xjt。
本系列博客在博客园和CSDN首发,地址为:
博客园 http://www.cnblogs.com/shishanyuan
CSDN http://blog.csdn.net/yirenboy
以下为该系列文章列表:
1.Spark及其生态圈简介 下载
2.Spark编译与部署(上)–基础环境搭建 下载
2.Spark编译与部署(中)–Hadoop编译安装 下载
2.Spark编译与部署(下)–Spark编译安装 下载
3.Spark编程模型(上)–编程模型及SparkShell实战 下载
3.Spark编程模型(下)–IDEA搭建及实战 下载
4.Spark运行架构 下载
5.Hive(上)–Hive介绍及部署 下载
5.Hive(下)–Hive实战 下载
6.SparkSQL(上)–SparkSQL简介 下载
6.SparkSQL(中)–深入了解运行计划及调优 下载
6.SparkSQL(下)–Spark实战应用 下载
7.Spark Streaming(上)–实时流计算Spark Streaming原理介绍 下载
7.Spark Streaming(下)–实时流计算Spark Streaming实战 下载
8.Spark MLlib(上)–机器学习及SparkMLlib简介 下载
8.Spark MLlib(下)–机器学习库SparkMLlib实战 下载
9.Spark图计算GraphX 下载
10.分布式内存文件系统Tachyon介绍及安装部署 下载