Hadoop入门及生态系统介绍

1.Docker

Docker是一种虚拟技术,和VMware类似,装过VM虚拟机的同学应该比较清楚。相同配置的主机上,最多装4个VM虚拟机的情况下,可以装10台Docker虚拟机。

2.什么是Hadoop,Hbase和Hive

Hadoop是一个类似oracle的数据库软件

Hbase基于Hadoop的关系型数据库

Hive是基于Hadoop的数据仓库和SQL查询引擎,有特殊的查询语句:Hql

3.云游戏

云游戏属于云计算的一种,意味着以后玩游戏不需要购买高端机,云服务器会直接渲染好,将数据传输到客户端,简直是屌丝福利。

4.云计算架构图

《Hadoop入门及生态系统介绍》

5.一句话解释大数据

大数据指的是,从过去的对随机抽样进行数据挖掘,数据分析等转变为对全部数据的数据挖掘,数据分析,数据可视化等操作。重要的事说三遍:全部数据,全部数据,全部数据!

6.大数据的四个特点

Volumn 海量 Velocity 快速 Variety 多样 Veracity 真实

其中海量对应知识点5中的一句话解释大数据。

7.云计算,大数据和Hadoop的关系

云计算相当于容器,大数据则是容器中的水,云计算为大数据提供存储和计算,这些水的来源则是Hadoop。

存放了海量数据的Hadoop安装在Docker上,Docker相当于云计算服务器,可以与Hadoop进行数据间的存储和计算,然后Hadoop通过Tomcat等服务器软件和网站或者应用实现数据交互。

8.Hadoop

命名是一个工程师儿子玩具的名字,并不是专业名词缩写。

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

Hdaoop的核心设计是:HDFS(存储)和MapReduce(计算)。

HDFS是Hadoop Distributed File System的缩写,意思是Hadoop分布式文件系统。

Hadoop可以部署在普通PC机上,Hadoop时由Java编写的框架。

9.HDFS组件

采用流式数据访问形式。

什么是流式数据访问?

《Hadoop入门及生态系统介绍》 知乎大神1号

《Hadoop入门及生态系统介绍》 知乎大神2号

HDFS两种集群节点:名称节点NameNode和数据节点DataNode。

NameNode在内容中保存文件数据块映射的映像信息和整个文件系统的命名空间。

DataNode负责存储和读取数据文件。

《Hadoop入门及生态系统介绍》

10.MapReduce组件

《Hadoop入门及生态系统介绍》
《Hadoop入门及生态系统介绍》

11.Hadoop版本选择及如何学习

Hadoop1.0和Hadoop2.0

《Hadoop入门及生态系统介绍》
《Hadoop入门及生态系统介绍》
《Hadoop入门及生态系统介绍》

Hadoop版本选择:

是否为开源软件,是否免费。

是否有稳定版,一般软件官方网站会给出说明。

是否经实践验证,这个可以通过是否有大点的公司在生产环境中应用。

是否有强有力的社区支持,社区的力量是无限大的。

《Hadoop入门及生态系统介绍》
《Hadoop入门及生态系统介绍》

学习资料出自天善智能的牟瑞老师Hadoop入门课:https://edu.hellobi.com/course/39/lessons

    原文作者:趁你还年轻233
    原文地址: https://www.jianshu.com/p/7279262c9fda
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞