一、 hadoop 离线部分 1. hadoop HA 集群都要启动哪些进程,他们的作用是什么 Namenode:(1) 维护文件系统的目录树,管理文件系统的 namespace、(2) 管理元数据信息、(3) 接收用户…
标签:hadoop
Hadoop之Unable to load native-hadoop library问题解决
在安装好Hadoop后,每次输入命令都会出现下面警告: WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform…
Hadoop、Spark、HBase与Redis的适用性讨论
最近在网上又看到有关于Hadoop适用性的讨论[1]。想想今年大数据技术开始由互联网巨头走向中小互联网和传统行业,估计不少人都在考虑各种“纷繁复杂”的大数据技术的适用性的问题。这儿我就结合我这几年在Hadoop等大数据方…
Hadoop到底能做什么?怎么用hadoop?
hadoop是什么? (1)Hadoop是一个开源的框架,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,并不适合那种对几个记录随机读写的在线事务处理模式。Hadoop=HDFS(文件系统,数据…
Hadoop安装配置文件(超详细)
【嵌牛导读】一个Linux小白的角度来讲述亲身经历安装Hadoop的全过程。虽说网上教程是有许多的,但是总感觉或因版本问题或因作者互抄不负责的原因,许多需要强调的细节并没有讲清楚。笔者自己在安装的过程中,由于对Linux…
手把手教你搭建hadoop+hive测试环境(新手向)
本文由网易云 发布。 作者:唐雕龙 本篇文章仅限内部分享,如需转载,请联系网易获取授权。 面向新手的hadoop+hive学习环境搭建,加对我走过的坑总结,避免大家踩坑。 对于hive相关docker,并没有官…
Apache Ranger安装配置以及和LDAP集成
导语 Ranger是Hadoop平台的集中式安全管理框架,能够为hadoop平台组件提供细粒度的访问控制。通过Ranger, Hadoop管理员能够轻松地管理各种安全策略,包括:访问文件/文件夹,数据库,Hive表,列,…
CentOS6.5安装Hbase1.2.6
一、安装Hadoop集群,这里准备两台,hd01,hd02 二、在hd01上安装单节点的Zookeeper,安装过程省略 三、用户root用户创建目录hbase,并赋权限给hadoop用户,如果没有,创建hadoop用户…
快速搭建Hadoop及HBase分布式环境
本文旨在快速搭建一套Hadoop及HBase的分布式环境,自己测试玩玩的话ok,如果真的要搭一套集群建议还是参考下ambari吧,目前正在摸索该项目中。下面先来看看怎么快速搭建一套分布式环境。 准备 三台虚拟机:1台作为…
hadoop – 确定地图/减少工作瓶颈的正确方法是什么?
在正常的 Java开发中,如果我想提高应用程序的性能,我通常的程序是运行附加了分析器的程序,或者在应用程序中嵌入一组检测标记.在任何一种情况下,最直接的目标是确定应用程序的热点,然后能够衡量我所做的更改的影响. 当应用程…
3. Hadoop之旅——运维篇
HDFS A. ha dfs 初始化和启动 启动zookeeper集群 在主Name结点上 格式化zookeeper上相应目录 hdfs zkfc -formatZK 格式化主NameNode, 格式化会格式化已存在的结…
spark 基础知识整理(一)
一.Spark是什么? Spark是一个基于内存计算的开源的集群计算系统,目的是让数据分析更加快速。Spark非常小巧玲珑,由加州伯克利大学AMP实验室的Matei为主的小团队所…