Mapper任务: Mapper任务是一个名词,用来形容在记录读取器中用来读取每条记录和产生对应中间件键值对儿的过程,Hadoop Mapper存储输出介质数据在本地磁盘上。 2.2 LZO 压缩用法 有一个非常的概念去…
标签:hadoop
hadoop+hbase 伪分布式安装
基本环境及软件: 软件版本 软件包 centos-6.x JDK-1.8 jdk-8u112-linux-x64.tar.gz hadoop-2.7 hadoop-2.7.4.tar.gz hbase-1.2.6 hba…
hadoop上搭建hive(远程模式+hive服务端、客户端)
环境 hadoop2.7.1+ubuntu 14.04 hive 2.0.1 集群环境 namenode节点:master (hive服务端) datanode 节点:slave1,slave2(hive客户端) hiv…
hadoop单机,伪分布搭建运行总结
1. hadoop的搭建 hadoop的搭建可参考文章 http://www.powerxing.com/install-hadoop/,文章比较完整且详细的介绍了单机和伪分布的搭建。 2. mapreduce的学习 m…
Hadoop安装指南
hadoop单机/伪分布式安装指导链接: hadoop集群安装 HDFS学习资源: HDFS入门 Hbase学习资源: Hbase入门 数据库汇总: mongodb安装及操作 Redis安装及操作 MySQL安装及入门 …
Hadoop-2.6.4 完全分布式搭建
资源准备 准备4台 Linux 服务器要求:glibc 版本 >= 2.14 192.168.9.1 192.168.9.2 192.168.9.3 192.168.9.4 安装配置 JDK1.7+(详细操作) 下…
Hadoop深入面试问答题
1. 简单描述如何安装配置一个apache开源版hadoop,只描述即可,无需列出完整步骤,能列出步骤更好。 1) 安装JDK并配置环境变量(/etc/profile) 2) 关闭防火墙 3) 配置hosts文件,方便h…
HBase深入(二)结合MapReduece
HBase, MapReduce, and the CLASSPATH $HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath` \ ${HADOOP_HOME}/bin…
hadoop+spark 伪分布式安装
基本环境及软件: 软件版本 软件包 centos-6.x JDK-1.8 jdk-8u112-linux-x64.tar.gz scala-2.11.8 jdk-8u112-linux-x64.tar.gz hadoop…
玩转大数据-如何搭建Hbase集群
小编的上一篇文章说了如何搭建hadoop集群,我们的目的还是为了去最终搭建一个成功的Hbase集群,不说太多废话,我们直接上教程。 本文只给出如何搭建Hbase集群的方法。但是Hbase最重要的一个步骤其实是性能调优,H…
Zookeeper相关知识
一.Zookeeper是什么? Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用…
Hadoop2.7.2完全分布式部署安装
最近需要安装Hadoop,HBase,Zookeeper。目前自己摸索了几天,终于打Hadoop2.7.2的完全分布式安装弄好了。写篇文章Mark下,自己回头可以看一下,也希望对读者有点帮助。目前还是有些问题的,会在文章…