一、Spark单机版安装 Spark部署模式主要是四种:Local模式(单机模式,是本文讲的方式,仅供熟悉Spark和scala入门用)、Standalone模式(使用Spark自带的简单集群管理器,计算数据不是特别庞大…
标签:hadoop
HDFS:Spark删除hdfs文件
1. 查看hdfs文件中前几行 随机返回指定行数的样本数据 hadoop fs -cat /test/gonganbu/scene_analysis_suggestion/* | shuf -n 5 返回前几行的样本数据…
解决There are 0 datanode(s) running and no node(s) are excluded in this operation.
出现上述问题可能是格式化两次hadoop,导致没有datanode 解决方法1:重启linux,再使用start-dfs.sh和start-yarn.sh 重启一下hadoop 解决办法2:找到hadoop安装目录下 h…
Hadoop三种部署模式及区别
Hadoop三种部署模式及区别 standalone mode,独立模式 Pseudo-Distributed mode,伪分布模式 cluster mode,集群模式 区别 集群模式不做介绍,用于实际生产环境 独立模式…
CentOS 7.0 hadoop 2.6 安装与配置
CentOS 7.0 hadoop 安装与配置 蒋小超 2015.04.03 背景介绍 hadoop 是一种大数据分布式运算解决方案。 hadoop 是什么? 实际上 hadoop 就是 Google 的 MapRedu…
hadoop – 如何将textinputformat.record.delimiter重置为hive cli / beeline中的默认值?
将textinputformat.record.delimiter设置为非默认值,对于加载多行文本很有用,如下面的演示所示. 但是,我没有在不退出cli的情况下将此参数设置回其默认值并重新打开它. 以下选项均无效(也未进…
Docker搭建Hadoop集群
Docker搭建Hadoop集群 首先搭建Docker环境,Docker版本大于1.3.2 安装主机监控程序和加速器(curl -sSL https://get.daocloud.io/daomonit/install.…
hadoop HA高可用集群模式搭建指南
简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。 HA模式的集群里面会部署两台NN(最多也只能两台),以形成主备NN节点,达到高可用的目的。两台NN之间同步数据有两种方法:QJM和NFC。本…
hadoop-2.7.4集群的安装配置
hadoop集群的安装配置 简介 Apache™Hadoop®项目是一个可靠的,可扩展的分布式计算的开源软件。 Apache Hadoop软件库是一个框架,允许使用简单的编程模型跨计算机群集分布式处理大型数…
HIve的安装
1 hadoop hive的使用依赖hadoop,所以先介绍hadoop。 1.1 hadoop下载和安装 笔者是在Centos7.3上安装的hadoop,使用的是hadoop-3.2的版本。直接按照hadoop-2.9…
HBase: HMaster服务自动停止,且关闭集群时HRegionserver无法关闭的问题解决
背景:三台阿里云Ubuntu服务器,Hadoop(2.6.5)完全分布式搭建,Zookeeper(3.4.10),HBase(1.2.6) 问题: 1、Hadoop、Zookeeper、HBase按顺序依次正常启动,但是…
hadoop性能测试TestDFSIO
1.测试工具 hadoop自带的TestDFSIO 2.命令 (1)写 sudo -u hdfs hadoop jar hadoop-test-2.6.0-mr1-cdh5.14.0.jar TestDFSIO -wri…