1.Hadoop HDFS架构向导的目的 在这篇关于HDFS文章结构的指南里,你可以读到所有关于HDFS的东西。首先,我们讨论一下HDFS的设计理念和目标。这个结构教程会覆盖所有Hadoop HDFS的结构细节,比如Na…
标签:hadoop
阿里橙鹰
数据开发技术专家 1、负责基于Hadoop、Hive、HBase、Spark等开源计算平台的实施、优化和定制开发,研发稳定又易用的大数据平台。 2、根据公司产品和业务发展特点,研究相关的大数据产品和技术发展方向。 3、针…
干货!Hadoop学习资源合辑
作者:IT程序狮 原文地址:http://www.jianshu.com/p/4a23fa85d64e 说到大数据,不得不提Hadoop系统,这个系统也已经超过十年的历史了。程小狮曾以为大数据就是Hadoop系统,请原谅…
简单介绍常用hadoop dfs命令
创建目录 hadoop dfs -mkdir /home 上传文件或目录到hdfs hadoop dfs -put hello / hadoop dfs -put hellodir/ 查看目录 hadoop dfs -l…
Hadoop重新格式化HDFS的方法
一、记一次“不合格”的方法 这种方法也是网上参考博客得来的,一开始就觉得有问题,后来真的发现了问题。 首先停止已经启动的hadoop: [hadoop@localhost ~]$ stop-all.sh 然后查看hado…
Greenplum pxf 连接hadoop
最近在搞greenplum连接hadoop,采用pxf插件。hadoop集群是kerberos认证的。 首先添加一下hadoop的参数: $ gpconfig -c gp_hadoop_target_version -v…
HDFS基础命令
1、hadoop fs hadoop fs = hdfs dfs 2、ls命令 …
Hadoop 入门(二)
目录 Hadoop 安装 单点启动&集群启动 访问 HDFS 常用配置 常用命令 启动关闭集群 单节点启动&停止 namenode 单节点启动 [root@node0 name]# hadoop-daem…
hadoop概念
大数据生态圈的概念 参考如何用形象的比喻描述大数据的技术生态? 为了用大量的机器(成千上百台)存下数据,设计出了HDFS(Hadoop Distributed FileSystem)。 存下数据以后为了能更好的处理(索引…
零基础入门学习大数据可以从事哪些工作?
2018年随着当代信息技术的迅猛发展,大数据在人们的工作、生产、生活、学习、娱乐等方面,人们想开始学习大数据的时候,最常问我的问题是,“我应该学Hadoop(hadoop是一款开源软件,主要用于分布式存储和计算,他由HD…
hadoop – Hive查询不使用索引
我正在分析在hive表上使用索引的影响.我创建了一个包含5列(COL1,COL2,COL3,COL4,COL5)的表格,并在其中加载了100000行.我还在这张桌子上创建了一个关于COL1的索引. 我在COL1上运行se…
Spark-on-yarn遇到的Java crash问题
问题描述 配置好Hadoop集群(包括hdfs和yarn),配置好spark-on-yarn,提交任务后发现container异常退出,有core dump产生;修改yarn的资源配置,依然crash。 containe…