macOS安装hadoop 3.0.0伪分布式教程

简介:Hadoop是一个由Apache基金会所开发的分布式系统基础架构。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算.本教程将指导如何用苹果macOS系统安装Hadoop。

1:安装Homebrew

类似使用ubuntu系统apt-get的软件安装方式。macOS上也有类似这样的包管理器,利用Homebrew即可。 Homebrew的官方网站

安装Homebrew的方法:

/usr/bin/ruby -e “$(curl -fsSLhttps://raw.githubusercontent.com/Homebrew/install/master/install)”

ps:homebrew常用shell命

# 查看brew的帮助 brew -help

# 安装软件 brew install hadoop

# 卸载软件 brew uninstall hadoop

# 搜索软件 brew search hadoop

# 查看已经安装的软件 brew list

# 更新软件 brew update

# 更新某具体软件 brew upgrade hadoop

ps:环境变量配置

修改profile文件

 nano ~/.bash_profile

添加如下内容:

export HADOOP_HOME=/usr/local/Cellar/hadoop/3.0.0/libexecexport PATH=$PATH:$HADOOP_HOME/bin/export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_121.jdk/Contents/Ho$export ANDROID_HOME=${HOME}/Library/Android/sdkexport PATH=${PATH}:${ANDROID_HOME}/toolsexport PATH=${PATH}:${ANDROID_HOME}/platform-toolsexport JAVA_OPTS=”-Djava.library.path=$HADOOP_HOME/lib/native”

#这行需要注意,在笔者最开始这样配置的时候报过错,最后部分需要改为$HADOOP_INSTALL/lib/native,但后来测试的时候又不需要了。所以如果读者本遇到类似缺库的问题,可以尝试修改这个地方。 

export HADOOP_OPTS=”-Djava.library.path=​HADOOP_INSTALL/lib/native #HADOOP VARIABLES END 

顺便在这里配置java路径:

首先输入代码看看你把 Java 装到哪里了 :

 /usr/libexec/java_home

《macOS安装hadoop 3.0.0伪分布式教程》

输入代码: java -version

如果已经装了Java,你会看到类似酱紫结果:

java version “1.8.0_121″Java(TM) SE Runtime Environment (build 1.8.0_121-b13)Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode)

如果没有 ,用 Homebrew 安装了最新版本 Java:brew install java

2:ssh登录本地

首先在系统里打开远程登录,位置在 System Preference -> Sharing 中,左边勾选 Remote Login,右边选择 All Users。

系统偏好可用快捷键 command+space 中搜索 “System      Preference” 打开。

1:首先生成ssh公钥,终端命令代码如下

ssh-keygen -t rsa -P “”

cat ​HOME/.ssh/authorized_keys

2:接下来进行测试登录本地是否成功,在 Terminal 里输入以下代码查看能不能免密 ssh 到 localhost:

ssh localhost

3:登录成功显示结果如下:

《macOS安装hadoop 3.0.0伪分布式教程》

3:安装Hadoop

3.1 : 输入以下代码,自动安装hadoop:

brew install hadoop

安装过程会提示重要的信息,如下:

$JAVA_HOME has been set to be the output of:  /usr/libexec/java_home

在macOS中,我们可以终端输入:/usr/libexec/java_home来获取JAVA_HOME的路径 Hadoop的安装需要配置JAVA_HOME,用 brew安装,就已经帮我们配置好了。

ps:通过Homebrew安装软件后,软件目录一般位于/usr/local/Cellar,并软件目录里面带有版本号. 如图我的hadoop安装目录如下:

《macOS安装hadoop 3.0.0伪分布式教程》

4:测试Hadoop是否安装成功

Hadoop有三种安装模式:单机模式,伪分布式模式,分布式模式 分布式模式需要在多台电脑上面测试,这里只测试 伪分布式模式

4.1:测试伪分布式模式

测试为分布模式前,需要修改相关的5个配置文件,把homebrew默认的单机模式修改成伪分布式模式

可以使用nano或者vim进行配置文件的修改,我这里使用sublime文本编辑器修改,方便省事儿。修改路径如图所示:

修改Core-site.xml(位置 etc/hadoop/),改参数如下:

《macOS安装hadoop 3.0.0伪分布式教程》

.修改mapred-site.xml  (位置 etc/hadoop/),改参数如下:

如果文件后缀是 .xml.example,改为 .xml。

《macOS安装hadoop 3.0.0伪分布式教程》

变量mapred.job.tracker 保存了JobTracker的位置,因为只有MapReduce组件需要知道这个位置,所以它出现在mapred-site.xml文件中。

修改hdfs-site.xml(位置 etc/hadoop/),改参数如下:

《macOS安装hadoop 3.0.0伪分布式教程》

变量dfs.replication指定了每个HDFS数据库的复制次数。 通常为3, 由于我们只有一台主机和一个伪分布式模式的DataNode,将此值修改为1。

修改yarn-site.xml(位置 etc/hadoop/),改参数如下:

《macOS安装hadoop 3.0.0伪分布式教程》

修改hadoop-env.sh(位置 etc/hadoop/),改参数如下:然后开启hadoop-env.sh里的注释

《macOS安装hadoop 3.0.0伪分布式教程》

《macOS安装hadoop 3.0.0伪分布式教程》

4.2:运行hadoop以及查看远端

进入文件夹(重要重要重要:后续所有操作一定要先进入当前hadoop文件夹)

 cd /usr/local/Cellar/hadoop/3.0.0

《macOS安装hadoop 3.0.0伪分布式教程》

格式化文件系统(是对namenode进行初始化):

 ./bin/hdfs namenode -format 

《macOS安装hadoop 3.0.0伪分布式教程》

启动 NameNode 和 DataNode:

$ ./sbin/start-dfs.sh

如果遇到DataNode启动失败,尝试删除tmp文件夹。

《macOS安装hadoop 3.0.0伪分布式教程》

关闭伪分布式

./sbin/stop-all.sh

ps:hadoop3.x版本的端口号改变如图:

《macOS安装hadoop 3.0.0伪分布式教程》

现在你应该可以在浏览器中打开下面的链接看到亲切的 Overview 界面了:

NameNode – http://localhost:9870

《macOS安装hadoop 3.0.0伪分布式教程》

让 HDFS 可以被用来执行 MapReduce jobs:

$ ./bin/hdfs dfs -mkdir /user

$ ./bin/hdfs dfs -mkdir /user/input

把 改成你想要命名的任意子文件夹名字即可,这里我选择命名input.

启动 ResourceManager 和 NodeManager:

$ ./sbin/start-yarn.sh

现在你应该可以在浏览器中打开下面的链接看到亲切的 All Applications 界面了:

ResourceManager – http://localhost:8088

《macOS安装hadoop 3.0.0伪分布式教程》

    原文作者:棉花糖do
    原文地址: https://www.jianshu.com/p/4a65fd034871
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞