Hadoop教程:HDFS操作

启动HDFS

首先,您必须格式化配置的HDFS文件系统,打开namenode (HDFS服务器),并执行以下命令。

$ hadoop namenode -format 

格式化HDFS之后,启动分布式文件系统。下面的命令将启动namenode以及数据节点作为集群。

$ start-dfs.sh 

列出HDFS中的文件

在服务器中加载信息后,我们可以使用“ls”查找目录中的文件列表、文件状态。下面给出了可以作为参数传递到目录或文件名的ls语法。

$ $HADOOP_HOME/bin/hadoop fs -ls <args>

将数据插入HDFS

假设我们在本地系统中一个名为file.txt的文件,应该保存在hdfs文件系统中。按照下面给出的步骤在Hadoop文件系统中插入所需的文件。

Step 1

您必须创建一个输入目录。

$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/input 

Step 2

使用put命令将数据文件从本地系统传输和存储到Hadoop文件系统。

$ $HADOOP_HOME/bin/hadoop fs -put /home/file.txt /user/input 

Step 3

您可以使用ls命令验证该文件。

$ $HADOOP_HOME/bin/hadoop fs -ls /user/input 

从HDFS检索数据

假设HDFS中有一个名为outfile的文件。下面是一个从Hadoop文件系统检索所需文件的简单演示。

Step 1

首先,使用cat命令查看来自HDFS的数据。

$ $HADOOP_HOME/bin/hadoop fs -cat /user/output/outfile 

Step 2

使用get命令将文件从HDFS获取到本地文件系统。

$ $HADOOP_HOME/bin/hadoop fs -get /user/output/ /home/hadoop_tp/ 

关闭HDFS

可以使用以下命令关闭HDFS

$ stop-dfs.sh 

原文链接:https://www.tutorialspoint.com/…

    原文作者:逍遥ii
    原文地址: https://www.jianshu.com/p/5eeff7e7c06a
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞