Hbase 之 Shell 初级(一)

一. 简介

学习Hbase最直观的方式无非是通过Shell命令,本文作为基础入门篇总结回顾一下常用 Hbase Shell 命令的使用方法,后续会为大家介绍更多中高级命令的使用。

首先在搭建好Hbase集群之后,我们进入 Hbase Shell 命令行,如下:

$ ./bin/hbase shell
18/04/16 21:33:52 INFO Configuration.deprecation: hadoop.native.lib is deprecated. Instead, use io.native.lib.available
HBase Shell; enter 'help<RETURN>' for list of supported commands.
Type "exit<RETURN>" to leave the HBase Shell
Version 1.2.0-cdh5.7.0, rUnknown, Wed Mar 23 11:39:14 PDT 2016

hbase(main):001:0>

如果想看到更详细的信息,可以以Debug的方式进入,如下:

$ ./bin/hbase shell -d

在 Hbase Shell 命令行我们输入 help 就会返回Shell的命令列表和选项,如下:

hbase(main):001:0> help
HBase Shell, version 1.2.0-cdh5.7.0, rUnknown, Wed Mar 23 11:39:14 PDT 2016
Type 'help "COMMAND"', (e.g. 'help "get"' -- the quotes are necessary) for help on a specific command.
Commands are grouped. Type 'help "COMMAND_GROUP"', (e.g. 'help "general"') for help on a command group.

COMMAND GROUPS:
  Group name: general
  Commands: status, table_help, version, whoami

  Group name: ddl
  Commands: alter, alter_async, alter_status, create, describe, disable, disable_all, drop, drop_all, enable, enable_all, exists, get_table, is_disabled, is_enabled, list, locate_region, show_filters

  Group name: namespace
  Commands: alter_namespace, create_namespace, describe_namespace, drop_namespace, list_namespace, list_namespace_tables

  Group name: dml
  Commands: append, count, delete, deleteall, get, get_counter, get_splits, incr, put, scan, truncate, truncate_preserve
 
  略...

可以看到,Shell 命令以默认以Group的方式进行定义划分,本文我们先讲解一下部分 Hbase 初级 Shell 命令的使用,后续将陆续展开详细介绍。

输入help ‘command’ (e.g. help “get”)可查看具体某一命令的使用方法;

输入help ‘command_group’(help “general”)可查看某一Group下命令的使用细则(不区分单引号双引号)。

例如想查看命令 ‘whoami’ 如何使用,输入如下指令即可:

hbase(main):007:0> help  "whoami"
Show the current hbase user.
Syntax : whoami
For example:

hbase> whoami

二. Shell Api 介绍

本文先主要举例详细讲解一下 general,ddl 组下 shell 命令的使用细则(文中代码块都可向右滑动进行查看)。

Group name: general

1. status

显示服务器的状态,例如:


hbase(main):009:0> status
1 active master, 1 backup masters, 10 servers, 0 dead, 86.3000 average load

还有三个开关:
  • status ‘simple’
    简述当前集群状态(Region 级),如下:
hbase(main):012:0> status 'simple'
active master:  yq-hadoop57:60000 1520300829133
1 backup masters
    yq-hadoop29:60000 1520429670888
10 live servers
    yq-hadoop184133:60020 1521785119328
        requestsPerSecond=19.0, numberOfOnlineRegions=85, usedHeapMB=1727, maxHeapMB=3959, numberOfStores=100, numberOfStorefiles=128, storefileUncompressedSizeMB=191042, storefileSizeMB=44354, compressionRatio=0.2322, memstoreSizeMB=0, storefileIndexSizeMB=0, readRequestsCount=164988634, writeRequestsCount=10089338, rootIndexSizeKB=2212, totalStaticIndexSizeKB=54385, totalStaticBloomSizeKB=8799, totalCompactingKVs=276327149, currentCompactedKVs=276327149, compactionProgressPct=1.0, coprocessors=[CubeVisitService, Observer]
0 dead servers
Aggregate load: 698, regions: 863

  • status ‘summary’
    默认值,同 status,如下:
hbase(main):014:0> status 'summary'
1 active master, 1 backup masters, 10 servers, 0 dead, 86.3000 average load

  • status ‘detailed’
    详细列出了当前集群状态,具体到表级,如:
"monitor_base_test,000152331479433158,1523413164030.df66f39d1868c19a27a588da8abb960c."
            numberOfStores=1, numberOfStorefiles=1, storefileUncompressedSizeMB=3595, lastMajorCompactionTimestamp=1523413165358, storefileSizeMB=3596, compressionRatio=1.0003, memstoreSizeMB=0, storefileIndexSizeMB=0, readRequestsCount=1166147, writeRequestsCount=213992, rootIndexSizeKB=2, totalStaticIndexSizeKB=3295, totalStaticBloomSizeKB=1792, totalCompactingKVs=16593376, currentCompactedKVs=16593376, compactionProgressPct=1.0, completeSequenceId=-1, dataLocality=1.0

另外还可以通过如下命令查看集群 Replication 状态:

hbase> status 'replication'
hbase> status 'replication', 'source'
hbase> status 'replication', 'sink'

2. whoami

显示Hbase当前的用户,如下:

hbase(main):022:0> whoami
root (auth:SIMPLE)
    groups: root

3. version

显示Hbase的版本,如下:

hbase(main):023:0> version
1.2.0-cdh5.7.0, rUnknown, Wed Mar 23 11:39:14 PDT 2016

4. table_help

截至0.96,我们可以为一个表创建引用,也可以将现有的表指向某一引用,然后通过该引用对表进行增删改查操作,不必再写冗长的表名。如:

  hbase> t = create 'test', 'cf'
  hbase> t = get_table 'test'
  t.put 'r', 'cf:q', 'v'

Group name: ddl

1. list

列出Hbase中已有的表,语法如下:

  hbase> list
  hbase> list 'abc.*'
  hbase> list 'ns:abc.*'
  hbase> list 'ns:.*'

且支持正则匹配,如下:

hbase(main):054:0> list 'monitor_bas.*'
TABLE                                                                                                                                                                                          
monitor_base                                                                                                                                                                                   
monitor_base_2                                                                                                                                                                                 
monitor_base_test                                                                                                                                                                              
monitor_base_test_snappy                                                                                                                                                                       
4 row(s) in 0.0040 seconds

2. create

创建一张新表,创建表必须指定一个列族,语法如下:

a. 创建表 t1,指定列族 f1,f2,默认 namespace=default

hbase(main):005:0> create 't1', {NAME => 'f1'}, {NAME => 'f2'}, {NAME => 'f3'}
可简写为:hbase(main):005:0> create 't1', 'f1', 'f2'

b. 指定表属性,如指定最大版本数(基于列族):

hbase(main):005:0> create 'ns1:t1', {NAME => 'f1', VERSIONS => 5}

c. 同时指定多个属性

hbase(main):005:0> create 't1', {NAME => 'f1', VERSIONS => 1, TTL => 2592000, BLOCKCACHE => true}

注:关于Hbase建表时所指定的属性还有很多,其中有基于列族指定的,也有基于整张表进行指定的,更详细的介绍我们后面会专门写篇公众号文章进行阐述,这里就不再赘述了。

3. exists

建好表之后,我们可以即刻检查一下该表是否存在,语法如下:

hbase> exists 't1'
hbase> exists 'ns1:t1'

例:
hbase(main):009:0> exists 't1'
Table t1 does exist                                                                                                                                                                            
0 row(s) in 0.2470 seconds

可见,我们刚才建的t1表已经存在,如果Hbase中表数量比较少时我们可以通过list命令查看。

4. describe

通过该命令可以查看表的描述信息。

hbase> describe 't1'
hbase> describe 'ns1:t1'

可简写为:
hbase> desc 't1'
hbase> desc 'ns1:t1'

例:
hbase(main):011:0> desc 't1'
Table t1 is ENABLED                                                                                                                                                                            
t1                                                                                                                                                                                             
COLUMN FAMILIES DESCRIPTION                                                                                                                                                                    
{NAME => 'f1', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS => '1', COMPRESSION => 'NONE', MIN_VERSIONS => '0', TTL => 'FOREVER', KEEP_DELETED_CELLS
 => 'FALSE', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}                                                                                                                 
{NAME => 'f2', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', VERSIONS => '1', COMPRESSION => 'NONE', MIN_VERSIONS => '0', TTL => 'FOREVER', KEEP_DELETED_CELLS
 => 'FALSE', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}                                                                                                                 
2 row(s) in 0.0620 seconds

5. is_enabled

检查表是否启用。

hbase> is_enabled 't1'
hbase> is_enabled 'ns1:t1'

例:
hbase(main):014:0>  is_enabled 't1'
true                                                                                                                                                                                           
0 row(s) in 0.0240 seconds

6. is_disabled

检查表是否被禁用。

hbase> is_disabled 't1'
hbase> is_disabled 'ns1:t1'

例:
hbase(main):017:0> is_disabled 't1'
false                                                                                                                                                                                          
0 row(s) in 0.0170 seconds

7. show_filters

显示Hbase中的过滤器列表。

hbase(main):021:0> show_filters
ColumnPrefixFilter                                                                                                                                                                             
TimestampsFilter                                                                                                                                                                               
PageFilter                                                                                                                                                                                     
MultipleColumnPrefixFilter                                                                                                                                                                     

略...                                                                                                                                                                                    
 
注:hbase 的过滤器有很多,之后我们会进行详细介绍,此处不再赘述。
8. alter

通过该命令,可以对Hbase表和列族就行修改,如新增一个列族、修改表属性,增加协处理器等等,更多操作后续我们会专门整理为文章进行详细阐述,此处只进行入门简述。

a. 单列族,改变表t1最大版本数为1:
hbase> alter 't1', NAME => 'f1', VERSIONS => 1

b. 多列族同时修改,{} 括起来
hbase> alter 't1', 'f1', {NAME => 'f2', IN_MEMORY => true}, {NAME => 'f3', VERSIONS => 5}

例:
hbase(main):029:0> alter 't1', NAME => 'f1', VERSIONS => 1
Updating all regions with the new schema...
0/1 regions updated.
1/1 regions updated.
Done.
0 row(s) in 3.7570 seconds

9. alter_status

可以给出alter命令的状态。

hbase> alter_status 't1'
hbase> alter_status 'ns1:t1'

例:
hbase(main):030:0> alter_status 't1'
1/1 regions updated.
Done.
10. alter_async

不管alter是否完成,这个命令不等待所有region获得模式的改变。

例:
hbase(main):004:0> alter_async 't1',{NAME => 'f1',TTL => '10000'}
0 row(s) in 1.8540 seconds

注:可通过alter_status查出alter命令的状态。
11. disable

为了删除或更改而禁用表,语法如下:

hbase> disable 't1'
hbase> disable 'ns1:t1'
12. disable_all

可通过正则匹配表达式禁用表,语法如下:

hbase> disable_all 't.*'
hbase> disable_all 'ns:t.*'
hbase> disable_all 'ns:.*'

注意小数点。
13. enable

启用被禁用的表,语法如下:

hbase> enable 't1'
hbase> enable 'ns1:t1'
14. enable_all

启用匹配正则表达式的所有表,语法如下:

hbase> enable_all 't.*'
hbase> enable_all 'ns:t.*'
hbase> enable_all 'ns:.*'

注意小数点。
15. drop

删除表,前提是要disable表,语法如下:

hbase> drop 't1'
hbase> drop 'ns1:t1'
16. drop_all

删除匹配正则表达式的所有表,语法如下:

hbase> drop_all 't.*'
hbase> drop_all 'ns:t.*'
hbase> drop_all 'ns:.*'

注意小数点。
17. locate_region

指定表和rowkey返回该rowkey所在的region信息,语法如下:

hbase> locate_region 'tableName', 'key0'

例:
hbase(main):030:0> locate_region 'xcar_suggest_item_test','r1'
HOST                                             REGION                                                                                                                                        
 yq-hadoop184194:60020                           {ENCODED => 6f5e22b9bef0f537e0e8a086cbcb03b5, NAME => 'xcar_suggest_item_test,,1523181823333.6f5e22b9bef0f537e0e8a086cbcb03b5.', STARTKEY => '', ENDKEY => ''}  
                                                                                                                            
1 row(s) in 0.0100 seconds
18. get_table

返回给定表的一个引用,可通过该引用操作表,语法如下:

hbase> t1 = get_table 't1'
hbase> t1 = get_table 'ns1:t1'

(未完待续 。。。)

    原文作者:步闲
    原文地址: https://www.jianshu.com/p/6e351ec6f321
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞