要求
把格式如下的数据导入到Hbase表中
过程
1.先创建一个表(hbase-csv1),且列族为info
[hadoop@MASTER ~]$ hbase shell
hbase(main):002:0> create ‘hbase-csv1′,’info’
2.把文件上传至HDFS
#要上传的文件
[hadoop@MASTER ~]$ ls -l small_user_hbase.csv
-rw-r–r– 1 hadoop hadoop 12542830 Dec 3 2018 small_user_hbase.csv
#上传
[hadoop@MASTER ~]$ hadoop fs -put small_user_hbase.csv /
3.把small_user_hbase.csv导入hbase的hbase-csv1表中
[hadoop@MASTER ~]$ hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=”,” -Dimporttsv.columns=HBASE_ROW_KEY,info:user_id,info:item_id,info:behavior_type,info:behavior_type,info:time hbase-csv1 /small_user_hbase.csv
info是列族,后边的user_id,item_id…是small_user_hbase.csv中的头部信息,导入后就是info列族中的列
4.查看是否导入
hbase(main):002:0> scan ‘hbase-csv1’
ROW COLUMN+CELL
10001082 column=info:behavior_type, timestamp=1543569641473, value=2014-12-14 16
10001082 column=info:item_id, timestamp=1543569641473, value=1
10001082 column=info:user_id, timestamp=1543569641473, value=85851739
100029775 column=info:behavior_type, timestamp=1543569641473, value=2014-12-09 18
100029775 column=info:item_id, timestamp=1543569641473, value=1
100029775 column=info:user_id, timestamp=1543569641473, value=70394849
100068031 column=info:behavior_type, timestamp=1543569641473, value=2014-12-11 09
100068031 column=info:item_id, timestamp=1543569641473, value=1
100068031 column=info:user_id, timestamp=1543569641473, value=315643365
100076491 column=info:behavior_type, timestamp=1543569641473, value=2014-12-09 08
100076491 column=info:item_id, timestamp=1543569641473, value=1
100076491 column=info:user_id, timestamp=1543569641473, value=75205807
导入成功!