1. 备份
执行HBase备份有两种主要策略:完全关闭集群进行备份(离线),以及在运行集群上进行备份(在线)。
https://hbase.apache.org/1.2/book.html#ops.backup
https://sematext.com/blog/hbase-backup-options/
2. 快照
快照就是一份元信息的合集,允许管理员恢复到表的先前状态,快照不是表的复制而是一个文件名称列表,因而不会复制数据。
HBase快照允许您对表进行快照,而不会对区域服务器造成太大影响。快照、克隆和恢复操作不涉及数据复制。此外,将快照导出到另一个集群不会对区域服务器产生影响。
2.1 配置启用快照支持
要打开快照支持,只需设置hbase.snapshot。启用属性为true。(快照默认在0.95+之后的版本中启用,默认在0.94.6+之前的版本中关闭)
<property>
<name>hbase.snapshot.enabled</name>
<value>true</value>
</property>
2.2 给表打快照
不管表是启用还是禁用,都可以对它进行快照。快照操作不涉及任何数据复制。
./bin/hbase shell
hbase> snapshot 'tablename', 'myTableSnapshot-122112'
2.3 查看快照
hbase> list_snapshots
2.4 删除快照
hbase> delete_snapshot 'myTableSnapshot-122112'
2.5 从快照克隆出一张新表
hbase> clone_snapshot 'myTableSnapshot-122112', 'myNewTestTable'
2.6 用快照恢复数据,它需要先禁用表,再进行恢复
hbase> disable 'myTable'
hbase> restore_snapshot 'myTableSnapshot-122112'