如何打造PostgreSQL闪回环境

在 PostgreSQL 数据库;目前是不支持类似 Oracle 闪回特性;我们知道 Oracle 闪回特性在数据恢复是非常简单给力。增加数据库操作人员(开发,DBA)的容错率。Oracle 闪回特性使用场景:

  • flashback database: 数据库闪回;多用于数据库恢复;数据库,用户,表空间误删。
  • flashback table : 表闪回;用于数据表恢复;数据表误删。
  • flashback query : 闪回查询;应用于修复误操作数据。

对于 PostgreSQL 闪回;校长(德哥)有写过一系列的文章PostgreSQL flashback(闪回)功能实现与介绍;如今我取巧实现 PostgreSQL 闪回特性。原理参考我之前的文章PostgreSQL恢复误删数据

  • 支持在线数据库恢复(不推荐),多用于数据表恢复,修复误操作数据。
  • 支持多次闪回操作;在 flashback query 中恢复的时间点不是很理想;可以重新设定时间点再闪回操作一次。

一. flashback 所需命令

实现 flashback 就是一个有效的数据库备份/恢复。

  • 备份操作命令有 scp/cp, pg_basebackup, pg_rman。我选 pg_basebackup。因为pg_basebackup 支持异构备份。意味着可以在同一台服务器在 cp 一个 PostgreSQL 实例。即可以在一台服务器上实现闪回。
  • 恢复操作有 copy 或者 pg_dump 命令。

二. flashback 所需条件

实现 flashback 可以是在线服务器上操作,也可以是在另一台服务器上操作。换句话说:可以是一台服务器或者是两台服务器来实现。在一台服务器上需要更改数据库端口。由于本环境有清理目录操作;避免在在线服务器上误删目录。所以建议用两条服务器来实现。

三. flashback 搭建原理

本文档采用两台服务器来实现。两台服务器时间校准,免密码登录。

  • 正式数据库环境:192.168.1.201
  • 闪回数据库环境:192.168.1.202
    当然闪回数据库环境可在正式环境下;配置文档精彩再续

3.1 创建脚本cleandir.sh

cleandir脚本用于在pg_basebackup备份前;先清空备份所需的路径

psql -h 192.168.1.201 -p $PGPORT -t -A -n -c"SELECT pg_catalog.pg_tablespace_location(oid) AS "Location" FROM pg_catalog.pg_tablespace where spcname not in ('pg_default','pg_global')" -o tablespace_location.txt
awk '{print "rm -rf " $1}' tablespace_location.txt > cleandir.sh
echo "rm -rf $PGDATA" >> cleandir.sh

3.2 创建备份脚本pg_backup.sh

采用pg_basebackup备份;

cleandir.sh
pg_basebackup -F p --progress -D $PGDATA -h 192.168.1.201 -p $PGPORT -U replica

加入定时任务 crontab 中 例如:每天凌晨过5分执行备份

5 0 * * * pg_backup.sh

3.3 创建配置文件recovery.conf模板

执行闪回查询/数据库恢复。多用时间点进行恢复即(PITR)

restore_command = 'scp postgres@192.168.1.201:**/%f %p'
recovery_target_time = '2018-11-10 10:33:12'

3.4 创建恢复脚本pg_flashback.sh

pg_flashback.sh 脚本用于数据库误操作实现闪回到某个时间点。支持多次闪回。执行闪回 之前;需要配置 recovery.conf 中的 “recovery_target_time” 时间点。即恢复到哪个时间点。
第一次执行;执行

pg_flashback.sh 1

往后执行闪回;通称再次执行;执行命令

pg_flashback.sh 2

当然往后加也行例如:pg_flashback.sh 3
pg_flashback.sh脚本如下

##===========================================================  
##   pg_flashback.sh                
##   created by lottu           
##   2018/11/07    
##   usage: pg_flashback.sh 1                          
##============================================================  
#!/bin/bash
PGHOME=/opt/pgsql96
PGDATA=/data/postgres/data              
LANG=en_US.utf8
PGPORT=5432
PGUSER=postgres
PGDATABASE=postgres
PG_BACK_HOST_IP=192.168.1.202
E_BADARGS=65
E_FAIL=66

if [ $# -ne 1 ];then
 echo "Usage: `basename $0` Please invoke this script with one command-line arguments"
 exit $E_BADARGS
fi
flashback_path=/data/flash_back
if [ $1 -eq 1 ];then
 echo "Info: backup backupset"
 backup.sh
else
 rebackup.sh
fi 
echo "Info: edit recovery.conf"
#scp recovery.conf postgres@192.168.1.202:$PGDATA
cp /home/postgres/recovery.conf $PGDATA
echo "Info: begin start database"
pg_ctl start -l /home/postgres/log/pg_server.log
if [ $? -eq 0 ];then
 echo "Info: start database succes"
 sleep 10
 psql -h $PG_BACK_HOST_IP -p 5432 postgres postgres -c "select pg_xlog_replay_resume()"
else
 echo "[Error]: start database fail"
 exit $E_FAIL
fi 

四. flashback 实验验证

4.1 验证目的

  • 验证是否可以闪回/恢复
  • 验证是否可以多次操作闪回
  • 验证在闪回的过程中;正式环境是否正常对外服务

4.2 实验操作

4.2.1 备份数据库

执行pg_backup.sh脚本。部署成功了是没这个操作。因为每天都有定时备份。

[postgres@Postgres202 ~]$ pg_backup.sh 
waiting for server to shut down......... done
server stopped
322503/322503 kB (100%), 4/4 tablespaces

4.2.2 模拟误操作

lottu=# create table lottu as select * from lottu01 ;
SELECT 4
lottu=# select * from lottu;
  id  | text  
------+-------
 1001 | lottu
 1004 | rax
 1002 | world
 1003 | world
(4 rows)
-- 获取时间点;这个时间点“2018-11-10 14:56:56”是我目标恢复时间点。表lottu有4条记录。
lottu=# select now();
             now              
------------------------------
 2018-11-10 14:56:56.30188+08
(1 row)
-- 在时间点“2018-11-10 14:57:51”;误操作1 清理表lottu的记录
lottu=# delete from lottu;
DELETE 4
lottu=# select now();
              now              
-------------------------------
 2018-11-10 14:57:51.891931+08
(1 row)

-- 误操作2 删除表lottu。
lottu=# drop table lottu;
DROP TABLE
  • 获取时间点;这个时间点“2018-11-10 14:56:56”是我目标恢复时间点。表lottu有4条记录。
  • 在时间点“2018-11-10 14:57:51”;误操作1 清理表lottu的记录
  • 误操作2 删除表lottu。

4.2.3 闪回操作

我们先在配置文件 recovery.conf 中的参数“recovery_target_time” 设置为 “2018-11-10 14:57:51”。执行闪回pg_flashback.sh 1

[postgres@Postgres202 ~]$ pg_flashback.sh 1
Info: backup backupset
Info: edit recovery.conf
Info: begin start database
server starting
Info: start database succes
psql: FATAL:  the database system is starting up

闪回数据库成功启动;登录查看表lottu情况:表数据未找回;这不是我所需闪回的目标

[postgres@Postgres202 ~]$ psql lottu lottu
psql (9.6.0)
Type "help" for help.

lottu=# \d lottu
     Table "lottu.lottu"
 Column |  Type   | Modifiers 
--------+---------+-----------
 id     | integer | 
 name   | text    | 

lottu=# select * from lottu;
 id | name 
----+------
(0 rows)

在配置文件 recovery.conf 中的参数“recovery_target_time” 设置为 “2018-11-10 14:56:56”。再执行闪回pg_flashback.sh 2

[postgres@Postgres202 ~]$ pg_flashback.sh 2
Info: edit recovery.conf
Info: begin start database
server starting
Info: start database success
psql: FATAL: the database system is starting up

再次闪回也成功了。我们在看下表lottu的情况

[postgres@Postgres202 ~]$ psql lottu lottu
psql (9.6.0)
Type "help" for help.

lottu=# \d lottu
     Table "lottu.lottu"
 Column |  Type   | Modifiers 
--------+---------+-----------
 id     | integer | 
 name   | text    | 

lottu=# select * from lottu;
  id  | name  
------+-------
 1001 | lottu
 1004 | rax
 1002 | world
 1003 | world
(4 rows)

表 lottu 的数据成功找回。在使用 pg_dump 导出表 lottu 的表结构和数据的脚本;

[postgres@Postgres202 ~]$ pg_dump -d lottu -t lottu.lottu  -f lottu.sql
[postgres@Postgres202 ~]$ scp lottu.sql postgres@192.168.1.201:/home/postgres

再到正式数据库上执行

[postgres@Postgres201 ~]$ psql lottu lottu 
psql (9.6.0)
Type "help" for help.

lottu=# \i lottu.sql
SET
SET
SET
SET
SET
SET
SET
SET
SET
SET
SET
CREATE TABLE
ALTER TABLE
COPY 4
lottu=# \d lottu
     Table "lottu.lottu"
 Column |  Type   | Modifiers 
--------+---------+-----------
 id     | integer | 
 name   | text    | 

lottu=# select * from lottu;
  id  | name  
------+-------
 1001 | lottu
 1004 | rax
 1002 | world
 1003 | world
(4 rows)

在整个闪回过程;除了最后一步是在正式服务器上执行。前面其他操作都是在闪回数据库操作。

4.3 实验结论

  • 可以闪回
  • 可以多次操作
  • 不影响正式环境

五. 其他实现方式参考

PostgreSQL flashback(闪回) 功能实现与介绍

六. 不足

  • 不推荐使用这种方式恢复数据库。多用于ddl/dml误操作恢复。

七. 代码下载

链接:https://pan.baidu.com/s/1j8ZNj3yjxj82MnomzxQkfA
提取码:j4xd

    原文作者:lottu
    原文地址: https://www.jianshu.com/p/dbc902574b27
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞