[PGSQL]PostgreSQL热备份时pg_start_backup() 做了什么?

PostgreSQL热备份的过程一般为:

  1. 数据库中执行:pg_start_backup() ;
  2. 然后使用操作系统的tar或 cp命令拷贝 PostgreSQL数据文件。
  3. 数据库中执行:pg_stop_backup()  ;

有人可能会问为什么我们开始用操作系统备份数据库前需要执行pg_start_backup()?

实际上pg_start_backup()主要做了以下两个工作:

  1. 置写日志标志为:XLogCtl->Insert.forcePageWrites = true,也就是把这个标志设置为true后,数据库会把变化的整个数据块都记录到数据库中,而不仅仅是块中记录的变化。
  2. 强制发生一次checkpoint点。

为什么要强制WAL日志把整个块都写入WAL中呢?

想象一下: 如果你用cp命令拷贝文件时,数据库也可能会同时写这个文件,那么可能会出现,一个数据块,数据库正在写,cp命令正在读,这样有可能拷贝的数据块的前半部分是新数据,后半部分是旧数据,也就是单个数据块的数据不一致,这时,如果后面使用WAL日志把数据推到一个一致点时,如果WAL日志中只记录是块中行的变化,那么对于这种不一致块就无法恢复。但这时如果WAL日志中记录的是整个新数据块的内容,那么后面重演WAL日志时,把整个新块的内容写到这个块中后,这个块的内容就达到了一致点了,这样就没有问题了。

强制发生一次checkpoint,也是为了把前面的脏数据都刷到磁盘中,这样从这之后产生的日志都是记录了整个数据块,这样就可以保证恢复的正确。

其实这个原理与oracle数据库对表空间做热备份时做的“ALTER TABLESPACE users BEGIN BACKUP;” 是一样的。