Резервное копирование базы данных с помощью встроенных средств резервирования
В данном разделе показано как сделать дамп базы данных PostgreSQL в консоли при подключении по SSH с помощью утилит pg_dump и pg_dumpall.
Утилита pg_dump
В PostgreSQL есть встроенный инструмент для создания резервных копий — утилита pg_dump. Утилита имеет простой синтаксис:
pg_dump -options <имя базы> > <файл для сохранения копии>
Где:
-options - параметры, с которыми должна выполняться утилита.
<имя базы> - название базы, которую необходимо сохранить.
<файл для сохранения копии> - название файла копии.
В простейшем случае достаточно указать имя базы данных, которую в дальнейшем нужно будет восстановить. Резервная копия создается следующей командой:
pg_dump -U vitrodbuser -W vitrodb > /tmp/vitrodb.dump # pg dump u postgres
Ключ -U определяет пользователя, а -W требует ввести пароль.
Чтобы сэкономить место на диске, можно сразу же сжимать дамп:
pg_dump -U vitrodbuser -W vitrodb | gzip > /tmp/vitrodb.gz
Для выполнения резервного копирования по расписанию, например, можно использовать скрипт. Нижеприведённый пример скрипта выполняет бэкап и удаляет все файлы старше 31 дня:
#!/bin/sh PATH=/etc:/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin #Устанавливает переменную PATH для определения путей поиска исполняемых файлов PGPASSWORD=vitrodbuser_password #Устанавливает переменную PGPASSWORD для установки пароля для доступа к базе данных PostgreSQL export PGPASSWORD #Экспортирует переменную PGPASSWORD, чтобы она была доступна в дочерних процессах pathB=/mnt/backup #Устанавливает переменную pathB для определения пути к каталогу резервных копий dbUser=vitrodbuser #Устанавливает переменную dbUser для определения имени пользователя базы данных database=vitrodb #Устанавливает переменную database для определения имени базы данных find $pathB \( -name "*-[0123]?.*" \) -ctime +31 -delete #Поиск резервных копий, соответствующих заданным критериям и были изменены более 31 дня назад, после чего удаляет их pg_dump -U $dbUser $database | gzip > $pathB/pgsql_$(date "+%Y-%m-%d").sql.gz #Создает резервную копии БД, сжимает её с помощью gzip и сохраняет в указанном каталоге с именем, содержащим текущую дату unset PGPASSWORD #Сбрасывает переменную PGPASSWORD
Для настройки работы данного скрипта по расписанию нужно настроить планировщик crontab:
crontab -e 3 0 * * * /etc/scripts/pgsql_dump.sh # postgres pg dump
Данная команда добавляет задание в cron, которое запускает скрипт /etc/scripts/pgsql_dump.sh и будет выполняться каждый день в 3:00.
Более подробное описание работы и параметров утилиты pg_dump см. по ссылке.
Утилита pg_dumpall
Утилита pg_dumpall реализует резервное копирование всего экземпляра (кластера или инстанса) базы данных без указания конкретной базы данных на инстансе:
pg_dumpall > /tmp/instance.bak
Чтобы сразу сжать резервную копию экземпляра базы данных, нужно передать вывод на архиватор gzip:
pg_dumpall | gzip > /tmp/instance.tar.gz
Более подробное описание работы и параметров утилиты pg_dumpall см. по ссылке.
Резервное копирование файлов
Утилита rsync
Rsync — утилита для удаленной синхронизации и копирования файлов. Одним из её преимуществ является то, что она позволяет не передавать файлы полностью, а только изменения в них, синхронизирует директории и файлы, имеет встроенный механизм сжатия.
Синтаксис утилиты в общем виде выглядит так:
rsync -options <source> <destination>
Где:
-options — параметры, с которыми должна выполняться утилита.
<source>— каталог или файл, который является источником.
<destination> — каталог или файл, который является приемником.
При локальном режиме работы достаточно задать каталог-источник и каталог-приемник:
rsync -avzhHl /path/of/source/folder /path/to/destination/folder
Заданные параметры:
-a - режим архивирования, который включает рекурсивное копирование, сохранение прав доступа, временных меток и т.д.
-v - уровень подробности вывода (verbose), позволяет видеть подробную информацию о процессе копирования.
-z - сжатие данных во время передачи.
-h - вывод размеров файлов в удобном для чтения формате (human-readable).
-H - сохранение жестких ссылок.
-l - сохранение символических ссылок.
Если копирование нужно выполнить с удаленным узлом, добавляется имя пользователя и IP-адрес или имя узла:
rsync -avzhHl /path/of/source/folder root@192.168.52.1:/path/to/destination/folder
Автоматическая синхронизация папок выполняется штатным способом — планировщиком заданий (cron). Создадим скрипт, который будет копировать файлы на удаленный узел:
!/bin/sh RSYNC=/usr/bin/rsync SSH=/usr/bin/ssh KEY=/root/.ssh/id_rsa #Путь к ssh ключу для подключения к удаленному узлу RUSER=root #Имя пользователя под которым будет происходить подключение к узлу RHOST=192.168.56.1 #Адрес удаленного узла RPATH=/remote/dir #Каталог, в который будут скопированы файлы LPATH=/local/dir #Каталог, из которого будут скопированы файлы $RSYNC -az -e "$SSH -i $KEY" $LPATH $RUSER@$RHOST:$RPATH
Настройка планировщика crontab:
crontab -e 0 22 * * * /root/scripts/rsync_to_cron.sh
Данная команда добавляет задание в cron, которое запускает скрипт /root/scripts/rsync_to_cron.sh и будет выполняться каждый день в 22:00.
Более подробное описание работы и параметров утилиты pg_dump см. по ссылке.