Home » Telegram » Всегда проверяйте работоспособность бэкапов

Всегда проверяйте работоспособность бэкапов

Еще одно напоминание-предостережение на тему бэкапов. Она просто вечная. Если вы делаете бэкапы, но не проверяете их работоспособность и просто возможность восстановления, это значит, что у вас их нет. Столкнулся с ситуацией, когда администратор делал бэкапы, но не разворачивал их. Когда случилась поломка, оказалось, что оперативно запустить работу системы из бэкапа не получается. Он просто не знает, как это сделать.

Хочешь научиться автоматически разворачивать и поддерживать высоконагруженные проекты? Тогда рекомендую познакомиться с онлайн курсом " Infrastructure as a code." в OTUS. Актуально для системных администраторов и devops инженеров. Подробности по .

Бэкапы делались на уровне виртуальной машины. Когда умер гипервизор (а подменного точно такого же не было), восстановление на другой не увенчалось успехом. Виртуальная машина не стартовала. Я оперативно починил это, так как часто сталкивался с различными проблемами такого рода. Конкретно тут нужно было накатить другое ядро и обновить initramfs.

Как должен быть организован бэкап:

  1. Бэкап виртуальной машины. К нему должна быть инструкция по восстановлению, где будет подробно указано, что и в какой последовательности делать, на какое железо восстанавливать. Соответственно, железо это должно быть. Инструкция должна быть проверена.
  2. Бэкап на уровне данных. Делать обязательно в дополнение к бэкапу виртуальной машины. Обычно бэкап виртуальной машины это огромный файл. С ним могут быть различные проблемы. Он может долго копироваться, он может побиться при копировании или создании (сталкивался). Его восстановление может длиться часами. Если у вас есть сырые данные, вы можете оперативно их предоставить и запустить в работу, либо скопировать на подменный сервер из резерва.
  3. Для бэкапов должен быть настроен мониторинг. Как его сделать, решать по месту. Обычно это проверка на дату изменения файлов в бэкапе и его объем. Статьи на эту тему есть у меня на сайте.

Когда все три пункта выполнены, можно более ли менее спокойно жить. Я еще по возможности настраиваю хранение бэкапов в двух различных локациях. Более подробно обо всем этом писал не так давно в статье - https://serveradmin.ru/kak-pravilno-delat-bekapy-i-sledit-za-nimi/.

Источник - мой канал: https://t.me/srv_admin/250.

Онлайн курс Infrastructure as a code

Если у вас есть желание научиться автоматизировать свою работу, избавить себя и команду от рутины, рекомендую пройти онлайн курс Infrastructure as a code. в OTUS. Обучение длится 4 месяца. Что даст вам этот курс:
  • Познакомитесь с Terraform.
  • Изучите систему управления конфигурацией Ansible.
  • Познакомитесь с другими системами управления конфигурацией - Chef, Puppet, SaltStack.
  • Узнаете, чем отличается изменяемая инфраструктура от неизменяемой, а также научитесь выбирать и управлять ей.
  • В заключительном модуле изучите инструменты CI/CD: это GitLab и Jenkins
Смотрите подробнее программу по .

Автор Zerox

Владимир, системный администратор, автор сайта. Люблю настраивать сервера, изучать что-то новое, делиться знаниями, писать интересные и полезные статьи. Открыт к диалогу и сотрудничеству. Если вам интересно узнать обо мне побольше, то можете послушать интервью. Запись на моем канале - https://t.me/srv_admin/425 или на сайте в контактах.

Добавить комментарий

Ваш адрес email не будет опубликован.

Нажимая кнопку "Отправить комментарий" Я даю согласие на обработку персональных данных.