Отличный старт статьи на Linux.com (написанной Брайаном Джонсом) помог мне начать с краткого обзора планов аварийного восстановления, которые у меня есть для моих собственных систем, а также для моих клиентов.
Имея опыт работы с ИТ на уровне предприятия в сфере финансовых услуг, у меня был большой опыт планирования — поэтому даже в малых и средних средах, в которых я сейчас работаю, аварийное восстановление всегда становится частью разговоров с клиентами.
Как и большинство, если не все из нас, я выполняю традиционные операции резервного копирования с веб-стороны (базы данных, файлы конфигурации, данные и т. Д.) Как локально, в виде оперативного резервного копирования, так и удаленно на ежедневной основе с использованием автоматизации. Один раз в месяц партия этих резервных копий отправляется на CD или DVD и попадает в банковский сейф.
Внутри (не через Интернет) происходят одни и те же базовые процессы: ежедневное резервное копирование как в локальных «горячих» копиях, так и еженедельное удаленное резервное копирование, а также раз в месяц архивирование на CD или DVD.
Во многих случаях я также начал использовать небольшие RAID-массивы с клиентами. Например, один клиент ежедневно занимается аудио и видео. Они используют внешний массив RAID 1 FireWire из двух дисков емкостью 160 ГБ. В RAID 1 диск A зеркалируется диском B. У нас также есть диск C, который выгружается раз в неделю и удаляется с сайта. В этом сценарии мы выбрали диски с горячей заменой, чтобы можно было дергать и менять зеркальный диск по требованию.
Недавно я также тестировал использование сторонних сервисов резервного копирования, которые предлагают сжатую передачу и хранение данных по широкополосному или высокоскоростному интернет-соединению. Эти поставщики используют шифрование для защиты процесса и хранения данных в течение неопределенного времени или по параметрам, установленным при инициализации службы. Я нашел один конкретный сервис, который предлагает 1 ГБ сжатого хранилища за 17,50 долларов в месяц (резервное копирование 2 ГБ данных).
Вернемся к началу — одна вещь, которую я не сделал, — это исследование программного обеспечения для профилирования, например, в SUSE. SCPM (Управление профилями конфигурации системы) выглядит как кандидат для такого дополнения к моим планам. SCPM профилирует и сохраняет информацию о вашем (например) Apache, брандмауэре и других файлах конфигурации демона и сохраняет их в текстовом файле. Пока эти файлы включены в план резервного копирования, восстановление после аварии на сервере может быть проще.
По существу, после переустановки базовой ОС с необходимыми вам демонами будет восстановлено профили, а затем SCPM должен повторно развернуть сохраненные данные конфигурации для этих критически важных приложений. Вы не только оправились от катастрофы, но, вероятно, сделали это на несколько часов быстрее.
Я с нетерпением ожидаю услышать о ваших планах аварийного восстановления, целях или вопросах.