Поделиться через


Рекомендации по аварийному восстановлению для Project Server 2007

Обновлено: Март 2009 г.

 

Последнее изменение раздела: 2009-03-02

План мероприятий аварийного восстановления гарантирует быстрое восстановление работоспособного состояния всех систем и данных в случае стихийного бедствия (например пожар) или технической аварии (например отказ двух дисков в массиве RAID-5). При составлении плана аварийного восстановления необходимо описать все ответные действия, принимаемые в случае катастрофического события.

Тщательно протестируйте план резервного копирования и восстановления перед развертыванием Microsoft Office Project Server 2007 в производственной среде. В процессе тестирования выявляйте уязвимые места путем моделирования как можно большего числа возможных сценариев сбоя. Рекомендуется проверить план аварийного восстановления путем моделирования наступления катастрофического события.

При планировании стратегии аварийного восстановления проанализируйте ответы на следующие вопросы.

  • На каком носителе будет записана резервная копия (лента или диск)?

  • Резервные копии будут создаваться вручную или автоматически, по расписанию?

  • Как будет проверяться успешное завершение копирования в случае автоматического создания резервных копий?

  • Как будет проверяться пригодность резервных копий к использованию?

  • Как долго будут храниться резервные копии до повторного использования носителя?

  • В случае сбоя, сколько времени займет восстановление самой последней резервной копии? Это приемлемый период простоя?

  • Где будут храниться резервные копии, и имеют ли соответствующие сотрудники к ним доступ?

  • Если ответственный системный администратор отсутствует, есть ли другое лицо, знающее надлежащие пароли и процедуры для выполнения резервного копирования и, если необходимо, восстановления системы?

Помимо прочих действий рекомендуется, чтобы любой план аварийного восстановления включал следующее.

  • Ежедневно открывать окно "Просмотр событий" Microsoft Windows и проверять наличие ошибок или предупреждений в системном журнале и журнале приложений на рабочих серверах.

  • Постоянно поддерживать актуальность диска аварийного восстановления или набора (ASR) автоматического восстановления системы Windows для каждого сервера развертывания. Дополнительные сведения см. в справке Windows.

Убедитесь, что все серверы защищены эффективным антивирусным программным обеспечением. Поддерживайте актуальность этого программного обеспечения установкой самых последних файлов сигнатур вирусов. Используйте функцию автоматического обновления антивирусной программы для поддержания актуальности набора сигнатур вирусов.

Типы событий.

Системные администраторы должны защищать свои сети как от потери данных, так и от вынужденного простоя системы. Это подразумевает выполнение как регламентных процедур на постоянной основе, так и принятие нестандартных действий для предотвращения или восстановления из состояния непредвиденного вынужденного простоя.

Ниже перечислены некоторые из потенциальных причин вынужденного простоя системы:

  • отказ подсистемы жесткого диска;

  • сбой питания;

  • сбой системного программного обеспечения;

  • случайное или злонамеренное выполнение команд удаления или изменения;

  • разрушительные вирусы;

  • природные катастрофы;

  • кража или саботаж.

Вероятность наступления каждого из этих событий зависит от особенностей организации. Но любое из них может оказать сильное негативное влияние на развертывание Office Project Server 2007. Рекомендуется оценить уязвимость системы по отношению к разным типам событий и принять соответствующие меры для сведения к минимуму уязвимости организации.

Рекомендации в отношении пространства жесткого диска.

На жестком диске должно быть достаточно свободного места для восстановления как базы данных, так и файлов журналов на компьютерах, на которых выполняется SQL Server. Размер резервной копии может оказаться слишком большим, что не позволит восстановить ее в исходное расположение. Например, обычная архивация, выполняемая раз в неделю, а также ежедневное в течение 6 дней создание разностных резервных копий могут потребовать больше свободного дискового пространства в процессе восстановления, чем имеется на сервере.

Кроме того, нельзя допускать заполнения более половины свободного места диска с базой данных. Хотя использование диска с базой данных, заполненного менее чем на половину, увеличивает размер неиспользуемого дискового пространства, это помогает сократить время простоя сервера по следующим причинам.

  • Можно быстрее восстановить базы данных, чем в случае полностью заполненного диска (особенно, если фрагментирована файловая система).

  • Можно архивировать копию баз данных на тот же физический диск для их последующего восстановления, что позволяет предпринять попытку исправления баз данных в случае возникновения проблемы во время процесса восстановления (например, если имеющаяся резервная копия содержит ошибки).

Использование аппаратных стандартов.

Примите один стандарт для аппаратного обеспечения и придерживайтесь его насколько это возможно. Используйте однотипные компоненты, например сетевые адаптеры, контроллеры диска, графические платы на всех компьютерах в организации. Используйте этот стандартный профиль компьютера для всех приложений, даже если для некоторых приложений эти ресурсы избыточны. Единственные модификации, которые допускаются в отношении аппаратного обеспечения, касаются объема памяти, количества ЦП и конфигураций жестких дисков.

Аппаратные стандарты обеспечивают следующие преимущества для организации.

  • Использование одной платформы сокращает объем обязательного тестирования.

  • При применении обновлений драйверов или обновлений приложений необходимо выполнить только одно тестирование перед развертыванием этих обновлений на все компьютеры.

  • Поскольку необходимо поддерживать однотипную систему, требуется меньше времени на обучение и подготовку персонала службы поддержки.

  • Не требуется хранить большую и разнообразную номенклатуру запасных компонентов, что сокращает издержки организации.

Храните запасные и сменные компоненты на месте эксплуатации, а также учитывайте запасное оборудование в смете аппаратного обеспечения. Количество запасных компонентов, хранящихся на месте, зависит от конфигурации и состояний сбоя, которые пользователи и персонал службы поддержки могут допустить.

Некоторые компоненты, например память и ЦП, легко найти спустя годы после приобретения оригинальных изделий. Другие компоненты, например жесткие диски, трудно найти уже через несколько лет. Приобретая оборудование, необходимо планировать приобретение запасных компонентов, которые будет трудно найти через некоторое время, и для замены которых требуются их точные аналоги. Рассмотрите возможность использования специализированных обслуживающих фирм или заключение контрактов с поставщиком для возложения на них этого обязательства, или храните 1-2 экземпляра каждого критически важного компонента в центральном офисе.

Ведение журнала оборудования.

Чтобы сократить время, затрачиваемое на выявление и устранение проблем с конфигурацией оборудования в процессе аварийного восстановления, ведите запись сведений о конфигурации оборудования, включая следующее:

  • контактная информация для связи со всеми поставщиками оборудования, включая номера телефонов, адреса электронной почты и веб-страницы для оперативной поддержки;

  • перечень оборудования, установленного в каждом сервере, с версиями обновлений микропрограмм и версиями драйверов оборудования (эти сведения об оборудовании можно найти в диспетчере устройств Windows);

  • перечень информации базовой системы ввода-вывода (BIOS), сведения о конфигурации жестких дисков и положениях перемычек в оборудовании для сервера.

Важно!

Сохраните эту информацию вне компьютера на случай выхода из строя компьютерной системы и необходимости восстановления систем в новом месте.

Ведение журнала программного обеспечения.

Чтобы сократить время, затрачиваемое на выявление и устранение проблем с программным обеспечением в процессе аварийного восстановления, ведите запись сведений о программах, включая следующее:

  • контактная информация для связи с поставщиками программного обеспечения, включая номера телефонов, адреса электронной почты и веб-страницы для оперативной поддержки;

  • список всех обновлений программ (например пакетов обновлений) в хронологическом порядке, а также исправлений программ, установленных на сервере. Сохранение такого списка позволит установить обновления программ в том же порядке, в каком они были установлены изначально;

  • запись конфигурации для каждого сервера, включая следующее:

    • имя сервера;

    • имя административной группы, к которой принадлежит сервер;

    • сведения о конфигурации жесткого диска, включая перечень разделов каждого жесткого диска с именами томов и размерами разделов, а также сводку того, что установлено в каждом разделе;

    • перечень всех статических IP-адресов, масок подсети и шлюзов по умолчанию, используемых сервером;

    • запись сведений о конфигурации кластеров, если топология включает кластеры;

    • все настройки, осуществленные на сервере, например настройки веб-клиента Project;

    • сведения о конфигурации для всех поставщиков общих служб, веб-приложений, сайтов, а также другие параметры.

    Важно!

    Сохраните эту информацию вне компьютера на случай выхода из строя компьютерной системы и необходимости восстановления систем в новом месте.

Планирование непредвиденных расходов на оборудование.

Чтобы свести к минимуму издержки из-за вынужденного простоя, включая снижение объема продаж и производительности, держите наготове оборудование для замены, предназначенное для рабочих серверов. К оборудованию для замены, которое необходимо иметь наготове, относятся запасные серверы резервного копирования, сетевые карты, графические платы, контроллеры жестких дисков, маршрутизаторы, кабели, жесткие диски, материнские платы и блоки питания.

Обучение и предоставление документации.

Обеспечьте администраторам, операторам и персоналу службы поддержки в организации доступ к различным возможностям обучения, а также предоставьте документацию, касающуюся вопросов аварийного восстановления.

Если в функционировании одного или нескольких серверов возникают проблемы, последующий период вынужденного простоя может дорого обойтись организации. Однако при инвестировании в эффективные курсы обучения и технические руководства с самой последней информацией для администраторов серверов, операторов и персонала службы поддержки организация будет готова к возможным сбоям, а период вынужденного простоя будет сокращен.

Кроме того, время от времени можно осуществлять моделирования аварийного восстановления в непроизводственных доменах. Такие моделирования помогают администраторам, операторам и персоналу службы поддержки освоить процедуры восстановления, а также выявляют все дефекты стратегий резервного копирования и восстановления. Все новые процедуры и практические решения, разработанные в процессе таких моделирований, отразите в документации.

Загрузить эту книгу

Для упрощения чтения и печати этот раздел включен в следующую загружаемую книгу:

См. полный список доступных книг на веб-сайте Загружаемые материалы для Project Server 2007.