Отслеживание непрерывной репликации
Применимо к: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1
Последнее изменение раздела: 2007-08-22
В сервере Microsoft Exchange Server 2007 с пакетом обновления 1 (SP1) реализованы новые и улучшенные возможности отслеживания сред с непрерывной репликацией. Эти изменения улучшают возможности средств отчетности кластеров по сравнению с имевшимися в окончательной первоначальной версии (RTM) сервера Microsoft Exchange Server 2007 и предоставляют дополнительные методы для упреждающего отслеживания сред с непрерывной репликацией. В частности, в Exchange 2007 с пакетом обновления 1 (SP1) появились новые возможности у командлета Get-StorageGroupCopyStatus и добавлен новый командлет Test-ReplicationHealth. Эти изменения расширяют возможности контроля в интервале потери данных, покрываемом транспортной корзиной. Помимо использования командлетов, предназначенных для отслеживания работоспособности непрерывной репликации, также появилась возможность задействовать несколько счетчиков производительности, публикуемых службой репликации Microsoft Exchange.
Улучшения, внесенные пакетом обновления 1 (SP1) в командлет Get-StorageGroupCopyStatus
В окончательной первоначальной версии (RTM) сервера Exchange 2007 было обнаружено несколько ситуаций, при которых отчет о состоянии, созданный командлетом Get-StorageGroupCopyStatus, и показания счетчиков производительности непрерывной репликации получались неточными или вводили в заблуждение.
Группа хранения, не являющаяся активной (например не изменяющаяся), может сообщать о том, что она работоспособна, хотя это не так. Такая ситуация может возникать из-за того, что неполадки не удается обнаружить до завершения преобразования журнала.
При инициализации происходит оценка состояния репликации, и она может быть неточной. Состояние обновляется после завершения инициализации.
Значение поля LastLogGenerated может быть неверным, если отключена база данных в группе хранения.
Если в потоке журналов обнаружится отсутствие одного или нескольких файлов журналов, пассивная копия повторяет попытку восстановления, приводя к изменению состояния репликации между сбоем и работоспособностью. Когда это происходит, очереди преобразования и копирования продолжают расти.
В очень редких случаях журнал может успешно пройти проверку, но все-таки не пройти преобразование. В этой ситуации система, пытаясь выполнить восстановление, будет менять значение состояния между сбоем и работоспособностью. Когда это происходит, очереди преобразования и копирования продолжают расти.
В окончательной первоначальной версии (RTM) сервера Exchange 2007 для обмена данными между службой репликации Microsoft Exchange и задачами управления Exchange, представляющего собой асинхронный процесс, используются реестр и база данных кластера. Поскольку данный процесс является асинхронным, результатом могут стать недостоверные сведения о состоянии (см. выше).
В Exchange 2007 с пакетом обновления 1 (SP1) перечисленные выше проблемы были решены переработкой низкоуровневого механизма обмена информацией между службой репликации Microsoft Exchange и задачами управления Exchange. Вместо использования службы кластеров или реестра задачи управления теперь напрямую взаимодействуют со службой репликации Microsoft Exchange, используя удаленные вызовы процедур (RPC).
Кроме того, командлет Get-StorageGroupCopyStatus теперь имеет возможность обрабатывать новые данные о состоянии:
Если служба репликации Microsoft Exchange целевого компьютера недоступна из сети, командлет Get-StorageGroupCopyStatus сообщает о значении ServiceDown для состояния SummaryCopyStatus.
Командлет Get-StorageGroupCopyStatus сообщает для состояния SummaryCopyStatus значение Initializing, если служба репликации Microsoft Exchange целевого компьютера не завершила начальные проверки при запуске. Для отражения данного состояния в виде логического значения также был создан новый счетчик производительности.
Командлет Get-StorageGroupCopyStatus сообщает для состояния SummaryCopyStatus значение Synchronizing, если добавочное заполнение не завершено.
Новые состояния для значения SummaryCopyStatus отображаются только при использовании средств управления Exchange версии Exchange 2007 с пакетом обновления 1 (SP1). При использовании задач управления Exchange окончательной первоначальной версии (RTM) сервера Exchange 2007 для любых предшествующих состояний будет сообщаться значение Failed.
Командлет Test-ReplicationHealth
В Exchange 2007 с пакетом обновления 1 (SP1) появился новый командлет Test-ReplicationHealth. Этот командлет предназначен для упреждающего наблюдения за процессом непрерывной репликации и конвейером непрерывной репликации. Командлет Test-ReplicationHealth предназначен для локального выполнения на сервере почтовых ящиков для проверки состояния репликации в среде локальной непрерывной репликации, в среде кластера с непрерывной репликацией и в среде пассивной непрерывной репликации. Для предоставления однозначной, точной информации о работоспособности непрерывной репликации сервера почтовых ящиков командлет Test-ReplicationHealth также тесно интегрируется с Microsoft Operations Manager (MOM). Проверки выполняются по мере убывания их важности. Более важные тесты выполняются первыми. При неуспешном выполнении хотя бы одного теста считается, что менее важные проверки будут неуспешными или необязательными для выполнения.
Командлет Test-ReplicationHealth проверяет все аспекты репликации, служб кластера и состояния преобразования и репликации группы хранения для предоставления полного обзора системы репликации. В частности, при выполнении на узле кластера командлет Test-ReplicationHealth проводит тесты, описанные в таблице ниже.
Тесты, выполняемые командлетом Test-ReplicationHealth
Test | Описание |
---|---|
Состояние пассивного узла (PassiveNodeUp) |
Проверяет, чтобы пассивный узел в среде кластера с непрерывной репликацией имел состояние Up. |
Состояние сети кластера (ClusterNetwork) |
Проверяет, чтобы на локальном узле были работоспособными все управляемые кластером сети. |
Состояние кворумной группы (QuorumGroup) |
Проверяет работоспособность кластерной группы с ресурсом кворума. |
Состояние кворума общего файлового ресурса (FileShareQuorum) |
Проверяет, доступно ли значение FileSharePath, используемое кворумом набора основных узлов с файловым ресурсом-свидетелем. |
Состояние группы кластерного сервера почтовых ящиков (CmsGroup) |
Подтверждает, что кластерный сервер почтовых ящиков работоспособен, путем проверки того, что все ресурсы в группе подключены. |
Состояние узла (NodePaused) |
Проверяет, чтобы ни один из узлов кластера не находился в приостановленном состоянии. |
Состояние регистрации DNS (DnsRegistrationStatus) |
Проверяет, чтобы все сетевые интерфейсы, управляемые кластером, для которых установлен параметр Требовать успешную регистрацию в DNS выполнили регистрацию в службе доменных имен (DNS). |
Состояние службы репликации (ReplayService) |
Проверяет работоспособность службы репликации Microsoft Exchange на локальном узле. |
Базы данных после перехода на другой ресурс при сбое подключены (DBMountedFailover) |
Проверяет, не осталось ли баз данных, которые не подключены или не выполнили переход на другой ресурс при сбое. Этот тест проверяет только наличие баз данных, не выполнивших переход на другой ресурс при сбое. |
Приостановка копирования группы хранения (SGCopySuspended) |
Проверяет наличие на кластерном сервере почтовых ящиков приостановленной непрерывной репликации для любой из групп хранения. |
Сбой при копировании группы хранения (SGCopyFailed) |
Проверяет наличие копий групп хранения в состоянии сбоя. |
Инициализация группы хранения (SGInitializing) |
Проверяет наличие групп хранения в состоянии инициализации. |
Длина очереди копирования группы хранения (SGCopyQueueLength) |
Проверяет наличие для любой из групп хранения длины очереди копирования репликации, превышающей рекомендованные пороговые значения. Ниже приведены текущие пороговые значения.
|
Длина очереди преобразования группы хранения (SGReplayQueueLength) |
Проверяет наличие для любой из групп хранения длины очереди преобразования репликации, превышающей рекомендованные пороговые значения. Ниже приведены текущие пороговые значения.
|
Отслеживание контекста для командлета Test-ReplicationHealth
Командлет Test-ReplicationHealth имеет параметр MonitoringContext, который позволяет включить в результаты выполнения счетчики производительности и наблюдение за событиями. Этот параметр используется пакетом управления для MOM. У этого параметра два возможных значения: $true и $false. Если указано значение $true, в результаты будут включены счетчики производительности и наблюдение за событиями, а также сведения о службах.
Если указан контекст отслеживания, на активном узле выполняются только указанные ниже проверки.
PassiveNodeUp
ClusterNetwork
QuorumGroup
FileShareQuorum
CmsGroup
NodePaused
DnsRegistrationStatus
ReplayService
DBMountedFailover
Если указан контекст отслеживания, на пассивном узле выполняются только указанные ниже проверки.
ClusterNetwork
DnsRegistrationStatus
ReplayService
SGCopySuspended
SGCopyFailed
SGInitializing
SGCopyQueueLength
SGReplayQueueLength
Счетчики производительности, публикуемые службой репликации Microsoft Exchange
Служба репликации Microsoft Exchange предоставляет счетчики производительности, которые можно использовать для отслеживания состояния репликации как в среде с локальной непрерывной репликацией, так и в среде кластера с непрерывной репликацией. Для наблюдения и устранения неполадок, связанных с производительностью, рекомендуется собирать и оценивать показания счетчиков, рассматриваемых ниже в данном разделе.
Рекомендуемые счетчики производительности службы репликации Microsoft Exchange
Для каждой копии группы хранения служба репликации Microsoft Exchange создает отдельный набор счетчиков, перечисленных в таблице ниже. Это позволяет независимо отслеживать состояние и производительность каждой группы хранения. Наблюдая за счетчиками ReplayQueueLength и CopyQueueLength в объекте производительности MSExchange Replication, можно отслеживать производительность и состояние каждой группы хранения.
Примечание. |
---|
Как упоминалось ранее, командлет Get-StorageGroupCopyStatus также показывает значения этих счетчиков. |
Имя счетчика | Описание счетчика |
---|---|
Длина очереди копирования превышает пороговое значение для подключения (только для кластера с непрерывной репликацией) |
Указывает, что длина очереди копирования превышает порог, заданный при автодозвоне для подключения базы данных. Если порог при автодозвоне для подключения базы данных в среде кластера с непрерывной репликацией превышен, значение этого счетчика будет равно 1. Для среды с локальной непрерывной репликацией это значение всегда будет равно 0. |
CopyGenerationNumber |
Показывает последовательный номер версии последнего скопированного файла журнала. |
CopyNotificationGenerationNumber |
Указывает, что последовательный номер версии последнего файла журнала известен службе репликации Microsoft Exchange. |
CopyQueueLength |
Показывает количество файлов журналов, ожидающих копирования и проверки. |
Ошибка |
Если значение равно 1, это указывает, что непрерывная репликация выбранного экземпляра (группы хранения) находится в состоянии сбоя. Если значение равно 0, это указывает, что непрерывная репликация не находится в состоянии сбоя. |
Инициализация |
Если значение равно 1, это указывает, что непрерывная репликация выбранного экземпляра (группы хранения) находится в состоянии инициализации. Такое состояние означает, что группа хранения выполняет начальные проверки после запуска или служба репликации Microsoft Exchange занята добавочным заполнением. Если значение равно 0, это указывает, что непрерывная репликация не находится в состоянии инициализации. |
InspectorGenerationNumber |
Показывает последовательный номер версии последнего проверенного файла журнала. |
ReplayBatchSize |
Показывает количество файлов журнала, преобразованных вместе. |
ReplayGenerationNumber |
Показывает последовательный номер версии последнего преобразованного файла журнала. |
ReplayGenerationsComplete |
Показывает количество файлов журнала, преобразованных в текущем пакете. |
ReplayGenerationsPerMinute |
Показывает скорость преобразования (количество версий журнала в минуту) в текущем пакете. |
ReplayGenerationsRemaining |
Показывает количество версий журнала, ожидающих преобразования в текущем пакете. |
ReplayNotificationGenerationNumber |
Указывает, что последовательный номер версии последнего файла журнала известен службе репликации Microsoft Exchange. |
ReplayQueueLength |
Показывает количество файлов журналов, ожидающих преобразования. |
Приостановлено |
Значение 1 указывает, что работа непрерывной репликации приостановлена. Приостановка означает, что файлы журналов не копируются и не преобразовываются в пассивную копию. |
TruncatedGenerationNumber |
Указывает, что последовательный номер версии последнего файла журнала усечен службой репликации Microsoft Exchange. |
Кроме счетчиков, перечисленных в предыдущей таблице, в объекте производительности MSExchange Replica Seeder опубликован еще один счетчик с названием Seeding Finished %. Это счетчик показывает процент выполненного заполнения. Его значение меняется от 0 до 100 процентов, и он публикуется только для групп хранения, находящихся в процессе заполнения.