Поделиться через


Основные сведения о диагностических тестах

Пакет Microsoft HPC предоставляет набор часто используемых диагностических тестов. Эти тесты можно использовать для проверки развертывания, устранения неполадок и обнаружения снижения производительности. В этом разделе описаны тесты system, включенные по умолчанию при установке пакета HPC. Сведения о службах HPC для Excel тесты, новые доступные тесты и создание пользовательской диагностики см. в сетевых ресурсов диагностики.

Диагностические тесты системы системы концептуально группируются по набору. В следующих разделах этого раздела описываются тесты в каждом наборе и, если это применимо, настраиваемые параметры для тестов:

Проверяющий элемент среды развертывания

Тесты в этом наборе помогут найти распространенные проблемы, которые могут повлиять на развертывание узла без операционной системы. Дополнительные сведения см. в статье Проверка среды перед развертыванием узлов.

Заметка

Для головного узла, настроенного как отказоустойчивый кластер, проверяющий среду развертывания проверяет только активный головной узел. Для дополнительной проверки может потребоваться выполнить отработку отказа и запустить тесты на другом головном узле. Как правило, головные узлы в отказоустойчивом кластере, имеющие аналогичные конфигурации, и различные проблемы между двумя головными узлами являются редкими, но это может быть хорошо для запуска теста после восстановления (на вновь восстановленном или восстановленном головном узле после неустранимого сбоя).

Диагностический Описание
Развертывание: проверка DHCP Проверяет доступность DHCP-сервера для всех сетей.
Развертывание: проверка DNS Проверяет доступность DNS-сервера для всех сетей и сообщает IP-адреса DNS-сервера.
Развертывание: проверка учетных данных Проверяет, являются ли учетные данные установки допустимым пользователем HPC. Дополнительные сведения см. в разделе Предоставление учетных данных установки.
Развертывание: проверка подключения Active Directory Проверяет подключение к контроллеру домена и сообщает время отклика.
Развертывание: тест IPsec Проверяет, включена ли безопасность интернет-протокола (IPsec) в корпоративной сети. Если IPsec применяется в вашем домене с помощью групповой политики, могут возникнуть проблемы во время развертывания. Например, IPsec может запретить вычислительным узлам говорить с головным узлом, блокируя порты.
Развертывание: тест служб развертывания Windows Проверяет, включена ли служба транспорта развертывания Windows и что сервер развертывания не установлен. Службы развертывания Windows позволяют удаленно устанавливать Windows на компьютеры с поддержкой PXE.

Пакет HPC использует только службу роли транспортного сервера в роли служб развертывания Windows. Служба роли сервера развертывания не должна быть установлена.
Развертывание: Образ Windows и установка теста общего ресурса Проверяет, что образ установки в каждом шаблоне узла и образе среды предустановки Windows (Windows PE), используемого для развертывания, не отсутствуют, повреждены или заблокированы другим процессом, и что размер образа Предустановки Windows не превышает 300 МБ. Проверяет, существует ли общая папка, используемая для установки, и имеет правильные разрешения.

См. также общие сведения о шаблонах узлов.

Windows PE используется для подготовки компьютера к установке Windows, копирования образов дисков с сетевого файлового сервера, запуска установки Windows и записи образа узла.
Развертывание: тест NAT Проверяет правильное настройку преобразования сетевых адресов (NAT) на головном узле, чтобы вычислительные узлы могли взаимодействовать с сетью Enterprise в некоторых топологиях.
Развертывание: проверка брандмауэра Тест добавлен в пакет HPC 2008 R2 с пакетом обновления 1 (SP1).

Проверяет, отключен ли брандмауэр для сетевых адаптеров в сетях частного и кластера приложений (т. е. эти сетевые адаптеры исключены из брандмауэра Windows). Он также проверяет, правильно ли настроены необходимые правила брандмауэра для входящего и исходящего трафика на головном узле.

Дополнительные сведения см. в разделе конфигурации брандмауэра Windows в сетевыхкластера HPC.
Развертывание: порты открытый тест Тест, добавленный в пакет HPC 2008 R2 с пакетом обновления 1 ( SP1).

Проверяет, открыты ли следующие TCP-порты в брандмауэре Windows:

- 1856
- 6729
- 6730
- 9094
- 9095
- 9096
- 9794
- 9892
- 9893
- 9894

Сведения о портах, необходимых пакетом HPC для обмена данными между службами кластера на головном узле и других узлах в кластере, см. в разделе конфигурации брандмауэра Windows в сети кластера HPC.
Развертывание: проверка порядка привязки Тест, добавленный в пакет HPC 2008 R2 с пакетом обновления 1 ( SP1).

Проверяет, задана ли сеть Enterprise в качестве первой в порядке привязки для сетевых шлюзов по умолчанию. Если частная сеть указана перед сетью Enterprise, это может вызвать проблемы с контроллером домена Active Directory в сети Enterprise.
Развертывание: проверка ресурсов виртуальной сети высокого уровня доступности Тест, добавленный в пакет HPC 2008 R2 с пакетом обновления 1 ( SP1).

Если головной узел настроен в отказоустойчивом кластере для обеспечения высокой доступности, проверяет правильность настройки ресурсов виртуальной сети для отказоустойчивого кластера. После настройки головного узла в отказоустойчивом кластере, так как отказоустойчивый кластер не привязан к одному физическому серверу, он не может иметь имя и IP-адрес физического сервера. Отказоустойчивый кластер должен иметь имя виртуального головного узла и соответствующий виртуальный IP-адрес, отличный от физических имен и IP-адресов двух головных узлов в отказоустойчивом кластере. Это позволяет связи в корпоративных и частных сетях обращаться к головному узлу, который в настоящее время активен в любое время по виртуальному имени и IP-адресу, что гарантирует, что связь не будет прерываться, если активный головной узел завершается сбоем, и функции переключаются на пассивный головной узел.

Дополнительные сведения см. в настройке пакета Microsoft HPC для обеспечения высокой доступностиголовного узла.

Производительность MPI

Тесты интерфейса передачи сообщений (MPI) ping-pong измеряют задержку сети и пропускную способность между узлами в кластере путем отправки пакетов данных обратно и вперед между парными узлами. Задержка составляет среднюю половину времени, которое требуется пакету для выполнения кругового пути между парой узлов в микросекундах. Пропускная способность — это средняя скорость передачи данных между парой узлов в МБ/секунде. При выполнении тестов MPI ping-pong можно указать режим выполнения и сеть, которые нужно использовать.

Важный

Чтобы получить точные результаты с помощью тестов ping-pong MPI, выполните тесты в режиме последовательной (если он доступен) и убедитесь, что узлы не выполняются задания. Если узлы выполняют задания, тесты не возвращают точные меры задержки и пропускной способности.

Параметр режима выполнения имеет следующие значения:

  • кольцо: в кольцевом тесте (также называемом ближайшим тестом соседа), узлы отправляют пакеты друг другу по одной паре в кольцевом шаблоне. Хотя одна пара узлов запускает тест, все остальные узлы остаются неактивными. Первый узел связывается с его непосредственным соседом. После завершения теста на первой паре следующий узел аналогично связывается с соседом. Это последовательное связывание и тестирование продолжается до тех пор, пока тест не охватывает все узлы в кластере HPC, и каждый узел связан с двумя соседями, по одному в каждом направлении вокруг кольца.

    Для получения разумных признаков производительности кластера HPC можно использовать режим кольца . Тест кольца занимает меньше времени, чем последовательный или турнирный тест, так как каждый узел тестируется только с двумя соседними узлами вместо всех узлов в кластере.

  • последовательный: последовательный режим выполняет тест MPI ping-pong на одной паре узлов одновременно. Хотя одна пара узлов запускает тест, все остальные узлы остаются неактивными. Когда одна пара узлов завершит тест, тест запускается для другой пары узлов, и это тестирование отдельных пар продолжается последовательно до тех пор, пока не будут проверены все возможные пары узлов.

    Вы можете использовать режим последовательного для тщательного тестирования всех отдельных сетевых связей между узлами, если кластер HPC имеет небольшое количество узлов. Этот режим обеспечивает самую точную меру задержки или пропускной способности. Так как последовательный тест запускает тест MPI ping-pong на всех возможных парах узлов по одной паре за раз, тест может занять много времени для большого количества узлов.

  • турнир: в режиме турнира выполняется тест MPI ping-pong в нескольких раундах, как и в турнире. В каждом раунде все узлы в паре кластеров HPC отключены. Два узла в каждой паре отправляют пакеты друг другу, причем все пары обмениваются пакетами параллельно. После завершения одного раунда начинается другой раунд, используя другой набор пар узлов, чем использовался в предыдущих раундах. Циклы продолжаются до тех пор, пока не будут проверены все возможные пары узлов. Тесты в этом режиме выполняются быстрее и сетевые коммутаторы наиболее высоко загружены.

    Вы можете использовать режим турнира для тестирования инфраструктуры указанной сети и его выполнения при загрузке. Измеряемая задержка и пропускная способность относятся к загруженном кластеру и, таким образом, не могут сравниться с спецификациями производителя для сетевого оборудования.

Заметка

Тесты можно выполнять с дополнительными аргументами и получать дополнительные выходные данные с помощью команды mpipingpong.

Диагностический Описание
MPI Ping Pong: задержка Этот тест измеряет пропускную способность и задержку обмена данными между узлами. Так как это тест производительности, чтобы получить точные результаты, запустите этот тест на узлах, которые находятся в автономном режиме и не выполняют другие задания.

параметры: можно указать сеть, используемую для тестирования и режима выполнения.

По умолчанию этот тест выполняется в режиме турнира . При использовании режима турниров для измерения задержки тест вводит небольшой шум в одновременные измерения задержки каждого раунда, так как пакеты небольшие и, следовательно, даже сильно перезаписываются сетевые коммутаторы, не препятствуют пакетам. Чтобы получить более точные измерения задержки, при необходимости используйте режим последовательного последовательного для тестирования всех пар.
MPI Ping Pong: пропускная способность Измеряет пропускную способность сети между соседними узлами в кластере.

параметры : Можно указать сеть, используемую для тестирования и режима выполнения (последовательной или турнирной).

По умолчанию этот тест выполняется в режиме последовательного .
MPI Ping Pong: простая пропускная способность Измеряет пропускную способность сети между соседними узлами в кластере.

параметры: можно указать сеть, используемую для теста.

Измеряет пропускную способность только между парами смежных узлов в кластере с помощью режима кольца . Это обеспечивает разумную проверку подключения между указанной сетью. Для более точных измерений пропускной способности выполните тест MPI Ping Pong: пропускная способность.

Состояние сети

Тесты в этом наборе помогут проверить конфигурацию сети кластера. Параметры, которые можно настроить для этих тестов, отсутствуют.

Диагностический Описание
Отчет о конфигурации брандмауэра Сообщает о состоянии брандмауэра (включено или отключено) для выбранных узлов. Этот тест также сообщает приложениям или службам, которым разрешен доступ через брандмауэр (исключения брандмауэра), включая номер порта, который они используют.

См. также сведения о конфигурации брандмауэра для сетей HPC.
Отчет о конфигурации сети Сообщает о конфигурации сетевых адаптеров для каждого выбранного узла.

Устранение неполадок сети

Тесты в этом наборе помогут проверить сетевое подключение для узлов кластера.

Диагностический Описание
Проверка DNS Проверяет разрешение имен системы доменных имен (DNS) между выбранными узлами.
Проверка подключения к домену Проверяет подключение между выбранными узлами и каждым контроллером домена.
Тест проверки ping Проверяет сетевое подключение между выбранными узлами, выполняя проверку связи между каждым узлом и всеми остальными узлами в выбранной группе.

параметры: можно указать сеть, используемую для теста, и количество pings на узел.

Заметка

Пакет инструментов пакета HPC включает отчет по устранению неполадок сети, дополнительный диагностический тест, который собирает и анализирует сведения о сети в кластере на основе пакета HPC, чтобы помочь устранить неполадки в сети. Если у вас есть сеть InfiniBand, отчет также включает состояние и возможности карт адаптера канала узла (HCA) в этой сети. Дополнительные сведения см. в разделе Установка и использование тестов диагностики отчета об устранении неполадок сети.

Услуги

Тесты и отчеты в этом наборе помогут убедиться, что необходимые службы HPC выполняются на выбранных узлах и устраняют ошибки службы.

Диагностический Описание
Отчет о конфигурации службы Сообщает обо всех запущенных службах, установленных на выбранных узлах и параметрах конфигурации запуска.
Отчет о состоянии службы Сообщает о событиях HPC в журнале событий для выбранных узлов.

параметры: Можно указать счетчик часов , чтобы указать, как далеко назад проверить журнал событий (от 1 до 50 часов назад). Кроме того, можно ограничить количество событий для отчета, задав параметр счетчика журналов (1–100).
Службы, на которых выполняется тест Проверяет, запущены ли службы HPC на выбранных узлах. Ожидаемые службы определяются ролью целевого узла (головного узла, вычислительного узла или узла брокера WCF). Этот тест может сообщить о состоянии необязательных служб, если они присутствуют, но он проверяет только необходимые службы.

SOA

тест загрузки службы SOA проверяет, могут ли библиотеки DLL для указанной службы загружаться на указанные узлы и какие-либо обнаруженные зависимости для библиотеки DLL присутствуют на узлах. По умолчанию этот тест использует встроенную службу CcpEchoSvc для проверки функциональности SOA в кластере.

Чтобы убедиться, что определенная служба может быть загружена, можно указать имя службы в параметре теста. При запускетестовой загрузки службы SOA вконфигурации в управлении службами SOA впакете MICROSOFT HPC, выбранная служба автоматически указывается в параметре для теста.

Конфигурация системы

Отчеты в этом наборе содержат сведения о конфигурации приложений и обновлениях программного обеспечения на выбранных узлах.

Диагностический Описание
Отчет о активной схеме питания Test добавлен в пакет HPC 2012.

Сообщает о активной схеме питания (план) и перечисляет все существующие схемы питания, настроенные в операционной системе на выбранных узлах.
Отчет о конфигурации приложения Сообщает приложениям, включая номера версий, установленные на выбранных узлах. Результаты включают таблицу, которая содержит список всех установленных приложений и количество узлов, на которых установлено это приложение. Вы также можете просматривать результаты по узлу.
Доступные обновления программного обеспечения для отчета узла Сообщает об обновлениях программного обеспечения, доступных для выбранных узлов. Тестовые отчеты об обновлениях, которые определяются как критически важные службы windows Server Update Services (WSUS) или Центр обновления Майкрософт. Диагностика взаимодействует с клиентом Центра обновления Майкрософт, который фильтрует обновления таким образом, чтобы сообщались диагностике только те, которые относятся к узлу.

Этот тест завершается ошибкой, если winhttp прокси-сервер не установлен на вычислительном узле. Выполните команду netsh winhttp show proxy, чтобы определить, имеют ли узлы набор прокси-сервера.

Дополнительные сведения о применении обновлений с помощью корпоративного сервера WSUS или с помощью шаблона узла см. в разделе "Рекомендации" в разделе пошаговые инструкции по обновлению узлов.
Тест KSP обратимой карточки HPC Тест, добавленный в пакет HPC 2008 R2 с пакетом обновления 2.

Сообщает, установлен ли поставщик хранилища ключей обратимой карты HPC (KSP) на выбранных узлах кластера. Этот параметр включает проверку подлинности обратимой карты при выполнении задач на узлах.

KSP — это отдельная установка, которая устанавливается только на головном узле и вычислительных узлах. Он не должен быть установлен на клиентских узлах.

Компонент KSP используется для входа смарт-карты для задач, выполняемых на вычислительных узлах. KSP используется только на компьютерах, где выполняются задачи.

Если тест завершается ошибкой: KSP обратимой карты HPC не установлен на этом компьютере. Дополнительные сведения об установке для включения проверки подлинности обратимой карты см. в заметках о выпуске пакета MICROSOFT HPC.

Если тест проходит: на этом компьютере установлен KSP обратимой карты HPC.
Отсутствующие или обязательные обновления программного обеспечения из отчета шаблона Сравнивает обновления программного обеспечения, установленные на выбранных узлах, с обновлениями, указанными в задаче Применить обновления в шаблоне узла. В отчете указывается, не удалось ли выполнить необходимый уровень обновления (нет, критически важный, все) или отсутствуют определенные обновления, как определено в шаблоне узла.

Если эта диагностика сообщает, что необходимые обновления отсутствуют, выполните указанные узлы в автономном режиме и запустите действие поддержки. См. задачи обслуживания на узлах.

Шаблон узла должен включать задачу применить обновления для выполнения этого теста. Если шаблон узла не включает эту задачу, можно запустить доступные обновления программного обеспечения для отчета узла, чтобы просмотреть список доступных обновлений или добавить задачу в шаблон узла. Сведения о добавлении задачи обновления в шаблон узла см. в статье Добавление задачи "Применить обновления" кшаблона узла.
Обновления программного обеспечения, установленные на узлах отчета Сообщает об обновлениях, установленных на выбранных узлах.

Windows Azure

Suite добавлен в пакет HPC 2008 R2 с пакетом обновления 2.

Тесты в этом наборе помогают проверить, можно ли развертывать и запускать задания на узлах Windows Azure в кластере.

Диагностический Описание
Проверка портов брандмауэра Windows Azure Выполняет простой тест, чтобы проверить связь с головного узла в Windows Azure через все существующие внутренние и внешние брандмауэры. Этот тест всегда выполняется с использованием учетных данных теста диагностики по умолчанию. Этот тест можно выполнить перед развертыванием узлов Windows Azure, чтобы убедиться, что любой существующий брандмауэр настроен для разрешения развертывания, планировщика и взаимодействия брокера между головным узлом и Windows Azure.

Этот тест проверяет исходящее подключение на выбранных TCP-портах из головного узла в службу hpcazureportcheck.cloudapp.net в Windows Azure. Служба hpcazureportcheck.cloudapp.net размещена корпорацией Майкрософт, чтобы предоставить конечную точку связи для этого теста. Важно: hpcazureportcheck.cloudapp.net не связана с любой размещенной службой Windows Azure, используемой для развертываний узлов Windows Azure. Вам не нужно развертывать узлы Windows Azure в кластере, так как он используется только тестом портов брандмауэра Windows Azure.

Порты брандмауэра, которые проверяются тестом, являются теми, которые требуются версии пакета HPC, установленного на головном узле (начиная с пакета HPC 2008 R2 с пакетом обновления 2 (SP2). Если вы установили пакет HPC 2008 R2 с пакетом обновления 2 (SP2), обмен данными на следующих TCP-портах проверяется:

- 80
- 443
- 3389
- 5901
- 5902
- 7998
- 7999

Если вы установили по крайней мере пакет HPC 2008 R2 с пакетом обновления 3 (SP3), обмен данными по следующим TCP-портам проверяется по умолчанию:

- 443
- 3389 Важно:
  • Сбой может указывать на то, что порт блокируется корпоративным брандмауэром. Если вы уже разблокировали все перечисленные порты и по-прежнему видите сбой, это может означать, что прокси-сервер или клиент, брандмауэр программного обеспечения или другое устройство, которое управляет интернет-трафиком, не настроено, чтобы службы HPC могли взаимодействовать с Windows Azure.
  • Успешные результаты теста не гарантируют правильность взаимодействия головного узла с размещенной службой, используемой для развертываний узлов Windows Azure.
  • Если вы решили включить доступ к брандмауэру для этого теста, рекомендуется включить доступ к имени узла hpcazureportcheck.cloudapp.net вместо IP-адреса, так как последний может измениться.
  • Если вы установили на восточном пакете HPC 2008 R2 с пакетом обновления 3 (SP3), можно настроить параметр реестра, чтобы головной узел взаимодействовал с Windows Azure с помощью портов брандмауэра сети, необходимых для пакета HPC 2008 R2 с пакетом обновления 2 (SP2) вместо портов по умолчанию, необходимых для пакета HPC 2008 R2 с пакетом обновления 3 (SP3). При этом тест проверяет связь между портами, необходимыми для пакета HPC 2008 R2 с пакетом обновления 2 (SP2).


Дополнительные сведения о портах брандмауэра для Windows Azure см. в разделе Требования к узлам Windows Azure в пакете Microsoft HPC.
Тест связи Windows Azure MPI Выполняет простой тест ping-pong между парами узлов Windows Azure, чтобы убедиться, что обмен данными MPI работает правильно. Этот тест выполняется только на узлах Windows Azure и на узлах в одном развертывании.
Отчет Windows Azure Сообщает о именах экземпляров ролей для развернутых узлов Windows Azure. Важно: после установки пакета HPC 2008 R2 с пакетом обновления 3 (SP3) этот тест больше не предоставляет имена экземпляров ролей для узлов Windows Azure. Чтобы обойти эту проблему, можно выполнить следующую команду на каждом узле, для которого нужно просмотреть имя: Set COMPUTERNAME Можно также использовать команду clusrun или создать новый диагностический тест для выполнения этой команды в группе узлов.
Проверка подключения служб Windows Azure Проверяет, могут ли службы, работающие на головном узле, подключаться к Windows Azure с помощью идентификаторов подписок и сертификатов, указанных в шаблонах узлов Windows Azure. Этот тест всегда выполняется с использованием учетных данных теста диагностики по умолчанию.

параметр : Можно указать шаблон узла, используемый для теста. По умолчанию этот тест использует все шаблоны узлов.
Проверка виртуальной сети Windows Azure Test добавлен в пакет HPC 2012.

Выполняет тест, чтобы убедиться, что сайты виртуальной сети Windows Azure, настроенные во всех шаблонах узлов Windows Azure, действительны.

Нет параметров, которые можно настроить для этого теста.

Дополнительные ссылки