Мониторинг и устранение неполадок со стороны HANA

В этой статье мы рассмотрим отслеживание и устранение неполадок SAP HANA в Azure (крупные экземпляры) с помощью ресурсов, предоставляемых SAP HANA.

Чтобы проанализировать проблемы, связанные с SAP HANA в Azure (крупные экземпляры), нужно сузить круг возможных первопричин проблемы. Компания SAP опубликовала множество справочных материалов, которые могут вам помочь. Ответы на часто задаваемые вопросы, связанные с производительностью SAP HANA, можно найти в следующих примечаниях SAP:

Оповещения SAP HANA

Для начала проверьте текущие журналы оповещений SAP HANA. В SAP HANA Studio выберите Administration Console: Alerts: Show: all alerts (Консоль администрирования: Оповещения: Показать: Все оповещения). На этой вкладке показаны все оповещения SAP HANA для значений (объем свободной физической памяти, использование ЦП и т. д.), которые выходят за пределы установленных минимальных и максимальных пороговых значений. По умолчанию проверки автоматически обновляются каждые 15 минут.

В SAP HANA Studio выберите Administration Console: Alerts: Show: all alerts (Консоль администрирования: Оповещения: Показать: Все оповещения).

ЦП

Если оповещение запущено с помощью неправильно заданного порогового значения, восстановите значение по умолчанию или задайте приемлемое пороговое значение.

Восстановление значения по умолчанию или задание приемлемого порогового значения

Следующие оповещения могут указывать на проблемы с ресурсами ЦП:

  • использование ЦП узла (оповещение 5);
  • последняя операция точки сохранения (оповещение 28);
  • длительность точки сохранения (оповещение 54).

Высокий уровень потребления ресурсов ЦП в базе данных SAP HANA можно заметить по одному из следующих признаков:

  • для текущего использования ЦП или использования ЦП в прошлом возникает оповещение 5 (использование ЦП узла);
  • отображаемое потребление ресурсов ЦП на экране обзора.

Отображаемое потребление ресурсов ЦП на экране обзора

На графике Load (Нагрузка) может быть показан высокий уровень потребления ресурсов ЦП или высокий уровень потребления в прошлом.

На графике Load (Нагрузка) может быть показан высокий уровень потребления ресурсов ЦП или высокий уровень потребления в прошлом

Оповещение, активируемое при высоком уровне использования ЦП, может быть вызвано такими причинами, как:

  • выполнение определенных транзакций;
  • Загрузка данных
  • задания, которые не отвечают;
  • долго выполняющиеся инструкции SQL;
  • низкая производительность запросов (например, с BW в кубах HANA).

Подробные инструкции по устранению неполадок с использованием ЦП см. в разделе об основных причинах проблем с ЦП и их решениях руководства по анализу устранения неполадок с SAP HANA.

Операционная система (ОС)

Важная проверка SAP HANA в Linux заключается в том, чтобы убедиться, что Transparent Huge Pages отключены. Дополнительные сведения см. в SAP Note #2131662 – Transparent Huge Pages (THP) on SAP HANA Servers (Примечание SAP № 2131662. Transparent Huge Pages (THP) на серверах SAP HANA).

Вы можете проверить, включены ли Transparent Huge Pages с помощью следующей команды Linux: cat /sys/kernel/mm/transparent_hugepage/enabled

  • Если значение always заключено в квадратные скобки, это означает, что Transparent Huge Pages включены: [always] madvise never
  • Если значение never заключено в квадратные скобки, это означает, что Transparent Huge Pages отключены: always madvise [never]

Следующая команда Linux не должна ничего возвращать: rpm -qa | grep ulimit. Если окажется, что ulimit установлен, немедленно удалите его.

Память

Вы можете заметить, что объем памяти, выделенный для базы данных SAP HANA, больше, чем ожидалось. Следующие оповещения указывают на неполадки в связи с использованием большого объема памяти:

  • использование физической памяти узла (оповещение 1);
  • использование памяти сервера доменных имен (оповещение 12);
  • общее использование памяти таблиц хранилища столбцов (оповещение 40);
  • использование памяти служб (оповещение 43);
  • использование памяти основного хранилища таблиц хранилища столбцов (оповещение 45);
  • файлы дампа среды выполнения (оповещение 46).

Подробные инструкции по устранению неполадок с памятью см. в разделе о первопричинах проблем с памятью руководства по анализу устранения неполадок с SAP HANA.

Сеть

См. примечание SAP Note #2081065 – Troubleshooting SAP HANA Network (Примечание SAP № 2081065. Устранение неполадок сети SAP HANA) и выполните действия по устранению неполадок сети, приведенные в этом примечании SAP.

  1. Анализ времени кругового пути между сервером и клиентом.

  2. Выполните анализ обмена данными между узлами.

  3. Выполните команду Linux ifconfig (в выходных данных показано, есть ли какие-либо потери пакетов).

  4. Выполните команду Linux tcpdump.

Кроме того, используйте инструмент IPERF с открытым кодом (или похожий), чтобы измерить реальную производительность сети приложения.

Подробные инструкции по устранению неполадок сети см. в разделе о проблемах с производительностью сети и подключением руководства по анализу устранения неполадок с SAP HANA.

Хранение

Предположим, что с производительностью ввода-вывода возникают проблемы. Пользователи могут обнаружить, что приложения или система в целом работают медленно или даже могут перестать отвечать. На вкладке Volumes (Тома) в SAP HANA Studio отображаются подключенные тома, а также то, какие тома использует каждая служба.

На вкладке Volumes (Тома) в SAP HANA Studio отображаются подключенные тома, а также то, какие тома использует каждая служба

В нижней части экрана (на вкладке Volumes (Тома)) можно увидеть сведения о томах, например о файлах и статистике операций ввода-вывода.

В нижней части экрана можно увидеть сведения о томах, например о файлах и статистике операций ввода-вывода.

Инструкции по устранению неполадок операций ввода-вывода см. в разделе об основных причинах проблем с операциями ввода-вывода и их решениях руководства по анализу устранения неполадок с SAP HANA. Инструкции по устранению неполадок связанных с дисками см. в разделе об основных причинах проблем, связанных с дисками, и их решениях руководства по анализу устранения неполадок с SAP HANA.

Диагностические средства

Выполните проверку работоспособности SAP HANA с помощью HANA_Configuration_Minichecks. Это средство возвращает потенциальные критические технические проблемы, которые должны вызвать оповещения в SAP HANA Studio.

  1. См. примечание SAP Note #1969700 – SQL statement collection for SAP HANA (Примечание SAP № 1969700. Коллекция инструкций SQL для SAP HANA) и скачайте файл SQL Statements.zip, прикрепленный к этому примечанию. Сохраните этот ZIP-файл на локальном жестком диске.

  2. В SAP HANA Studio на вкладке System Information (Сведения о системе) щелкните правой кнопкой мыши столбец Name (Имя) и выберите Import SQL Statements (Импорт инструкций SQL).

    В SAP HANA Studio на вкладке System Information (Сведения о системе) щелкните правой кнопкой мыши столбец Name (Имя) и выберите Import SQL Statements (Импорт инструкций SQL)

  3. Выберите хранящийся локально файл Statements.zip SQL. После этого будет импортирована папка с соответствующими инструкциями SQL. На этом этапе с помощью этих инструкций SQL можно выполнить множество различных диагностических проверок.

    Например, чтобы проверить требования к пропускной способности при репликации системы SAP HANA, щелкните правой кнопкой мыши инструкцию Bandwidth (Пропускная способность), выбрав Replication: Bandwidth (Репликация: Пропускная способность), и щелкните Open (Открыть) в консоли SQL.

    Откроется полная инструкция SQL, что позволит изменить входные параметры (раздел изменения), а затем выполнить их.

    Откроется полная инструкция SQL, что позволит изменить входные параметры (раздел изменения), а затем выполнить их

  4. Другой пример — щелкнуть правой кнопкой мыши файл Overview (Обзор) в папке Replication (Репликация) . В контекстном меню выберите Execute (Выполнить).

    Еще один пример — щелкните правой кнопкой мыши инструкции в разделе

    Вы можете просмотреть сведения, полезные при устранении неполадок:

    Вы можете просмотреть сведения, полезные при устранении неполадок

  5. Сделайте то же самое для HANA_Configuration_Minichecks и проверьте наличие меток X в столбце C (Критический).

    Пример выходных данных

    HANA_Configuration_MiniChecks_Rev102.01+1 для общих проверок SAP HANA.

    HANA_Configuration_MiniChecks_Rev102.01+1 для общих проверок SAP HANA

    HANA_Services_Overview для обзора, какие службы SAP HANA запущены в данный момент.

    HANA_Services_Overview для обзора выполняющихся в настоящий момент служб SAP HANA

    HANA_Services_Statistics для получения сведений о службе SAP HANA (ЦП, память и т. д.).

    HANA_Services_Statistics для сведений о службе SAP HANA

    HANA_Configuration_Overview_Rev110+ для получения общих сведений об экземпляре SAP HANA.

    HANA_Configuration_Overview_Rev110+ для общих сведений об экземпляре SAP HANA

    HANA_Configuration_Parameters_Rev70+ для проверки параметров SAP HANA.

    HANA_Configuration_Parameters_Rev70+ для проверки параметров SAP HANA

Дальнейшие действия

Узнайте, как настроить высокий уровень доступности в операционной системе SUSE с помощью устройства ограничения.