Мониторинг и обслуживание SharePoint Server 2010

 

Применимо к: SharePoint Server 2010

Последнее изменение раздела: 2015-03-09

В этой статье представлены сведения о счетчиках мониторинга и производительности для ферм Microsoft SharePoint Server 2010. Для поддержки производительности системы SharePoint Server 2010 необходимо отслеживать сервер, чтобы определить потенциальные узкие места. Для эффективного отслеживания необходимо знать, какие ключевые индикаторы могут сообщить о том, что определенная часть фермы требует внимания, и как интерпретировать эти индикаторы. Если обнаружится, что ферма работает, не достигая определенных для нее целей, ферму можно отрегулировать, добавляя или удаляя аппаратные ресурсы, изменяя топологию или способ хранения данных.

Сведения этого раздела должны помочь администраторам в ручной настройке счетчиков производительности и других параметров. Дополнительные сведения об отслеживании исправности и устранении неполадок с помощью средств мониторинга исправности, встроенных в интерфейс центра администрирования SharePoint, см. в следующих статьях:

Прежде чем приступать к чтению этой статьи, вы должны прочитать статью Обзор управления емкостью и изменения размера для SharePoint Server 2010.

Содержание:

  • Настройка мониторинга

  • Устранение узких мест

Настройка мониторинга

Ниже приведен список параметров, которые можно изменить для отслеживания среды на ранних стадиях, которое поможет определить необходимость изменений. Имейте в виду, что увеличение возможностей мониторинга повлияет на объем дискового пространства, необходимый для базы данных использования. Когда среда станет стабильной и детальный мониторинг станет ненужным, можно вернуть этим параметрам значения по умолчанию.

Параметр Значение Примечания

Защита журнала событий от переполнения

Отключено

Значение по умолчанию Включено. Этот параметр можно отключить, чтобы собрать как можно больше данных мониторинга. Для выполнения обычных операций он должен быть включен.

Расписание задания таймера

   

Импорт данных об использовании Microsoft SharePoint Foundation

5 мин.

Значение по умолчанию 30 минут. При уменьшении значения этого параметра данные импортируются в базу данных использования чаще. Это особенно удобно при диагностике. Для выполнения обычных операций значение этого параметра должно быть равно 30 минутам.

Поставщики диагностики

   

Включить всех поставщиков диагностики

Включено

Значение по умолчанию Отключено, кроме поставщика "Мониторинг исправности поиска — трассировка событий". Эти поставщики собирают данные о исправности для различных функций и компонентов. Для выполнения обычных операций можно вернуть значение по умолчанию.

Задать интервалы расписания "задание-диагностики-счетчик-производительности-поставщик-wfe" и "задание-диагностики-счетчик-производительности-поставщик-sql"

1 минута

Значение по умолчанию 5 минут. При уменьшении значения этого параметра данные будут выбираться чаще, что особенно полезно при диагностике. Для выполнения обычных операций значение этого параметра должно быть равно 5 минутам.

Прочее

   

Включить трассировку стека для запросов контента

Включено

Значение по умолчанию Отключено. Включение этого параметра позволяет выполнять диагностику ошибок запросов контента, используя трассировку стека процесса. Для выполнения обычных операций этот параметр должен быть отключен.

Включить информационную панель разработчика

Включено

Значение по умолчанию Отключено. Включение этого параметра позволяет выполнять диагностику медленных страниц или других проблем с помощью информационной панели разработчика. Для выполнения обычных операций, когда диагностика уже не нужна, этот параметр следует отключить.

Сбор данных об использовании

   

Использование импорта контента

Использование экспорта контента

Запросы страниц

Использование компонента

Использование запроса поиска

Использование инвентаризации сайта

Задания таймера

Использование оценок

Включено

Включение ведения журнала этого набора счетчиков позволяет собирать больше данных об использовании и лучше понимать шаблоны трафика в среде.

Счетчики производительности

При использовании базы данных использования в нее можно добавить счетчики производительности, помогающие отслеживать и оценивать производительность фермы. Данные этих счетчиков регистрируются автоматически с определенным интервалом (по умолчанию 30 минут). Таким образом, можно запрашивать базу данных использования, чтобы получать данные счетчиков и создавать графическое представление результатов с течением времени. Ниже приведен пример использования командлета PowerShell Add-SPDiagnosticsPerformanceCounter для добавления счетчика "% загруженности процессора" в базу данных использования. Этот командлет необходимо выполнить на одном из веб-серверов:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Существует несколько универсальных счетчиков производительности, которые следует отслеживать для любой системы серверов. Эти счетчики приведены в следующей таблице.

Счетчик производительности Описание

Процессор

Необходимо отслеживать производительность процессора, чтобы гарантировать, что совокупное использование процессора не сохраняется на постоянно высоком уровне (свыше 80 процентов), так как в противном случае система будет не способна обрабатывать неожиданные всплески активности. А также, что в обычном состоянии не произойдет "эффект домино", когда при отказе одного из компонентов остальные компоненты приходят в нерабочее состояние. Например, при наличии трех веб-серверов усредненная по всем серверам загрузка процессора не должна превышать 60%, чтобы при отказе одного из серверов у двух других серверов сохранялся запас для обработки дополнительной нагрузки.

Сетевой интерфейс

Отслеживайте скорость отправки и получения данных через сетевую интерфейсную плату. Она не должна превышать 50 процентов пропускной способности сети.

Диски и кэш

Существует несколько параметров логического диска, которые необходимо отслеживать регулярно. Доступное дисковое пространство является существенным фактором при оценке емкости, но также необходимо проанализировать время простоя диска. В зависимости от типов приложений или служб, выполняемых на серверах, можно проанализировать время чтения и записи диска. Расширенная очередь для функции записи или чтения будет влиять на производительность. Кэш оказывает существенное влияние на операции чтения и записи. Необходимо отслеживать увеличение количества ошибок кэша.

Память и файл подкачки

Отслеживайте объем доступной для выделения физической памяти. Нехватка памяти приведет к чрезмерному использованию файла подкачки и увеличению частоты ошибок страниц.

Системные счетчики

В следующей таблице приведены сведения о системных объектах и счетчиках, которые можно добавить в набор отслеживаемых в базе данных использования счетчиков, выполнив команду SPDiagnosticPerformanceCounter на веб-сервере.

Объекты и счетчики Описание

Процессор

 

% загруженности процессора

Показывает использование процессора за период времени. Постоянно высокое значение этого счетчика может указывать на негативное влияние на производительность. Не забывайте учитывать "совокупное значение" в многопроцессорных системах. Также можно измерить использование каждого процессора, чтобы обеспечить балансировку производительности между ядрами.

Диск

 

- Средняя длина очереди диска

Показывает среднее число запросов на чтение и запись, помещенных в очередь для выбранного диска за определенный интервал времени. Большая длина очереди диска может не быть проблемой, пока это не сказывается на операциях чтения/записи диска и система работает в стабильном состоянии без расширения очереди.

Средняя длина очереди на чтение диска

Среднее число помещенных в очередь запросов на чтение.

Средняя длина очереди на запись диска

Среднее число помещенных в очередь запросов на запись.

Обращений чтения с диска/сек

Число операций чтения с диска в секунду.

Обращений записи на диск/сек

Число операций записи на диск в секунду.

Память

 

- Доступно МБ

Показывает объем доступной для выделения физической памяти. Нехватка памяти приведет к чрезмерному использованию файла подкачки и увеличению частоты ошибок страниц.

- Ошибок кэша/сек

Этот счетчик показывает частоту возникновения ошибок, когда при поиске страницы в кэше файловой системы ее не удается найти. Это может быть программная ошибка, когда страница находится в памяти, или аппаратная ошибка, когда страница находится на диске.

Эффективное использование кэша для операций чтения и записи может оказывать существенное влияние на производительность сервера. Необходимо отслеживать увеличение количества ошибок кэша, на которое указывает уменьшение значений счетчиков Асинхронных быстрых чтений/сек или Упреждающих чтений/сек.

- Обмен страниц/сек

Этот счетчик показывает частоту считывания страниц с диска или записи на диск в случае страничных прерываний. Увеличение его значения указывает на проблемы, связанные с производительностью всей системы.

Файл подкачки

 

- % использования и пиковый % использования

Файл подкачки сервера, иногда называемый своп-файлом, хранит адреса "виртуальной" памяти на диске. Ошибки страниц возникают, когда выполняемый процесс должен остановиться и ждать, пока требуемые "виртуальные" ресурсы не загрузятся с диска в память. Они могут возникать чаще, если физическая память является недостаточной.

Сетевой адаптер

 

- Всего байт/сек

Это скорость отправки и получения данных через сетевую интерфейсную плату. Если эта скорость превышает 40-50 процентов пропускной способности сети, может потребоваться дополнительное выяснение причин. Для точного выяснения причин отследите счетчики Получено байт/сек и Отправлено байт/сек.

Процесс

 

- Рабочий набор

Этот счетчик показывает текущий размер (в байтах) рабочего набора для данного процесса. Эта память резервируется для процесса, даже если он не используется.

- % загруженности процессора

Этот счетчик показывает процент загруженности процессора данным процессом.

Число потоков (_Total)

Текущее число потоков.

ASP.NET

 

Всего запросов

Общее число запросов с момента запуска службы.

Запросов в очереди

Microsoft SharePoint Foundation 2010 предоставляет стандартные блоки для HTML-страниц, которые отображаются в браузере пользователя через HTTP. Этот счетчик показывает число запросов, ожидающих обработки.

Время ожидания запроса

Время в миллисекундах, в течение которого самый последний запрос ожидал обработки в очереди. При увеличении числа событий ожидания пользователи будут ощущать ухудшение производительности отображения страниц.

Отказанных запросов

Общее число запросов, не выполненных из-за нехватки ресурсов сервера для их обработки. Этот счетчик представляет число запросов, возвративших код состояния HTTP 503, указывающий на перегрузку сервера.

Выполняется запросов (_Total)

Число запросов, выполняемых в данный момент.

Запросов/сек (_Total)

Число запросов, выполняемых в секунду. Представляет текущую пропускную способность приложения. При постоянной нагрузке это число должно оставаться в определенном диапазоне, запрещая другую работу сервера (такую как сборка мусора, поток очистки кэша, внешние средства сервера и т. д.).

Память CLR .NET

 

Сборов мусора для поколения 0

Этот счетчик показывает, сколько раз с момента запуска приложения для объектов поколения 0 (т. е. для объектов, существующих меньше остальных, размещенных самыми последними) выполнялся сбор "мусора". Это число можно использовать в соотношении "поколение 0: поколение 1: поколение 2", чтобы убедиться, что число сборов для поколения 2 не на много превышает число сборов для поколения 0 (оптимально — в два раза).

Сборов мусора для поколения 1

Показывает, сколько раз с момента запуска приложения для объектов поколения 1 выполнялся сбор "мусора".

Сборов мусора для поколения 2

Показывает, сколько раз с момента запуска приложения для объектов поколения 2 выполнялся сбор "мусора". Этот счетчик увеличивается в конце сбора мусора для поколения 2 (также называемом полным сбором мусора).

% времени на сбор мусора

Показывает процент времени, затраченного на выполнение сбора "мусора" с момента завершения последнего цикла сбора мусора. Этот счетчик обычно может служить индикатором работы по сбору и уплотнению памяти, которую выполняет сборщик мусора по поручению приложения. Этот счетчик обновляется только при завершении каждого сбора мусора. Этот счетчик не является усредненным, он отражает последнее наблюдаемое значение. При нормальной работе значение этого счетчика не должно превышать 5%.

Счетчики SQL Server

В следующей таблице приведены сведения об объектах и счетчиках SQL Server.

Объекты и счетчики Описание

Общая статистика

Этот объект содержит счетчики для мониторинга работы сервера в целом, например число текущих подключений или число пользователей, в течение секунды подключающихся к компьютерам с запущенными экземплярами SQL Server и отключающихся от них.

Подключения пользователей

Этот счетчик показывает число подключений пользователей для экземпляра SQL Server. Если его значение окажется на 500% выше базового, это может привести к снижению производительности.

Базы данных

Этот объект содержит счетчики для мониторинга операций массового копирования, пропускной способности средства резервного копирования и восстановления, операций с журналами транзакций. Мониторинг транзакций и журналов транзакций позволит определить, сколько пользовательских операций выполняется в базе данных и насколько заполнен журнал транзакций. Объем пользовательских операций может влиять на производительность базы данных, размер журнала, выполнение блокировки и репликации. Мониторинг операций с журналом на нижнем уровне, дающий оценки активности пользователей и загруженности ресурсов, помогает выявлять узкие места в системе.

Транзакций/сек

Этот счетчик показывает количество транзакций для данной базы данных или всего экземпляра SQL Server, выполняемых в секунду. Это число помогает в определении базового уровня и устранении проблем.

Блокировки

Этот объект содержит информацию о блокировках SQL Server по отдельным типам ресурсов.

Количество взаимоблокировок/сек

Этот счетчик показывает число взаимоблокировок, происходящих в секунду в SQL Server. Его значение не должно превышать 0.

Среднее время ожидания (мс)

Этот счетчик показывает среднее время ожидания по всем запросам блокировки, вызвавшим переход в состояние ожидания.

Время ожидания блокировки (мс)

Этот счетчик показывает общее время ожидания для блокировок, установленных за последнюю секунду.

Ожиданий блокировок/сек

Этот счетчик показывает число запросов блокировки в секунду, которые не были удовлетворены немедленно и были вынуждены ждать освобождения ресурсов.

Кратковременные блокировки

Этот объект содержит счетчики для мониторинга внутренних блокировок ресурсов SQL Server, называемых кратковременными блокировками. Мониторинг таких блокировок, дающий оценки активности пользователей и загруженности ресурсов, помогает выявлять узкие места в системе.

Среднее время ожидания кратковременной блокировки (мс)

Этот счетчик показывает среднее время ожидания блокировки для запросов кратковременных блокировок, которым пришлось ожидать обработки.

Ожиданий кратковременных блокировок/сек

Этот счетчик показывает число запросов кратковременных блокировок, которые не удалось удовлетворить немедленно.

Статистика SQL

Этот объект содержит счетчики для слежения за компиляцией и типом запросов, направляемых в экземпляр SQL Server. Мониторинг числа компиляций и повторных компиляций, а также число пакетов, полученных экземпляром SQL Server, позволяет судить о том, как быстро в SQL Server обрабатываются запросы пользователей и насколько эффективно работает оптимизатор запросов.

Компиляций SQL/сек

Этот счетчик показывает, сколько раз в секунду вводится путь к компилируемому коду.

Повторных компиляций SQL/сек

Этот счетчик показывает число повторных компиляций инструкции в секунду.

Кэш планов

Этот объект содержит счетчики, позволяющие следить за тем, как в SQL Server используется память для хранения таких объектов, как хранимые процедуры, специальные и подготовленные инструкции Transact-SQL и триггеры.

Коэффициент попадания в кэш

Этот счетчик показывает отношение числа успешных обращений в кэш к числу операций поиска для планов.

Буферный кэш

Этот объект содержит счетчики, позволяющие контролировать, как в SQL Server используется память для хранения страниц данных, внутренних структур данных и кэша процедур, и как работает физическая подсистема ввода-вывода при чтении и записи страниц базы данных SQL Server.

Коэффициент попадания в буферный кэш

Этот счетчик показывает, сколько страниц (в процентах от общего числа) было найдено в буферном кэше, что позволило не считывать их с диска. Его значение равняется отношению общего числа успешных обращений в кэш к общему числу операций поиска в кэше с момента запуска экземпляра SQL Server.

Устранение узких мест

Узкие места системы — это точки конфликта, возникающие при нехватке ресурсов для обслуживания пользовательских запросов на транзакции. Они могут быть связаны с физическим оборудованием, операционной системой или приложением. Часто причиной узкого места является пользовательский код или сторонние решения, анализ которых может принести лучшие результаты, чем добавление оборудования. Другой распространенной причиной узких мест является неправильная настройка фермы или неэффективная реализация решения, когда способ структурирования данных требует больше ресурсов, чем необходимо. Системный администратор должен справляться с узкими местами, постоянно отслеживая производительность. При обнаружении проблемы, связанной с производительностью, необходимо выбрать решение, наиболее подходящее для устранения узкого места. Счетчики производительности и другие приложения мониторинга производительности, например System Center Operations Manager (SCOM), являются ключевыми средствами отслеживания и анализа проблем, помогающими в разработке решения.

Устранение физического узкого места

Физические узкие места основаны на конфликтах процессора, диска, памяти и сети: при слишком большом количестве запросов они конфликтуют из-за нехватки физических ресурсов. Описанные в разделе "Отслеживание производительности" объекты и счетчики показывают источник проблемы производительности, например аппаратный процессор или ASP.NET. Для устранения узкого места необходимо определить проблему и внести устраняющие ее изменения.

Проблемы редко возникают мгновенно; обычно происходит постепенное ухудшение производительности, которое можно отследить при регулярном мониторинге с использованием средства мониторинга производительности или более сложной системы, например SCOM. Для обоих вариантов в той или иной степени можно внедрить в предупреждение решение в виде рекомендательного текста или подготовленных команд.

Для устранения узких мест может потребоваться изменение конфигурации оборудования или системы, если вы определили, что проблемы не являются следствием неправильной настройки, неэффективного пользовательского кода или сторонних решений, либо неэффективной реализации решения. В следующих таблицах представлены пороговые значения проблем и возможные варианты их решения. Некоторые варианты предполагают обновление или изменение оборудования.

Объекты и счетчики Проблема Варианты решения

Процессор

Процессор — % загруженности процессора

Свыше 75-85%

Обновить процессор

Увеличить число процессоров

Добавить дополнительный сервер (серверы)

Диск

   

Средняя длина очереди диска

Постепенное увеличение, нестабильное состояние системы и копирование очереди

Увеличить число или скорость дисков

Изменить конфигурацию массива для чередования томов

Переместить некоторые данные на другой сервер

% времени простоя

Больше 90%

Увеличить число дисков

Переместить данные на другой диск или сервер

% свободного места

Меньше 30%

Увеличить число дисков

Переместить данные на другой диск или сервер

Память

   

Доступно МБ

Менее 2 ГБ на веб-сервере.

Добавить память.

Примечание

Доступная память сервера SQL будет намеренно недостаточной и не всегда укажет на проблему.

Ошибок кэша/сек

Больше 1

Добавить память

Увеличить скорость или размер кэша, если возможно

Переместить данные на другой диск или сервер

Обмен страниц/сек

Больше 10

Добавить память

Файл подкачки

   

% использования и пиковый % использования

Файл подкачки сервера, иногда называемый своп-файлом, хранит адреса "виртуальной" памяти на диске. Ошибки страниц возникают, когда выполняемый процесс должен остановиться и ждать, пока требуемые "виртуальные" ресурсы не загрузятся с диска в память. Они могут возникать чаще, если физическая память является недостаточной.

Добавить память

Сетевой адаптер

   

Всего байт/сек

Свыше 40-50% пропускной способности сети. Это скорость отправки и получения данных через сетевую интерфейсную плату.

Уточните причину, отследив счетчики "Получено байт/сек" и "Отправлено байт/сек".

Переоцените скорость сетевой интерфейсной платы

Проверьте количество, размер и использование буферов памяти

Процесс

   

Рабочий набор

Больше 80% общей памяти

Добавить память

% загруженности процессора

Ниже 75-85%.

Увеличить число процессоров

Перераспределить нагрузку на дополнительные серверы

ASP.NET

   

Перезапуски пула приложений

Несколько в день, приводят к временному замедлению.

Убедитесь, что не реализованы параметры, которые автоматически перезапускают пул приложений в течение дня без необходимости.

Запросов в очереди

Сотни или тысячи запросов в очереди.

Развернуть дополнительные веб-серверы

Максимальное значение по умолчанию для этого счетчика 5000. Этот параметр можно изменить в файле Machine.config

Время ожидания запроса

При увеличении числа событий ожидания пользователи будут ощущать ухудшение производительности отображения страниц.

Развернуть дополнительные веб-серверы

Отказанных запросов

Больше 0

Развернуть дополнительные веб-серверы

See Also

Concepts

Обзор управления емкостью и изменения размера для SharePoint Server 2010
Тестирование производительности для SharePoint Server 2010
Планирование емкости для SharePoint Server 2010
Health monitoring (SharePoint Server 2010)
Планирование и настройка рабочих характеристик хранилища и SQL Server (SharePoint Server 2010)