Monitoramento e manutenção do SharePoint Server 2013
APLICA-SE A:2013 2016 2019 Subscription Edition SharePoint no Microsoft 365
Este artigo aborda os contadores de monitorização e desempenho para farms do SharePoint Server 2013. Para manter o desempenho do sistema do SharePoint Server 2013, tem de monitorizar o servidor para identificar potenciais estrangulamentos. Antes de poder monitorar com eficácia, você deve entender os principais indicadores que informarão se houver uma parte específica do farm que requer atenção, e como saber interpretar esses indicadores. Se perceber que o farm está operando fora do plano definido, ajuste-o adicionando ou removendo recursos de hardware, modificando a topologia ou alterando a forma de armazenamento dos dados.
As informações desta seção pretendem ajudar os administradores a configurar manualmente os contadores de desempenho e outras configurações. Para obter mais informações sobre a monitorização do estado de funcionamento e a resolução de problemas com as ferramentas de monitorização do estado de funcionamento incorporadas na interface do site da Administração Central do SharePoint, leia os seguintes artigos:
Antes de ler este artigo, deve ler Capacity management and sizing overview for SharePoint Server 2013 (Descrição geral da gestão de capacidade e dimensionamento do SharePoint Server 2013).
Configurando o Monitoramento
Veja abaixo uma lista de configurações que você pode alterar para monitorar seu ambiente nos primeiros estágios; elas o ajudarão a determinar se alguma modificação é ou não necessária. O aumento dos recursos de monitoramento afetará a quantidade de espaço em disco que o banco de dados de uso precisará. Depois que o ambiente estiver estável e que este monitoramento detalhado não for mais necessário, talvez seja preciso reverter as configurações abaixo para os respectivos padrões.
Configuração | Valor | Observações |
---|---|---|
Proteção de Saturação do Log de Eventos |
Desabilitado |
O valor padrão é Habilitado. Essa proteção pode ser desabilitada para coletar o máximo possível de dados de monitoramento. Em operações normais, ela deve ser habilitada. |
Cronograma do Trabalho do Temporizador |
||
Importação de Dados de Uso do Microsoft SharePoint Foundation |
5 minutos |
O valor padrão é 30 minutos. A diminuição deste valor leva à importação dos dados no banco de dados de uso com mais frequência, o que é especialmente útil na solução de problemas. Em operações normais, esse valor deve ser 30 minutos. |
Provedores de Diagnóstico |
||
Habilitar todos os provedores de diagnóstico |
Habilitado |
O valor padrão é Desabilitado, exceto para o provedor de "Monitoramento da Integridade da Pesquisa - Eventos de Rastreamento". Esses provedores coletam dados de integridade de diversos recursos e componentes. Em operações normais, talvez seja preciso reverter para o padrão. |
Defina os Intervalos de Agendamento "job-diagnostics-performance-counter-wfe-provider" e "job-diagnostics-performance-counter-sql-provider" |
1 minuto |
O valor padrão é 5 minutos. A diminuição deste valor pode extrair dados com mais frequência, o que é especialmente útil na solução de problemas. Em operações normais, esse valor deve ser 5 minutos. |
Miscellaneous |
||
Habilitar rastreamento de pilha de solicitações de conteúdo |
Habilitado |
O valor padrão é Desabilitado. A habilitação desta configuração permite o diagnóstico de falhas de solicitações de conteúdo usando o rastreamento de pilha do processo. Em operações normais, esse rastreamento deve estar desativado. |
Habilitar o Painel de Desenvolvimento |
Habilitado |
O valor padrão é Desabilitado. A habilitação desta configuração permite o diagnóstico de páginas lentas ou de outros problemas com o uso do Painel de Desenvolvimento. Em operações normais, e desde que a solução de problemas não seja mais necessária, deve ser desabilitada. |
Coleção de Dados de Uso |
||
Uso da Importação de Conteúdo Uso da Exportação de Conteúdo Solicitações de Página Uso de Recurso Uso da Consulta de Pesquisa Uso de Inventário de Site Trabalhos de Timer Uso de Classificação |
Habilitado |
A habilitação deste conjunto de contadores permite coletar mais dados de uso em todo o ambiente e permite uma compreensão melhor dos padrões de tráfego no ambiente. |
Contadores de desempenho
Se estiver utilizando o banco de dados de uso, você poderá adicionar contadores de desempenho que o auxiliem no monitoramento e avaliação do desempenho do seu farm para o banco de dados de uso, de tal maneira que eles sejam conectados automaticamente em um intervalo específico (por padrão, 30 minutos). Deste modo, você poderá consultar o banco de dados de uso para recuperar esses contadores e fazer um gráfico dos resultados ao longo do tempo. Veja este guia de uso do cmdlet do PowerShell Add-SPDiagnosticsPerformanceCounter para adicionar o contador % Tempo do Processador ao banco de dados de uso. Ele só precisa ser executado em um dos servidores Web:
Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd
Há diversos contadores de desempenho genéricos, que você deve monitorar em qualquer sistema de servidor. A tabela abaixo descreve esses contadores de desempenho.
Contador de Desempenho | Descrição |
---|---|
Processador |
Você deve monitorar o desempenho do processador para garantir que todo o uso do processador permaneça consistentemente alto (acima de 80 por cento), pois isto indica que o sistema não conseguiria lidar com qualquer aumento repentino de atividade. E que, no estado comum, você não verá um efeito dominó, caso uma falha de componente leve a um estado de mau funcionamento dos demais componentes. Se, por exemplo, você tiver três servidores da Web, deverá se assegurar de que a média da CPU em todos os servidores seja menos de 60%, de maneira que, se um falhar, os outros dois consigam absorver a carga adicional. |
Interface de Rede |
Monitore a taxa de envio e recebimento dos dados pela placa da interface da rede. Essa taxa deve permanecer abaixo de 50 por cento da capacidade da rede. |
Discos e Cache |
Há várias opções de disco lógico, que você deve monitorar regularmente. O espaço em disco disponível é importante em qualquer estudo de capacidade, mas você também deve revisar o tempo de ociosidade do disco. Dependendo dos tipos de aplicativos ou serviços que esteja executando nos seus servidores, você pode revisar os tempos de leitura e gravação do disco. Uma fila extensa para a função de gravação ou leitura afetará o desempenho. O cache tem um grande efeito sobre as operações de leitura e gravação. Você deve monitorar crescentes falhas do cache. |
Arquivo de Paginação e Memória |
Monitore a quantidade de memória física disponível para alocação. Memória insuficiente levará ao uso excessivo do arquivo de paginação e a um aumento da quantidade de falhas de paginação por segundo. |
Contadores do sistema
A tabela abaixo traz informações sobre contadores e objetos do sistema, que você pode adicionar ao conjunto de contadores monitorados no banco de dados de uso, utilizando o SPDiagnosticPerformanceCounter em um servidor da Web.
Objetos e Contadores | Descrição |
---|---|
Processador |
|
% do Tempo do Processador |
Aqui você vê o uso do processador ao longo do tempo. Se estiver frequentemente muito alto, você perceberá que o desempenho está sendo negativamente afetado. Lembre-se de fazer a contagem "Total" em sistemas multiprocessadores. Você também pode medir a utilização de cada processador para garantir um desempenho equilibrado entre os núcleos. |
Disco |
|
- Comprimento Médio da Fila do Disco |
Mostra a quantidade média de solicitações de leitura e gravação enfileiradas para o disco selecionado durante o intervalo da amostra. Um comprimento de fila de disco maior pode não significar um problema, desde que as leituras/gravações de disco não estejam sendo penalizadas e o sistema esteja trabalhando em criação contínua, sem expandir a fila. |
Comprimento Médio da Fila de Leitura do Disco |
A quantidade média de solicitações de leitura que estão enfileiradas. |
Comprimento Médio da Fila de Gravação do Disco |
A quantidade média de solicitações de gravação que estão enfileiradas. |
Leituras de Disco/seg. |
A quantidade de leituras do disco por segundo. |
Gravações de Disco/seg. |
A quantidade de gravações no disco por segundo. |
Memória |
|
- Mbytes Disponíveis |
Este dado mostra quanta memória física está disponível para alocação. Memória insuficiente levará ao uso excessivo do arquivo de paginação e a um aumento da quantidade de falhas de paginação por segundo. |
- Falhas de Cache/seg. |
Este contador mostra o índice de ocorrência de falhas quando uma página é procurada no cache do sistema de arquivo sem ser encontrada. Esta pode ser uma falha de software, quando a página é encontrada na memória, ou uma falha de hardware, quando a página está no disco. A utilização eficaz da cache para operações de leitura e escrita pode ter um efeito significativo no desempenho do servidor. Tem de monitorizar as falhas de cache aumentadas, indicadas por uma redução nas Leituras Rápidas Assíncronas/seg ou Leitura Antecipada/seg. |
- Páginas/seg |
Este contador mostra a taxa em que as páginas são lidas ou gravadas no disco, para solucionar falhas de página de hardware. Se aumentar, a taxa indicará problemas de desempenho do sistema todo. |
Arquivo de Paginação |
|
- % Usada e % de Pico Usada |
O arquivo de paginação do servidor, também conhecido como arquivo de permuta, mantém endereços de memória "virtual" no disco. As falhas de paginação ocorrem quando um processo precisa parar e esperar enquanto os recursos "virtuais" necessários são recuperados do disco para a memória. Isto será mais frequente se a memória física for insuficiente. |
NIC |
|
- Total de Bytes/seg. |
Esta é a taxa de envio e recebimento de dados pela placa de interface da rede. Poderá ter de investigar mais aprofundadamente se esta taxa for superior a 40-50 por cento de capacidade de rede. Para ajustar a investigação, monitorize Bytes recebidos/seg e Bytes Enviados/seg. |
Processo |
|
- Conjunto de Trabalho |
Este contador indica o tamanho atual (em bytes) do conjunto de trabalho de um determinado processo. Esta memória é reservada para o processo, mesmo que não esteja sendo usada. |
- % Tempo do Processador |
Este contador indica a porcentagem do tempo do processador que é usado por um determinado processo. |
Contagem de Threads (_Total) |
A quantidade atual de threads. |
ASP.NET |
|
Total de Solicitações |
A quantidade total de solicitações desde o início do serviço. |
Solicitações Enfileiradas |
O SharePoint Server 2013 fornece os blocos modulares para páginas HTML que são compostas no browser do utilizador através de HTTP. Este contador mostra a quantidade de solicitações à espera de processamento. |
Tempo de Espera da Solicitação |
A quantidade de milissegundos que a solicitação mais recente esperou na fila de processamento. À medida que a quantidade de eventos de espera aumenta, os usuários vão perceber uma diminuição no desempenho das páginas apresentadas. |
Solicitações Rejeitadas |
A quantidade total de solicitações não executadas devido à insuficiência de recursos de servidor para processá-las. Este contador representa a quantidade de solicitações que retornam o código de status HTTP 503, indicando que o servidor está ocupado demais. |
Solicitações em Execução (_Total) |
A quantidade de solicitações sendo executadas no momento. |
Pedidos/Seg (_Total) |
A quantidade de solicitações executadas por segundo. Isto representa a taxa de transferência atual do aplicativo. Com carga constante, esta quantidade deve se manter dentro de um certo intervalo, barrando outros trabalhos do servidor (como coleta de lixo, thread de limpeza de cache, ferramentas do servidor externo etc.). |
Memória do .NET CLR |
|
No. Coletas Ger 0 |
Apresenta o número de vezes que os objetos de geração 0 (ou seja, os objetos mais jovens e alocados mais recentemente) são recuperados pela libertação da memória desde o início da aplicação. Este número é útil como uma proporção de #Gen 0: #Gen 1: #Gen 2 para garantir que o número de coleções da Gen 2 não excede em grande medida as coleções de Gen 0, idealmente por um fator de 2. |
Nº de Coletas Ger 1 |
Exibe a quantidade de vezes que os objetos da geração 1 são recuperados pela coleta de lixo desde o início do aplicativo. |
Nº de Coletas Ger 2 |
Exibe a quantidade de vezes que os objetos da geração 2 são recuperados pela coleta de lixo desde o início do aplicativo. O contador é incrementado no fim de uma coleta de lixo da geração 2 (também conhecida como coleta total de lixo). |
% Tempo Gasto em CL |
Apresenta a percentagem de tempo decorrido que foi despendido a efetuar uma libertação da memória desde o último ciclo de libertação da memória. Normalmente, este contador indica o trabalho realizado pelo recoletor de lixo para recolher e compactar a memória em nome da aplicação. Este contador é atualizado apenas no final de cada libertação da memória. Este contador não é uma média. O respetivo valor reflete o último valor observado. Este contador deve estar abaixo dos 5% no funcionamento normal. |
Contadores do SQL Server
A tabela seguinte fornece informações sobre os contadores e objetos do SQL Server.
Objetos e Contadores | Descrição |
---|---|
Estatísticas Gerais |
Este objeto fornece contadores para monitorizar a atividade geral ao nível do servidor, como o número de ligações atuais e o número de utilizadores que se ligam e desligam por segundo de computadores que estão a executar uma instância do SQL Server. |
Conexões de Usuário |
Este contador mostra o número de ligações de utilizador na instância do SQL Server. Se este número aumentar cerca de 500 por cento em relação à linha de base, provavelmente haverá redução de desempenho. |
Bancos de dados |
Este objeto fornece contadores para monitorar operações de cópia em massa, taxa de transferência de backup e recuperação e atividades de log de transações. Monitore transações e o log de transações para determinar a atividade de usuário que está ocorrendo no banco de dados e o quão cheio o log de transações está se tornando. A atividade de usuário pode determinar o desempenho do banco de dados e afetar o tamanho do log, o bloqueio e a replicação. O monitoramento da atividade de log de nível baixo para medir a atividade de usuário e o uso de recursos pode ajudar a identificar os gargalos do desempenho. |
Transações/seg |
Este contador mostra o número de transações numa determinada base de dados ou em toda a instância do SQL Server por segundo. Este número deve ajudá-lo a criar uma linha de base e a solucionar problemas. |
Bloqueios |
Este objeto fornece informações sobre bloqueios do SQL Server em tipos de recursos individuais. |
Número de Bloqueios/seg. |
Este contador mostra o número de impasses no SQL Server por segundo. Geralmente, deve ser 0. |
Tempo de Espera Médio (ms) |
Este contador mostra a média do tempo de espera para cada solicitação de bloqueio que tenha resultado em espera. |
Tempo de Espera de Bloqueio (ms) |
Este contador mostra o tempo total de espera para bloqueios no último segundo. |
Esperas de Bloqueio/seg |
Este contador mostra a quantidade de bloqueios por segundo que não puderam ser atendidos imediatamente e tiveram que aguardar por recursos. |
Bloqueios |
Este objeto fornece contadores para monitorizar bloqueios de recursos internos do SQL Server denominados bloqueios. O monitoramento das travas para determinar a atividade do usuário e o uso de recursos pode ajudar a identificar gargalos do desempenho. |
Tempo Médio de Espera de Trava (ms) |
Este contador mostra o tempo médio de espera de solicitações de trava que tiveram que esperar. |
Esperas de Trava/seg. |
Este contador mostra o número de solicitações de trava por segundo que não puderam ser atendidas imediatamente. |
Estatísticas de SQL |
Este objeto fornece contadores para monitorizar a compilação e o tipo de pedidos enviados para uma instância do SQL Server. O monitoramento do número de compilações e de recompilações de consulta e o número de lotes recebidos por uma instância do SQL Server oferece a você uma indicação da rapidez com que o SQL Server está processando consultas de usuário e com que efetividade o otimizador de consultas está processando as consultas. |
Compilações do SQL/seg |
Este contador indica a quantidade de vezes por segundo que o caminho de código de compilação é inserido. |
Recompilações de SQL/seg. |
Este contador indica a quantidade de vezes por segundo que as recompilações da instrução são acionadas. |
Cache de Planos |
Este objeto fornece contadores para monitorizar a forma como o SQL Server utiliza a memória para armazenar objetos como procedimentos armazenados, instruções Transact-SQL improvisadas e preparadas e acionadores. |
Taxa de Acertos do Cache |
Este contador indica a taxa entre os acertos do cache e pesquisas de planos. |
Cache do Buffer |
Este objeto fornece contadores para monitorizar a forma como o SQL Server utiliza a memória para armazenar páginas de dados, estruturas de dados internas e a cache de procedimentos e contadores para monitorizar a E/S física à medida que o SQL Server lê e escreve páginas de base de dados. |
Taxa de Acertos do Cache do Buffer |
Este contador mostra a porcentagem de páginas encontradas no cache do buffer sem ter que ler do disco. A proporção é o número total de acertos na cache dividido pelo número total de pesquisas em cache desde que uma instância do SQL Server foi iniciada. |
Removendo gargalos
Os gargalos do sistema representam um ponto de contenção onde há recursos insuficientes para atender as solicitações de transação do usuário. Podem ser recursos de hardware físico, ambiente operacional ou de aplicativo. Geralmente, a causa do gargalo é código personalizado ineficiente ou soluções de terceiros, que se forem revisados podem produzir resultados melhores que a adição de hardware. Outra causa comum dos gargalos é uma configuração incorreta do farm ou uma implementação de solução ineficiente que estruture os dados de maneira a exigir mais recursos que o necessário. O administrador do sistema deve gerenciar gargalos pelo constante monitoramento do desempenho. Ao identificar um problema de desempenho, você deve avaliar a melhor solução para remoção do gargalo. Os contadores de desempenho e outras aplicações de monitorização de desempenho, como o SCOM, são as principais ferramentas para controlar e analisar problemas, para que possa desenvolver uma solução.
Solução de gargalo físico
Gargalos físicos estão relacionados à contenção da rede, memória, disco e processador: excesso de solicitações disputando poucos recursos físicos. Os objetos e contadores descritos no tópico Monitoramento de Desempenho indicam onde está localizado o problema de desempenho; por exemplo, processador de hardware ou ASP.NET. A solução do gargalo exige que você identifique o problema e depois faça uma ou mais alterações que amenizem o problema de desempenho.
Problemas raramente acontecem de maneira instantânea; geralmente, há uma degradação gradual do desempenho, que você pode rastrear se fizer o monitoramento regularmente, usando a ferramenta de monitoramento de desempenho ou um sistema mais sofisticado, como o SCOM. Nas duas opções, em graus variados, você pode incorporar soluções em um alerta, na forma de texto de orientação ou comandos de script.
Poderá ter de resolver problemas de estrangulamento ao efetuar alterações às configurações do hardware ou do sistema, depois de ter determinado que não são causados por uma configuração incorreta, código personalizado ineficiente ou soluções de terceiros ou implementação de soluções ineficientes. As tabelas abaixo identificam o limiar do problema e as possíveis opções de solução. Algumas das opções sugerem atualizações ou modificações de hardware.
Objetos e Contadores | Problema | Opções de Solução |
---|---|---|
Processador |
||
Processador - % Tempo do Processador |
Acima de 75-85% |
Atualizar o processador Aumentar o número de processadores Adicionar outros servidores |
Disco |
||
Comprimento Médio da Fila do Disco |
Aumentando gradualmente, o sistema não está em criação contínua e a fila está em processo de backup |
Aumentar a quantidade ou a velocidade dos discos Alterar a configuração da matriz para distribuir Mover alguns dados para um servidor alternativo |
% Tempo Ocioso |
Menos de 90% |
Aumentar o número de discos Mover dados para um disco ou servidor alternativo |
% Espaço Livre |
Menos de 30% |
Aumentar número de discos Mover dados para um disco ou servidor alternativo |
Memória |
||
Mbytes Disponíveis |
Menos de 2GB em um servidor da Web. |
Adicionar memória. > [! NOTA]> A memória disponível do SQL Server será baixa, por predefinição, e nem sempre indica um problema. |
Falhas de Cache/seg. |
Mais de 1 |
Adicionar memória Aumentar a velocidade ou o tamanho do cache, se possível Mover dados para um disco ou servidor alternativo |
Páginas/seg |
Mais de 10 |
Adicionar memória |
Arquivo de Paginação |
||
% Usada e % de Pico Usada |
O arquivo de paginação do servidor, às vezes chamado de arquivo de permuta, mantém endereços de memória "virtual" no disco. As falhas de paginação ocorrem quando um processo precisa parar e esperar enquanto os recursos "virtuais" necessários são recuperados do disco para a memória. Isto será mais frequente se a memória física for inadequada. |
Adicionar memória |
NIC |
||
Total de Bytes/seg. |
Acima de 40-50% da capacidade da rede. Esta é a taxa de envio e recebimento de dados pela placa de interface da rede. |
Investigue mais, monitorando os Bytes Recebidos/seg. e os Bytes Enviados/seg. Reavalie a velocidade da placa de interface da rede Verifique a quantidade, tamanho e uso dos buffers de memória |
Processo |
||
Conjunto de Trabalho |
Maior do que 80% da memória total |
Adicionar memória |
% Tempo do Processador |
Acima de 75-85%. |
Aumentar a quantidade de processadores Redistribuis carga de trabalho para servidores adicionais |
ASP.NET |
||
Reciclagens do Pool de Aplicativos |
Vários por dia, causando lentidão intermitente. |
Verifique se não implementou configurações que automaticamente reciclam o pool de aplicativos desnecessariamente durante todo o dia. |
Solicitações Enfileiradas |
Centenas ou milhares de solicitações enfileiradas. |
Implementar outros servidores da Web O máximo padrão deste contador é 5.000 e esta configuração pode ser alterada no arquivo Machine.config |
Tempo de Espera da Solicitação |
À medida que aumenta a quantidade de eventos em espera, os usuários vão percebendo uma degradação no desempenho da apresentação das páginas. |
Implementar outros servidores da Web |
Solicitações Rejeitadas |
Acima de 0 |
Implementar outros servidores da Web |
Confira também
Conceitos
Teste de desempenho para SharePoint Server 2013
Planejamento de capacidade para o SharePoint Server 2013
Outros recursos
Capacity management and sizing overview for SharePoint Server 2013