Solucionar problemas de consultas que parecem ser executadas sem parar no SQL Server

Este artigo fornece diretrizes de solução de problemas para problemas em que uma consulta do Microsoft SQL Server leva um tempo excessivo para terminar (horas ou dias).

Sintomas

Este artigo se concentra em consultas que parecem ser executadas ou compiladas sem fim. Ou seja, o uso da CPU continua aumentando. Este artigo não se aplica a consultas bloqueadas ou aguardando um recurso que nunca foi liberado. Nesses casos, o uso da CPU permanece constante ou muda apenas ligeiramente.

Importante

Se uma consulta for deixada para continuar em execução, ela poderá eventualmente ser concluída. Esse processo pode levar apenas alguns segundos ou vários dias. Em algumas situações, a consulta pode realmente ser infinita, por exemplo, quando um loop WHILE não é encerrado. O termo "sem fim" é usado aqui para descrever a percepção de uma consulta que não termina.

Motivo

As causas comuns de consultas de execução longa (sem fim) incluem:

O NL (Loop Aninhado) une-se a tabelas muito grandes: Devido à natureza das junções nl, uma consulta que une tabelas que têm muitas linhas pode ser executada por um longo tempo. Para obter mais informações, consulte Junções.
- Um exemplo de uma junção nl é o uso de TOP, FASTou EXISTS. Mesmo que uma junção hash ou mesclagem possa ser mais rápida, o otimizador não poderá usar nenhum dos operadores devido à meta de linha.
- Outro exemplo de uma junção nl é o uso de um predicado de junção de desigualdade em uma consulta. Por exemplo, SELECT .. FROM tab1 AS a JOIN tab 2 AS b ON a.id > b.id. O otimizador também não pode usar junções de mesclagem ou hash aqui.
Estatísticas desatualizadas: As consultas que escolhem um plano com base em estatísticas desatualizadas podem ser abaixo do ideal e levar muito tempo para serem executadas.
Loops sem fim: Consultas T-SQL que usam loops WHILE podem ser gravadas incorretamente. O código resultante nunca sai do loop e é executado sem parar. Essas consultas são verdadeiramente intermináveis. Eles correm até serem mortos manualmente.
Consultas complexas que têm muitas junções e tabelas grandes: Consultas que envolvem muitas tabelas unidas normalmente teriam planos de consulta complexos que podem levar muito tempo para serem executadas. Esse cenário é comum em consultas analíticas que não filtram linhas e que envolvem um grande número de tabelas.
Índices ausentes: As consultas poderão ser executadas significativamente mais rapidamente se os índices apropriados forem usados em tabelas. Os índices permitem que a seleção de um subconjunto dos dados forneça acesso mais rápido.

Solução

Etapa 1: Descobrir consultas intermináveis

Procure uma consulta interminável em execução no sistema. Você precisa determinar se uma consulta tem um longo tempo de execução, um longo tempo de espera (preso em um gargalo) ou um longo tempo de compilação.

1.1 Executar um diagnóstico

Execute a seguinte consulta de diagnóstico em sua instância do SQL Server em que a consulta sem fim está ativa:

DECLARE @cntr INT = 0

WHILE (@cntr < 3)
BEGIN
    SELECT TOP 10 s.session_id,
                    r.status,
                    CAST(r.cpu_time / (1000 * 60.0) AS DECIMAL(10,2)) AS cpu_time_minutes,
                    CAST(r.total_elapsed_time / (1000 * 60.0) AS DECIMAL(10,2)) AS elapsed_minutes,
                    r.logical_reads,
                    r.wait_time,
                    r.wait_type,
                    r.wait_resource,
                    r.reads,
                    r.writes,
                    SUBSTRING(st.TEXT, (r.statement_start_offset / 2) + 1,
                    ((CASE r.statement_end_offset
                        WHEN -1 THEN DATALENGTH(st.TEXT)
                        ELSE r.statement_end_offset
                    END - r.statement_start_offset) / 2) + 1) AS statement_text,
                    COALESCE(QUOTENAME(DB_NAME(st.dbid)) + N'.' + QUOTENAME(OBJECT_SCHEMA_NAME(st.objectid, st.dbid)) 
                    + N'.' + QUOTENAME(OBJECT_NAME(st.objectid, st.dbid)), '') AS command_text,
                    r.command,
                    s.login_name,
                    s.host_name,
                    s.program_name,
                    s.last_request_end_time,
                    s.login_time,
                    r.open_transaction_count,
                    atrn.name as transaction_name,
                    atrn.transaction_id,
                    atrn.transaction_state
        FROM sys.dm_exec_sessions AS s
        JOIN sys.dm_exec_requests AS r ON r.session_id = s.session_id 
                CROSS APPLY sys.Dm_exec_sql_text(r.sql_handle) AS st
        LEFT JOIN (sys.dm_tran_session_transactions AS stran 
                JOIN sys.dm_tran_active_transactions AS atrn
                ON stran.transaction_id = atrn.transaction_id)
        ON stran.session_id =s.session_id
        WHERE r.session_id != @@SPID
        ORDER BY r.cpu_time DESC
    
    SET @cntr = @cntr + 1
WAITFOR DELAY '00:00:05'
END

1.2 Examinar a saída

Há vários cenários que podem fazer com que uma consulta seja executada por muito tempo: execução longa, longa espera e compilação longa. Para obter mais informações sobre por que uma consulta pode ser executada lentamente, consulte Running vs. Waiting: por que as consultas estão lentas?

Tempo de execução longo

As etapas de solução de problemas neste artigo são aplicáveis quando você recebe uma saída semelhante à seguinte, em que o tempo da CPU aumenta proporcionalmente ao tempo decorrido sem tempos de espera significativos.

session_id	status	cpu_time_minutes	elapsed_time_minutes	logical_reads	wait_time_minutes	wait_type
56	executando	64.40	23.50	0	0.00	NULO

A consulta será executada continuamente se tiver:

Um tempo de CPU crescente
Um status de running ou runnable
Tempo de espera mínimo ou zero
Sem wait_type

Nessa situação, a consulta está lendo linhas, ingressando, processando resultados, calculando ou formatação. Essas atividades são todas ações associadas à CPU.

Observação

As alterações nesse logical_reads caso não são relevantes porque algumas solicitações T-SQL associadas à CPU, como a execução de cálculos ou um WHILE loop, podem não fazer nenhuma leitura lógica.

Se a consulta lenta atender a esses critérios, concentre-se em reduzir seu runtime. Normalmente, a redução do runtime envolve a redução do número de linhas que a consulta precisa processar ao longo de sua vida aplicando índices, reescrevendo a consulta ou atualizando estatísticas. Para obter mais informações, consulte a seção Resolução .

Longo tempo de espera

Este artigo não é aplicável a cenários de espera prolongada. Em um cenário de espera, você pode receber uma saída semelhante ao exemplo a seguir no qual o uso da CPU não muda nem muda ligeiramente porque a sessão está aguardando um recurso:

session_id	status	cpu_time_minutes	elapsed_time_minutes	logical_reads	wait_time_minutes	wait_type
56	suspenso	0.03	4.20	50	4.10	LCK_M_U

O tipo de espera indica que a sessão está aguardando um recurso. Um longo tempo decorrido e um longo tempo de espera indicam que a sessão está aguardando a maior parte de sua vida útil para esse recurso. O curto tempo de CPU indica que pouco tempo foi gasto, na verdade, processando a consulta.

Para solucionar problemas de consultas que são longas devido a esperas, consulte Solucionar problemas de consultas de execução lenta no SQL Server.

Longo tempo de compilação

Em raras ocasiões, você pode observar que o uso da CPU aumenta continuamente ao longo do tempo, mas não é impulsionado pela execução da consulta. Em vez disso, uma compilação excessivamente longa (a análise e a compilação de uma consulta) pode ser a causa. Nesses casos, verifique a transaction_name coluna de saída para obter um valor de sqlsource_transform. Esse nome de transação indica uma compilação.

Etapa 2: Coletar logs de diagnóstico manualmente

Depois de determinar que existe uma consulta sem fim no sistema, você pode coletar os dados de plano da consulta para solucionar mais problemas. Para coletar os dados, use um dos métodos a seguir, dependendo da sua versão do SQL Server.

Para coletar dados de diagnóstico usando o SSMS (SQL Server Management Studio ), siga estas etapas:

Capture o XML estimado do plano de execução da consulta.
Examine o plano de consulta para saber se os dados mostram indicações óbvias do que está causando a lentidão. Exemplos de indicações típicas incluem:
- Verificações de tabela ou índice (examine as linhas estimadas)
- Loops aninhados impulsionados por um enorme conjunto de dados de tabela externa
- Loops aninhados que têm um branch grande no lado interno do loop
- Spools de tabela
- Funções na SELECT lista que levam muito tempo para processar cada linha
Se a consulta for executada mais rapidamente a qualquer momento, você poderá capturar as execuções "rápidas" (plano de execução XML real) para comparar os resultados.

A infraestrutura leve de criação de perfil de consulta foi introduzida no Microsoft SQL Server 2014. Ele permite capturar estatísticas reais enquanto uma consulta lenta é executada. Esse recurso de solução de problemas permite que você examine os operadores de consulta em um plano de consulta em runtime e entenda onde a maior parte do tempo é gasto em uma consulta.

Para identificar as etapas lentas na consulta nu usando a infraestrutura de criação de perfil de estatísticas de execução de consulta lightweight v1, siga estas etapas:

Execute os seguintes comandos para ativar o query_thread_profile XEvent:

CREATE EVENT SESSION [NodePerfStats] ON SERVER
ADD EVENT sqlserver.query_thread_profile(
  ACTION(sqlos.scheduler_id,sqlserver.database_id,sqlserver.is_system,
    sqlserver.plan_handle,sqlserver.query_hash_signed,sqlserver.query_plan_hash_signed,
    sqlserver.server_instance_name,sqlserver.session_id,sqlserver.session_nt_username,
    sqlserver.sql_text))
ADD TARGET package0.ring_buffer(SET max_memory=(25600))
WITH (MAX_MEMORY=4096 KB,
  EVENT_RETENTION_MODE=ALLOW_SINGLE_EVENT_LOSS,
  MAX_DISPATCH_LATENCY=30 SECONDS,
  MAX_EVENT_SIZE=0 KB,
  MEMORY_PARTITION_MODE=NONE,
  TRACK_CAUSALITY=OFF,
  STARTUP_STATE=OFF);

ALTER EVENT SESSION [NodePerfStats] ON SERVER STATE = START

Inicie a consulta interminável afetada no aplicativo.

Execute o seguinte comando várias vezes, com cerca de um minuto de diferença, para verificar as estatísticas de execução de runtime para os operadores do plano de consulta:

SELECT CONVERT (varchar(30), getdate(), 126) as runtime,
            qp.session_id,
            convert(nvarchar(48), qp.physical_operator_name) as physical_operator_name,
            qp.row_count,
            qp.estimate_row_count,
            qp.node_id,
            req.cpu_time,
            req.total_elapsed_time,
            substring
            (REPLACE
            (REPLACE
                (SUBSTRING
                (SQLText.text
                , (req.statement_start_offset/2) + 1
                , (
                    (CASE statement_END_offset
                        WHEN -1
                        THEN DATALENGTH(SQLText.text)  
                        ELSE req.statement_END_offset
                        END
                        - req.statement_start_offset)/2) + 1)
            , CHAR(10), ' '), CHAR(13), ' '), 1, 512)  AS active_statement_text
FROM sys.dm_exec_query_profiles qp 
RIGHT OUTER JOIN sys.dm_exec_requests req
    ON qp.session_id = req.session_id
LEFT OUTER JOIN sys.dm_exec_sessions sess
    on req.session_id = sess.session_id
LEFT OUTER JOIN sys.dm_exec_connections conn on conn.session_id = req.session_id
OUTER APPLY sys.dm_exec_sql_text (ISNULL (req.sql_handle, conn.most_recent_sql_handle)) as SQLText
WHERE req.session_id <> @@SPID 
    AND sess.is_user_process = 1 
ORDER BY qp.session_id asc, row_count desc 
--this is to prevent massive grants
OPTION (max_grant_percent = 3, MAXDOP 1)

Capture três ou quatro instantâneos, com um minuto de diferença, para obter dados suficientes para análise. Especificamente, você pode comparar os row_count números de cada operador ao longo do tempo para saber quais valores indicam um aumento significativo na contagem de linhas (em um milhão ou mais).
Em uma nova janela de consulta no SSMS, capture um plano de consulta estimado para a consulta com problema executando os seguintes comandos:
```
SET SHOWPLAN_XML ON
GO
<problem query here>
GO
SET SHOWPLAN_XML OFF
```
Localize o mesmo nó no plano de consulta estimado usando a ID do nó que tem a contagem de linhas mais alta, conforme determinado pela consulta que você executou na etapa 3. Esta etapa ajuda a identificar qual operador no plano é a principal causa do longo tempo de execução.

Pare o XEvent executando o seguinte comando:

ALTER EVENT SESSION [NodePerfStats] ON SERVER STATE = STOP

Você pode usar a infraestrutura de criação de perfil de estatísticas de execução de consulta Lightweight v2 para capturar planos de consulta ao vivo que incluem contagens de linhas reais. Essa infraestrutura de criação de perfil permite examinar operadores de consulta em um plano de consulta em runtime e saber onde a maior parte do tempo é gasto em uma consulta.

Para identificar as etapas lentas na consulta, siga estas etapas:

Para habilitar a infraestrutura leve, use um dos seguintes métodos:

Habilite o sinalizador de rastreamento 7412 executando o seguinte comando:
```
DBCC TRACEON (7412, -1)
```

Como alternativa, habilite o query_thread_profile XEvent executando os seguintes comandos:

CREATE EVENT SESSION [PerfStats_LWP_Plan_v2] ON SERVER
ADD EVENT sqlserver.query_plan_profile(
 ACTION(sqlos.scheduler_id,sqlserver.database_id,sqlserver.is_system,
   sqlserver.plan_handle,sqlserver.query_hash_signed,sqlserver.query_plan_hash_signed,
   sqlserver.server_instance_name,sqlserver.session_id,sqlserver.session_nt_username,
   sqlserver.sql_text))
ADD TARGET package0.ring_buffer(SET max_memory=(25600))
WITH (MAX_MEMORY=4096 KB,
 EVENT_RETENTION_MODE=ALLOW_SINGLE_EVENT_LOSS,
 MAX_DISPATCH_LATENCY=30 SECONDS,
 MAX_EVENT_SIZE=0 KB,
 MEMORY_PARTITION_MODE=NONE,
 TRACK_CAUSALITY=OFF,
 STARTUP_STATE=OFF);

ALTER EVENT SESSION [PerfStats_LWP_Plan_v2] ON SERVER STATE = START

Inicie a consulta interminável afetada no aplicativo.
Para identificar a Session_id consulta interminável que está em execução, execute um comando semelhante ao seguinte comando:
```
SELECT t.text, session_id 
FROM sys.dm_exec_requests req
CROSS APPLY sys.dm_exec_sql_text (req.sql_handle) as t
```
Para examinar o plano de consulta e as estatísticas reais no plano, execute o comando a seguir três ou quatro vezes, com um minuto de diferença. Salve o plano de consulta todas as vezes para que você possa comparar os planos e saber quais operadores de consulta estão consumindo a maior parte do tempo da CPU. Especificamente, você pode comparar a contagem de linhas (número real de linhas) para cada operador ao longo do tempo para ver quais operadores estão mostrando um aumento significativo na contagem de linhas (em um milhão ou mais). Substitua <session_id> pelo valor inteiro encontrado na etapa anterior.
```
SELECT * FROM sys.dm_exec_query_statistics_xml (<session_id>)
```

Pare o XEvent se você iniciou um ou desative o sinalizador de rastreamento:

ALTER EVENT SESSION [PerfStats_LWP_Plan_v2] ON SERVER STATE = STOP
-- or
DBCC TRACEOFF (7412, -1)

Você pode usar a infraestrutura de criação de perfil de estatísticas de execução de consulta Lightweight v3 para capturar planos de consulta ao vivo que incluem contagens de linhas reais. Essa infraestrutura de criação de perfil permite examinar os operadores de consulta em um plano de consulta em runtime e entender onde a maior parte do tempo é gasto em uma consulta. A criação de perfil leve é habilitada por padrão no Microsoft SQL Server 2019.

Para identificar as etapas lentas na consulta, siga estas etapas:

Inicie a consulta interminável afetada do seu aplicativo.
Para identificar a Session_id consulta interminável que está em execução, execute um comando semelhante ao seguinte comando:
```
SELECT t.text, session_id 
FROM sys.dm_exec_requests req
CROSS APPLY sys.dm_exec_sql_text (req.sql_handle) as t
```
Execute o comando a seguir para examinar o plano de consulta e as estatísticas reais no plano. Salve o plano de consulta todas as vezes para que você possa compará-los e saber qual operador de consulta está consumindo a maior parte do tempo da CPU. Substitua <session_id> pelo valor inteiro encontrado na etapa anterior.
```
SELECT * FROM sys.dm_exec_query_statistics_xml (<session_id>)
```
Selecione o link XML na query_plan coluna. Depois que o plano de consulta gráfica for aberto em uma nova janela, clique com o botão direito do mouse nele e selecione Salvar Plano de Execução como.... Repita essas etapas para capturar três ou quatro instantâneos, com um minuto de diferença, para obter dados suficientes para análise. Especificamente, você pode comparar a contagem de linhas (número real de linhas) para cada operador ao longo do tempo para saber quais operadores estão mostrando um aumento significativo na contagem de linhas (em um milhão ou mais).
Observação

Se você não estiver recebendo nenhuma saída, sys.dm_exec_query_statistics_xmlverifique se a opção LAST_QUERY_PLAN_STATS de banco de dados está desabilitada executando o seguinte comando:
```
SELECT name, value, value_for_secondary, is_value_default 
FROM sys.database_scoped_configurations
WHERE name = 'LAST_QUERY_PLAN_STATS'
```
Você pode habilitar as estatísticas do último plano de consulta no nível do banco de dados executando ALTER DATABASE SCOPED CONFIGURATION SET LAST_QUERY_PLAN_STATS = ON.

Usar o LogScout do SQL para capturar consultas intermináveis

Você pode usar o LogScout do SQL para capturar logs enquanto uma consulta sem fim está em execução. Use o cenário de consulta sem fim com o seguinte comando:

.\SQL_LogScout.ps1 -Scenario "NeverEndingQuery" -ServerName "SQLInstance"

Observação

Esse processo de captura de log requer que a consulta longa consuma pelo menos 60 segundos de tempo de CPU.

O SQL LogScout captura pelo menos três planos de consulta para cada consulta de alto consumo de CPU. Você pode encontrar nomes de arquivo semelhantes servername_datetime_NeverEnding_statistics_QueryPlansXml_Startup_sessionId_#.sqlplana . Você pode usar esses arquivos na próxima etapa quando revisar os planos para identificar o motivo da execução de consulta longa.

Etapa 3: Examinar os planos coletados

Esta seção discute como examinar os dados coletados. Ele usa os vários planos de consulta XML (usando extensão .sqlplan) coletados no Microsoft SQL Server 2016 SP1 e versões e builds posteriores.

Compare os planos de execução seguindo estas etapas:

Abra um arquivo de plano de execução de consulta salvo anteriormente (.sqlplan).
Clique com o botão direito do mouse em uma área em branco do plano de execução e selecione Comparar Plano de Execução.
Escolha o segundo arquivo de plano de consulta que você gostaria de comparar.
Procure setas grossas que indiquem um grande número de linhas fluindo entre os operadores. Em seguida, selecione o operador antes ou depois da seta e compare o número de linhas reais entre os dois planos.
Compare o segundo e o terceiro planos para saber se o maior fluxo de linhas ocorre nos mesmos operadores.

Por exemplo:

Etapa 4: Resolução

Verifique se as estatísticas são atualizadas para as tabelas usadas na consulta.
Procure recomendações de índice ausentes no plano de consulta e aplique qualquer um que você encontrar.
Simplifique a consulta:
- Use predicados mais seletivos WHERE para reduzir os dados processados antecipadamente.
- Quebre-o.
- Selecione algumas peças em tabelas temporárias e junte-as mais tarde.
- Remova TOP, EXISTSe FAST (T-SQL) nas consultas que são executadas por um longo tempo devido a uma meta de linha do otimizador.
  - Como alternativa, use a DISABLE_OPTIMIZER_ROWGOALdica. Para obter mais informações, consulte Metas de linha desonestas.
- Evite usar CTEs (Expressões de Tabela Comuns) nesses casos porque combinam instruções em uma única consulta grande.
Tente usar dicas de consulta para produzir um plano melhor:
- HASH JOIN ou MERGE JOIN dica
- Dica de FORCE ORDER
- Dica de FORCESEEK
- RECOMPILE
- USE PLAN N'<xml_plan>' (se você tiver um plano de consulta rápido que possa forçar)
Use o QDS (Repositório de Consultas) para forçar um bom plano conhecido se esse plano existir e se a versão do SQL Server der suporte ao Repositório de Consultas.

Solucionar problemas de uma consulta que mostra uma diferença significativa de desempenho entre dois servidores

Comentários

Esta página foi útil?

Last updated on 2025-08-19