Partilhar via


Informações de desempenho de consultas

Importante

Esta funcionalidade está em Pré-visualização Privada. Para a experimentar, contacte o representante do Azure Databricks.

Quando as consultas são executadas, o Databricks pode retornar informações que identificam oportunidades para melhorar o desempenho. Esta página apresenta as análises suportadas e o seu significado.

Para obter uma visão geral mais ampla das práticas recomendadas de desempenho, consulte o Guia abrangente para otimizar cargas de trabalho de Databricks, Spark e Delta Lake.

ESCRITA_CONCORRENTE

  • Gravações simultâneas na tabela causam conflitos que são resolvidos automaticamente ou falham.
  • Recomendação: Verifique o histórico delta para identificar escritas simultâneas e considere uma programação diferente para evitar conflitos.

COVERAGE_FILTER_KEYS_CLUSTERING

  • A tabela é agrupada por uma ou mais chaves que não são usadas na filtragem durante a verificação da tabela.
  • Recomendação: Determine qual subconjunto de dados você precisa para o resultado desejado e, em seguida, adicione filtros nas chaves de cluster correspondentes para reduzir os bytes lidos.

COBERTURA_FILTRO_CHAVES_PARTICIONAMENTO

  • A tabela é particionada por uma ou mais chaves que não são usadas na filtragem durante a verificação da tabela.
  • Recomendação: Determine qual subconjunto de dados você precisa para o resultado desejado e, em seguida, adicione filtros nas chaves de particionamento correspondentes para reduzir os bytes lidos.

COVERAGE_PHOTON

  • Photon não pode acelerar a operação, então o mecanismo de tempo de execução padrão foi usado.
  • Recomendação: Revise as limitações do Photon e considere ajustar a consulta para usar uma estratégia de execução suportada para um tempo de execução mais rápido.

DELTA_ESTATÍSTICAS_COBERTURA

  • As estatísticas de salto de dados delta estão ausentes ou incompletas para os filtros de ficheiro de varredura da tabela, assim a consulta usa filtragem no ficheiro. São possíveis os seguintes estados estatísticos:
    • Completo: As estatísticas estão disponíveis para todos os filtros.
    • Parcial: As estatísticas estão disponíveis em um subconjunto de filtros.
    • Indisponível: As estatísticas não estão disponíveis em nenhum filtro.
    • Não utilizado: as estatísticas não puderam ser usadas em um filtro que converte o tipo de dados.
  • Recomendação: Colete estatísticas Delta para reduzir o número de bytes lidos.

COVERAGE_STATS_OPTIMIZER

DISTORÇÃO_DE_DADOS

EXPLODING_JOIN

  • Join está a gerar um número significativamente maior de linhas do que leu.
  • Recomendação: Determine qual o subconjunto de resultados necessário, depois atualize a junção ou reduza o número de linhas de entrada de ambas as relações.

IO_THROTTLING

  • O pedido de armazenamento na cloud foi limitado pelo seu fornecedor de cloud.
  • Recomendação: Contacte o seu administrador para aumentar os seus limites de pedidos de armazenamento na cloud junto do seu fornecedor de cloud.