Compartir vía


Información de rendimiento de consultas

Importante

** Esta característica está disponible en versión preliminar privada. Para probarlo, póngase en contacto con el contacto de Azure Databricks.

Cuando se ejecutan consultas, Databricks puede devolver información que identifique las oportunidades para mejorar el rendimiento. En esta página se enumeran las conclusiones admitidas y su significado.

Para obtener información general más amplia sobre los procedimientos recomendados de rendimiento, revise la Guía completa para optimizar las cargas de trabajo de Databricks, Spark y Delta Lake.

ESCRITURA_CONCURRENTE

  • Las escrituras simultáneas en la tabla provocan conflictos que se resuelven automáticamente o fallan.
  • Recomendación: Revise el historial delta para identificar las escrituras simultáneas y considere una programación diferente para evitar conflictos.

AGRUPACIÓN_DE_CLAVES_DE_FILTRO_DE_COBERTURA

  • La tabla se agrupa mediante una o varias claves que no se usan en el filtrado durante el examen de la tabla.
  • Recomendación: determine qué subconjunto de datos necesita para el resultado deseado y agregue filtros a las claves de agrupación en clústeres coincidentes para reducir los bytes leídos.

KEYS_DE_PARTICIÓN_DEL_FILTRO_DE_COBERTURA

  • La tabla se particiona mediante una o varias claves que no se usan en el filtrado durante el examen de la tabla.
  • Recomendación: determine qué subconjunto de datos necesita para el resultado deseado y agregue filtros en las claves de partición coincidentes para reducir los bytes leídos.

COVERAGE_PHOTON

  • Photon no puede acelerar la operación, por lo que se utilizó el motor de tiempo de ejecución estándar.
  • Recomendación: revise las limitaciones de Photon y considere la posibilidad de ajustar la consulta para usar una estrategia de ejecución compatible para un tiempo de ejecución más rápido.

COVERAGE_STATS_DELTA

  • Faltan estadísticas de omisión de datos delta o están incompletas para los filtros de archivo de escaneo de tabla, por lo que la consulta usa la filtración dentro del archivo. Los siguientes estados de estadísticas son posibles:
    • Completo: las estadísticas están disponibles para todos los filtros.
    • Parcial: las estadísticas están disponibles en un subconjunto de filtros.
    • No disponible: las estadísticas no están disponibles en ningún filtro.
    • Sin usar: no se pudieron usar estadísticas en un filtro que convierte el tipo de datos.
  • Recomendación: recopile estadísticas delta para reducir el número de bytes leídos.

COVERAGE_STATS_OPTIMIZER

  • Las estadísticas del optimizador de costes faltan o están incompletas, por lo que se usaron heurísticas estándar para generar el plan de consulta.
  • Recomendación: recopile estadísticas para permitir que el optimizador genere un mejor plan.

DATA_SKEW

  • Los datos se procesan de forma desigual por los recursos informáticos disponibles.
  • Recomendación: revise la distribución de los datos, después añada sal a las claves o agregue previamente los datos.

EXPLODING_JOIN

  • Join está generando significativamente más filas que las que ha leído.
  • Recomendación: determine qué subconjunto de resultados es necesario y actualice la combinación o reduzca el número de filas de entrada de ambas relaciones.

IO_THROTTLING

  • El proveedor de nube limitó la solicitud de almacenamiento en la nube.
  • Recomendación: póngase en contacto con el administrador para aumentar los límites de solicitudes de almacenamiento en la nube con su proveedor de nube.