Partager via


Analyse des performances des requêtes

Important

Cette fonctionnalité est disponible en préversion privée . Pour l’essayer, contactez votre contact Azure Databricks.

Lorsque les requêtes s’exécutent, Databricks peut retourner des insights qui identifient les opportunités d’amélioration des performances. Cette page répertorie les insights pris en charge et leur signification.

Pour une vue d’ensemble plus large des meilleures pratiques en matière de performances, consultez le Guide complet d’optimisation des charges de travail Databricks, Spark et Delta Lake.

ÉCRITURE_CONCURRENTE

  • Les écritures simultanées sur la table provoquent des conflits qui sont automatiquement résolus ou échouent.
  • Recommandation : passez en revue l’historique delta pour identifier les écritures simultanées et envisagez une planification différente pour éviter les conflits.

COVERAGE_FILTER_KEYS_CLUSTERING

  • La table est indexée par une ou plusieurs clés qui ne sont pas utilisées dans le filtrage pendant le balayage de la table.
  • Recommandation : déterminez le sous-ensemble de données dont vous avez besoin pour le résultat souhaité, puis ajoutez des filtres sur les clés de clustering correspondantes pour réduire la lecture des octets.

COVERAGE_FILTER_KEYS_PARTITIONING

  • La table est partitionnée par une ou plusieurs clés qui ne sont pas utilisées dans le filtrage pendant l’analyse de la table.
  • Recommandation : déterminez le sous-ensemble de données dont vous avez besoin pour le résultat souhaité, puis ajoutez des filtres sur les clés de partitionnement correspondantes pour réduire la lecture des octets.

COVERAGE_PHOTON

  • Photon ne peut pas accélérer l’opération, de sorte que le moteur d’exécution standard a été utilisé.
  • Recommandation : passez en revue les limitations de Photon et envisagez d’ajuster la requête pour utiliser une stratégie d’exécution prise en charge pour accélérer l’exécution.

COVERAGE_STATS_DELTA

  • Les statistiques de saut de données Delta sont manquantes ou incomplètes pour le balayage de table des filtres de fichiers. Par conséquent, la requête utilise le filtrage dans le fichier. Les états des statistiques suivants sont possibles :
    • Complet : Les statistiques sont disponibles pour tous les filtres.
    • Partiel : Les statistiques sont disponibles sur un sous-ensemble de filtres.
    • Non disponible : les statistiques ne sont pas disponibles sur un filtre.
    • Inutilisé : Les statistiques n’ont pas pu être utilisées sur un filtre qui convertit le type de données.
  • Recommandation : Collectez les statistiques Delta pour réduire le nombre d’octets lus.

Optimiseur des statistiques de couverture

déséquilibre_de_données

EXPLODING_JOIN

  • La jointuregénère beaucoup plus de lignes qu'elle n'en a lues.
  • Recommandation : déterminez le sous-ensemble de résultats requis, puis mettez à jour la jointure ou réduisez le nombre de lignes d’entrée des deux relations.

IO_THROTTLING

  • La demande de stockage cloud a été limitée par votre fournisseur de cloud.
  • Recommandation : contactez votre administrateur pour augmenter les limites de vos demandes de stockage cloud avec votre fournisseur de cloud.