Dela via


Optimera anslutningsprestanda i Azure Databricks

Med Azure Databricks kan du skapa kopplingar mellan dina batch- eller strömningstabeller. Vissa kopplingar kan vara dyra. Följande kan hjälpa dig att optimera dina kopplingar.

Mer information om kopplingar finns i Arbeta med kopplingar i Azure Databricks.

Beräkning med Photon aktiverat väljer alltid den bästa kopplingstypen. Se Vad är Photon?. Att använda en ny Databricks Runtime-version med Photon aktiverat ger vanligtvis bra kopplingsprestanda, men du bör också överväga följande rekommendationer:

  • Korskopplingar är mycket dyra. Ta bort korskopplingar från arbetsbelastningar och frågor som kräver låg svarstid eller frekvent omkomputation.

  • Ordningen för sammanfogning är viktig. När du utför flera kopplingar ansluter du alltid dina minsta tabeller först och ansluter sedan resultatet till större tabeller.

  • Optimeraren kan kämpa med frågor med många kopplingar och sammansättningar. Om du sparar mellanliggande resultat kan frågeplaneringen och databehandlingsresultaten påskyndas.

  • Håll färsk statistik för att förbättra prestanda. Förutsägande optimering uppdaterar och underhåller statistik automatiskt. Se Förutsägande optimering för hanterade Unity Catalog-tabeller.

    Du kan också köra frågan ANALYZE TABLE table_name COMPUTE STATISTICS för att uppdatera statistik i frågehanteraren.

Anmärkning

I Databricks Runtime 14.3 LTS och senare kan du ändra de kolumner som Delta Lake samlar in statistik om för dataskipping och sedan beräkna om befintlig statistik i Delta Lake-loggen. Se även Ange deltastatistikkolumner.