Optimera anslutningsprestanda i Azure Databricks

Med Azure Databricks kan du skapa kopplingar mellan dina batch- eller strömningstabeller. Vissa kopplingar kan vara dyra. Följande kan hjälpa dig att optimera dina kopplingar.

Mer information om kopplingar finns i Arbeta med kopplingar i Azure Databricks.

Beräkning med Photon aktiverat väljer alltid den bästa kopplingstypen. Se Vad är Photon?. Att använda en ny Databricks Runtime-version med Photon aktiverat ger vanligtvis bra kopplingsprestanda, men du bör också överväga följande rekommendationer:

Korskopplingar är mycket dyra. Ta bort korskopplingar från arbetsbelastningar och frågor som kräver låg svarstid eller frekvent omkomputation.
Ordningen för sammanfogning är viktig. När du utför flera kopplingar ansluter du alltid dina minsta tabeller först och ansluter sedan resultatet till större tabeller.
Optimeraren kan kämpa med frågor med många kopplingar och sammansättningar. Om du sparar mellanliggande resultat kan frågeplaneringen och databehandlingsresultaten påskyndas.
Håll färsk statistik för att förbättra prestanda. Förutsägande optimering uppdaterar och underhåller statistik automatiskt. Se Förutsägande optimering för hanterade Unity Catalog-tabeller.

Du kan också köra frågan ANALYZE TABLE table_name COMPUTE STATISTICS för att uppdatera statistik i frågehanteraren.

Anmärkning

I Databricks Runtime 14.3 LTS och senare kan du ändra de kolumner som Delta Lake samlar in statistik om för dataskipping och sedan beräkna om befintlig statistik i Delta Lake-loggen. Se Ange statistikkolumner.

Feedback

Var den här sidan till hjälp?

Last updated on 2026-01-23

Optimera anslutningsprestanda i Azure Databricks

Feedback

Ytterligare resurser