Arkitektur på hög nivå

Den här artikeln innehåller en översikt över Azure Databricks-arkitekturen på hög nivå, inklusive dess företagsarkitektur, i kombination med Azure.

Databricks-objekt

Ett Azure Databricks-konto är den konstruktion på den översta nivån som du använder för att hantera Azure Databricks i hela organisationen. På kontonivå hanterar du:

Identitet och åtkomst: Användare, grupper, tjänstens huvudnamn och användaretablering.

Hantering av arbetsytor: Skapa, uppdatera och ta bort arbetsytor i flera regioner.
Hantering av metaarkiv i Unity Catalog: Skapa och koppla metaarkiv till arbetsytor.
Användningshantering: Fakturering, efterlevnad och principer.

Ett konto kan innehålla flera arbetsytor och Unity Catalog-metaarkiv.

Arbetsytor är samarbetsmiljön där användare kör beräkningsarbetsbelastningar som inmatning, interaktiv utforskning, schemalagda jobb och ML-utbildning.
Unity Catalog-metaarkiv är det centrala styrningssystemet för datatillgångar som tabeller och ML-modeller. Du organiserar data i ett metaarkiv under ett namnområde på tre nivåer:

<catalog-name>.<schema-name>.<object-name>

Metaarkiv är kopplade till arbetsytor. Du kan länka ett enda metaarkiv till flera Azure Databricks-arbetsytor i samma region, vilket ger varje arbetsyta samma datavy. Dataåtkomstkontroller kan hanteras på alla länkade arbetsytor.

Diagram: Databricks-objekthierarki

Arkitektur för arbetsyta

Azure Databricks fungerar från ett kontrollplan och ett beräkningsplan.

Kontrollplanet innehåller de serverdelstjänster som Azure Databricks hanterar i ditt Azure Databricks-konto. Kontrollplanet finns i Azure Databricks-kontot, inte ditt molnkonto. Webbprogrammet finns i kontrollplanet.
Det är på beräkningsplanet där dina data bearbetas. Det finns två typer av beräkningsplan beroende på vilken beräkning du använder.
- För serverlös beräkning körs de serverlösa beräkningsresurserna i ett serverlöst beräkningsplan i ditt Azure Databricks-konto.
- För klassisk Azure Databricks-beräkning finns beräkningsresurserna i din Azure-prenumeration i det som kallas det klassiska beräkningsplanet. Detta refererar till nätverket i din Azure-prenumeration och dess resurser.
Mer information om klassisk beräkning och serverlös beräkning finns i Beräkning.

Klassisk arbetsytearkitektur

Anmärkning

Klassiska arbetsytor kallas hybridarbetsytor i Azure-portalen.

Klassiska Azure Databricks-arbetsytor har ett associerat lagringskonto som kallas lagringskontot för arbetsytan. Lagringskontot för arbetsytan finns i din Azure-prenumeration.

I följande diagram beskrivs den allmänna Azure Databricks-arkitekturen för klassiska arbetsytor.

Diagram: Databricks-arkitektur för Azure

Arkitektur för serverlös arbetsyta

Arbetsytans lagring i serverlösa arbetsytor sparas i arbetsytans förvalda lagring. Du kan också ansluta till ditt molnlagringskonto för att få åtkomst till dina data. I följande diagram beskrivs den allmänna arkitekturen för serverlösa arbetsytor.

Diagram: Databricks serverlös arbetsytearkitektur

Serverlöst beräkningsplan

I det serverlösa beräkningsplanet körs Azure Databricks-beräkningsresurser i ett beräkningslager i ditt Azure Databricks-konto. Azure Databricks skapar ett serverlöst beräkningsplan i samma Azure-region som arbetsytans klassiska beräkningsplan. Du väljer den här regionen när du skapar en arbetsyta.

För att skydda kunddata i det serverlösa beräkningsplanet körs serverlös beräkning inom en nätverksgräns för arbetsytan, med olika säkerhetslager för att isolera olika Azure Databricks-kundarbetsytor och ytterligare nätverkskontroller mellan kluster för samma kund.

Om du vill veta mer om nätverk i den serverlösa beräkningsplanen, nätverk i serverlös beräkningsplan.

Klassiskt beräkningsplan

I det klassiska beräkningsplanet körs Azure Databricks-beräkningsresurser i din Azure-prenumeration. Nya beräkningsresurser skapas i varje arbetsytas virtuella nätverk i kundens Azure-prenumeration.

Ett klassiskt beräkningsplan har naturlig isolering eftersom det körs i varje kunds egen Azure-prenumeration. Mer information om nätverk i det klassiska beräkningsplanet finns i Klassiska nätverk för beräkningsplanet.

Regionalt stöd finns i Azure Databricks-regioner.

Lagring av arbetsyta

Lagring av arbetsytor hanteras på olika sätt beroende på din arbetsytetyp. Mer information om arbetsytetyperna finns i Skapa en arbetsyta.

Lagring av arbetsytor innehåller två kategorier av data: data för arbetsytefilsystem och systemdata för arbetsytor. Båda är separata från dina egna dataobjekt (till exempel Unity Catalog-tabeller och volymer).

Data om arbetsytefilsystem

Filsystemet för arbetsytan lagrar de tillgångar som användarna skapar och hanterar via Azure Databricks-användargränssnittet. Dessa inkluderar:

Notebooks
SQL-frågor och instrumentpaneler
Aviseringar
Repo (mappar som är kopplade till Git-repositorier)
Bibliotek (.whl, .jar)
Python-filer, YAML-konfigurationsfiler och andra små filer

Mer information om arbetsytefiler finns i Vad är arbetsytefiler?. En fullständig lista över arbetsytetillgångar finns i Introduktion till arbetsyteobjekt.

Systemdata för arbetsytor

Varje Azure Databricks-arbetsyta lagrar även systemdata som genereras internt av Azure Databricks-funktioner. Dessa data är för stora för att lagras i minne eller databaser, eller måste sparas längre än livslängden för en enda beräkningsresurs. Exempel på systemdata för arbetsytor är:

SQL-frågeresultat och cachelagrade frågeresultat
Resultat av jobbkörning
Notebook-revisioner
SQL-frågeplaner som används för observerbarhet
Klusterloggar

Mer information om hur lagring av arbetsytor konfigureras för varje arbetsytetyp finns i avsnitten nedan.

Serverlösa arbetsytor

Serverlösa arbetsytor använder standardlagring, vilket är en fullständigt hanterad lagringsplats för interna arbetsytesystemdata och Unity Catalog-datatillgångar. Serverlösa arbetsytor stöder också möjligheten att ansluta till dina molnlagringsplatser för dina egna kataloger, tabeller och andra datatillgångar. Se Standardlagring i Databricks.

Klassiska arbetsytor

Viktigt!

Ta inte bort eller ändra arbetsytans lagring i ditt molnkonto. En Azure Databricks-arbetsyta är beroende av både sina kontrollplansdatabaser och arbetsytelagring för korrekt funktion. Om arbetsytans lagring tas bort går det inte att återställa arbetsytan.

I klassiska arbetsytor skiljer sig arbetsytesystemdata från Vad är DBFS?. Båda kan finnas i samma molnlagringskonto på klassiska arbetsytor, men de har olika syften. DBFS-roten är ett användartillgängligt filsystem, medan arbetsytesystemdata används internt av Azure Databricks-funktioner.

Lagringskontot för arbetsytan innehåller:

Systemdata för arbetsytor: Interna data som genereras av Azure Databricks-funktioner
Unity Catalog-arbetsytekatalog: Om arbetsytan aktiverades automatiskt för Unity Catalog innehåller arbetsytans lagringskonto standardkatalogen för arbetsytor. Alla användare på din arbetsyta kan skapa tillgångar i standardschemat i den här katalogen. Se Kom igång med Unity Catalog.
DBFS (äldre): DBFS-rot- och DBFS-monteringar är äldre och kan vara inaktiverade på din arbetsyta. DBFS (Databricks File System) är ett distribuerat filsystem i Azure Databricks-miljöer som är tillgängliga under dbfs:/ namnområdet. DBFS-rot och DBFS-montage både finns i dbfs:/ namnområdet. Lagring och åtkomst till data med DBFS-rot- eller DBFS-monteringar är ett inaktuellt mönster och rekommenderas inte av Databricks. Mer information finns i Vad är DBFS?.

Information om hur du begränsar åtkomsten till ditt lagringskonto för arbetsytor från endast auktoriserade resurser och nätverk finns i Aktivera brandväggsstöd för ditt lagringskonto för arbetsytan.

Feedback

Var den här sidan till hjälp?

Last updated on 2026-03-16