Dela via


Hanterade eller externa volymer

I den här artikeln beskrivs skillnaderna mellan hanterade volymer och externa volymer och varför du kan välja att använda externa volymer. Databricks rekommenderar hanterade volymer som den enklaste lösningen för att lagra och hantera åtkomst till icke-tabelldata.

Mer information om hur du använder Unity Catalog för att konfigurera åtkomst till molnobjektlagring finns i Ansluta till molnobjektlagring med Unity Catalog.

Beteendeskillnader mellan hanterade och externa volymer

Hanterade och externa volymer ger nästan identiska upplevelser när du använder Azure Databricks-verktyg, UIs och API:er. Följande är skillnaderna mellan dessa volymtyper.

Hanterade volymer ger en fullständigt hanterad lagringsupplevelse. Detta innebär följande:

  • Alla interaktioner med filer i hanterade volymer måste gå igenom Unity Catalog.
  • Katalognamngivning och datalayout hanteras av Unity Catalog. Katalognamn innehåller hashvärden för att undvika konflikter i underliggande lagringskonton för molnobjekt.
  • När du släpper en hanterad volym tar Azure Databricks bort underliggande data inom 30 dagar.

Externa volymer för datastyrning till molnobjektlagring. Detta innebär följande:

  • Du kan använda moln-URI:er i Azure Databricks eller externa system för att interagera med filer i externa volymer.
  • Alla kataloger som skapats i en extern volym eller filer som laddats upp är i förhållande till de som angavs när de LOCATION skapades.
  • När du släpper en extern volym tar du bort volymen från Unity Catalog, men underliggande data förblir oförändrade på den externa platsen.

Varför ska du använda externa volymer?

Med externa volymer kan du lägga till datastyrning i Unity Catalog till befintliga lagringskataloger för molnobjekt. Några användningsfall för externa volymer är följande:

  • Lägga till styrning till datafiler utan migrering.
  • Styr filer som skapats av andra system som måste matas in eller nås av Azure Databricks.
  • Styra data som produceras av Azure Databricks som måste nås direkt från molnobjektlagring av andra system.

Databricks rekommenderar att du använder externa volymer för att lagra icke-tabellbaserade datafiler som läs- eller skrivs av externa system utöver Azure Databricks. Unity Catalog styr inte läsningar och skrivningar som utförs direkt mot molnobjektlagring från externa system, så du måste konfigurera ytterligare principer och autentiseringsuppgifter i ditt molnkonto för att säkerställa att datastyrningsprinciper respekteras utanför Azure Databricks.