Objemy

platí pro: zaškrtnuto Ano Databricks SQL Databricks Runtime 13.3 LTS a vyšší, zaškrtnuto Ano pouze pro katalog Unity .

Svazky jsou objekty katalogu Unity představující logický svazek úložiště v cloudovém úložišti objektů. Svazky poskytují možnosti pro přístup k souborům, jejich ukládání, řízení a uspořádání. Zatímco tabulky poskytují zásady správného řízení nad tabulkovou datovou sadou, svazky přidávají zásady správného řízení nad ne tabulkovou datovou sadou. Svazky můžete použít k ukládání a přístupu k souborům v libovolném formátu, včetně strukturovaných, částečně strukturovaných a nestrukturovaných dat.

Svazky jsou součástí stejné skupiny jako tabulky, pohledy a další objekty uspořádané do schématu v katalogu Unity.

Svazek může být spravovaný nebo externí.

Další podrobnosti a omezení najdete v tématu Co jsou svazky katalogu Unity?.

Spravovaný svazek

Spravovaný svazek je svazek úložiště řízený Unity Catalogem vytvořený v rámci spravovaného umístění úložiště schématu, které obsahuje. Spravované svazky umožňují vytvořit spravované úložiště pro práci se soubory bez režie externích umístění a přihlašovacích údajů k úložišti. Při vytváření spravovaného svazku nemusíte zadávat umístění a veškerý přístup k souborům pro data ve spravovaných svazcích probíhá prostřednictvím cest spravovaných katalogem Unity.

Externí svazek

Externí svazek je úložný svazek řízený katalogem Unity, který je zaregistrován jako část adresáře v externím umístění.

Pojmenování svazků a referenční informace

Název svazku je identifikátor , který lze v příkazech SQL kvalifikovat pomocí katalogu a názvu schématu.

Cesta pro přístup k souborům ve svazcích používá následující formát:

/Volumes/<catalog_identifier>/<schema_identifier>/<volume_identifier>/<path>/<file_name>

Všimněte si, že Azure Databricks normalizuje identifikátory na malá písmena.

Azure Databricks také podporuje volitelné dbfs:/ schéma, takže funguje i následující cesta:

dbfs:/Volumes/<catalog_identifier>/<schema_identifier>/<volume_identifier>/<path>/<file_name>

Poznámka:

K datům v externích svazcích můžete přistupovat také pomocí identifikátorů URI cloudového úložiště.

Správa souborů ve svazcích

Platí pro: zaškrtnuté ano Konektor SQL Databricks

Pomocí konektoru SQL Databricks můžete spravovat soubory ve svazcích pomocí následujících příkazů:

PUT INTO zkopírovat soubor z místního úložiště do svazku.
GET zkopírovat soubor ze svazku do místního úložiště.
REMOVE odstranit soubor ze svazku.

Příklady

--- Create an external volume under the directory “my-path”
> CREATE EXTERNAL VOLUME IF NOT EXISTS myCatalog.mySchema.myExternalVolume
        COMMENT 'This is my example external volume'
        LOCATION 's3://my-bucket/my-location/my-path'
 OK

--- Set the current catalog
> USE CATALOG myCatalog;
 OK

--- Set the current schema
> USE SCHEMA mySchema;
 OK

--- Create a managed volume; it is not necessary to specify a location
> CREATE VOLUME myManagedVolume
    COMMENT 'This is my example managed volume';
 OK

--- List the files inside the volume, all names are lowercase
> LIST '/Volumes/mycatalog/myschema/myexternalvolume'
 sample.csv

> LIST 'dbfs:/Volumes/mycatalog/myschema/mymanagedvolume'
 sample.csv

--- Print the content of a csv file
> SELECT * FROM csv.`/Volumes/mycatalog/myschema/myexternalvolume/sample.csv`
 20

> SELECT * FROM csv.`dbfs:/Volumes/mycatalog/myschema/mymanagedvolume/sample.csv`
 20

Váš názor

Byla tato stránka užitečná?

Last updated on 2025-01-21