Množství
Platí pro: Databricks SQL Databricks Runtime 13.3 LTS a vyšší pouze katalog Unity
Svazky jsou objekty katalogu Unity představující logický svazek úložiště v cloudovém úložišti objektů. Svazky poskytují možnosti pro přístup k souborům, jejich ukládání, řízení a uspořádání. Zatímco tabulky poskytují zásady správného řízení nad tabulkovou datovou sadou, svazky přidávají zásady správného řízení nad ne tabulkovou datovou sadou. Svazky můžete použít k ukládání a přístupu k souborům v libovolném formátu, včetně strukturovaných, částečně strukturovaných a nestrukturovaných dat.
Svazky jsou na stejné úrovni jako tabulky, zobrazení a další objekty uspořádané do schématu v katalogu Unity.
Svazek je možné spravovat nebo externí.
Další podrobnosti a omezení najdete v tématu Co jsou svazky katalogu Unity?.
Spravovaný svazek
Spravovaný svazek je svazek úložiště, který se řídí katalogem Unity vytvořeným v rámci spravovaného umístění úložiště obsahujícího schématu. Spravované svazky umožňují vytvořit spravované úložiště pro práci se soubory bez režie externích umístění a přihlašovacích údajů k úložišti. Při vytváření spravovaného svazku nemusíte zadávat umístění a veškerý přístup k souborům pro data ve spravovaných svazcích probíhá prostřednictvím cest spravovaných katalogem Unity.
Externí svazek
Externí svazek je svazek úložiště řízený katalogem Unity zaregistrovaný v adresáři v rámci externího umístění.
Pojmenování svazků a referenční informace
Název svazku je identifikátor, který lze v příkazech SQL kvalifikovat pomocí katalogu a názvu schématu.
Cesta pro přístup k souborům ve svazcích používá následující formát:
/Volumes/<catalog_identifier>/<schema_identifier>/<volume_identifier>/<path>/<file_name>
Všimněte si, že Azure Databricks normalizuje identifikátory na malá písmena.
Azure Databricks také podporuje volitelné dbfs:/
schéma, takže funguje i následující cesta:
dbfs:/Volumes/<catalog_identifier>/<schema_identifier>/<volume_identifier>/<path>/<file_name>
Poznámka:
K datům v externích svazcích můžete přistupovat také pomocí identifikátorů URI cloudového úložiště.
Správa souborů ve svazcích
Platí pro: Konektor SQL Databricks
Pomocí konektoru SQL Databricks můžete spravovat soubory ve svazcích pomocí následujících příkazů:
- VLOŽTE DO a zkopírujte soubor z místního úložiště do svazku.
- GET pro zkopírování souboru ze svazku do místního úložiště
- Odebráním souboru ze svazku odeberete soubor.
Příklady
--- Create an external volume under the directory “my-path”
> CREATE EXTERNAL VOLUME IF NOT EXISTS myCatalog.mySchema.myExternalVolume
COMMENT 'This is my example external volume'
LOCATION 's3://my-bucket/my-location/my-path'
OK
--- Set the current catalog
> USE CATALOG myCatalog;
OK
--- Set the current schema
> USE SCHEMA mySchema;
OK
--- Create a managed volume; it is not necessary to specify a location
> CREATE VOLUME myManagedVolume
COMMENT 'This is my example managed volume';
OK
--- List the files inside the volume, all names are lowercase
> LIST '/Volumes/mycatalog/myschema/myexternalvolume'
sample.csv
> LIST 'dbfs:/Volumes/mycatalog/myschema/mymanagedvolume'
sample.csv
--- Print the content of a csv file
> SELECT * FROM csv.`/Volumes/mycatalog/myschema/myexternalvolume/sample.csv`
20
> SELECT * FROM csv.`dbfs:/Volumes/mycatalog/myschema/mymanagedvolume/sample.csv`
20
Související články
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro