Doporučení pro práci s kořenem DBFS

Azure Databricks používá kořenový adresář DBFS jako výchozí umístění pro některé akce pracovního prostoru. Databricks doporučuje ukládat produkční data nebo citlivé informace v kořenovém adresáři DBFS. Tento článek se zaměřuje na doporučení, jak zabránit náhodnému odhalení citlivých dat v kořenovém adresáři DBFS.

Poznámka

Azure Databricks konfiguruje samostatné umístění privátního úložiště pro uchovávání dat a konfigurací v cloudovém úložišti vlastněné zákazníkem, označované jako interní DBFS. Toto umístění není uživatelům zpřístupněno.

Důležité

Od 6. března 2023 používají nové pracovní prostory Azure Databricks účty úložiště Azure Data Lake Storage Gen2 kořenového adresáře DBFS. Dříve zřízené pracovní prostory používají službu Blob Storage.

Informujte uživatele, aby neukládaly data v kořenovém adresáři DBFS.

Vzhledem k tomu, že kořen DBFS je přístupný všem uživatelům v pracovním prostoru, mají všichni uživatelé přístup ke všem zde uloženým datům. Je důležité dát uživatelům pokyn, aby se vyhýbali používání tohoto umístění k ukládání citlivých dat. Výchozím umístěním spravovaných tabulek v metastoru Hive v Azure Databricks je kořen DBFS. Pokud chcete koncovým uživatelům, kteří vytvářejí spravované tabulky, zabránit v zápisu do kořenového adresáře DBFS, deklarujte při vytváření databází v metastoru Hive umístění v externím úložišti.

Spravované tabulky katalogu Unity používají ve výchozím nastavení zabezpečené umístění úložiště. Databricks doporučuje používat katalog Unity pro spravované tabulky.

Monitorování aktivity pomocí protokolování auditu

Poznámka

Podrobnosti o událostech auditu DBFS najdete v tématu Události DBFS.

Šifrování kořenových dat DBFS pomocí klíče spravovaného zákazníkem

Kořenová data DBFS můžete šifrovat pomocí klíče spravovaného zákazníkem. Viz Klíče spravované zákazníkem pro kořenový adresář DBFS.