Consigli per l'uso della radice DBFS
Azure Databricks usa la directory radice DBFS come percorso predefinito per alcune azioni dell'area di lavoro. Databricks consiglia di archiviare dati di produzione o informazioni riservate nella radice DBFS. Questo articolo è incentrato sulle raccomandazioni per evitare l'esposizione accidentale dei dati sensibili nella radice DBFS.
Nota
Azure Databricks configura un percorso di archiviazione privato separato per rendere persistenti i dati e le configurazioni nell'archiviazione cloud di proprietà del cliente, noto come DBFS interno. Questo percorso non è esposto agli utenti.
Importante
A partire dal 6 marzo 2023, le nuove aree di lavoro di Azure Databricks usano gli account di archiviazione di Azure Data Lake Storage Gen2 per la radice DBFS. Le aree di lavoro con provisioning in precedenza usano l'archiviazione BLOB.
Informare gli utenti di non archiviare i dati nella radice DBFS
Poiché la radice DBFS è accessibile a tutti gli utenti in un'area di lavoro, tutti gli utenti possono accedere a tutti i dati archiviati qui. È importante indicare agli utenti di evitare di usare questo percorso per l'archiviazione dei dati sensibili. Il percorso predefinito per le tabelle gestite nel metastore Hive in Azure Databricks è la radice DBFS; per impedire agli utenti finali che creano tabelle gestite di scrivere nella radice DBFS, dichiarare una posizione nell'archiviazione esterna durante la creazione di database nel metastore Hive.
Per impostazione predefinita, le tabelle gestite del catalogo Unity usano un percorso di archiviazione sicuro. Databricks consiglia di usare Unity Catalog per le tabelle gestite.
Usare la registrazione di controllo per monitorare l'attività
Nota
Per informazioni dettagliate sugli eventi di controllo DBFS, vedere Eventi DBFS.
Crittografare i dati radice di DBFS con una chiave gestita dal cliente
È possibile crittografare i dati radice DBFS con una chiave gestita dal cliente. Vedere Chiavi gestite dal cliente per la radice DBFS
Importante
Non disabilitare Storage account key access
per l'account di archiviazione che esegue il backup della radice DBFS. La disabilitazione di questa impostazione comporta comportamenti e errori imprevisti.