這很重要
DBFS 根目錄和 DBFS 掛載已被 Databricks 棄用且不建議使用。 新帳號在無法使用這些功能的情況下被設定。 Databricks 建議改用 Unity Catalogvolumes、external locations 或workspace files。
DBFS 一詞用來描述平臺的兩個部分:
- DBFS 根目錄
- DBFS 掛接
什麼是 Databricks 檔案系統?
DBFS 一詞來自 Databricks 檔案系統,其描述 Azure Databricks 用來與雲端式記憶體互動的分散式文件系統。
與 DBFS 相關聯的基礎技術仍然是 Azure Databricks 平臺的一部分。 例如, dbfs:/ 與 Unity 目錄磁碟區互動時,是選擇性的配置。
DBFS 的過去和目前警告和警告僅適用於 DBFS 根或 DBFS 掛接。
DBFS 如何搭配 Unity 目錄使用?
Databricks 建議使用 Unity 目錄來管理所有數據的存取權。
Unity 目錄新增外部位置、記憶體認證和磁碟區的概念,以協助組織為雲端物件記憶體中的數據提供最低許可權存取權。
某些安全性設定可讓您直接存取 Unity 目錄管理的資源和 DBFS,主要是針對已完成移轉或部分移轉至 Unity 目錄的組織。 請參閱適用於 DBFS 和 Unity 目錄的最佳做法。
什麼是 DBFS 根目錄?
DBFS 根目錄是在包含 Azure Databricks 工作區的雲端帳戶中建立工作區期間布建的記憶體位置。 如需 Databricks 檔案系統根設定和部署的詳細資訊,請參閱 工作區儲存體。
Databricks 不建議將生產數據、連結庫或腳本儲存在 DBFS 根目錄中。 請參閱 使用 DBFS 根目錄的建議。
若要為包含 DBFS 根目錄的記憶體帳戶設定客戶管理的密鑰,請參閱 DBFS 根目錄的客戶自控密鑰。
若要限制對包含 DBFS 根目錄之記憶體帳戶的網路存取,請參閱 啟用工作區記憶體帳戶的防火牆支援。
掛接物件記憶體
注意
DBFS 掛接已被取代。 Databricks 建議使用 Unity 目錄磁碟區。 請參閱Unity Catalog 磁碟區是什麼?。
將物件記憶體掛接至 DBFS 可讓您存取物件記憶體中的物件,就像它們位於本機檔案系統上一樣。 掛接會儲存存取記憶體所需的Hadoop組態。 如需詳細資訊,請參閱在 Azure Databricks 上掛接雲端物件儲存體。