共用方式為


Databricks 中的預設儲存體

本頁說明 Azure Databricks 的預設儲存如何運作,以及如何建立使用該儲存裝置的目錄與資料物件。

什麼是預設儲存體?

預設儲存是一個完全管理的物件儲存平台,能在你的 Azure Databricks 帳號中提供隨時可用的儲存空間。 部分 Azure Databricks 功能將預設儲存作為外部儲存的替代方案。

無伺服器工作區使用預設儲存作為內部與工作區儲存,以及與工作區建立的預設目錄。 在無伺服器工作空間中,你可以在預設儲存或自己的 雲端物件儲存中建立額外的目錄。

在經典工作區和無伺服器工作區中,功能會使用預設儲存來儲存控制平面元資料、衍生資料、模型及其他工件。 例如, 潔淨室資料分類異常偵測代理磚 都使用工作區的預設儲存空間。 請參閱個別功能文件,了解每個功能在預設儲存中儲存的內容。

需求

  • 在預設儲存上建立目錄僅在 無伺服器工作區 (公開預覽版)中可用。
  • 根據預設,只能從建立預設記憶體的工作區存取使用預設記憶體的目錄。 你可以授權其他工作區存取權,包括經典工作區,但它們必須使用無伺服器運算來存取目錄中的資料。 請參閱限制特定工作區的目錄存取
  • 您必須具有 CREATE CATALOG 許可權,才能建立具有預設記憶體的目錄。 請參閱 Unity Catalog 使用權限與可保護物件
  • 如果您的客戶端使用 Azure Databricks ODBC 驅動程式從防火牆後方存取預設儲存目錄,您必須設定防火牆允許存取 Azure Databricks 區域儲存閘道。 關於預設儲存的 IP 與網域名稱細節,請參見 Azure Databricks 服務與資產的 IP 位址與網域

建立新目錄

完成下列步驟,以使用預設記憶體建立新的目錄:

  1. 按一下[資料] 圖示。在側邊欄中點擊目錄。 [目錄總管] 隨即出現。
  2. 點選 「建立目錄」。 [ 建立新的目錄 ] 對話框隨即出現。
  3. 提供您帳戶中唯一的 目錄名稱
  4. 選取 [ 使用預設儲存體] 選項。
  5. 點擊 建立

在無伺服器工作區中,您也可以使用下列 SQL 命令,在預設儲存體中建立新的目錄。 您不需要指定型錄的位置。

CREATE CATALOG [ IF NOT EXISTS ] catalog_name
    [ COMMENT comment ]

使用預設記憶體

所有與預設記憶體的互動都需要無伺服器且已啟用 Unity 目錄的計算。

預設儲存體所支援的資源會使用與 Unity 目錄中其他物件相同的許可權模型。 您必須具有足夠的權限才能建立、檢視、查詢或修改資料物件。 請參閱 Unity Catalog 使用權限與可保護物件

您可以建立預設儲存體所支援的受管理資料表和受管理磁碟區並與之互動,以使用預設儲存體。 請參閱 適用於 Delta Lake 和 Apache Iceberg 的 Azure Databricks 中的 Unity 目錄受控數據表 ,以及 什麼是 Unity 目錄磁碟區?

您可以使用目錄總管、筆記本、SQL 編輯器和儀錶板,與儲存在預設記憶體中的數據物件互動。

範例作業

以下是您可以使用預設儲存體完成的工作範例:

局限性

適用下列限制:

  • 傳統計算(任何非無伺服器計算)都無法與預設記憶體中的數據資產互動。
  • Delta Sharing 支援將資料表共用給任何收件者 (開啟或 Azure Databricks),而且收件者可以使用傳統計算來存取共用資料表 (Beta)。 在您的帳戶主控台中啟用 預設儲存的 Delta Sharing – 擴充權限 功能。
    • 下列區域不支援此功能: southcentralusuksouthwestus2
    • 所有其他可共用資產只能使用 Delta sharing 與相同雲端上的 Azure Databricks 收件者共享。 收件者必須使用無伺服器運算。
  • 已啟用分割的資料表無法進行差異共用。
  • 外部 Iceberg 與 Delta 用戶端無法直接存取預設儲存空間中 UC 表格的底層元資料、清單清單及資料檔案(不支援 FileIO 存取)。 然而,像 Power BI 和 Tableau 這類 BI 工具可以使用 ODBC 和 JDBC 驅動程式存取預設儲存空間的 Unity 目錄資料表。 外部用戶端也可以透過檔案 API 存取預設儲存的 Unity 目錄卷。
  • 預設儲存支援透過 Azure Databricks ODBCJDBC 驅動程式進行外部存取,包括 ODBC 驅動程式的 雲端擷取 效能優化功能,以查詢較大資料集。 然而,如果你從啟用前端私有連結的工作區存取預設儲存表,當你的 ODBC 用戶端查詢超過 100 MB 時會失敗,因為 Cloud Fetch 對預設儲存表的優化目前不支援前端私有連結。