工作區對象的簡介

本文提供 Azure Databricks 工作區物件的高階簡介。 您可以在工作區瀏覽器中跨角色建立、檢視及組織工作區物件。

集群

Azure Databricks 資料科學 與工程和 Databricks 機器學習 叢集為各種使用案例提供統一的平臺,例如執行生產 ETL 管線、串流分析、臨機操作分析和機器學習。 叢集是一種 Azure Databricks 計算資源類型。 其他計算資源類型包括 Azure Databricks SQL 倉儲

如需管理和使用叢集的詳細資訊,請參閱 計算

筆記本

筆記本是一個網頁型介面,其中包含一系列可執行的數據格(命令),可在檔案和 數據表視覺效果和敘述文字上運作。 命令可以依序執行,指的是一或多個先前執行命令的輸出。

Notebook 是一種在 Azure Databricks 中執行程式代碼的機制。 另一個機制是 作業

如需管理和使用筆記本的詳細資訊,請參閱 Databricks 筆記本簡介。

工作

作業是一種在 Azure Databricks 中執行程式代碼的機制。 另一個機制是筆記本。

如需管理和使用作業的詳細資訊,請參閱 建立和執行 Azure Databricks 作業

圖書館

連結庫讓第三方或本機建置的程式代碼可供叢集上執行的筆記本和作業使用。

如需管理和使用連結庫的詳細資訊,請參閱 連結庫

數據

您可以將數據匯入掛接至 Azure Databricks 工作區的分散式文件系統,並在 Azure Databricks 筆記本和叢集中使用它。 您也可以使用各種不同的 Apache Spark 數據源來存取數據。

如需載入數據的詳細資訊,請參閱 將數據內嵌至 Databricks Lakehouse

重要

這項功能處於公開預覽狀態

在 Databricks Runtime 11.3 LTS 和更新版本中,您可以在 Databricks 工作區中建立和使用任意檔案。 檔案可以是任何文件類型。 常見的範例包括:

  • .py 自訂模組中使用的檔案。
  • .md 檔案,例如 README.md
  • .csv 或其他小型數據檔。
  • .txt 檔案。
  • 記錄檔。

如需使用檔案的詳細資訊,請參閱 使用 Azure Databricks 上的檔案。 如需如何使用檔案在使用 Databricks 筆記本進行開發時將程式代碼模組化的資訊,請參閱 在 Databricks 筆記本之間共用程式代碼

Git 資料夾

Git 資料夾是 Azure Databricks 資料夾,其內容會藉由將它們同步至遠端 Git 存放庫,共同建立版本。 使用 Databricks Git 資料夾,您可以在 Azure Databricks 中開發筆記本,並使用遠端 Git 存放庫進行共同作業和版本控制。

如需使用存放庫的詳細資訊,請參閱 Git 與 Databricks Git 資料夾的整合。

模型

模型 是指在 MLflow 模型登錄中註冊的模型。 Model Registry 是集中式模型存放區,可讓您管理 MLflow 模型的完整生命週期。 它提供時間模型譜系、模型版本設定、階段轉換,以及模型和模型版本批注和描述。

如需管理和使用模型的詳細資訊,請參閱 在 Unity 目錄中管理模型生命週期。

實驗

MLflow 實驗是 MLflow 機器學習模型定型執行的組織與訪問控制主要單位;所有 MLflow 執行都屬於實驗。 每個實驗都可讓您可視化、搜尋及比較執行,以及下載執行成品或元數據以供其他工具分析。

如需管理和使用實驗的詳細資訊,請參閱 使用 MLflow 實驗組織定型執行。

查詢

查詢是可讓您與數據互動的 SQL 語句。 如需詳細資訊,請參閱 存取和管理已儲存的查詢

儀表板

儀錶板是查詢視覺效果和評論的呈現方式。 請參閱 儀錶板舊版儀錶板

警示

警示是查詢傳回的欄位已達到閾值的通知。 如需詳細資訊,請參閱 什麼是 Databricks SQL 警示?

工作區對象的參考

在過去,用戶必須包含 /Workspace 某些 Databricks API 的路徑前置詞 (%sh),但不適用於其他 API(%runREST API 輸入)。

用戶可以隨處使用具有前置詞的 /Workspace 工作區路徑。 沒有 /Workspace 前置詞的路徑舊參考會重新導向,並繼續運作。 我們建議所有工作區路徑都帶有 /Workspace 前置詞,以區分它們與磁碟區和 DBFS 路徑。

一致 /Workspace 路徑前置詞行為的必要條件是:工作區根層級不能 /Workspace 有資料夾。 如果您有 /Workspace 根層級的資料夾,而且想要啟用此 UX 改進功能,請刪除或重新命名 /Workspace 您建立的資料夾,並連絡您的 Azure Databricks 帳戶小組。

共用檔案、資料夾或筆記本URL

在您的 Azure Databricks 工作區中,工作區檔案、筆記本和資料夾的 URL 格式如下:

工作區檔案 URL

  https://<databricks-instance>/?o=<16-digit-workspace-ID>#files/<16-digit-object-ID>

筆記本 URL

  https://<databricks-instance>/?o=<16-digit-workspace-ID>#notebook/<16-digit-object-ID>/command/<16-digit-command-ID>

資料夾 (工作區和 Git) URL

  https://<databricks-instance>/browse/folders/<16-digit-ID>?o=<16-digit-workspace-ID>

如果目前路徑中的任何資料夾、檔案或筆記本都以 Git 提取命令更新,或以相同名稱刪除並重新建立,這些連結可能會中斷。 不過,您可以根據工作區路徑建構連結,以透過下列格式將連結變更為連結,以與其他具有適當存取層級的 Databricks 用戶共用:

  https://<databricks-instance>/?o=<16-digit-workspace-ID>#workspace/<full-workspace-path-to-file-or-folder>

您可以使用工作區根目錄中的檔案、資料夾或筆記本路徑取代URL中的 ?o=<16-digit-workspace-ID> 所有專案,以共用資料夾、筆記本和檔案的連結。 如果您要共享資料夾的 URL,請從原始 URL 移除 /browse/folders/<16-digit-ID>

若要取得檔案路徑,請以滑鼠右鍵按下您要共用之工作區中的資料夾、筆記本或檔案,然後選取 [複製URL/路徑完整路徑>] 來開啟操作功能表。 前面加上 #workspace 您剛才複製的檔案路徑,並在 之後 ?o=<16-digit-workspace-ID> 附加產生的字串,使其符合上述 URL 格式。

從工作區資料夾的操作功能表中選取 [複製URL 路徑],後面接著 [完整路徑]。

URL 公式範例 #1:資料夾 URL

若要共用工作區資料夾 URL https://<databricks-instance>/browse/folders/1111111111111111?o=2222222222222222,請從 URL 移除 browse/folders/1111111111111111 子字串。 新增 #workspace ,後面接著您要共用的資料夾或工作區對象路徑。

在這裡情況下,工作區路徑是資料夾 /Workspace/Users/user@example.com/team-git/notebooks。 從工作區複製完整路徑之後,您現在可以建構可共用的連結:

  https://<databricks-instance>/?o=2222222222222222#workspace/Workspace/Users/user@example.com/team-git/notebooks

URL 公式範例 2:筆記本 URL

若要分享筆記本 URL https://<databricks-instance>/?o=1111111111111111#notebook/2222222222222222/command/3333333333333333 請移除 #notebook/2222222222222222/command/3333333333333333。 將 #workspace 後面加上資料夾或工作區對象的路徑。

在這裡情況下,工作區路徑會指向筆記本 /Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook。 從工作區複製完整路徑之後,您現在可以建構可共用的連結:

  https://<databricks-instance>/?o=1111111111111111#workspace/Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook

現在您有檔案、資料夾或筆記本路徑的穩定URL可共用! 如需 URL 和識別碼的詳細資訊,請參閱 取得工作區對象的標識碼。