Azure Databricks 元件

本文介紹你必須了解的基本元件，以便有效使用 Azure Databricks。

帳戶與工作區

在Azure Databricks中，workspace 是一種Azure Databricks雲端部署，作為團隊存取 Databricks 資產的環境。根據需求，您的組織可以選擇擁有多個工作區或只有一個工作區。

Azure Databricks account代表一個可以包含多個工作區的單一實體。啟用 Unity Catalog 的帳戶可用於在帳戶中所有工作區，集中管理使用者及其資料存取權。

計費：Databricks 單位 (DBU)

Azure Databricks 依據 Databricks 單位（DBU）計費，DBU 是根據虛擬實例類型每小時計算的處理能力單位。

請參考Azure Databricks價格頁面。

驗證與授權

本節說明管理 Azure Databricks 身份及其存取 Azure Databricks 資產時需要了解的概念。

使用者

可以存取系統的唯一個人。使用者識別會以電子郵件地址表示。請參閱管理使用者。

服務主體

服務識別，用於作業、自動化工具和系統，例如指令碼、應用程式和 CI/CD 平台。服務主體會以應用程式識別碼表示。請參閱服務主體。

群組

身分的集合。群組可簡化身分識別管理，讓您更輕鬆地指派對工作區、資料和其他安全性實體物件的存取權。所有 Databricks 身分識別都可以被指定為群組成員。請參閱群組。

存取控制清單（ACL）

附加至工作區、叢集、作業、表格或實驗的權限清單。 ACL 會指定哪些使用者或系統進程會被授與物件存取權限，以及資產上允許哪些作業。一般 ACL 中的每個項目都會指定主體和作業。請參閱訪問控制清單。

個人存取權杖 (PAT)

個人存取令牌是用來驗證 REST API 呼叫、技術夥伴連線和其他工具的字串。請參見用Azure Databricks個人存取憑證認證（舊版）。

Microsoft Entra ID 憑證也可用於驗證 REST API。

Azure Databricks 介面

本節說明在 Azure Databricks 中存取資產的介面。

UI

Azure Databricks 的使用者介面是一個圖形介面，用於與功能互動，例如工作區資料夾及其包含的物件、資料物件和計算資源。

Databricks One

Databricks One 是一個簡化版的 Azure Databricks 介面，專為商業用戶設計。它提供單一入口，讓你瀏覽 AI/BI 儀表板、使用 Genie 提出資料問題，以及使用 Databricks 應用程式，無需操作技術工作空間的概念。請參閱什麼是 Databricks One？。

REST API

Databricks REST API 提供端點，用於修改或請求關於 Azure Databricks 帳號與工作區物件的資訊。請參閱帳戶參考和工作區參考。

SQL REST API

SQL REST API 可讓您將 SQL 物件上的工作自動化。請參閱 SQL API。

CLI

Databricks CLI 託管於 GitHub。 CLI 建置於 Databricks REST API 之上。

資料管理

本節說明用於組織與管理 Azure Databricks 資料的工具與邏輯物件。請參見 Azure Databricks 中的 Database 物件。

Unity 目錄

Unity Catalog 是一套統一治理解決方案，適用於 Azure Databricks 上的資料與 AI 資產，提供跨 Databricks 工作空間的集中存取控制、稽核、血統及資料發現功能。請參閱什麼是 Unity 目錄？。

圖式

架構（亦稱為資料庫的一部分）位於目錄中，提供更細微的組織層級。它們包含資料庫物件和 AI 資產，例如磁碟區、數據表、函式和模型。參見 Azure Databricks？中的 schema 是什麼。

桌子

數據表會組織和管理結構化數據的存取權。您可以使用 Apache Spark SQL 和 Apache Spark API 來查詢數據表。請參見Azure Databricks表格。

檢視

檢視是從一或多個資料表和其他檢視衍生而來的唯讀物件。檢視會儲存針對數據表定義的查詢。請參閱什麼是檢視？。

音量

磁碟區代表雲端物件儲存區中的邏輯磁碟區，並組織和控管對非結構化資料的存取。 Databricks 建議使用磁碟區來管理雲端物件記憶體上非表格式數據的所有存取。請參閱什麼是 Unity 目錄磁碟區？。

Delta 表格

預設情況下，Azure Databricks 中建立的所有表格都是 Delta 表格。 Delta 表格基於 Delta Lake open source專案，這是一個用於雲端物件儲存的高效能 ACID 表格儲存框架。 Delta 數據表將資料儲存為雲端物件儲存上的檔案目錄，並將數據表元數據註冊至目錄和資料庫架構內的中繼存放區。

中繼存放區

Unity 目錄提供帳戶層級中繼存放區，可註冊有關數據、AI 的元數據，以及目錄、架構和數據表的許可權。請參閱 Metastore。

Azure Databricks 為尚未採用 Unity Catalog 的客戶提供一個舊有的 Hive 元儲存庫。請參閱Hive Metastore 表訪問控制（舊版）。

目錄瀏覽器

目錄總管可讓您探索和管理數據和 AI 資產，包括架構（資料庫）、數據表、模型、磁碟區（非表格式數據）、函式和已註冊的 ML 模型。您可以使用它來尋找數據對象和擁有者、了解數據表之間的數據關聯性，以及管理許可權和共用。請參閱什麼是目錄總管？。

DBFS 根目錄

重要

使用 DBFS 根或 DBFS 掛接來儲存和存取資料是已被取代的模式，Databricks 不建議這麼做。相反地，Databricks 建議使用 Unity 目錄來管理所有數據的存取權。請參閱什麼是 Unity 目錄？。

DBFS 根目錄預設為所有使用者可用的儲存位置。請參閱什麼是 DBFS？。

計算管理

本節說明你需要知道的概念，以便在 Azure Databricks 中執行運算。

叢集

執行筆記本和作業的一組計算資源和組態。叢集有兩種類型：通用和作業。請參閱計算。

您可以使用 UI、CLI 或 REST API 來建立 所有用途的叢集 。您可以手動終止並重新啟動通用叢集。多個使用者可以共用這類叢集，以執行共同作業的互動式分析。
Azure Databricks工作排程器當你在一個新的工作叢集上執行任務時，會建立一個工作叢集，並在任務完成後終止該叢集。 您無法重新啟動作業叢集。

游泳池

一組閑置且現成可用的實例，可減少叢集啟動和自動調整時間。當附加到集區時，叢集會從集區分配其驅動程式節點和工作節點。請參閱集區組態參考。

如果集區沒有足夠的閑置資源來容納叢集的要求，集區會藉由從實例提供者配置新的實例來擴充。當連結的叢集終止時，所使用的執行個體會傳回集區，並可由不同的叢集重複使用。

Databricks執行時間

在 Azure Databricks 管理的叢集上執行的核心元件集合。請參閱計算。 Azure Databricks 有以下執行時：

Databricks Runtime 包含 Apache Spark，但也新增了一些元件和更新，可大幅改善巨量數據分析的可用性、效能和安全性。
Databricks Runtime for Machine Learning 建立在 Databricks 執行環境之上，並提供與 Azure Databricks 工作空間所有功能整合的預建 machine learning 基礎架構。它包含多種熱門的函式庫，包括 TensorFlow、Keras、PyTorch 和 XGBoost。

作業和管線 UI

作業與管線工作區 UI 提供作業、Lakeflow Spark 宣告式管線和 Lakeflow Connect UI 的入口，這些工具允許您協調和排程工作流程。

工作

協調和排程筆記本、程式庫和其他工作的非互動式機制。請參閱 Lakeflow 職位

Pipelines

Lakeflow Spark 宣告式管線提供宣告式架構，用於建置可靠、可維護且可測試的資料處理管線。請參閱 Lakeflow Spark 宣告式管線。

工作負載

工作負載是執行工作或工作群組所需處理功能的量。 Azure Databricks 識別了兩種工作負載類型：資料工程（工作）和資料分析（多用途）。

資料工程 （自動化的）工作負載運行在由Azure Databricks工作排程器為每個工作負載建立的工作叢集上。
數據分析的互動式工作負載在全用途叢集上執行。互動式工作負載通常在 Azure Databricks notebook 中執行指令。不過，在現有的所有用途叢集上執行作業也會被視為互動式工作負載。

執行環境

每個支援的程式設計語言的「讀取、求值、輸出」迴圈 (REPL) 環境狀態。支援的語言包括 Python、R、Scala 和 SQL。

資料工程

資料工程工具可協助資料科學家、資料工程師、資料分析師和機器學習工程師共同作業。

工作區

workspace 是一個用來存取你所有Azure Databricks資產的環境。工作區會將物件（筆記本、連結庫、儀錶板和實驗）組織成資料夾，並提供數據物件和計算資源的存取權。

Notebook

Web 型介面，可用來建立資料科學和機器學習工作流程，其中包含可執行的命令、視覺效果和敘述文字。請參閱 Databricks 筆記本。

圖書館

可供叢集上執行的筆記本或作業使用的程式碼套件。 Databricks Runtime 包含許多程式庫，您也可以上傳自己的程式庫。請參閱安裝連結庫。

Git 資料夾（前稱 Repos）

將內容同步到遠端 Git 存放庫、共同版本管理的資料夾。 Databricks Git 資料夾會與 Git 整合，為您的專案提供來源和版本控制。

AI 和機器學習

Databricks 提供整合式端對端環境，並提供受控服務來開發和部署 AI 與機器學習應用程式。

馬賽克 AI

Databricks Mosaic AI 研究的產品和服務品牌名稱，是由負責 Databricks 在生成式 AI 中最大突破的研究人員和工程師團隊所提供。 Mosaic AI 產品包括 Databricks 中的 ML 和 AI 功能。請參閱馬賽克研究。

機器學習執行階段

為了協助你開發機器學習與人工智慧模型，Databricks 提供 Databricks 執行環境（Machine Learning），透過預先建置的 machine learning 與深度學習基礎設施，包括最常見的 ML 與深度學習函式庫，自動化運算創建。它也具有內建、預先設定的 GPU 支援，包括驅動程式和支援庫。流覽至 Databricks Runtime 版本資訊及相容性中，了解最新執行環境版本的資訊。

實驗

一組用於開發代理程式、大型語言模型（LLM）應用和機器學習模型的 MLflow 執行。請參閱使用 MLflow 實驗組織訓練回合。

功能

功能是 ML 模型的重要元件。功能存放區可在整個組織中啟用功能共用和探索，也可確保相同的功能計算程式碼用於模型訓練和推斷。請參閱 Databricks 功能存放區。

生成式 AI 模型

Databricks 支援探索、開發和部署生成式 AI 模型，包括：

AI 遊樂場是工作區中類似聊天的環境，您可以在其中測試、提示和比較 LLM。請參閱使用 AI 遊樂場與 LLM 互動及原型開發生成式 AI 應用程式。
內建的一組您可以查詢的預先設定基礎模型。
- 請參閱按令牌付費基礎模型 API。
- 請參閱 [建議] 從 Unity 目錄部署基礎模型，以取得您可以按兩下即可提供的基礎模型。
第三方託管的 LLM，稱為外部模型。這些模型應依現況使用。
自定義基礎模型的功能，以優化特定應用程式的效能（通常稱為微調）。請參閱基礎模型微調。

模型管理庫

Databricks 提供 Unity 目錄中裝載的 MLflow 模型登錄版本。在 Unity 目錄中註冊的模型會繼承集中式訪問控制、譜系和跨工作區探索和存取。請參閱在 Unity 目錄中管理模型生命週期。

模型部署

Mosaic AI 模型服務提供整合介面，可用來部署、控管及查詢 AI 模型。您提供的每個模型都可作為 REST API，您可將其整合到網頁或用戶端應用程式中。使用 Mosaic AI 模型服務，您可以部署自己的模型、基礎模型或 Databricks 外部託管的第三方模型。請參閱使用馬賽克 AI 模型服務部署模型。

資料倉儲

資料倉儲是指從多個來源收集和儲存資料，以便快速存取商業見解和報告。 Databricks SQL 是一系列服務的集合，可將資料倉儲功能和效能帶入現有的 Data Lake。請參閱數據倉儲架構。

查詢

查詢是有效的 SQL 陳述式，可讓您與資料互動。您可以使用平臺 SQL 編輯器撰寫查詢，或使用 SQL 連接器、驅動程式或 API 進行連線。若要深入瞭解如何使用查詢，請參閱存取和管理已儲存的查詢。

SQL 資料庫

用於執行 SQL 查詢的計算資源。 SQL 倉儲有三種類型：傳統、Pro 和無伺服器。 Azure Databricks 建議在可用時使用無伺服器倉庫。請參閱 SQL 倉儲類型，以比較每個倉儲類型的可用功能。

查詢歷程記錄

已執行的查詢及其效能特性的清單。查詢歷程記錄可讓您監視查詢效能，協助您找出瓶頸並優化查詢運行時間。請參閱查詢歷程記錄。

視覺效果

執行查詢的結果的圖形化表示。請參閱 Databricks 筆記本和 SQL 編輯器中的視覺效果。

儀表板

資料可視化和評論的展示。你可以用儀表板自動將報告傳送給你 Azure Databricks 帳號中的任何人。利用 Genie Code 幫助你根據自然語言提示建立視覺化。請參閱儀錶板。您也可以從筆記本建立儀表板。請參閱筆記本中的儀錶板。

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-04-11