Azure Databricks 提供一套工具和產品,可簡化透過 Databricks Data Intelligence Platform 存取的資料資產探索。 本文提供具個人觀點的概觀,說明如何探索和預覽已在您的工作區中設定以供存取的資料。
- 若要連線到數據源,請參閱 連線到數據源和外部服務。
- 如需有關取得 Databricks Marketplace 中資料存取權的相關資訊,請參閱什麼是 Databricks Marketplace?。
本節中的主題著重於探索資料物件和資料檔案。 如果您要尋找使用筆記本、SQL 查詢、連結庫和模型等資產的相關信息,請參閱 工作區 UI。
如果您要針對與探勘數據分析相關聯的數據集或其他工作產生摘要統計數據尋求指引,請參閱 Azure Databricks 上的探勘數據分析:工具和技術。
如何探索資料資產?
Azure Databricks 上的資料探索工具分為下列一般類別:
- AI 輔助的深入解析、摘要和搜尋。
- 關鍵字搜尋。
- 使用 UI 進行目錄探索。
- 程式化清單與元數據探索。
數據探索工具已針對 Unity 目錄控管的數據進行優化。 未註冊為 Unity Catalog 對象的數據資產可能無法使用其中一些方法來探索。
使用 UI 尋找資料
- Genie:瀏覽與你分享的資產,依名稱搜尋,用自然語言提問資料,並依網域篩選。 請參見 使用精靈介面。
- 發現頁面:一個精心策劃的瀏覽體驗,讓你能探索依網域組織的資料資產。 策展人可以突出其組織的關鍵資產,消費者則可依網域或資產類型瀏覽。 請參閱 發現頁面、網域及子網域。
-
目錄瀏覽器:提供探索與管理資料資產的工具。 請使用
存取目錄檔案總管。目錄放在工作區側邊欄。 使用 「洞察 」標籤來了解資料在你工作區的使用情況。 請參閱 「什麼是目錄檔案總管?」 以及 「查看頻繁查詢與資料表使用者」。
- 筆記本與 SQL 編輯器:同時提供目錄導覽器以探索資料庫物件。 點擊編輯器側邊欄的 目錄 圖示,可在不離開程式碼編輯器的情況下展開或摺疊目錄導航器。
以程序設計方式探索資料
您可以在所有資料庫物件上使用 SHOW 命令來探索註冊至 Unity 目錄的資產。 使用 LIST 命令、%fs magic 命令或 Databricks 公用程式來列出檔案。
請參閱探索儲存體並尋找資料檔案和探索資料庫物件。
檢閱資料評論
您可以查看評論,以了解 Lakehouse 中可用的資料集內容。 您可以在資料物件上設定批註,包括目錄、架構、資料表和數據行。 您可以在目錄瀏覽器中檢視註解,或使用對象的 DESCRIBE 指令。
目錄總管可為數據表提供 AI 產生的批注,讓數據資產擁有者輕鬆地提供豐富的數據集概觀。 請參閱 將 AI 產生的批註新增至 Unity Catalog 物件。
使用者也可以選擇性地使用 Markdown 為數據表和其他資料庫物件提供批注,這些批注將在目錄總管中呈現。 請參閱將註解新增至資料和 AI 資產。
搜尋 Lakehouse 中的數據表
您可以使用 Azure Databricks 中的搜尋列來尋找已註冊至 Unity 目錄的數據表。 您可以執行關鍵詞搜尋或使用語意搜尋來尋找與搜尋查詢相關的數據集或數據行。 搜尋只會傳回您有權查看之數據表的結果。 搜尋檢閱數據表名稱、數據行名稱、數據表批註和數據行批註。 請參閱搜尋工作區物件。