在 Azure 資料目錄 中註冊數據源

重要

Azure 資料目錄 將於 2024 年 5 月 15 日淘汰。

無法再建立新的 Azure 資料目錄 帳戶。

針對數據目錄功能,請使用 Microsoft Purview 服務,此服務會為您的整個數據資產提供統一的數據控管。

如果您已經使用 Azure 資料目錄,您必須為組織建立移轉計劃,以在 2024 年 5 月 15 日前移至 Microsoft Purview

簡介

Azure 資料目錄 是完全受控的雲端服務,可作為企業數據源的註冊和探索系統。 換句話說,資料目錄 可協助人們探索、瞭解和使用數據源,並協助組織從其現有數據取得更多價值。 透過 資料目錄 探索數據源的第一個步驟是註冊該數據源。

註冊資料來源

註冊是從數據源擷取元數據,並將該數據複製到 資料目錄 服務的程式。 數據會保留在目前所在的位置,而且會維持在目前系統的系統管理員和原則的控制之下。

若要註冊數據源,請遵循下列步驟:

  1. 在 Azure 資料目錄 入口網站中,啟動 資料目錄 數據源註冊工具。
  2. 使用您用來登入入口網站的相同 Microsoft Entra 認證,使用您的公司或學校帳戶登入。
  3. 選取您要註冊的數據源。

註冊數據源之後,目錄會追蹤其位置,並編製其元數據的索引。 使用者可以搜尋、流覽及探索數據源,然後使用其位置,透過選擇的應用程式或工具來連線到數據源。

支援的資料來源

如需目前支持的數據源清單,請參閱 資料目錄 DSR

結構元數據

當您註冊數據源時,註冊工具會擷取您所選取對象結構的相關信息。 這項資訊稱為結構化元數據。

對於所有對象,這個結構化元數據會包含物件的位置,讓探索數據的使用者可以使用該資訊,在他們所選擇的用戶端工具中連接到物件。 其他結構化元數據包括物件名稱和類型,以及屬性/資料行名稱和數據類型。

描述性元數據

除了從數據源擷取的核心結構元數據之外,數據源註冊工具也會擷取描述性元數據。 針對 SQL Server Analysis Services 和 SQL Server Reporting Services,此元數據取自這些服務所公開的描述屬性。 針對 SQL Server,會擷取使用 ms_description 擴充屬性提供的值。 針對 Oracle 資料庫,數據源註冊工具會從ALL_TAB_COMMENTS檢視擷取 COMMENTS 數據行。

除了從數據源擷取的描述性元數據之外,使用者也可以使用數據源註冊工具輸入描述性元數據。 用戶可以新增標記,而且他們可以識別所註冊對象的專家。 所有這些描述性元數據都會與結構元數據一起複製到 資料目錄 服務。

包含預覽

根據預設,只有元數據會從數據源擷取並複製到 資料目錄 服務,但是當您檢視包含之數據的範例時,通常更容易了解數據源。

您可以使用 資料目錄 數據源註冊工具,在每個數據表和檢視中包含數據的快照預覽。 如果您選擇在註冊期間包含預覽,註冊工具會包含每個數據表和檢視中的最多 20 筆記錄。 接著,此快照集會連同結構和描述性元數據一起複製到目錄。

注意

包含大量數據行的寬數據表,其預覽中可能包含少於 20 筆記錄。

包含數據配置檔

與包含預覽一樣,可為搜尋 資料目錄 中數據源的使用者提供寶貴的內容,包括數據配置檔,可讓您更輕鬆地瞭解探索到的數據源。

藉由使用 資料目錄 數據源註冊工具,您可以為每個已註冊的數據表和檢視包含數據設定檔。 如果您選擇在註冊期間包含資料設定檔,註冊工具會包含每個數據表和檢視中數據的匯總統計數據,包括:

  • 對象中的數據列數和大小。
  • 最新數據更新和物件架構的日期。
  • 數據行的 Null 記錄數目和相異值。
  • 數據行的最小值、最大值、平均值和標準偏差值。

這些統計數據接著會連同結構和描述性元數據一起複製到目錄。

注意

文字和日期數據行不包含其數據配置檔中的平均值或標準偏差統計數據。

更新註冊

當您在註冊期間使用擷取的元數據和選擇性預覽時,註冊數據源可在 資料目錄 中探索。 如果需要在目錄中更新數據來源(例如,如果對象的架構已變更,原本排除的數據表應該包含,或者您想要更新預覽中包含的數據),則可以重新執行數據源註冊工具。

重新註冊已註冊的數據源會執行合併「upsert」作業:現有的物件會更新,並建立新的物件。 用戶透過 資料目錄 入口網站提供的任何元數據都會保留。

摘要

因為它會將結構化和描述性元數據從數據源複製到目錄服務,所以在 資料目錄 中註冊數據源可讓數據更容易探索和瞭解。 註冊數據源之後,您可以使用 資料目錄 入口網站來標註、管理及探索數據源。