資料譜系
資料譜系在雲端級分析中扮演重要的角色。 譜系顯示原始資料與成品之間的依賴關係,描述將原始資料轉換為最終資料產品的轉換與處理過程。 資料譜系涵蓋資料的生命週期,從其起源到其在資料產業中的移動。 可用於疑難排解、根本原因分析、資料品質分析、合規性和影響分析。 還可為資料集和產品增加情境,讓資料產品有可發現性和自助性。
任何資料目錄的首要條件是能夠顯示資料產品之間的譜系。
Microsoft Purview 資料目錄可連結各種資料處理、儲存和分析系統,以擷取譜系資訊。 該目標是要呈現每個資料系統的移動、轉換和作業中繼資料。
建議使用 Azure Data Factory、Azure Synapse 管線作為擷取解決方案,因為可在 Microsoft Purview 中啟用資料譜系。 替代的擷取模式應使用 Apache Atlas API 來更新資料譜系,作為其資料處理程序的一部分。
Microsoft Fabric 不需要 Microsoft Purview 即可支援譜系。 如果您需要在一個地方檢視資料譜系,我們建議將 Microsoft Purview 設定為掃描 Microsoft Fabric 租用戶,因為這將自動從 Fabric 項目 (包括 Power BI) 將中繼資料和沿革帶入 Microsoft Purview 資料目錄。 如需更多資訊,請參閱 Fabric 中的譜系以及如何從 Microsoft Fabric 項目取得譜系到 Microsoft Purview。
提示
如需支援系統和最佳實作的更多資訊,請參閱 Microsoft Purview 中的資料譜系。
下一步
了解如何在 Azure 中管理主資料。