分享方式:


Data Lakehouse 的數據和 AI 治理

數據和 AI 治理要素的架構原則涵蓋如何集中管理資產和存取。

Databricks 的數據控管 Lakehouse 架構圖表。

數據和 AI 治理的原則

  1. 整合數據和 AI 管理

    數據和 AI 管理是執行數據和 AI 治理策略的基礎。 它牽涉到受信任數據資產的集合、整合、組織和持續性,以協助組織發揮其最大價值。 統一目錄會集中且一致地儲存所有數據和分析成品,以及與每個數據對象相關聯的元數據。 它可讓使用者探索可用的數據集,並藉由追蹤所有數據資產的譜系來提供源度可見度。

  2. 整合數據和 AI 安全性

    有效的數據安全性治理有兩個原則:瞭解誰可以存取哪些數據,以及最近存取哪些數據資產的人員。 此資訊對於受管制產業幾乎所有的合規性需求而言都很重要,對於任何安全性治理計劃而言都是基本的。 使用統一的數據安全性系統,許可權模型可以集中且一致地管理所有數據資產。 數據存取會以警示和監視功能進行集中稽核,以提升責任。

  3. 建立數據質量標準

    數據品質是從數據衍生精確且有意義的深入解析的基礎。 數據質量有許多維度,包括完整性、精確度、有效性和一致性。 必須主動管理,才能改善最終數據集的品質,讓數據成為商務使用者可靠且值得信任的資訊。

下一步:數據控管的最佳做法

請參閱 數據和 AI 治理的最佳做法。