分享方式:


數據品質和質量監視

在 Azure Operator Insights 平臺上運作的每個數據產品都有內建的數據品質監視支援。 數據品質非常重要,因為它可確保決策的準確、可靠且可信任的資訊。 它可防止成本高昂的錯誤、與客戶和監管機構建立信譽,並啟用個人化體驗。

當數據擷取至數據產品輸入記憶體時,Azure Operator Insights 平臺會監視數據品質(下圖中的數據產品輸入區塊),以及處理數據並提供給客戶使用之後(下圖中的數據產品計算區塊)。

適用於 Azure Operator Insights 的擷取代理程式和數據產品的圖表

品質維度

數據品質維度是定義數據品質的各種層面或特性。 Azure Operator Insights 支援下列維度:

  • 精確度 - 是指數據反映實境的方式,例如,正確的名稱、位址和最新的數據。 高數據精確度可讓您產生可信任的分析,並導致正確的報告和自信的決策。
  • 完整性 - 是指特定用途所需的所有數據是否存在且可供使用。 完整性不僅適用於數據項層級,也適用於記錄層級。 完整性有助於瞭解遺漏的數據是否會影響數據深入解析的可靠性。
  • 唯一性 - 是指數據集中沒有重複專案。
  • 一致性 - 是指相同的數據元素不會在不同來源或一段時間內發生衝突。 一致性可確保數據是統一的,而且可以跨不同來源進行比較。
  • 時程表 - 是指數據是否為最新狀態,並在需要時可供使用。 時間軸可確保數據與決策相關且有用。
  • 有效性 - 是指數據是否符合一組定義的規則或條件約束。

計量

所有數據品質維度都會由 Azure Operator Insights 平臺所產生的品質計量所涵蓋。 質量計量有兩種類型:

  • 基本 - 所有數據產品的標準檢查集。
  • 自訂 - 自定義檢查集,允許所有數據產品實作其產品專屬的檢查。

下表提供平臺所產生的基本品質計量。

計量 維度 資料來源
擷取的數據列數目 及時 攝入
包含必要數據行 Null 的數據列數目 完整性 攝入
針對架構驗證的數據列數目失敗 有效期 攝入
篩選出的數據列數目 完整性 攝入
已處理的數據列數目 及時 已處理
未包含必要數據的數據列數目 完整性 已處理
重複的數據列數目 唯一性 已處理
記錄產生和可供查詢的整體延遲百分位數 及時 已處理
記錄產生和擷取到輸入記憶體之間的延遲百分位數 及時 已處理
擷取和處理數據之間的延遲百分位數 及時 已處理
處理的數據與可供查詢的數據延遲百分位數 及時 已處理
具體化檢視的年齡 及時 已處理

自訂數據品質計量會根據每個數據產品實作。 這些計量涵蓋精確度和一致性維度。 數據產品檔包含可用自定義品質計量的描述。

監視

所有 Azure Operator Insight 數據產品都會以儀錶板來部署,其中顯示品質計量。 您可以使用儀錶板來監視其數據的品質。

所有數據品質計量都會儲存至 Data Product ADX 數據表。 若要探索數據品質計量,您可以使用標準 Data Product KQL 端點,然後視需要擴充儀錶板。