數據品質和質量監視
在 Azure Operator Insights 平臺上運作的每個數據產品都有內建的數據品質監視支援。 數據品質非常重要,因為它可確保決策的準確、可靠且可信任的資訊。 它可防止成本高昂的錯誤、與客戶和監管機構建立信譽,並啟用個人化體驗。
當數據擷取至數據產品輸入記憶體時,Azure Operator Insights 平臺會監視數據品質(下圖中的數據產品輸入區塊),以及處理數據並提供給客戶使用之後(下圖中的數據產品計算區塊)。
品質維度
數據品質維度是定義數據品質的各種層面或特性。 Azure Operator Insights 支援下列維度:
- 精確度 - 是指數據反映實境的方式,例如,正確的名稱、位址和最新的數據。 高數據精確度可讓您產生可信任的分析,並導致正確的報告和自信的決策。
- 完整性 - 是指特定用途所需的所有數據是否存在且可供使用。 完整性不僅適用於數據項層級,也適用於記錄層級。 完整性有助於瞭解遺漏的數據是否會影響數據深入解析的可靠性。
- 唯一性 - 是指數據集中沒有重複專案。
- 一致性 - 是指相同的數據元素不會在不同來源或一段時間內發生衝突。 一致性可確保數據是統一的,而且可以跨不同來源進行比較。
- 時程表 - 是指數據是否為最新狀態,並在需要時可供使用。 時間軸可確保數據與決策相關且有用。
- 有效性 - 是指數據是否符合一組定義的規則或條件約束。
計量
所有數據品質維度都會由 Azure Operator Insights 平臺所產生的品質計量所涵蓋。 質量計量有兩種類型:
- 基本 - 所有數據產品的標準檢查集。
- 自訂 - 自定義檢查集,允許所有數據產品實作其產品專屬的檢查。
下表提供平臺所產生的基本品質計量。
計量 | 維度 | 資料來源 |
---|---|---|
擷取的數據列數目 | 及時 | 攝入 |
包含必要數據行 Null 的數據列數目 | 完整性 | 攝入 |
針對架構驗證的數據列數目失敗 | 有效期 | 攝入 |
篩選出的數據列數目 | 完整性 | 攝入 |
已處理的數據列數目 | 及時 | 已處理 |
未包含必要數據的數據列數目 | 完整性 | 已處理 |
重複的數據列數目 | 唯一性 | 已處理 |
記錄產生和可供查詢的整體延遲百分位數 | 及時 | 已處理 |
記錄產生和擷取到輸入記憶體之間的延遲百分位數 | 及時 | 已處理 |
擷取和處理數據之間的延遲百分位數 | 及時 | 已處理 |
處理的數據與可供查詢的數據延遲百分位數 | 及時 | 已處理 |
具體化檢視的年齡 | 及時 | 已處理 |
自訂數據品質計量會根據每個數據產品實作。 這些計量涵蓋精確度和一致性維度。 數據產品檔包含可用自定義品質計量的描述。
監視
所有 Azure Operator Insight 數據產品都會以儀錶板來部署,其中顯示品質計量。 您可以使用儀錶板來監視其數據的品質。
所有數據品質計量都會儲存至 Data Product ADX 數據表。 若要探索數據品質計量,您可以使用標準 Data Product KQL 端點,然後視需要擴充儀錶板。
意見反映
https://aka.ms/ContentUserFeedback。
即將推出:我們會在 2024 年淘汰 GitHub 問題,並以全新的意見反應系統取代並作為內容意見反應的渠道。 如需更多資訊,請參閱:提交及檢視以下的意見反映: