Share via


Adatminőség és minőségfigyelés

Az Azure Operator Elemzések platformon dolgozó összes adattermék beépített támogatást nyújt az adatminőség-monitorozáshoz. Az adatminőség kulcsfontosságú, mert pontos, megbízható és megbízható információkat biztosít a döntéshozatalhoz. Megakadályozza a költséges hibákat, hitelességet épít ki az ügyfelekkel és a szabályozókkal, és személyre szabott élményt tesz lehetővé.

Az Azure Operator Elemzések platform figyeli az adatminőséget, amikor az adatokat adattermék bemeneti tárolójába (az alábbi képen az első AOI-adattermék-tárolóblokkba) betöltik, és az adatok feldolgozását és az ügyfelek számára elérhetővé teszik (az AOI-adattermék-számítást a következő képen).

Az Azure Operator Elemzések betöltési ügynökeinek és adattermékeinek diagramja

Minőségi dimenziók

Az adatminőségi dimenziók az adatok minőségét meghatározó különböző szempontok vagy jellemzők. Az Azure Operator Elemzések a következő dimenziókat támogatja:

  • Pontosság – Azt jelzi, hogy az adatok mennyire tükrözik a valóságot, például helyes neveket, címeket és naprakész adatokat. A nagy adatpontosság lehetővé teszi olyan elemzések készítését, amelyek megbízhatóak, és megfelelő jelentéskészítéshez és magabiztos döntéshozatalhoz vezetnek.
  • Teljesség – Azt jelzi, hogy az adott felhasználáshoz szükséges összes adat jelen van-e, és elérhető-e a felhasználáshoz. A teljesség nem csak az adatelem szintjén, hanem a rekord szintjén is érvényes. A teljesség segít megérteni, hogy a hiányzó adatok befolyásolják-e az adatokból származó megállapítások megbízhatóságát.
  • Egyediség – Az adathalmazban lévő ismétlődések hiányára utal.
  • Konzisztencia – Azt jelzi, hogy ugyanaz az adatelem nem ütközik-e különböző források között vagy idővel. A konzisztencia biztosítja, hogy az adatok egységesek legyenek, és különböző forrásokban összehasonlíthatók legyenek.
  • Idősorok – Azt jelzi, hogy az adatok naprakészek-e, és szükség esetén elérhetők-e. Az ütemtervek biztosítják, hogy az adatok relevánsak és hasznosak a döntéshozatalhoz.
  • Érvényesség – Azt jelzi, hogy az adatok megfelelnek-e egy meghatározott szabálykészletnek vagy korlátozásnak.

Mérőszámok

Minden adatminőségi dimenziót az Azure Operator Elemzések platform által előállított minőségi metrikák fednek le. A minőségi metrikáknak két típusa van:

  • Alapszintű – Standard ellenőrzési készlet az összes adattermékre vonatkozóan.
  • Egyéni – Egyéni ellenőrzőkészlet, amely lehetővé teszi, hogy minden adattermék a termékére jellemző ellenőrzéseket implementáljon.

A platform által előállított alapvető minőségi metrikák az alábbi táblázatban érhetők el.

Metrika Dimenzió Adatforrás
Betöltési sorok száma Időszerűség Lenyelik
A kötelező oszlopokhoz null értéket tartalmazó sorok száma Teljességét Lenyelik
A sémán alapuló sikertelen érvényesítés során meghiúsult sorok száma Érvényességét Lenyelik
Szűrt sorok száma Teljességét Lenyelik
Feldolgozott sorok száma Időszerűség Feldolgozva
Hiányos sorok száma, amelyek nem tartalmaznak kötelező adatokat Teljességét Feldolgozva
Duplikált sorok száma Egyediség Feldolgozva
Percentilisek a rekordlétrehozás és a lekérdezések közötti általános késéshez Időszerűség Feldolgozva
Percentilisek a rekordlétrehozás és a bemeneti tárolóba való betöltés közötti késéshez Időszerűség Feldolgozva
Percentilisek a betöltött és feldolgozott adatok közötti késéshez Időszerűség Feldolgozva
Percentilisek a feldolgozott és a lekérdezéshez elérhető adatok közötti késéshez Időszerűség Feldolgozva
Korok a materializált nézetekhez Időszerűség Feldolgozva

Az egyéni adatminőségi metrikák adattermékenként vannak implementálva. Ezek a metrikák a pontosság és a konzisztencia dimenzióit fedik le. A Data Product dokumentációja az elérhető egyéni minőségi metrikák leírását tartalmazza.

Figyelés

Minden Azure Operator Insight-adattermék üzembe helyezése egy minőségi metrikákat megjelenítő irányítópulttal. Az irányítópult használatával monitorozhatja az adataik minőségét.

A rendszer minden adatminőségi metrikát a Data Product ADX-táblákba ment. Az adatminőségi metrikák feltárásához használhatja a standard data product KQL-végpontot, majd szükség esetén kibővítheti az irányítópultot.