Monitorování kvality a kvality dat
Každý datový produkt pracující na platformě Azure Operator Přehledy má integrovanou podporu monitorování kvality dat. Kvalita dat je důležitá, protože zajišťuje přesné, spolehlivé a důvěryhodné informace pro rozhodování. Brání nákladným chybám, vytváří důvěryhodnost zákazníků a regulačních orgánů a umožňuje přizpůsobené prostředí.
Operátor Azure Přehledy platformě monitoruje kvalitu dat, když se data ingestují do vstupního úložiště datového produktu (vstupní blok datového produktu na následujícím obrázku) a po zpracování a zpřístupnění dat zákazníkům (blok Výpočetní prostředky datového produktu na následujícím obrázku).
Rozměry kvality
Dimenze kvality dat jsou různé aspekty nebo charakteristiky, které definují kvalitu dat. Operátor Azure Přehledy podporuje následující dimenze:
- Přesnost – Odkazuje na to, jak dobře data odrážejí realitu, například správná jména, adresy a aktuální data. Vysoká přesnost dat umožňuje vytvářet analýzy, které můžou být důvěryhodné a vedou ke správnému rozhodování o vytváření sestav a jistoty.
- Úplnost – Označuje, zda jsou všechna data požadovaná pro konkrétní použití přítomná a dostupná k použití. Úplnost platí nejen na úrovni datové položky, ale také na úrovni záznamu. Úplnost pomáhá pochopit, jestli chybějící data ovlivní spolehlivost přehledů z dat.
- Jedinečnost – odkazuje na absence duplicit v datové sadě.
- Konzistence – Odkazuje na to, zda stejný datový prvek není v konfliktu mezi různými zdroji nebo v průběhu času. Konzistence zajišťuje jednotnost dat a je možné je porovnat napříč různými zdroji.
- Časová dostupnost – Označuje, jestli jsou data v případě potřeby aktuální a dostupná. Aktuálnost zajišťuje, aby data byla relevantní a užitečná pro rozhodování.
- Platnost – Odkazuje na to, zda jsou data v souladu s definovanou sadou pravidel nebo omezení.
Metriky
Všechny dimenze kvality dat jsou pokryty metrikami kvality vytvořenými operátorem Azure Přehledy platformou. Existují dva typy metrik kvality:
- Základní – standardní sada kontrol ve všech datových produktech.
- Vlastní – vlastní sada kontrol, která umožňuje všem datovým produktům implementovat kontroly specifické pro jejich produkt.
Základní metriky kvality vytvořené platformou jsou k dispozici v následující tabulce.
Metrika | Dimenze | Zdroj dat |
---|---|---|
Počet přijatých řádků | Včasnost | Požití |
Počet řádků obsahujících hodnotu null pro požadované sloupce | Úplnost | Požití |
Počet řádků, které selhaly při ověřování schématu | Platnost | Požití |
Počet odfiltrovaných řádků | Úplnost | Požití |
Počet zpracovaných řádků | Včasnost | Zpracováno jako |
Počet neúplných řádků, které neobsahují požadovaná data | Úplnost | Zpracováno jako |
Počet duplicitních řádků | Jedinečnost | Zpracováno jako |
Percentily pro celkovou prodlevu mezi generováním záznamů a dostupnými pro dotazování | Včasnost | Zpracováno jako |
Percentily pro prodlevu mezi generováním záznamů a ingestování do vstupního úložiště | Včasnost | Zpracováno jako |
Percentily pro prodlevu mezi přijatými a zpracovanými daty | Včasnost | Zpracováno jako |
Percentily pro prodlevu mezi zpracovanými a dostupnými daty pro dotazování | Včasnost | Zpracováno jako |
Věk pro materializovaná zobrazení | Včasnost | Zpracováno jako |
Metriky kvality vlastních dat se implementují na základě jednotlivých datových produktů. Tyto metriky pokrývají přesnost a dimenze konzistence. Dokumentace k datovému produktu obsahuje popis dostupných metrik vlastní kvality.
Sledování
Všechny datové produkty Přehled operátora Azure se nasazují s řídicím panelem zobrazujícím metriky kvality. Pomocí řídicího panelu můžete monitorovat kvalitu jejich dat.
Všechny metriky kvality dat se ukládají do tabulek ADX datového produktu. Ke zkoumání metrik kvality dat můžete použít standardní koncový bod KQL datového produktu a v případě potřeby řídicí panel rozšířit.
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro