Monitorowanie jakości i jakości danych
Każdy produkt danych pracujący nad platformą Azure Operator Szczegółowe informacje ma wbudowaną obsługę monitorowania jakości danych. Jakość danych ma kluczowe znaczenie, ponieważ zapewnia dokładne, niezawodne i wiarygodne informacje na potrzeby podejmowania decyzji. Zapobiega to kosztownym błędom, buduje wiarygodność z klientami i organami regulacyjnymi oraz umożliwia spersonalizowane środowiska.
Platforma Azure Operator Szczegółowe informacje monitoruje jakość danych, gdy dane są pozyskiwane do magazynu danych wejściowych produktu (blok Dane wejściowe produktu na poniższej ilustracji) oraz po przetworzeniu i udostępnieniu danych klientom (blok Obliczenia produktu danych na poniższej ilustracji).
Wymiary jakości
Wymiary jakości danych to różne aspekty lub cechy definiujące jakość danych. Operator platformy Azure Szczegółowe informacje obsługuje następujące wymiary:
- Dokładność — odnosi się do tego, jak dobrze dane odzwierciedlają rzeczywistość, na przykład poprawne nazwy, adresy i aktualne dane. Wysoka dokładność danych umożliwia tworzenie analiz, które mogą być zaufane i prowadzi do poprawnego raportowania i pewności podejmowania decyzji.
- Kompletność — określa, czy wszystkie dane wymagane do określonego użycia są obecne i dostępne do użycia. Kompletność ma zastosowanie nie tylko na poziomie elementu danych, ale także na poziomie rekordu. Kompletność pomaga zrozumieć, czy brakujące dane wpłyną na niezawodność szczegółowych informacji z danych.
- Unikatowość — odnosi się do braku duplikatów w zestawie danych.
- Spójność — odnosi się do tego, czy ten sam element danych nie powoduje konfliktu między różnymi źródłami lub w czasie. Spójność gwarantuje, że dane są jednolite i można je porównać w różnych źródłach.
- Osie czasu — określa, czy dane są aktualne i dostępne w razie potrzeby. Terminy zapewniają, że dane są istotne i przydatne do podejmowania decyzji.
- Ważność — określa, czy dane są zgodne ze zdefiniowanym zestawem reguł lub ograniczeń.
Metryki
Wszystkie wymiary jakości danych są objęte metrykami jakości utworzonymi przez platformę Azure Operator Szczegółowe informacje. Istnieją dwa typy metryk jakości:
- Podstawowy — standardowy zestaw kontroli we wszystkich produktach danych.
- Niestandardowy — niestandardowy zestaw testów, dzięki któremu wszystkie produkty danych mogą implementować kontrole specyficzne dla ich produktu.
Podstawowe metryki jakości tworzone przez platformę są dostępne w poniższej tabeli.
Metryka | Wymiar | Źródło danych |
---|---|---|
Liczba pozyskanych wierszy | Terminowość | Spożycia |
Liczba wierszy zawierających wartość null dla wymaganych kolumn | Kompletności | Spożycia |
Sprawdzanie poprawności wierszy zakończonych niepowodzeniem względem schematu | Poprawność | Spożycia |
Liczba odfiltrowanych wierszy | Kompletności | Spożycia |
Liczba przetworzonych wierszy | Terminowość | Przetworzone |
Liczba niekompletnych wierszy, które nie zawierają wymaganych danych | Kompletności | Przetworzone |
Liczba zduplikowanych wierszy | Unikatowość | Przetworzone |
Percentyle dla ogólnego opóźnienia między generowaniem rekordów i dostępnymi do wykonywania zapytań | Terminowość | Przetworzone |
Percentyle dla opóźnienia między generowaniem rekordu a pozyskiwaniem do magazynu wejściowego | Terminowość | Przetworzone |
Percentyle dla opóźnienia między pozyskanych i przetworzonych danych | Terminowość | Przetworzone |
Percentyle dla opóźnienia między przetworzonymi danymi i dostępnymi do wykonywania zapytań | Terminowość | Przetworzone |
Wiek zmaterializowanych widoków | Terminowość | Przetworzone |
Niestandardowe metryki jakości danych są implementowane dla poszczególnych produktów danych. Te metryki obejmują wymiary dokładności i spójności. Dokumentacja produktu data zawiera opis dostępnych niestandardowych metryk jakości.
Monitorowanie
Wszystkie produkty danych usługi Azure Operator Insight są wdrażane z pulpitem nawigacyjnym przedstawiającym metryki jakości. Pulpit nawigacyjny służy do monitorowania jakości danych.
Wszystkie metryki jakości danych są zapisywane w tabelach Data Product ADX. W celu eksplorowania metryk jakości danych można użyć standardowego punktu końcowego KQL produktu danych, a następnie rozszerzyć pulpit nawigacyjny w razie potrzeby.
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla