Bewaking van gegevenskwaliteit en -kwaliteit
Elk gegevensproduct dat op het Azure Operator Insights-platform werkt, biedt ingebouwde ondersteuning voor bewaking van gegevenskwaliteit. Gegevenskwaliteit is cruciaal omdat deze zorgt voor nauwkeurige, betrouwbare en betrouwbare informatie voor besluitvorming. Het voorkomt kostbare fouten, bouwt geloofwaardigheid op met klanten en toezichthouders en maakt persoonlijke ervaringen mogelijk.
Het Azure Operator Insights-platform bewaakt de gegevenskwaliteit wanneer gegevens worden opgenomen in de invoeropslag van gegevensproducten (het invoerblok Voor gegevensproduct in de volgende afbeelding) en nadat de gegevens zijn verwerkt en beschikbaar zijn voor klanten (het blok Data Product Compute in de volgende afbeelding).
Kwaliteitsdimensies
Dimensies voor gegevenskwaliteit zijn de verschillende aspecten of kenmerken die de kwaliteit van gegevens definiëren. Azure Operator Insights biedt ondersteuning voor de volgende dimensies:
- Nauwkeurigheid: verwijst naar hoe goed de gegevens de realiteit weerspiegelen, bijvoorbeeld de juiste namen, adressen en actuele gegevens. Met hoge gegevensnauwkeurigheid kunt u analyses produceren die vertrouwd kunnen worden en leiden tot een juiste rapportage en betrouwbare besluitvorming.
- Volledigheid: verwijst naar of alle gegevens die vereist zijn voor een bepaald gebruik aanwezig zijn en beschikbaar zijn om te worden gebruikt. Volledigheid is niet alleen van toepassing op gegevensitemniveau, maar ook op recordniveau. Volledigheid helpt te begrijpen of ontbrekende gegevens van invloed zijn op de betrouwbaarheid van inzichten uit de gegevens.
- Uniekheid: verwijst naar het ontbreken van duplicaten in een gegevensset.
- Consistentie: verwijst naar of hetzelfde gegevenselement niet conflicteert tussen verschillende bronnen of in de loop van de tijd. Consistentie zorgt ervoor dat gegevens uniform zijn en kunnen worden vergeleken in verschillende bronnen.
- Tijdigheid: verwijst naar of de gegevens up-to-date en beschikbaar zijn wanneer dat nodig is. Tijdigheid zorgt ervoor dat gegevens relevant en nuttig zijn voor besluitvorming.
- Geldigheid: verwijst naar of de gegevens voldoen aan een gedefinieerde set regels of beperkingen.
Metrische gegevens voor
Alle dimensies voor gegevenskwaliteit worden gedekt door metrische kwaliteitsgegevens die worden geproduceerd door het Azure Operator Insights-platform. Er zijn twee typen metrische gegevens over kwaliteit:
- Basic - Standaardset controles voor alle gegevensproducten.
- Aangepast: aangepaste set controles, zodat alle gegevensproducten controles kunnen implementeren die specifiek zijn voor hun product.
De metrische basiskwaliteitsgegevens die door het platform worden geproduceerd, zijn beschikbaar in de volgende tabel.
Metrische gegevens | Dimensie | Gegevensbron |
---|---|---|
Aantal opgenomen rijen | Tijdigheid | Ingenomen |
Aantal rijen met null voor vereiste kolommen | Volledigheid | Ingenomen |
Het aantal rijen dat is gevalideerd op schema | Geldigheid | Ingenomen |
Aantal gefilterde rijen | Volledigheid | Ingenomen |
Aantal verwerkte rijen | Tijdigheid | Verwerkt |
Aantal onvolledige rijen, die geen vereiste gegevens bevatten | Volledigheid | Verwerkt |
Aantal gedupliceerde rijen | Uniciteit | Verwerkt |
Percentielen voor de algehele vertraging tussen het genereren van records en beschikbaar voor het uitvoeren van query's | Tijdigheid | Verwerkt |
Percentielen voor vertraging tussen het genereren van records en opgenomen in invoeropslag | Tijdigheid | Verwerkt |
Percentielen voor vertraging tussen opgenomen en verwerkte gegevens | Tijdigheid | Verwerkt |
Percentielen voor vertraging tussen verwerkte gegevens en beschikbaar voor het uitvoeren van query's | Tijdigheid | Verwerkt |
Leeftijden voor gerealiseerde weergaven | Tijdigheid | Verwerkt |
De metrische gegevens van de aangepaste gegevenskwaliteit worden per gegevensproduct geïmplementeerd. Deze metrische gegevens hebben betrekking op de nauwkeurigheid en consistentiedimensies. Documentatie voor gegevensproduct bevat een beschrijving voor de beschikbare metrische gegevens van aangepaste kwaliteit.
Controleren
Alle Azure Operator Insight-gegevensproducten worden geïmplementeerd met een dashboard met metrische gegevens over kwaliteit. U kunt het dashboard gebruiken om de kwaliteit van hun gegevens te bewaken.
Alle metrische gegevens over gegevenskwaliteit worden opgeslagen in de ADX-tabellen van Het gegevensproduct. Voor het verkennen van de metrische gegevens van de gegevenskwaliteit kunt u het standaard KQL-eindpunt voor gegevensproduct gebruiken en het dashboard zo nodig uitbreiden.
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor