Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of mappen te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen om mappen te wijzigen.
Van toepassing op:SQL Server
Belangrijk
DQS (Data Quality Services) wordt verwijderd in SQL Server 2025 (17.x). We blijven DQS ondersteunen in SQL Server 2022 (16.x) en eerdere versies.
Gegevensprofilering in DQS (Data Quality Services) is het proces van het analyseren van de gegevens in een bestaande gegevensbron en het weergeven van statistieken over de gegevens in DQS-activiteiten. Het biedt u geautomatiseerde metingen van gegevenskwaliteit. DQS-profilering is geïntegreerd in DQS-projecten voor kennisbeheer en gegevenskwaliteit. Het is dynamisch en aanpasbaar. Profilering heeft twee belangrijke doelen: eerst om u te begeleiden door processen voor gegevenskwaliteit en om uw beslissingen te ondersteunen, en ten tweede om de effectiviteit van de processen te beoordelen. Het DQS-profileringsproces heeft de volgende voordelen:
Profilering biedt inzicht in de kwaliteit van uw brongegevens en helpt u bij het identificeren van problemen met de kwaliteit van gegevens.
Profilering beoordeelt de effectiviteit van processen voor gegevenskwaliteit, begeleidt u bij uw kennisdetectie, het opschonen van gegevens, het overeenkomende beleid en het overeenkomende werk.
Profilering biedt u de meest relevante informatie op het meest relevante moment.
Het profileringsproces genereert meldingen die belangrijke statistieken of gebeurtenissen benadrukken die actie kunnen verdienen. In veel gevallen geven DQS-meldingen een voorwaarde aan en raden u de actie aan die u kunt ondernemen om die voorwaarde te verhelpen.
Met profilering kunt u Data Quality Services niet alleen gebruiken voor kennisdetectie, opschoning en matching, maar ook als analysehulpprogramma. U kunt één knowledge base maken voor analyse en kennisdetectie uitvoeren met behulp van die knowledge base om te bepalen op basis van de profileringsstatistieken of de knowledge base voldoet aan uw detectie-, opschonings- en overeenkomende behoeften.
Hoe profilering werkt
Profilering meet niet de kwaliteit van de knowledge base. Het meet de kwaliteit van de brongegevens. Profilering biedt statistieken die aangeven wat het effect is van de specifieke bewerking die u uitvoert in kennisbeheer of een project voor gegevenskwaliteit op uw brongegevens. Profilering bevindt zich altijd in de context van de specifieke activiteit die u uitvoert. U kunt op het tabblad Profilering in een scherm klikken om profileringsgegevens weer te geven zonder de fase van de activiteit die u uitvoert te verlaten. De profileringstabel wordt in realtime ingevuld terwijl het proces wordt uitgevoerd, zodat u taken voor gegevenskwaliteit kunt beoordelen terwijl u ze uitvoert. U kunt bepalen of brongegevens beter zijn na het opschonen of de-duplicatie, en in welke mate.
Alle profileringsnummers verwijzen naar het aantal weergaven van een waarde en verwijzen in veel gevallen naar het percentage van het totaal, met uitzondering van metrische gegevens over uniekheid. Metrische gegevens over uniekheid verwijzen naar het absolute aantal waarden, ongeacht het aantal weergaven van deze waarden.
Profilering maakt deel uit van de kennisgestuurde DQS-oplossing. Het biedt informatie over een kennisbank, matching of het opschonen van gegevens op basis van de toewijzing van gegevensbronvelden aan domeinen van de kennisbank. U profileert pas nadat de kaart is voltooid; er vindt geen profilering plaats tijdens de kaartenfase van een activiteit. Profilering wordt altijd gekoppeld aan een activiteit. Het profileringsproces wordt uitgevoerd op de gegevens die zijn toegewezen aan domeinen, niet op de gegevens in de domeinen. Het is geïntegreerd in de volgende stappen van activiteiten:
De stappen Ontdekken en Beheren van domeinwaarden van de activiteit Kennisdetectie
De Opschonen en Beheren en bekijken van resultaten stappen van de activiteit Opschonen
De stappen Overeenkomend beleid en Overeenkomende resultaten van de activiteit Overeenkomend beleid
De stappen voor vergelijken en exporteren van de overeenkomende activiteit
DQS biedt geen profileringsstatistieken voor de activiteit Domeinbeheer.
Profileringsgegevens per activiteit
DQS-profilering maakt gebruik van standaardgegevenskwaliteitsdimensies om de kwaliteit van de gegevens weer te geven: volledigheid (de mate waarin gegevens aanwezig zijn), nauwkeurigheid (de mate waarin gegevens kunnen worden gebruikt voor het beoogde gebruik) en uniekheid (de mate waarin verschillende waarden verschillende entiteiten vertegenwoordigen). Null- en lege waarden worden standaard als ontbrekend beschouwd of verlagen het volledigheidspercentage; U kunt echter ook andere waarden definiëren die null-equivalent zijn. In dat geval worden ze ook als ontbrekend beschouwd.
Profilering biedt u de statistieken die u nodig hebt om uw processen te evalueren, maar u moet de statistieken interpreteren. U kunt zien wat profilering u vertelt door naar de kolom statistieken per kolom te kijken.
De DQS-activiteiten hebben als volgt verschillende sets profileringsstatistieken:
Alleen de opschoningsactiviteit heeft profileringsstatistieken voor nauwkeurigheid (in procent per domein). Nauwkeurigheid wordt beïnvloed door geldigheid, consistentie, syntaxisfouten en domeinregels.
Alleen de Cleansing-activiteit bevat profileringsstatistieken voor de juiste, gecorrigeerde en voorgestelde waarden in de bron, en gecorrigeerde en voorgestelde waarden per domein (zowel aantal als percentage).
De activiteiten voor opschonen en kennisdetectie hebben profileringsstatistieken voor geldigheid (Opschonen per record, Kennisdetectie per record en domein). Het overeenkomende beleid en overeenkomende activiteiten hebben geen statistieken voor geldigheid.
De opschoningsactiviteit heeft geen profileringsstatistieken voor uniekheid. De activiteiten Knowledge Discovery, Matching Policy en Matching hebben profileringsstatistieken voor uniekheid in aantal en percentage voor de bron en per domein.
Zie de secties Profilering in de volgende artikelen voor meer informatie over de specifieke profileringsstatistieken die betrekking hebben op een activiteit:
Profileringsgegevens in activiteitenbewaking
Profileringsinformatie voor de activiteiten kennisdetectie, matchingsbeleid, matching en opschoning is niet alleen beschikbaar op de activiteitenpagina's in de client voor gegevenskwaliteit, maar ook in activiteitenbewaking. Activiteitenbewaking biedt een overzicht van huidige en eerdere activiteiten. Naast de eigenschappen en gerelateerde rekenprocessen van activiteiten kunt u de profileringsgegevens bekijken die voor elke activiteit op één locatie zijn gegenereerd. U selecteert een activiteit in de activiteitentabel om profileringsresultaten weer te geven in een onderstaande tabel. U kunt ook de profileringsresultaten exporteren. Zie DQS-beheer voor meer informatie.
Meldingen
Naast het verzamelen en weergeven van belangrijke statistieken en metrische gegevens via profilering, genereert DQS meldingen (indien ingeschakeld) om aan te geven wanneer u mogelijk een actie wilt ondernemen op basis van de weergegeven profileringsstatistieken. DQS gebruikt meldingen om belangrijke feiten over de gegevensbron te benadrukken en om de effectiviteit van de huidige activiteit weer te geven in vergelijking met het doel waarvoor deze is uitgevoerd. Meldingen bieden tips en aanbevelingen die wijzen op een voorwaarde en aanbevelen hoe u een kennisdetectie, gegevensopschoning of gegevenskoppelingsactiviteit kunt verbeteren.
Een DQS-melding wordt gebruikt om een probleem op te stellen dat mogelijk interessant voor u is of om een mogelijk probleem op te lossen. Of u op de melding reageert, is afhankelijk van of deze relevant is voor uw doeleinden. Stel dat DQS een melding plaatst wanneer het opschonen van gegevens geen gecorrigeerde waarden of voorgestelde waarden produceert, terwijl volledigheid en nauwkeurigheid beide 100%zijn. Deze melding geeft aan dat de activiteit mogelijk niet hoeft te worden uitgevoerd. Of u ervoor kiest om de activiteit uit te voeren, is echter uw beslissing.
Een melding wordt aangegeven met een knopinfo met een uitroepteken op het tabblad Profilering . Statistieken die aan de melding zijn gekoppeld, zijn rood gekleurd om de statistische reden voor de melding aan te geven.
U kunt meldingen inschakelen (de standaardinstelling) of uitschakelen op het tabblad Algemene instellingen van de sectie Beheer van de startpagina van de Data Quality Client. Wanneer de melding is uitgeschakeld, worden knopinfo niet weergegeven en worden statistieken niet rood gekleurd. Er is geen aanzienlijke verbetering in de prestaties door meldingen uit te schakelen. Profilering is nog steeds operationeel als u meldingen uitschakelt.
Zie de volgende artikelen voor specifieke voorwaarden die zijn gekoppeld aan meldingen voor een activiteit:
Gerelateerde taken
| Taakbeschrijving | Artikel |
|---|---|
| Hierin wordt beschreven hoe u meldingen kunt in- of uitschakelen in DQS. | Profileringsmeldingen in- of uitschakelen in DQS |