Sdílet prostřednictvím


Projekty kvality dat (DQS)

platí pro:SQL Server

Důležité

Služba DQS (Data Quality Services) se odebere v SQL Serveru 2025 (17.x). Stále podporujeme DQS v SQL Serveru 2022 (16.x) a starších verzích.

Projekt na kvalitu dat v systému Data Quality Services (DQS) je způsob použití znalostní báze ke zlepšení kvality zdrojových dat provedením čištění dat a shody dat, a následným exportem výsledných dat do databáze SQL Server nebo do souboru .csv. Projekt kvality dat můžete vytvořit jako čisticí projekt nebo odpovídající projekt pro provádění příslušných aktivit. Čištění a porovnávání projektů je možné spustit pomocí stejné znalostní báze, protože do stejné znalostní báze je možné integrovat znalosti pro čištění a párování dat.

Projekt kvality dat má následující výhody:

  • Umožňuje provádět čištění dat u zdrojových dat pomocí znalostí ve znalostní bázi DQS.

  • Umožňuje provádět porovnávání dat se zdrojovými daty pomocí odpovídajících zásad ve znalostní bázi.

  • Poskytuje průvodce, který vás provede čištěním a odpovídajícími aktivitami a exportuje data podle vašeho výběru do databáze SQL Serveru nebo do souboru .csv. Správce dat může pomocí projektu kvality dat spouštět a řídit kroky pro čištění a porovnávání dat s asistencí počítače nebo interaktivním čištěním a porovnávání dat.

Projekt kvality dat: Aktivita čištění

Projekt čištění kvality dat umožňuje vyčistit zdrojová data na základě znalostní báze. Aktivita čištění dat v DQS je dvoustupňový proces:

  1. Proces čištění dat s asistencí počítače , který analyzuje zdrojová data na základě znalostí znalostní báze, a navrhuje změny. Zpracovávaná data jsou kategorizována (navržená, nová, neplatná, opravená a správná) podle DQS a zobrazí se uživateli pro další zpracování.

  2. Interaktivní proces čištění, který správci dat umožňuje schválit, odmítnout nebo upravit data navržená procesem čištění dat s asistencí počítače.

Podrobné informace o aktivitě čištění v projektu kvality dat naleznete v tématu Čištění dat.

Projekt zaměřený na kvalitu dat: Porovnávací aktivita

Odpovídající projekt kvality dat umožňuje provádět odpovídající aktivity na základě odpovídajících zásad ve znalostní bázi, aby se zabránilo duplikaci dat identifikací přesných a přibližných shod, a tím vám umožní odebrat duplicitní data. Doporučuje se vyčistit data před jejich párováním. K tomu:

  1. Vytvořte projekt kvality dat, vyberte aktivitu Čištění , dokončete aktivitu čištění dat ve zdrojových datech a pak ji exportujte do tabulky v databázi SQL Serveru.

  2. Vytvořte jiný projekt kvality dat pomocí znalostní báze, která obsahuje odpovídající zásady, vyberte odpovídající aktivitu a pak na stránce Mapa vyberte databázi a tabulku, ve které jste exportovali vyčištěná data v kroku 1.

  3. Dokončete odpovídající aktivitu na vyčištěných datech.

Podrobné informace o odpovídající aktivitě v projektu kvality dat naleznete v tématu Porovnávání dat.

Profilace dat a oznámení

Při spouštění aktivit čištění a porovnávání v projektu zaměřeného na kvalitu dat můžete sledovat statistiky v reálném čase a informace o datech, která jsou zpracovávána DQS. Profilace dat vám pomůže vyhodnotit efektivitu procesů čištění a párování a případně určit rozsah, do kterého čištění nebo párování dat pomohlo zlepšit kvalitu dat. Profilace DQS poskytuje dvě dimenze kvality dat: úplnost (rozsah, v jakém jsou data přítomna) a přesnost (rozsah, v jakém lze data použít pro zamýšlené použití). Na základě informací o profilaci dat se navíc uživateli zobrazí oznámení o akcích, které je možné provést, aby se zlepšily operace čištění dat a párování dat. Podrobné informace o profilaci dat a oznámeních najdete v tématu Profilace dat a oznámení v DQS.

Popis úkolu Téma
Popisuje, jak vytvořit projekt kvality dat. Vytvoření projektu kvality dat
Popisuje, jak otevřít, odemknout, přejmenovat a odstranit projekt kvality dat. Otevření, odemknutí, přejmenování a odstranění projektu kvality dat
Popisuje, jak otevřít projekt integračních služeb v klientovi kvality dat. Otevření projektů služby integrace v klientu pro správu kvality dat

Viz také

DQS – znalostní báze a domény