Condividi tramite


Progetti sulla qualità dei dati (DQS)

Si applica a: SQL Server

Un progetto di qualità dei dati in (DQS) consiste nell'utilizzo di una Knowledge Base per migliorare la qualità dei dati di origine eseguendo attività di pulizia dei dati e di individuazione di corrispondenze tra dati ed esportando quindi i dati risultanti in un database SQL Server o in un file csv. È possibile creare un progetto di qualità dei dati come progetto di pulizia o come progetto di corrispondenza per eseguire le rispettive attività. È possibile eseguire progetti di pulizia e di individuazione delle corrispondenze utilizzando la stessa Knowledge Base, poiché le informazioni per la pulizia e per l'individuazione di corrispondenze possono essere inserite all'interno della stessa Knowledge Base.

Un progetto di qualità dei dati offre i vantaggi seguenti:

  • Consente di eseguire la pulizia dei dati sui dati di origine utilizzando le informazioni in una Knowledge Base DQS.

  • Consente di eseguire l'individuazione delle corrispondenze sui dati di origine utilizzando i criteri di corrispondenza in una Knowledge Base.

  • Fornisce una procedura guidata per supportare le attività di pulizia e individuazione delle corrispondenze e consente di esportare i dati selezionati in un database SQL Server o in un file csv. L'amministratore dei dati può utilizzare il progetto di qualità dei dati per eseguire e controllare i passaggi di pulizia e di individuazione delle corrispondenze sia computerizzati che interattivi.

Progetto Data Quality: attività di pulizia dei dati

I progetti Data Quality di pulizia consentono di pulire i dati di origine in base a una Knowledge Base. L'attività di pulizia dei dati in DQS è un processo in due passaggi:

  1. Un processo computerizzato di pulizia dei dati tramite cui vengono analizzati i dati di origine in base alle informazioni incluse nella Knowledge Base e vengono proposte modifiche. I dati elaborati vengono suddivisi da DQS in categorie (suggerito, nuovo, non valido, con correzione e corretto), quindi vengono presentati all'utente per ulteriore elaborazione.

  2. Quando il processo di pulizia è interattivo , l'amministratore dei dati può approvare, rifiutare o modificare i dati proposti dal processo di pulizia computerizzato.

Per informazioni dettagliate sull'attività di pulizia in un progetto di qualità dei dati, vedere Data Cleansing.

Progetto Data Quality: attività di individuazione delle corrispondenze

Un progetto Data Quality di corrispondenza tra dati consente di eseguire l'attività di individuazione di corrispondenze in base ai criteri di corrispondenza in una Knowledge Base per impedire la duplicazione dei dati mediante l'identificazione di corrispondenze esatte e approssimative e permettendo quindi la rimozione dei dati duplicati. Si consiglia di pulire i dati prima di eseguire su questi l'individuazione di corrispondenze. A questo scopo:

  1. Creare un progetto Data Quality, selezionare l'attività Pulizia , completare l'attività di pulizia sui dati di origine, quindi esportarli in una tabella di un database di SQL Server.

  2. Creare un altro progetto Data Quality utilizzando una Knowledge Base che contiene criteri di corrispondenza, selezionare l'attività Corrispondenza , quindi nella pagina Mappa , selezionare il database e la tabella dove sono stati esportati i dati puliti nel passaggio 1.

  3. Completare l'attività di individuazione delle corrispondenze sui dati puliti.

Per informazioni dettagliate sull'attività di individuazione delle corrispondenze in un progetto Data Quality, vedere Data Matching.

Profiling di dati e notifiche

Durante l'esecuzione delle attività di pulizia e corrispondenza in un progetto Data Quality, è possibile ottenere statistiche e informazioni in tempo reale sui dati elaborati da DQS. Il profiling dati consente di valutare l'efficacia dei processi di pulizia e di corrispondenza nonché l'entità del miglioramento dei dati grazie alla pulizia o all'individuazione delle corrispondenze. Il profiling DQS fornisce due dimensioni della qualità dei dati: completezza (l'entità della presenza dei dati) e accuratezza (la misura entro cui i dati possono essere utilizzati per gli scopi previsti). Inoltre, in base alle informazioni sul profiling dei dati, vengono presentate notifiche riguardanti azioni che possono essere intraprese per migliorare la pulizia dei dati e le operazioni di individuazione delle corrispondenze. Per informazioni dettagliate sul profiling dei dati e sulle notifiche, vedere Data Profiling and Notifications in DQS.

Descrizione dell'attività Argomento
Viene descritto come creare un progetto Data Quality. Creare un progetto Data Quality
Viene descritto come aprire, sbloccare, rinominare ed eliminare un progetto Data Quality. Aprire, sbloccare, rinominare ed eliminare un progetto Data Quality
Viene descritto come aprire un progetto di Integration Services in Data Quality Client. Aprire progetti di Integration Services in Data Quality Client

Vedi anche

Knowledge Base e domini DQS