Concetti di Data Quality Services
Si applica a: SQL Server
In questo argomento viene fornito un breve riepilogo dei concetti di Data Quality Services (DQS) nell'ambito della gestione delle informazioni, dei progetti Data Quality e dell'amministrazione della qualità dei dati.
Concetti relativi alla gestione delle informazioni
La Knowledge Base DQS è un repository di metadati creati dall'amministratore dei dati o dal personale IT da utilizzare per migliorare la qualità dei dati tramite la pulizia e la corrispondenza dei dati. La gestione delle informazioni DQS include i processi utilizzati per creare e gestire la Knowledge Base, sia in modo computerizzato che in modo interattivo.
Individuazione informazioni
L'individuazione delle informazioni è un processo computerizzato che analizza esempi di dati dell'organizzazione per compilare le informazioni sui dati. Una volta ottenuti i risultati dell'analisi, è possibile convalidare e migliorare le informazioni, quindi applicarle per eseguire la pulizia dei dati, la corrispondenza e il profiling. Per altre informazioni, vedere DQS Knowledge Bases and Domains.
Gestione dominio
Il processo di gestione del dominio consente di modificare o aumentare le informazioni generate dal processo di individuazione delle informazioni. È possibile modificare, aggiornare e rivedere in modo interattivo le informazioni in una Knowledge Base. Una Knowledge Base è costituita da domini di dati che contengono i valori di dominio e il relativo stato, le regole di dominio, le relazioni basate su termini e i dati di riferimento. Nella gestione del dominio è possibile modificare le proprietà del dominio, associare i dati di riferimento a un dominio, gestire le regole di dominio, gestire i valori di dominio e immettere le relazioni di dati nonché creare, eliminare, importare o esportare i domini. È inoltre possibile utilizzare domini compositi che aggregano più domini singoli. Per altre informazioni, vedere DQS Knowledge Bases and Domains.
Criteri di abbinamento
I criteri di corrispondenza contengono le regole di corrispondenza utilizzate per eseguire la deduplicazione dei dati. Il processo dei criteri di corrispondenza consente di creare le regole di corrispondenza, di ottimizzarle in base ai risultati corrispondenti e ai dati di profiling e di aggiungere i criteri alla Knowledge Base. Per altre informazioni, vedere Data Matching.
Servizi dati di riferimento
È possibile utilizzare i dati di riferimento per convalidare, correggere e migliorare i dati, sfruttando i servizi di società che garantiscono la qualità dei dati di riferimento. È possibile utilizzare i servizi di Windows Azure MarketPlace per connettersi ai provider di dati di riferimento. In alternativa, è possibile utilizzare una connessione diretta a un provider. Per altre informazioni, vedere Reference Data Services in DQS.
Per ulteriori informazioni sulla gestione delle informazioni in DQS, vedere DQS Knowledge Bases and Domains.
Concetti relativi ai progetti Data Quality
L'amministratore dei dati esegue le operazioni di qualità dei dati (pulizia e corrispondenza) utilizzando un progetto per la qualità dei dati nell'applicazione Data Quality Client.
Pulizia dei dati
La pulizia dei dati in DQS viene effettuata in base alle informazioni incluse nella Knowledge Base DQS e prevede un processo in due passaggi:
Pulizia assistita da computer: in DQS vengono utilizzate le informazioni disponibili nella Knowledge Base selezionata per la pulizia di un progetto, al fine di proporre correzioni e suggerimenti relativi ai valori in un'origine dati.
Pulizia interattiva: l'amministratore dei dati può eseguire il processo di pulizia interattiva per modificare o aumentare le correzioni dei dati proposte dal processo di pulizia dei dati computerizzato. L'amministratore dei dati esegue questa operazione utilizzando livelli di confidenza e statistiche identificati dal processo di pulizia dei dati o immettendo manualmente le proprie modifiche nel progetto.
In seguito al processo di pulizia, l'amministratore può esportare i dati elaborati in un database di SQL Server, un file con estensione csv o un file di Excel. Per altre informazioni, vedere Data Cleansing.
Corrispondenza di dati
Con il processo di corrispondenza l'amministratore dei dati può confrontare i dati in modo da poter allineare quelli simili tramite il processo di deduplicazione. La deduplicazione in DQS viene eseguita in base alle regole di corrispondenza contenute nella Knowledge Base. L'amministratore dei dati specifica i parametri per il processo di corrispondenza all'interno di un progetto Data Quality. Per altre informazioni, vedere Data Matching.
Profiling e notifiche
Con il profiling dei dati, agli amministratori dei dati vengono fornite statistiche e informazioni in tempo reale sui dati elaborati da DQS per le attività di pulizia e di corrispondenza durante l'esecuzione di un progetto Data Quality. Viene inoltre valutata l'efficacia delle attività di pulizia e di corrispondenza in un progetto Data Quality e, con le notifiche, l'utente può scegliere le azioni che possono essere eseguite per migliorare le attività di pulizia e di corrispondenza dei dati. Per altre informazioni, vedere Data Profiling and Notifications in DQS.
Per altre informazioni sui progetti per la qualità dei dati in DQS, vedere Progetti per la qualità dei dati DQS.
Concetti relativi all'amministrazione della qualità dei dati
Un amministratore DQS può eseguire numerose attività amministrative mediante l'applicazione Data Quality Client.
Monitoraggio attività
Tramite il monitoraggio delle attività viene visualizzato lo stato di ogni attività eseguita all'interno di un intervallo di dati, vengono forniti i dati per ogni attività e viene consentito agli amministratori DQS di controllare un'attività. Per altre informazioni, vedere Monitor DQS Activities.
Configurazione
Con l'opzione Configurazione è possibile effettuare le operazioni seguenti:
Configurare le impostazioni del servizio dati di riferimento. Per altre informazioni, vedere Configure DQS to Use Reference Data.
Impostare i valori soglia per le attività di pulizia e di corrispondenza. Per altre informazioni, vedere Configurazione dei valori soglia per le attività di pulizia e di individuazione delle corrispondenze.
Abilitare o disabilitare le notifiche di profiling Per altre informazioni, vedere Abilitare o disabilitare le notifiche di profiling in DQS.
Configurare i livelli di gravità per i file di log DQS a livello di attività o a livello di modulo, che rappresenta la modalità più avanzata. Per altre informazioni, vedere Configure Severity Levels for DQS Log Files.
Sicurezza relativa a DQS
È possibile utilizzare i ruoli all'interno del meccanismo di sicurezza di SQL Server per proteggere DQS. Sono disponibili tre ruoli DQS tramite cui viene determinato il livello di accesso per un utente nell'applicazione Data Quality Client, cioè dqs_administrator, dqs_kb_editor e dqs_kb_operator. Non è possibile concedere ruoli agli utenti utilizzando l'applicazione Data Quality client, bensì mediante SQL Server Management Studio. Per altre informazioni, vedere DQS Security.
Per ulteriori informazioni sull'amministrazione DQS, vedere DQS Administration.