Gestione della qualità dei dati per gli elementi di dati critici (anteprima)
Articolo
Gli elementi dati critici (CDE) sono un raggruppamento logico di colonne importanti tra tabelle nelle origini dati che consentono di concentrare in modo strategico le attività di governance in cui si avrà l'effetto più significativo.
Qualità dei dati di Microsoft Purview offre una soluzione integrata per misurare la qualità degli elementi di dati critici (CDE), consentendo alle organizzazioni di garantire che questi elementi di dati chiave soddisfino gli standard richiesti per accuratezza, completezza, coerenza e integrità.
Le organizzazioni possono stabilire soglie di qualità specifiche che le cde devono soddisfare per mantenere la qualità. Tali soglie vengono applicate a livello di CDE logico, ma si riduce a tutte le singole colonne che costituiscono l'ambiente cde. Queste regole possono includere vari aspetti della qualità dei dati, tra cui convalida, pulizia, standardizzazione e arricchimento. Ad esempio, le regole di qualità dei dati potrebbero specificare che gli indirizzi dei clienti devono essere standardizzati in un formato specifico o che gli ID dipendente devono rispettare un determinato modello.
Una volta applicate le regole di qualità dei dati alle cde, Qualità dei dati di Microsoft Purview valuta sistematicamente gli elementi di dati fisici sottostanti per valutarne la conformità con queste regole. Usando l'approccio integrato di Purview Data Quality, le organizzazioni possono monitorare e gestire in modo proattivo la qualità dei loro elementi di dati critici, assicurandosi che rimangano affidabili, accurati e adatti allo scopo. Ciò non solo migliora i processi decisionali, ma aiuta anche a mitigare i rischi associati a errori o incoerenze dei dati, determinando in definitiva risultati aziendali migliori.
Tipi di asset supportati
Azure Data Lake Storage (ADLS Gen2)
Tipi di file: Delta e Parquet
database SQL di Azure
Il data estate di Fabric in OneLake include il collegamento e il mirroring dei dati. L'analisi della qualità dei dati è supportata solo per le tabelle delta e i file Parquet di Lakehouse.
Data estate di mirroring: CosmosDB, Snowflake, Azure SQL
Data estate di collegamento: AWS S3, GCS, AdlsG2 e dataverse
Azure Synapse serverless e data warehouse
Catalogo Unity Azure Databricks
Fiocco di neve
Google Big Query (anteprima privata)
Regole di qualità dei dati disponibili per cde
Qualità dei dati di Microsoft Purview abilita la configurazione delle regole seguenti per le cde. Se si seleziona una regola, per altre informazioni verrà visualizzato l'articolo generale sulle regole di qualità dei dati .
Specificare i dettagli necessari per il tipo di regola.
Scegliere se si vuole attivare o disattivare la regola.
Selezionare Crea.
Eseguire regole di qualità dei dati per cde
Quando viene eseguita un'analisi della qualità dei dati per un asset di dati disponibile con una colonna associata a un cde, le regole di qualità dei dati configurate per tale cde genereranno un punteggio.
Analizzare i risultati del processo di analisi della qualità dei dati per identificare eventuali problemi, anomalie o aree di miglioramento correlati all'asset di dati cde. Ciò potrebbe comportare la pulizia, la standardizzazione o l'arricchimento dei dati per migliorarne la qualità.
Questo modulo di training guiderà nella creazione di uno stack completo per la gestione dei dati master e la governance dei dati end-to-end con Microsoft Purview e CluedIn. Include lo sviluppo di record golden, la deduplicazione, la derivazione dei dati e strategie di qualità dei dati.
Dimostrare la comprensione delle attività comuni di ingegneria dei dati per implementare e gestire carichi di lavoro di ingegneria dei dati in Microsoft Azure, usando vari servizi di Azure.
Ottenere una panoramica delle regole di qualità dei dati in Microsoft Purview Unified Catalog e come usarle per aumentare la qualità e l'affidabilità dei dati.
Informazioni su come applicare analisi della qualità dei dati agli asset all'interno di Archiviazione di Azure usando Microsoft Purview Unified Catalog.
Informazioni su come interpretare i punteggi di qualità dei dati dopo l'esecuzione di un'analisi della qualità dei dati in Microsoft Purview Unified Catalog.
Questo articolo offre una panoramica del modo in cui gli amministratori della qualità dei dati possono monitorare i processi di profilatura e analisi della qualità dei dati nel Microsoft Purview Unified Catalog.
Informazioni su come vengono gestite le azioni di qualità dei dati in Microsoft Purview Unified Catalog per migliorare gli obiettivi di qualità dei dati.