Panoramica della zona di destinazione della gestione dei dati di analisi su scala cloud

Articolo
04/03/2023

La zona di destinazione della gestione dei dati è una funzione di gestione ed è fondamentale per l'analisi su scala cloud. È responsabile della governance della piattaforma di analisi.

La zona di destinazione della gestione dei dati è una sottoscrizione separata con gli stessi servizi della zona di destinazione di Azure standard. Consente la governance dei dati dei dati tramite crawler, che si connettono ai data lake e all'archiviazione poliglotta nelle zone di destinazione dei dati. Il peering di rete virtuale connette la zona di destinazione della gestione dei dati alle zone di destinazione dei dati e alla sottoscrizione di connettività.

Usare questa architettura come punto di partenza. Scaricare il file di Visio e modificarlo in base ai requisiti aziendali e tecnici specifici durante la pianificazione dell'implementazione della zona di destinazione della gestione dei dati.

Nota

La persistenza poliglotta è un termine di archiviazione che descrive la scelta tra diverse tecnologie di archiviazione dati/archivi dati per supportare i vari tipi di dati e le relative esigenze di archiviazione. Essenzialmente, la persistenza poliglotta è il concetto che un'applicazione può usare più di un database principale o tecnologia di archiviazione.

Importante

La zona di destinazione della gestione dei dati deve essere distribuita come sottoscrizione separata in un gruppo di gestione con la governance appropriata. È quindi possibile controllare la governance nell'organizzazione. L'acceleratore di zona di destinazione di Azure illustra come affrontare le zone di destinazione di Azure.

Catalogo dati

Gruppo di risorse: governance-rg

Il catalogo dati registra e gestisce le informazioni sui dati in una posizione centralizzata e la rende disponibile per l'organizzazione. Garantisce che le aziende evitino prodotti dati duplicati causati dall'inserimento di dati ridondanti da team di progetto diversi.

È consigliabile effettuare il provisioning di un servizio catalogo dati per definire i metadati dei prodotti dati archiviati nelle zone di destinazione dei dati.

L'analisi su scala cloud si basa su Microsoft Purview per fungere da:

Un sistema di registrazione
Individuazione per le origini dati aziendali
Un motore di classificazione dei dati
Un archivio criteri
API per la registrazione e la lettura delle informazioni sui dati
Un hub del dashboard di conformità

Poiché il catalogo dati fa parte della zona di destinazione di gestione dei dati, può comunicare con ogni zona di destinazione dei dati tramite il peering di rete virtuale e i runtime di integrazione self-hosted. L'individuazione dei prodotti dati negli archivi locali e in altri cloud pubblici è ottenuta da più distribuzioni di runtime di integrazione self-hosted.

Nota

Anche se questa documentazione è incentrata principalmente sull'uso di Microsoft Purview per le funzionalità e la classificazione dei dati del catalogo dati, le aziende potrebbero aver investito in altri prodotti, ad esempio Alation, Okera o Collibra. In questo caso, rivolgersi al fornitore per applicare i principi descritti per una zona di destinazione di gestione dei dati il più vicino possibile. Occorre essere consapevoli che potrebbe essere necessaria un'integrazione personalizzata.

Per altre informazioni, vedere Catalogo dati e Procedure consigliate per la distribuzione di Microsoft Purview per l'analisi su scala cloud.