Analisi su scala cloud per settori regolamentati
Con forme di adozione del cloud più grandi e sofisticate, il percorso verso il cloud diventa più complesso. L'analisi su scala cloud di Azure è un framework scalabile e ripetibile che soddisfa le esigenze specifiche dell'organizzazione per la creazione di piattaforme dati moderne.
L'analisi su scala cloud riguarda considerazioni tecniche e non tecniche per l'analisi e la governance nel cloud. Queste linee guida si sforzano di supportare l'adozione ibrida e multicloud essendo indipendenti dal cloud, ma gli esempi di implementazione tecnica inclusi si concentrano sui prodotti Azure.
L'analisi su scala cloud ha gli obiettivi seguenti:
- Rendere disponibili i dati come prodotto, anziché come prodotto byproduct
- Offrire un ecosistema di prodotti dati, anziché un data warehouse singolare che potrebbe non adattarsi allo scenario dei dati
- Adottare un approccio predefinito per applicare la governance e la sicurezza dei dati
- Guidare i team a classificare in ordine di priorità i risultati aziendali invece di concentrarsi solo sulla tecnologia sottostante.
L'analisi su scala cloud si basa sul framework di adozione del cloud di Microsoft e richiede la comprensione delle zone di destinazione. Se non si ha già un'implementazione delle zone di destinazione di Azure, consultare i team cloud su come soddisfare i prerequisiti. Per altre informazioni, vedere Predisporre l'adozione del cloud.
Le architetture di riferimento consentono di iniziare con un footprint ridotto e crescere nel tempo, adattando lo scenario ai casi d'uso.
L'analisi su scala cloud include modelli ripetibili che accelerano cinque distribuzioni di risorse e infrastruttura di base. È anche adattabile per diverse dimensioni dell'organizzazione. Se si è un'azienda di piccole dimensioni con risorse limitate, un modello operativo centralizzato misto con alcuni esperti del settore aziendale potrebbe adattarsi alla situazione. Se si è un'azienda più grande con business unit autonome (ognuna con i propri data engineer e analisti) come obiettivo, un modello operativo distribuito, ad esempio mesh di dati o data fabric, potrebbe soddisfare meglio le esigenze.
Obiettivi
L'analisi su scala cloud offre un framework basato sui principi seguenti. Questi principi affrontano le sfide con architetture di dati complesse che non vengono ridimensionate in base alle esigenze delle organizzazioni.
Principio | Descrizione |
---|---|
Consenti |
|
Seguire |
|
Supporto |
|
Adottare |
|
Eseguire il commit |
|
Abilitazione |
|
Linee guida per l'implementazione
Le linee guida per l'implementazione possono essere suddivise in due sezioni:
- Linee guida globali applicabili a tutti i carichi di lavoro.
- Linee guida specifiche per la scalabilità cloud
Linee guida globali
Documentazione | Descrizione |
---|---|
Cloud Adoption Framework | La gestione e la governance dei dati sono un processo del ciclo di vita, che inizia basandosi sulla strategia cloud esistente e passa attraverso le operazioni in corso. Cloud Adoption Framework aiuta a guidare il ciclo di vita completo del patrimonio di dati. |
Azure Well-Architected Framework | L'architettura e le operazioni del carico di lavoro hanno un effetto diretto sui dati. Comprendere in che modo l'architettura può migliorare la gestione e la governance dei dati del carico di lavoro. |
Linee guida specifiche per la scalabilità cloud
Sezione | Descrizione |
---|---|
Creare una strategia iniziale | Come creare la strategia e il pivot dei dati per diventare un'organizzazione guidata dai dati. |
Definire il piano | Come sviluppare un piano per l'analisi su scala cloud. |
Preparare l'ambiente di analisi | Panoramica della preparazione del patrimonio di analisi su scala cloud con considerazioni chiave sull'area di progettazione, ad esempio registrazione aziendale, rete, gestione delle identità e degli accessi, criteri, continuità aziendale e ripristino di emergenza. |
Gestire l'analisi | Requisiti per gestire dati, catalogo dati, derivazione, gestione dei dati master, qualità dei dati, contratti di condivisione dei dati e metadati. |
Proteggere il patrimonio di analisi | Come proteggere l'ambiente di analisi con autenticazione e autorizzazione, privacy dei dati e gestione degli accessi ai dati. |
Organizzare utenti e team | Come organizzare operazioni, ruoli, team e funzioni del team efficaci. |
Gestire il patrimonio di analisi | Come effettuare il provisioning della piattaforma e dell'osservabilità per uno scenario. |
Architetture
In questa sezione vengono illustrati i dettagli delle implementazioni fisiche dell'analisi su scala cloud. Esegue il mapping delle architetture fisiche delle zone di destinazione di gestione dei dati e delle zone di destinazione dei dati.
L'analisi su scala cloud ha due concetti principali dell'architettura:
- Zona di destinazione dei dati
- Zona di destinazione per la gestione dei dati
- Integrazione con soluzioni software-as-a-service come Microsoft Fabric e Microsoft Purview
Queste architetture standardizzano le procedure consigliate e riducono al minimo i colli di bottiglia della distribuzione per i team di sviluppo e possono accelerare la distribuzione di soluzioni di analisi comuni su scala cloud. È possibile adottare le linee guida per le architetture lakehouse e mesh di dati. Queste linee guida evidenziano le funzionalità necessarie per una piattaforma di analisi ben regolamentata che si adatta alle proprie esigenze.
Per altre informazioni, vedere: Panoramica delle architetture
Modelli di distribuzione
Questa sezione include molti modelli di riferimento che possono essere distribuiti.
Repository | Contenuto | Richiesto | Modello di distribuzione |
---|---|---|---|
Modello di gestione dei dati | Servizi di gestione dei dati centrali e servizi dati condivisi, ad esempio catalogo dati e runtime di integrazione self-hosted | Sì | Una per analisi su scala cloud |
Modello della zona di destinazione per i dati | Servizi condivisi della zona di destinazione dei dati, inclusi i servizi di inserimento, gestione e archiviazione dei dati | Sì | Uno per zona di destinazione per i dati |
Modello di integrazione dei dati - Elaborazione batch | Servizi aggiuntivi necessari per l'elaborazione dei dati batch | No | Uno o più per zona di destinazione dei dati |
Modello di integrazione dei dati - Elaborazione del flusso | Servizi aggiuntivi necessari per l'elaborazione del flusso di dati | No | Uno o più per zona di destinazione dei dati |
Modello di prodotto dati - Analisi e data science | Servizi aggiuntivi necessari per l'analisi dei dati e l'intelligenza artificiale | No | Uno o più per zona di destinazione dei dati |
Questi modelli contengono modelli di Azure Resource Manager, i file di parametri dei modelli e le definizioni di pipeline CI/CD per la distribuzione delle risorse.
I modelli possono cambiare nel tempo a causa di nuovi servizi e requisiti di Azure. Proteggere il ramo principale di ogni repository in modo che rimanga privo di errori e pronto per l'utilizzo e la distribuzione. Usare una sottoscrizione di sviluppo per testare le modifiche di configurazione dei modelli prima di unire nuovamente i miglioramenti delle funzionalità nel ramo principale.
Per altre informazioni, vedere Modelli di distribuzione.
Procedure consigliate
Gli articoli avanzati e di livello 300+ seguenti nel sommario di analisi su scala cloud consentono ai team IT centrali di distribuire strumenti e gestire i processi per la gestione e la governance dei dati:
- Inserimento dati per l'analisi su scala cloud
- Data Lake Storage per l'analisi su scala cloud
- Usare Azure Databricks nell'analisi su scala cloud
- Usare Azure Synapse Analytics per l'analisi su scala cloud
Prodotti Azure in primo piano
Espandere la sezione Prodotti Azure in primo piano nel sommario di analisi su scala cloud per informazioni sui prodotti Azure che supportano l'analisi su scala cloud.
Percorsi comuni dei clienti
I percorsi dei clienti comuni seguenti supportano l'analisi su scala cloud:
Preparazione dell'ambiente. Usare gli articoli Preparare l'ambiente come risorse. Definire processi e approcci che supportano l'intero portfolio di carichi di lavoro nel patrimonio di dati.
Influenzare le modifiche ai singoli carichi di lavoro. Man mano che i processi di analisi su scala cloud migliorano, i team di governance dei dati centrali trovano i requisiti che dipendono dalla conoscenza dell'architettura alla base dei singoli carichi di lavoro. Usare gli articoli Architettura per comprendere come usare gli scenari all'interno del caso d'uso.
Ottimizzare singoli carichi di lavoro e team dei carichi di lavoro. Iniziare con le linee guida di Azure Well-Architected Framework per integrare strategie di analisi su scala cloud in singoli carichi di lavoro. Queste linee guida descrivono le procedure consigliate e le architetture che i team IT e di governance centrali devono usare per accelerare lo sviluppo di singoli carichi di lavoro.
Usare le procedure consigliate per eseguire l'onboarding di singoli asset. Espandere la sezione Procedure consigliate nel sommario dell'analisi su scala cloud per trovare articoli sui processi per l'onboarding dell'intero patrimonio di dati in un piano di controllo di analisi su scala cloud.
Usare prodotti Azure specifici. Accelerare e migliorare le funzionalità di analisi su scala cloud usando i prodotti Azure nella sezione Prodotti Azure in primo piano del sommario di analisi su scala cloud.
Entra in azione
Per altre informazioni sulla pianificazione per l'implementazione dell'analisi su scala cloud, vedere:
Passaggi successivi
Iniziare il percorso di analisi su scala cloud: