Architettura di analisi avanzata

Azure Analysis Services
Archiviazione BLOB di Azure
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Idee sulla soluzione

Questo articolo è un'idea di soluzione. Per espandere il contenuto con altre informazioni, ad esempio potenziali casi d'uso, servizi alternativi, considerazioni sull'implementazione o indicazioni sui prezzi, inviare commenti e suggerimenti su GitHub.

Questa architettura consente di combinare tutti i dati su qualsiasi scala con Machine Learning personalizzato e ottenere analisi dei dati quasi in tempo reale nei servizi di streaming.

Architettura

Diagramma di un'architettura di analisi avanzata con Azure Synapse Analytics con Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB e Power BI.

Scaricare un file di Visio di questa architettura.

Flusso di dati

  1. Raggruppare tutti i dati strutturati, non strutturati e semistrutturati (log, file e supporti) usando Pipeline synapse per Azure Data Lake Storage.
  2. Usare i pool apache Spark per pulire e trasformare i set di dati senza struttura e combinarli con dati strutturati da database operativi o data warehouse.
  3. Usare tecniche di Machine Learning/Deep Learning scalabili per derivare informazioni dettagliate più approfondite da questi dati usando Python, Scala o .NET, con esperienze di notebook nel pool di Apache Spark.
  4. Applicare pool apache Spark e pipeline synapse in Azure Synapse Analytics per accedere e spostare i dati su larga scala.
  5. Eseguire query e report sui dati in Power BI.
  6. Acquisire informazioni dettagliate dai pool apache Spark ad Azure Cosmos DB per renderli accessibili tramite app Web e per dispositivi mobili.

Flusso di lavoro

  • Azure Synapse Analytics è il data warehouse cloud veloce, flessibile e attendibile che consente di ridimensionare, calcolare e archiviare in modo elastico e indipendentemente un'architettura di elaborazione parallela di grandi dimensioni.
  • La documentazione di Synapse Pipelines consente di creare, pianificare e orchestrare i flussi di lavoro ETL/ELT.
  • Archiviazione BLOB di Azure è un'archiviazione a oggetti scalabile enorme per qualsiasi tipo di immagini dati non strutturate, video, audio, documenti e più facilmente e conveniente.
  • Azure Synapse pool spark di Analytics è una piattaforma di analisi basata su Apache Spark veloce, semplice e collaborativa.
  • Azure Cosmos DB è un servizio di database multimodello e distribuito a livello globale. Informazioni su come replicare i dati in qualsiasi numero di aree di Azure e ridimensionare la velocità effettiva indipendente dall'archiviazione.
  • Collegamento ad Azure Synapse per Azure Cosmos DB consente di eseguire analisi near real-time sui dati operativi in Azure Cosmos DB, senza alcun impatto sulle prestazioni o sui costi del carico di lavoro transazionale, usando i due motori di analisi disponibili nell'area di lavoro Azure Synapse: SQL Serverless e Pool di Spark.
  • Azure Analysis Services è un'analisi di livello aziendale come servizio che consente di gestire, distribuire, testare e distribuire la soluzione BI con fiducia.
  • Power BI è un gruppo di strumenti di Analisi business che consente di distribuire informazioni dettagliate in tutta l'organizzazione. Connettersi a centinaia di origini dati, semplificare il prep dei dati e guidare l'analisi non pianificata. Produrre report belli, quindi pubblicarli per l'organizzazione da usare sul Web e in tutti i dispositivi mobili.

Alternativi

Dettagli dello scenario

Trasformare i dati in informazioni dettagliate utilizzabili usando i migliori strumenti di Machine Learning di classe. Questa soluzione consente di combinare tutti i dati su qualsiasi scala e di compilare e distribuire modelli di Machine Learning personalizzati su larga scala. Per informazioni sul modo in cui le piattaforme dati su scala aziendale sono progettate come parte di una zona di destinazione aziendale, vedere la documentazione Cloud Adoption Framework Zona di destinazione dei dati.

Potenziali casi d'uso

Le organizzazioni hanno la possibilità di accedere a più dati di quanto mai prima. Analisi avanzata consente di sfruttare le informazioni dettagliate sui dati. Le aree includono:

  • Servizio clienti.
  • Manutenzione predittiva.
  • Raccomandazione di prodotti o servizi.
  • Ottimizzazione del sistema di tutto, dalle catene di fornitura alle operazioni del data center.
  • Sviluppo di prodotti e servizi.

Considerazioni

Ottimizzazione dei costi

L'ottimizzazione dei costi riguarda l'analisi dei modi per ridurre le spese non necessarie e migliorare l'efficienza operativa. Per altre informazioni, vedere Panoramica del pilastro di ottimizzazione dei costi.

Passaggi successivi

Vedere la documentazione seguente sui servizi in primo piano in questa architettura: