Condividi tramite


Azure Cosmos DB: casi d'uso di analisi no-ETL

SI APPLICA A: NoSQL MongoDB Gremlin

Azure Cosmos DB offre varie opzioni di analisi per l'analisi no-ETL, near real-time sui dati operativi. È possibile abilitare l'analisi sui dati di Azure Cosmos DB usando le opzioni seguenti:

  • Mirroring di Azure Cosmos DB in Microsoft Fabric
  • Collegamento ad Azure Synapse per Azure Cosmos DB

Per altre informazioni su queste opzioni, vedere "Analisi e BI nei dati di Azure Cosmos DB".

Importante

Il mirroring di Azure Cosmos DB in Microsoft Fabric è ora disponibile in anteprima per l'API NoSql. Questa funzionalità offre tutte le funzionalità di Collegamento ad Azure Synapse con prestazioni analitiche migliori, la possibilità di unificare il patrimonio di dati con Fabric OneLake e di aprire l'accesso ai dati in OneLake con formato Delta Parquet. Se si sta valutando il collegamento ad Azure Synapse, è consigliabile provare a eseguire il mirroring per valutare l'idoneità complessiva per l'organizzazione. Per iniziare a eseguire il mirroring, fare clic qui.

No-ETL, l'analisi near real-time può aprire varie possibilità per le aziende. Ecco tre scenari di esempio:

  • Analisi della supply chain, previsioni e creazione di report
  • Personalizzazione in tempo reale
  • Manutenzione predittiva e rilevamento delle anomalie in scenari IoT

Analisi della supply chain, previsioni e creazione di report

Gli studi di ricerca mostrano che l'incorporamento di analisi di Big Data nelle operazioni della supply chain comporta miglioramenti nei tempi tra ordine e consegna e nell'efficienza generale.

I produttori adottano tecnologie native del cloud per interrompere i vincoli da sistemi ERP (Enterprise Resource Planning) e SCM (Supply Chain Management) legacy. Con le supply chain che generano volumi crescenti di dati operativi ogni minuto (su ordini, spedizioni, transazioni), ai produttori serve un database operativo. Per ottenere il livello di intelligenza contestuale in tempo reale e acquisire un vantaggio competitivo, è necessario che questo database operativo sia scalabile per gestire i volumi di dati e una piattaforma analitica.

L'architettura seguente mostra le potenzialità associate all'uso di Azure Cosmos DB come database operativo nativo del cloud nell'analisi della catena di approvvigionamento:

Diagramma dell'analisi in tempo reale per Azure Cosmos DB nella catena di approvvigionamento.

In base all'architettura precedente, è possibile ottenere i casi d'uso seguenti:

  • Preparare ed eseguire il training della pipeline predittiva: generare informazioni dettagliate dai dati operativi attraverso la supply chain tramite Machine Learning. In questo modo è possibile ridurre l'inventario, i costi operativi e i tempi tra ordine e consegna per i clienti.

Il mirroring e il collegamento a Synapse consentono di analizzare i dati operativi mutevoli in Azure Cosmos DB senza processi ETL manuali. Queste offerte consentono di evitare costi aggiuntivi, latenza e complessità operativa. Consentono a ingegneri e scienziati dei dati di creare pipeline predittive affidabili:

  • Eseguire query sui dati operativi di Azure Cosmos DB usando l'integrazione nativa con i pool di Apache Spark in Microsoft Fabric o Azure Synapse Analytics. È possibile eseguire query sui dati in un notebook interattivo o con processi remoti pianificati senza interventi complessi di ingegneria dei dati.

  • Creare modelli di Machine Learning (ML) con algoritmi ML di Spark e l'integrazione di Azure Machine Learning (AML) in Microsoft Fabric o Azure Synapse Analytics.

  • Eseguire il writeback dei risultati dopo l'inferenza del modello in Azure Cosmos DB per l'assegnazione di punteggi operativi quasi in tempo reale.

  • Creazione di report operativi: i team della supply chain hanno bisogno di report flessibili e personalizzati su dati operativi accurati e in tempo reale. Questi report sono necessari per ottenere uno snapshot dell'efficacia, della redditività e della produttività della supply chain. Gli analisti dei dati e altri stakeholder chiave possono rivalutare costantemente il business e identificare le aree da modificare per ridurre i costi operativi.

Il mirroring e il collegamento a Synapse per Azure Cosmos DB rende possibili scenari avanzati di business intelligence (BI) e creazione di report:

  • Eseguire query sui dati operativi di Azure Cosmos DB tramite integrazione nativa con la completa espressività del linguaggio T-SQL.

  • Modellare e pubblicare i dashboard BI che si aggiornano automaticamente in Azure Cosmos DB tramite Power BI integrato in Microsoft Fabric o Azure Synapse Analytics.

Di seguito sono riportate alcune indicazioni per l'integrazione dei dati in batch e in streaming in Azure Cosmos DB:

  • Integrazione e orchestrazione di dati in batch: con le supply chain che diventano sempre più complesse, è necessario integrare le relative piattaforme di dati con un'ampia varietà di origini e formati. Microsoft Fabric e Azure Synapse incorporano lo stesso motore di integrazione dei dati e le stesse esperienze di Azure Data Factory. Grazie a questa integrazione, gli ingegneri dei dati possono creare pipeline di dati avanzate senza un motore di orchestrazione distinto:

  • Integrazione ed elaborazione di dati in streaming: con la crescita dell'IoT industriale (sensori che rilevano gli asset dalla fabbrica al punto vendita, flotte di logistica connesse e così via), si registra un'esplosione di dati in tempo reale generati in streaming che è necessario integrare con il tradizionale flusso di dati lento per generare informazioni dettagliate. Analisi di flusso di Azure è un servizio consigliato per lo streaming di ETL e l'elaborazione in Azure con un'ampia gamma di scenari. Analisi di flusso di Azure supporta Azure Cosmos DB come sink di dati nativo.

Personalizzazione in tempo reale

Oggi i retailer devono sviluppare soluzioni di e-commerce sicure e scalabili che soddisfino le esigenze dei clienti e del business. Queste soluzioni di e-commerce devono coinvolgere i clienti tramite offerte e prodotti personalizzati, elaborare le transazioni in modo rapido e sicuro e soddisfare i requisiti di evasione degli ordini e assistenza clienti. Azure Cosmos DB, insieme al recente servizio Collegamento a Synapse per Azure Cosmos DB, consente ai retailer di generare raccomandazioni personalizzate per i clienti in tempo reale. Queste soluzioni usano impostazioni di coerenza ottimizzabili e a bassa latenza per generare informazioni dettagliate immediate, come illustrato nell'architettura seguente:

Diagramma di Azure Cosmos DB nella personalizzazione in tempo reale.

  • Preparare ed eseguire il training della pipeline predittiva: è possibile generare informazioni dettagliate dai dati operativi tra business unit o segmenti di clienti usando Fabric oppure Synapse Spark e modelli di Machine Learning. Il risultato si traduce in una distribuzione personalizzata ai segmenti di clienti target, oltre che in esperienze predittive per gli utenti finali e in iniziative di marketing mirate in base ai requisiti degli utenti. )

Manutenzione predittiva di IoT

Le innovazioni dell'IoT industriale hanno portato a una riduzione drastica dei tempi di inattività dei macchinari e a un aumento generale dell'efficienza in tutti i settori industriali. Una di queste innovazioni è l'analisi di manutenzione predittiva per i macchinari al perimetro del cloud.

Di seguito è riportata un'architettura che usa le funzionalità HTAP nella manutenzione predittiva di IoT:

Diagramma di Azure Cosmos DB per la manutenzione predittiva di IoT.

  • Preparare ed eseguire il training della pipeline predittiva: i dati operativi cronologici provenienti dai sensori dei dispositivi IoT possono essere usati per il training di modelli predittivi, ad esempio i rilevatori di anomalie. Questi rilevatori di anomalie vengono quindi distribuiti nuovamente sul perimetro per il monitoraggio in tempo reale. Tale ciclo virtuoso consente la ripetizione continua del training dei modelli predittivi.

  • Creazione di report operativi: con la crescita delle iniziative di gemelli digitali, le aziende raccolgono enormi quantità di dati operativi da un numero elevato di sensori per creare una copia digitale di ogni computer. Questi dati soddisfano i requisiti di BI per l'interpretazione delle tendenze su dati cronologici oltre ai dati ad accesso frequente.