Quando usare Esplora dati di Azure

Completato

In questo articolo viene illustrato come decidere se Azure Esplora dati è la scelta giusta per le esigenze di analisi dei Big Data. Valutando i criteri seguenti, è possibile determinare se Azure Esplora dati soddisfa gli obiettivi funzionali e delle prestazioni.

  • Analisi interattiva
  • Ampia gamma di dati
  • Velocità dei dati
  • Volume dei dati
  • Organizzazione dei dati
  • Concorrenza delle query
  • Build o acquisto

Criteri decisionali

Azure Esplora dati è una piattaforma di analisi interattiva per Big Data che consente alle persone di prendere decisioni basate sui dati in un ambiente estremamente agile. I fattori elencati qui consentono di valutare se Azure Esplora dati è adatto al carico di lavoro. Porre le domande chiave seguenti:

Analisi interattiva

Si ha l'esigenza di analizzare i dati in modo interattivo?

L'analisi dei dati include tecniche, come l'aggregazione, la determinazione dell'ambito, la valutazione, la correlazione, il rilevamento anomalie, la previsione e la valutazione generale del modello, che consentono di trarre da grandi quantità di dati conclusioni praticabili. L'esecuzione interattiva di queste attività è compito di Esplora dati di Azure. Queste attività possono essere eseguite nei dashboard interattivi, nell'applicazione personalizzata analitica o tramite l'interazione diretta con i dati tramite query e visualizzazioni descrittive. Azure Esplora dati potrebbe non essere la tecnologia appropriata per l'esecuzione di processi batch con esecuzione prolungata sui dati. Prendere in considerazione l'uso di tecnologie come Microsoft Spark che funzionano bene con Azure Esplora dati per le attività a esecuzione prolungata.

Ampia gamma di dati

Quanto è varia la struttura dei dati?

Esplora dati di Azure supporta gli indici full-text scalabili ad alte prestazioni e lo schema dinamico. Se occorre analizzare ed elaborare dati strutturati, semistrutturati (json/xml) e testuali, Esplora dati di Azure è una soluzione valida per il carico di lavoro disponibile.

Velocità dei dati

L'analisi dei dati in tempo reale è un fattore critico?

Esplora dati di Azure può acquisire grandi quantità di dati in modo rapido e con una bassa latenza. I set di dati tipici sono costituiti da tracce, log delle transazioni, serie temporali, metriche e, in generale, flussi di record attività. L'analisi near real-time di nuovi dati è un caso d'uso comune. Per alimentare questi carichi di lavoro, Esplora dati di Azure è ben connesso alle tecnologie di streaming come Hub eventi di Azure, hub IoT e Kafka. Tuttavia, nel caso in cui sia necessaria l'analisi in tempo reale, Azure Esplora dati potrebbe non essere l'opzione migliore.

Volume dei dati

Quanti dati è necessario inserire?

Esplora dati di Azure è progettato per fornire analisi del percorso a caldo, interattive e tramite API, su carichi di lavoro con grandi quantità di dati. Per gli scenari in cui le dimensioni totali dei dati accumulati sono di pochi gigabyte, esistono altre soluzioni più efficienti in termini di costi.

Organizzazione dei dati

Con quanta coerenza sono organizzati i dati?

Esplora dati di Azure è progettato per applicare lo schema in lettura ai dati non elaborati. Questo approccio crea la flessibilità necessaria per esaminare i dati in modi diversi e da punti di vista diversi in base alle esigenze correnti. Questa funzionalità è utile per affrontare sfide impreviste in termini di sicurezza, operazioni e ambienti competitivi, tra le altre aree. Esplora dati di Azure offre un alto livello di velocità, scalabilità ed efficienza dei costi per l'analisi dei dati non elaborati. Spesso nelle distribuzioni di data warehousing, un processo di estrazione, trasformazione, caricamento (ETL) genera periodicamente un set ben curato, altamente coerente e ben documentato di entità e attributi. L'analisi di questi complessi schemi a stella comporta in genere join di tipo fact-to-fact di grandi dimensioni per i quali Esplora dati di Azure non è ottimizzato.

Concorrenza delle query

Quanti utenti devono eseguire query/inserire/elaborare i dati contemporaneamente?

Esplora dati di Azure viene ampiamente usato per l'implementazione di offerte SaaS di analisi. Se è necessario supportare esigenze di analisi diverse e univoche da un numero elevato di richieste in parallelo, Azure Esplora dati deve offrire una soluzione valida.

Build o acquisto

Quanto si vuole personalizzare la piattaforma dati?

Esplora dati di Azure è una piattaforma distribuita come servizio completamente gestita. Tuttavia, non fornisce una soluzione chiavi in mano. Perché offra una soluzione (build), deve essere personalizzato, configurato, connesso e occorre aggiungergli esperienze. Esistono diverse soluzioni, di Microsoft e di terze parti che usano Azure Esplora dati per offrire tali soluzioni chiavi in mano in domini e verticali diversi. Ad esempio, Monitoraggio di Azure per le operazioni IT. Microsoft Advanced Threat Protection e Microsoft Sentinel nel dominio di sicurezza e Azure Time Series Insights e Azure IoT Central nei domini IoT.

Applicare i criteri

Esplora dati di Azure funziona al meglio quando si tratta di offrire funzionalità di analisi interattiva ai knowledge worker su dati non elaborati ad alta velocità e diversificati. Si esaminerà ora come applicare i criteri elencati in precedenza ai processi di esempio nello scenario aziendale dell'abbigliamento.

È consigliabile Esplora dati di Azure per i dati di produzione?

Il reparto di produzione dell'azienda di abbigliamento di esempio deve prendere decisioni su come gestire i volumi di inventario e di produzione. L'azienda ha a disposizione log di dati in ingresso per l'inventario. Intende anche usare i dati geospaziali ottenuti dal marketing per prevedere le esigenze dei prodotti in base all'area. Questi dati hanno un elevato grado di varietà,velocitàe volume. Non è organizzato in modo coerente e molti stakeholder devono eseguire simultaneamente query su questi dati. Dall'inserimento all'esecuzione delle query, è necessario che la latenza sia bassa. I tempi di risposta delle query devono essere inferiori a un secondo o al massimo di un secondo. In base ai criteri decisionali, Esplora dati di Azure rappresenta una buona scelta per il reparto di produzione dell'azienda di abbigliamento.

Ha senso usare Esplora dati di Azure per i dati di marketing?

Il reparto di marketing dell'azienda di abbigliamento vuole valutare l'efficacia della propria campagna. Dispone dei dati clickstream provenienti dal sito Web e dalle campagne pubblicitarie. Dispone anche dei dati di testo libero (non strutturati) derivati dai social media. Questi dati sono estremamente vari e non organizzati. Il reparto intende eseguire analisi interattive esplorative. In base ai criteri decisionali, Esplora dati di Azure rappresenta una buona scelta per il reparto di marketing dell'azienda di abbigliamento.

Riepilogo delle indicazioni

Nella tabella seguente viene illustrato come valutare nuovi casi d'uso. Anche se tutti i casi d'uso non sono trattati qui, è possibile decidere se Azure Esplora dati è la soluzione più adatta.

Caso d'uso Analisi interattiva Big Data (varietà, velocità, volume) Organizzazione dei dati Concorrenza Build o acquisto Quando usare Esplora dati di Azure?
Implementazione di un SaaS di analisi sicurezza Uso intenso di analisi interattive quasi in tempo reale. I dati sulla sicurezza sono vari, voluminosi e molto veloci. Variabile Il sistema viene spesso usato da più analisti di più tenant. L'implementazione di un'offerta SaaS è uno scenario di compilazione .
Analisi dei log della rete CDN Interattiva per la risoluzione dei problemi, monitoraggio QoS. I log della rete CDN sono vari, voluminosi e molto veloci. Record di log separati. Un piccolo gruppo di data scientist può usare queste analisi, ma può anche alimentare molti dashboard. Il valore estratto da rete CDN analytics è specifico dello scenario e richiede analisi personalizzate.
Database di serie temporali per i dati di telemetria IoT Interattivo per la risoluzione dei problemi, l'analisi delle tendenze, l'utilizzo e il rilevamento di anomalie. I dati di telemetria IoT sono ad alta velocità, ma possono essere strutturati solo o di medie dimensioni. Set di record correlati. Un piccolo gruppo di data scientist può usare queste analisi, ma può anche alimentare molti dashboard. Il contesto è in genere Build durante la ricerca di un database.

La tabella del diagramma di flusso seguente riepiloga le domande principali da porre quando si sta valutando l'uso di Azure Esplora dati.

Flowchart showing when to use Azure Data Explorer. Questions include: do you need to read and write a specific record, do you need to perform long running tasks, classic data warehouse, must run on other clouds, and small data.