Quando usare HDInsight

Completato

Il principale punto di forza di HDInsight è dato dalle numerose configurazioni offerte dal servizio. Consente quindi di supportare un'ampia gamma di carichi di lavoro. Questi carichi di lavoro possono essere l'elaborazione dei dati in batch, l'uso di flussi di dati o la gestione di carichi di lavoro di data warehousing e/o di data science. Questa funzionalità rende HDInsight una soluzione interessante, soprattutto se il processo aziendale contiene più carichi di lavoro.

Se, ad esempio, l'organizzazione crea solo un data warehouse per presentare report cronologici tramite Power BI, è possibile usare Azure SQL Data Warehouse con Power BI. Analogamente, se l'organizzazione si limita a eseguire analisi avanzate con una soluzione di data science, potrebbe essere opportuno usare solo Azure Databricks.

Se, però, i carichi di lavoro dell'organizzazione implicano l'inserimento di dati per la creazione di report cronologici e l'analisi avanzata e sono disponibili dati in streaming che richiedono l'analisi, la soluzione migliore è HDInsight. Tutti i dati possono essere inseriti in un'unica posizione Data Lake ed è quindi possibile usare la configurazione corretta di HDInsight per gestire l'elaborazione batch, il data warehousing, le operazioni di data science e i carichi di lavoro di streaming. Grazie alla separazione tra calcolo e archiviazione, questa operazione può essere eseguita facilmente sugli stessi dati. Sarà inoltre possibile ridurre al minimo il costo dell'archiviazione perché le operazioni vengono eseguite su un unico archivio dati.

Elementi distintivi di HDInsight

Oltre agli scenari illustrati in precedenza, di seguito sono elencati i principali elementi distintivi che rendono HDInsight la soluzione ideale per carichi di lavoro basati su Big Data:

  • Calcolo e archiviazione scalabili in modo indipendente
  • Ridimensionamento automatico dei nodi di lavoro in base al carico di lavoro o alla pianificazione
  • Flessibilità e tolleranza di errore dei nodi master
  • Sicurezza aziendale
  • SDK

La separazione delle risorse di calcolo e di archiviazione, unitamente al ridimensionamento automatico del cluster in base al carico di lavoro o alla pianificazione, può contribuire a ridurre significativamente i costi. I nodi master di HDInsight sono resilienti agli errori. I nodi master sono supportati da macchine virtuali a tolleranza di errore che garantiscono un servizio a disponibilità elevata con un contratto di servizio del 99,9%. Grazie all'integrazione di Microsoft Entra è possibile disporre di funzionalità di sicurezza aziendale per l'autenticazione e l'autorizzazione. Queste funzionalità, combinate con la crittografia e il supporto della rete virtuale, offrono un controllo granulare sugli utenti autorizzati ad accedere ai dati. HDInsight è supportato da numerosi SDK, che consentono la creazione e lo sviluppo di cluster in più linguaggi in diversi IDE.