Creazione di soluzioni di analisi basate su software open source con Azure HDInsight

Intermedio
Data engineer
Data scientist
Azure HDInsight

In questo percorso di apprendimento viene introdotto HDInsight e verrà illustrato come applicare questa tecnologia per risolvere una serie di sfide concrete.

Prerequisiti

I prerequisiti seguenti devono essere completati

  • Accesso al portale di Azure
  • Conoscenza delle opzioni di archiviazione di Azure
  • Conoscenza delle opzioni di elaborazione di Azure

Moduli in questo percorso di apprendimento

Al termine del modulo, si saprà che Azure HDInsight è un servizio cloud completamente gestito che consente di elaborare in modo efficiente notevoli quantità di dati usando i framework open source più diffusi.

In questo modulo vengono illustrate le varie configurazioni per garantire l'utilizzo ottimale di HDInsight, dal punto di vista sia delle prestazioni che dei costi.

In questo modulo viene descritto come creare un cluster HDInsight, monitorare un cluster ed essere a conoscenza dei comuni problemi di provisioning.

Informazioni sul modo in cui HBase offre accesso casuale e coerenza assoluta per quantità elevate di dati non strutturati e semistrutturati in un database privo di schema organizzato per famiglie di colonne.

In questo modulo si apprende come creare applicazioni e pipeline di analisi dei dati di streaming in tempo reale nel cloud, usando Azure HDInsight insieme ad Apache Kafka e Apache Spark.

Al termine di questo modulo, l'utente sarà in grado di eseguire query ad hoc su un set di dati di grandi dimensioni. L'uso di HDInsight Interactive Query consente di ottenere latenze di query inferiori al secondo.

Azure HDInsight garantisce, con altri servizi di Azure, una soluzione di sicurezza multilivello completa ed è una responsabilità condivisa tra Microsoft e il cliente.