Geavanceerde streaminggegevenstransformaties uitvoeren met Apache Spark en Kafka in Azure HDInsight

Gevorderd
Data Engineer
Data Scientist
Azure HDInsight

In deze module leert u hoe u realtime pijplijnen en toepassingen voor streaminggegevensanalyse in de cloud maakt met behulp van Azure HDInsight met Apache Kafka en Apache Spark.

Leerdoelen

Aan het einde van deze module begrijpt u het volgende:

  • Wanneer gebruikt u Apache Spark en Kafka met HDInsight.
  • Spark Structured Streaming.
  • De architectuur van een Kafka- en Spark-oplossing.
  • HdInsight inrichten, een Kafka-producent maken en Kafka-gegevens streamen naar een Jupyter-notebook.
  • Gegevens repliceren naar een secundair cluster.

Vereisten

De volgende vereiste moet worden voltooid:

  • Meld u aan bij Azure Portal.
  • Inzicht in de Opties voor Azure Storage.
  • Inzicht in de Azure-rekenopties.
  • Maak en configureer een HDInsight-cluster in Azure Portal.