Analyseoplossing ontwikkelen op basis van Open Source-software (OSS) met Azure HDInsight

Gevorderd
Data Engineer
Data Scientist
Azure HDInsight

In dit leertraject wordt de cursist geïntroduceerd in HDInsight en hoe deze technologie kan worden toegepast om een reeks echte uitdagingen op te lossen.

Vereisten

Er moet aan de volgende vereiste worden voldaan

  • Aanmelden bij Azure Portal
  • De opslagopties in Azure begrijpen
  • De berekeningsopties in Azure begrijpen

Modules in dit leertraject

Aan het einde van deze module leert u dat Azure HDInsight een volledig beheerde cloudservice is waarmee u efficiënt enorme hoeveelheden gegevens kunt verwerken met behulp van de populairste opensource-frameworks.

In deze module leert u de verschillende configuraties voor optimaal gebruik van HDInsight vanuit zowel prestatie- als kostenperspectief.

In deze module leert u hoe u een HDInsight-cluster maakt, een cluster bewaakt en op de hoogte bent van veelvoorkomende inrichtingsproblemen.

Meer informatie over hoe HBase willekeurige toegang en sterke consistentie biedt voor grote hoeveelheden ongestructureerde en semi-gestructureerde gegevens in een schema dat minder is geordend op kolomfamilies.

In deze module leert u hoe u realtime pijplijnen en toepassingen voor streaminggegevensanalyse in de cloud maakt met behulp van Azure HDInsight met Apache Kafka en Apache Spark.

Aan het einde van deze module kunt u ad-hocquery's uitvoeren op een set met big data. Het gebruik van HDInsight Interactive Query helpt bij het bereiken van latenties van sub tweede query's.

Azure HDInsight met andere Azure-services biedt een uitgebreide beveiligingsoplossing met meerdere lagen en is een gedeelde verantwoordelijkheid tussen Microsoft en de klant.