Erstellen von analytischen Open-Source-Softwarelösungen mit Azure HDInsight

Fortgeschrittene Anfänger
Datentechniker
Data Scientist
Azure HDInsight

In diesem Lernpfad erhält der Benutzer eine Einführung in HDInsight und Informationen zum Anwenden dieser Technologie, um Herausforderungen in der realen Welt zu lösen.

Voraussetzungen

Die folgenden Voraussetzungen müssen erfüllt sein:

  • Erfolgreiche Anmeldung im Azure-Portal
  • Kenntnisse über Azure-Speicheroptionen
  • Kenntnisse über Azure-Computeoptionen

Module in diesem Lernpfad

Am Ende dieses Moduls werden Sie gelernt haben, dass Azure HDInsight ein vollständig verwalteter Clouddienst ist, mit dem Sie effizient riesige Datenmengen mithilfe der beliebtesten Open-Source-Frameworks verarbeiten können.

In diesem Modul erfahren Sie mehr über die verschiedenen Konfigurationen, mit denen Sie die Leistung von HDInsight optimieren und die Kosten möglichst gering halten können.

In diesem Modul erfahren Sie, wie Sie einen HDInsight-Cluster erstellen, einen Cluster überwachen und welche Probleme häufiger bei der Bereitstellung auftreten können.

In diesem Modul erfahren Sie, wie HBase Direktzugriff und starke Konsistenz für große Mengen unstrukturierter und teilweise strukturierter Daten in einer Datenbank ohne Schema bieten kann, die nach Spaltenfamilien organisiert ist.

In diesem Modul erfahren Sie, wie Sie mit Azure HDInsight, Apache Kafka und Apache Spark Pipelines und Anwendungen für Streamingdatenanalysen in Echtzeit in der Cloud erstellen.

Nach Abschluss dieses Moduls sind Sie in der Lage, Ad-hoc-Abfragen für ein großes Dataset durchzuführen. Mithilfe von HDInsight Interactive Query können Abfragewartezeiten unter einer Sekunde erzielt werden.

Azure HDInsight bietet in Verbindung mit anderen Azure-Diensten eine umfassende Sicherheitslösung mit mehreren Ebenen und liegt in der gemeinsamen Verantwortung von Microsoft und dem Kunden.