Vergleich der Speicheroptionen für die Verwendung mit Azure HDInsight-Clustern

Sie haben beim Erstellen von HDInsight-Clustern die Auswahl zwischen verschiedenen Azure Storage-Diensten:

Dieser Artikel bietet eine Übersicht über diese Speichertypen und ihre besonderen Merkmale.

Speichertypen und Features

Die folgende Tabelle enthält die Azure Storage-Dienste, die mit den unterschiedlichen Versionen von HDInsight unterstützt werden:

Speicherdienst Kontotyp Namespacetyp Unterstützte Dienste Unterstützte Leistungsstufen Unterstützte Zugriffsebenen HDInsight-Version Clustertyp
Azure Data Lake Storage Gen2 Allgemein v2 Hierarchisch (Dateisystem) Blob Standard Heiß, Kalt, Archiv 3.6 und höher Alle außer Spark 2.1 und 2.2
Azure Storage Allgemein v2 Object Blob Standard Heiß, Kalt, Archiv 3.6 und höher All
Azure Storage Allgemein v1 Object Blob Standard All All
Azure Storage Blob Storage** Object Blockblob Standard Heiß, Kalt, Archiv All All
Azure Data Lake Storage Gen1 Hierarchisch (Dateisystem) Nur 3.6 Alle mit Ausnahme von HBase
Azure Storage Blockblob Object Blockblob Premium 3.6 und höher Nur HBase mit beschleunigten Schreibvorgängen
Azure Data Lake Storage Gen2 Blockblob Hierarchisch (Dateisystem) Blockblob Premium 3.6 und höher Nur HBase mit beschleunigten Schreibvorgängen

**Für HDInsight-Cluster können nur sekundäre Speicherkonten den Typ „BlobStorage“ aufweisen, und der Seitenblob ist keine unterstützte Speicheroption.

Weitere Informationen zu Azure Storage-Kontotypen finden Sie unter Azure-Speicherkonten – Übersicht.

Weitere Informationen zu Azure Storage-Zugriffsebenen finden Sie unter Azure Blob Storage: Speicherebenen „Premium“ (Vorschauversion), „Heiß“, „Kalt“ und „Archiv“.

Sie können einen Cluster mit Kombinationen von Diensten für den primären und optional für den sekundären Speicher erstellen. Die folgende Tabelle enthält die Clusterspeicherkonfigurationen, die derzeit in HDInsight unterstützt werden:

HDInsight-Version Primärer Speicher Sekundärer Speicher Unterstützt
3.6 und 4.0 Universell V1, Universell V2 Universell V1, Universell V2, BlobStorage (Blockblobs) Ja
3.6 und 4.0 Universell V1, Universell V2 Data Lake Storage Gen2 Nein
3.6 und 4.0 Data Lake Storage Gen2* Data Lake Storage Gen2 Ja
3.6 und 4.0 Data Lake Storage Gen2* Universell V1, Universell V2, BlobStorage (Blockblobs) Ja
3.6 und 4.0 Data Lake Storage Gen2 Data Lake Storage Gen1 Nein
3.6 Data Lake Storage Gen1 Data Lake Storage Gen1 Ja
3.6 Data Lake Storage Gen1 Universell V1, Universell V2, BlobStorage (Blockblobs) Ja
3.6 Data Lake Storage Gen1 Data Lake Storage Gen2 Nein
4,0 Data Lake Storage Gen1 Any Nein
4,0 Universell V1, Universell V2 Data Lake Storage Gen1 Nein

*Hierbei kann es sich um ein oder mehrere Data Lake Storage Gen2-Konten handeln, sofern alle für die Verwendung derselben verwalteten Identität für den Clusterzugriff eingerichtet wurden.

Hinweis

Primärer Data Lake Storage Gen2-Speicher wird für Spark 2.1- und 2.2-Cluster nicht unterstützt.

Datenreplikation

Azure HDInsight speichert keine Kundendaten. Das primäre Speichermedium für einen Cluster sind die zugeordneten Speicherkonten. Sie können Ihren Cluster an ein vorhandenes Speicherkonto anfügen oder bei der Clustererstellung ein neues Speicherkonto erstellen. Wenn Sie ein neues Konto erstellen, wird es als LRS-Konto (lokal redundanter Speicher) erstellt, das neben den Anforderungen an die Datenresidenz in der Region auch die im Trust Center definierten Anforderungen erfüllt.

Sie können überprüfen, ob HDInsight ordnungsgemäß für die Speicherung von Daten in einer einzelnen Region konfiguriert ist, indem Sie sicherstellen, dass das mit HDInsight verknüpfte Speicherkonto ein LRS-Konto ist oder einer anderen im Trust Center definierten Speicheroption entspricht.

Hinweis

Ein Upgrade des primären oder sekundären Speicherkontos eines ausgeführten Clusters mit Azure Data Lake Storage Gen2-Funktionen wird nicht unterstützt. Um den Speichertyp eines vorhandenen HDInsight-Clusters in Data Lake Storage Gen2 zu ändern, müssen Sie den Cluster neu erstellen und ein Speicherkonto mit aktiviertem hierarchischem Namespace auswählen.

Nächste Schritte