Teilen über


Einführung in Clusterspeicher

Wichtig

Diese Funktion steht derzeit als Vorschau zur Verfügung. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure-Vorschauen enthalten weitere rechtliche Bestimmungen, die für Azure-Features in Betaversionen, in Vorschauversionen oder anderen Versionen gelten, die noch nicht allgemein verfügbar gemacht wurden. Informationen zu dieser spezifischen Vorschau finden Sie unter Informationen zur Vorschau von Azure HDInsight on AKS. Bei Fragen oder Funktionsvorschlägen senden Sie eine Anfrage an AskHDInsight mit den entsprechenden Details, und folgen Sie uns für weitere Updates in der Azure HDInsight-Community.

Azure HDInsight on AKS kann nahtlos in Azure Storage integriert werden – eine allgemeine Speicherlösung, die gut mit vielen anderen Azure-Diensten funktioniert. Azure Data Lake Storage Gen2 (ADLS Gen 2) ist das Standarddateisystem für die Cluster.

Das Speicherkonto kann als Standardspeicherort für Daten, Clusterprotokolle und andere Ausgaben verwendet werden, die während des Clustervorgangs generiert werden. Es kann auch ein Standardspeicher für den Hive-Katalog sein, der vom Clustertyp abhängt.

Weitere Informationen hierzu finden Sie unter Einführung in Azure Data Lake Storage Gen2.

Verwaltete Identitäten für sicheren Dateizugriff

Azure HDInsight on AKS verwendet verwaltete Identitäten (MSI), um den Clusterzugriff auf Dateien in Azure Data Lake Storage Gen2 zu sichern. „Verwaltete Identität“ ist ein Feature von Microsoft Entra ID, das Azure-Diensten eine Reihe von automatisch verwalteten Anmeldeinformationen zur Verfügung stellt. Diese Anmeldeinformationen können zur Authentifizierung bei jedem Dienst verwendet werden, der Active Directory-Authentifizierung unterstützt. Darüber hinaus erfordert die Verwendung verwalteter Identitäten nicht, dass Sie Anmeldeinformationen in Code- oder Konfigurationsdateien speichern.

Wenn Sie in Azure HDInsight on AKS während der Clustererstellung eine verwaltete Identität und einen Speicher auswählen, kann die verwaltete Identität nahtlos mit dem Speicher für die Datenverwaltung verwendet werden, vorausgesetzt, die Rolle Besitzer von Speicherblobdaten ist der benutzerseitig zugewiesenen MSI zugewiesen.

In der folgenden Tabelle sind die unterstützten Speicheroptionen für Azure HDInsight on AKS (öffentliche Vorschau) beschrieben:

Clustertyp Unterstützter Speicher Verbindung Rolle für den Speicher
Trino, Apache Flink und Apache Spark ADLS Gen2 Benutzerseitig zugewiesene verwaltete Identität (MSI) des Clusters Die benutzerseitig zugewiesene MSI muss über die Rolle Besitzer von Speicherblobdaten für das Speicherkonto verfügen.

Hinweis

Wenn Sie ein Speicherkonto über mehrere Cluster hinweg freigeben möchten, können Sie einfach die benutzerseitig zugewiesene Cluster-MSI mit der Rolle „Besitzer von Speicherblobdaten“ für das freigegebene Speicherkonto zuweisen. Erfahren Sie, wie Sie eine Rolle zuweisen.

Danach können Sie den vollständigen Speicherpfad abfs:// verwenden, um über Ihre Anwendungen auf die Daten zuzugreifen.

Weitere Informationen finden Sie unter Verwaltete Identitäten für Azure-Ressourcen.
Erfahren Sie mehr über das Erstellen eines ADLS Gen2-Kontos.

Azure HDInsight on AKS-Speicherarchitektur

Das folgende Diagramm bietet eine verallgemeinerte Übersicht über die Azure HDInsight on AKS-Architektur von Azure Storage:

Screenshot: Speicherarchitektur

Speicherverwaltung

Derzeit unterstützt Azure HDInsight on AKS keine Speicherkonten mit aktiviertem vorläufigem Löschen. Deaktivieren Sie unbedingt vorläufiges Löschen für Ihr Speicherkonto.

Screenshot: Portal-Benutzeroberfläche für das vorläufige Löschen