Was ist neu in HDInsight auf AKS? (Vorschau)
Hinweis
Azure HDInsight on AKS wird am 31. Januar 2025 eingestellt. Vor dem 31. Januar 2025 müssen Sie Ihre Workloads zu Microsoft Fabric oder einem gleichwertigen Azure-Produkt migrieren, um eine abruptes Beendigung Ihrer Workloads zu vermeiden. Die verbleibenden Cluster in Ihrem Abonnement werden beendet und vom Host entfernt.
Bis zum Einstellungsdatum ist nur grundlegende Unterstützung verfügbar.
Wichtig
Diese Funktion steht derzeit als Vorschau zur Verfügung. Die zusätzlichen Nutzungsbedingungen für Microsoft Azure-Vorschauen enthalten weitere rechtliche Bestimmungen, die für Azure-Features in Betaversionen, in Vorschauversionen oder anderen Versionen gelten, die noch nicht allgemein verfügbar gemacht wurden. Informationen zu dieser spezifischen Vorschau finden Sie unter Informationen zur Vorschau von Azure HDInsight on AKS. Bei Fragen oder Funktionsvorschlägen senden Sie eine Anfrage an AskHDInsight mit den entsprechenden Details, und folgen Sie uns für weitere Updates in der Azure HDInsight-Community.
In HDInsight auf AKS haben alle Clusterverwaltung und -vorgänge native Unterstützung für Dienstverwaltung im Azure-Portal für einzelne Cluster.
In HDInsight auf AKS werden zwei neue Konzepte eingeführt:
- Clusterpools werden zum Gruppieren und Verwalten von Clustern verwendet.
- Werden Cluster für Open Source-Berechnungen verwendet, werden sie in einem Clusterpool gehostet.
Clusterpools
HDInsight auf AKS wird auf Azure Kubernetes Service (AKS) ausgeführt. Die Ressource auf oberster Ebene ist der Clusterpool und verwaltet alle Cluster, die auf demselben AKS-Cluster ausgeführt werden. Wenn Sie einen Clusterpool erstellen, wird gleichzeitig ein zugrunde liegender AKS-Cluster erstellt, um alle Cluster im Pool zu hosten. Clusterpools sind eine logische Gruppierung von Clustern, die bei der Erstellung einer stabilen Interoperabilität über mehrere Clustertypen hinweg helfen und es Unternehmen ermöglichen, die Cluster im selben virtuellen Netzwerk zu haben. Clusterpools bieten schnellen und kostengünstigen Zugriff auf alle Clustertypen, die bei Bedarf und im Großen und Maßstab erstellt wurden. Ein Clusterpool entspricht einem Cluster in der AKS-Infrastruktur.
Cluster
Cluster sind einzelne Open-Source-Computeworkloads wie Apache Spark, Apache Flink und Trino, die in wenigen Minuten mit voreingestellten Konfigurationen und wenigen Klicks schnell erstellt werden können. Obwohl sie auf demselben Clusterpool ausgeführt wird, kann jeder Cluster eigene Konfigurationen haben, z. B. Clustertyp, Version, Größe des virtuellen Knotens, Knotenanzahl. Cluster werden auf getrennten Computeressourcen mit eigenen DNS- und Endpunkten ausgeführt.
Funktionen, die sich derzeit in der Vorschauphase befinden
In der folgenden Tabellenliste sind die Features von HDInsight auf AKS aufgeführt, die sich derzeit in der Vorschau befinden. Previewfunktionen werden alphabetisch sortiert.
Bereich | Funktionen |
---|---|
Grundlagen | Erstellen von Pool und Clustern mithilfe des Portals, Unterstützung der sicheren Webshell (SSH), Auswahl der Anzahl der Workerknoten während der Clustererstellung |
Storage | ADLS Gen2-Speicher-Support |
Metastore | Support für externe Metastores für Trino, Spark und Flink, Integration in HDInsight |
Sicherheit | Support für ARM RBAC, Support für MSI-basierte Authentifizierung, Option zum Bereitstellen des Clusterzugriffs auf andere Benutzer |
Protokollierung und Überwachung | Protokollaggregation in Azure-Protokollanalysen, für Serverprotokolle, Cluster- und Dienstmetriken über verwaltetes Prometheus und Grafana, Support von Servermetriken in Azure Monitor, Dienststatusseite zur Überwachung von Integritätsdienst |
Automatische Skalierung | Lastbasierte automatische Skalierung und Planen der automatischen Skalierung |
Anpassen und Konfigurieren von Clustern | Support für Skriptaktionen während der Clustererstellung, Unterstützung für Bibliotheksverwaltung, Dienstkonfigurationseinstellungen nach der Clustererstellung |
Trino | Unterstützung für Trino-Kataloge, Trino CLI-Support, DBeaver-Support für die Abfrageübermittlung, Hinzufügen oder Entfernen von Plug-Ins und Connectors, Support für Protokollierungsabfrageevents, Support für Scanabfragestatistiken für jeden Connector im Trino-Dashboard, Unterstützung für Trino-Dashboard zum Überwachen von Abfragen, Abfragezwischenspeicherung, Integration mit PowerBI, Integration mit Apache Superset, Redash, Unterstützung für mehrere Connectors |
Flink | Unterstützung für Flink native Web-UI, Flink-Unterstützung mit HMS für DStream, Senden von Aufträgen an den Cluster mithilfe vonREST-API und Azure Portal, Ausführen von Programmen, die als JAR-Dateien über dieFlink CLI gepackt sind, Unterstützung für persistente Speicherpunkte, Unterstützung für Updates der Konfigurationsoptionen während der Auftragsausführung, Herstellen einer Verbindung mit mehreren Azure-Diensten:Azure Cosmos DB,Azure Databricks, Azure Data Explorer, Azure Event Hubs, Azure IoT Hub, Azure Pipelines, Azure Data Factory Wokflow Orchestration Manager, HDInsight Kafka, Senden von Aufträgen an den Cluster mithilfe von Flink CLI und CDC mit Flink |
Spark | Jupyter Notebook, Support für Delta Lake 2.0, Zeppelin Support, Support ATS, Support für Yarn History Server Interface, Auftragsübermittlung mit SSH, Auftragsübermittlung mit SDK und Machine Learning Notebook |
Roadmap der Funktionen
Funktion | Geschätzte Release-Zeitachse | Status |
---|---|---|
Autoskalierung – Lastbasiert – Trino | Q1 2024 | Abgeschlossen |
Lastbasierte automatische Skalierung für Spark | Q2 2024 | In Bearbeitung |
Direktes Upgrade | Q2 2024 | Abgeschlossen |
Support für reservierte Instanzen | Q2 2024 | In Bearbeitung |
MSI-basierte Authentifizierung für Metastore (SQL) | Q1 2024 | In Bearbeitung |
SPARK 3.4 | Q2 2024 | In Bearbeitung |
Trino 426 | Q1 2024 | Abgeschlossen |
Ranger für RBAC | Q2 2024 | In Bearbeitung |
Unterstützung für den App-Modus für Flink | Q1 2024 | Abgeschlossen |
Flink 1.17 | Q1 2024 | Abgeschlossen |
Spark ACID-Support | Q1 2024 | In Bearbeitung |
Konfigurierbare SKUs für Headnode, SSH | Q2 2024 | In Bearbeitung |
Flink-SQL-Gateways-Support | Q1 2024 | Abgeschlossen |
Private Cluster für HDInsight on AKS | Q1 2024 | Abgeschlossen |
Ranger-Support für Spark SQL | Q4 2024 | In Bearbeitung |
Ranger ACLs auf Speicherebene | Q4 2024 | In Bearbeitung |
Unterstützung für One Lake als primärer Container | Q2 2024 | Vorgang wird ausgeführt |