Novità di HDInsight nel servizio Azure Kubernetes (anteprima)

Articolo
03/24/2024

Importante

Questa funzionalità è attualmente disponibile solo in anteprima. Le condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure disponibili in versione beta, in anteprima o non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere Informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire microsoft per altri aggiornamenti nella community di Azure HDInsight.

In HDInsight nel servizio Azure Kubernetes, tutte le operazioni e la gestione dei cluster hanno supporto nativo per la gestione dei servizi in portale di Azure per singoli cluster.

In HDInsight nel servizio Azure Kubernetes sono stati introdotti due nuovi concetti:

I pool di cluster vengono usati per raggruppare e gestire i cluster.
I cluster vengono usati per i calcoli open source, che sono ospitati all'interno di un pool di cluster.

Pool di cluster

HDInsight nel servizio Azure Kubernetes viene eseguito in servizio Azure Kubernetes (servizio Azure Kubernetes). La risorsa di primo livello è il pool di cluster e gestisce tutti i cluster in esecuzione nello stesso cluster del servizio Azure Kubernetes. Quando si crea un pool di cluster, viene creato un cluster del servizio Azure Kubernetes sottostante contemporaneamente per ospitare tutti i cluster nel pool. I pool di cluster sono un raggruppamento logico di cluster, che consente di creare un'interoperabilità affidabile tra più tipi di cluster e consentire alle aziende di avere i cluster nella stessa rete virtuale. I pool di cluster offrono accesso rapido e conveniente a tutti i tipi di cluster creati su richiesta e su larga scala. Un pool di cluster corrisponde a un cluster nell'infrastruttura del servizio Azure Kubernetes.

Clusters (Cluster)

I cluster sono singoli carichi di lavoro di calcolo open source, ad esempio Apache Spark, Apache Flink e Trino, che possono essere creati rapidamente in pochi minuti con configurazioni predefinite e pochi clic. Anche se in esecuzione nello stesso pool di cluster, ogni cluster può avere configurazioni personalizzate, ad esempio il tipo di cluster, la versione, le dimensioni della macchina virtuale del nodo, il numero di nodi. I cluster vengono eseguiti in risorse di calcolo separate con i propri endpoint e DNS.

Funzionalità attualmente in anteprima

L'elenco seguente illustra le funzionalità di HDInsight nel servizio Azure Kubernetes attualmente in anteprima. Le funzionalità di anteprima vengono ordinate alfabeticamente.

Area	Funzionalità
Nozioni fondamentali	Creare pool e cluster usando il portale, il supporto di Web Secure Shell (ssh) e la possibilità di scegliere il numero di nodi di lavoro durante la creazione del cluster
Storage	Supporto Archiviazione di ADLS Gen2
Metastore	Supporto metastore esterno per Trino, Spark e Flink, integrazione con HDInsight
Sicurezza	Supporto per il controllo degli accessi in base al ruolo arm, supporto per l'autenticazione basata su MSI, opzione per fornire l'accesso al cluster ad altri utenti
Registrazione e monitoraggio	Aggregazione dei log in Log Analytics di Azure per i log del server, le metriche del cluster e del servizio tramite Prometheus gestito e Grafana, metriche del server di supporto in Monitoraggio di Azure, pagina Stato del servizio per monitorare il Integrità dei servizi
Scalabilità automatica	Scalabilità automatica basata sul carico e Scalabilità automatica basata su pianificazione
Personalizzare e configurare i cluster	Supporto per le azioni script durante la creazione del cluster, Supporto per la gestione delle librerie, Impostazioni di configurazione del servizio dopo la creazione del cluster
Trino	Supporto per cataloghi Trino, supporto dell'interfaccia della riga di comando di Trino, supporto DBeaver per l'invio di query, aggiunta o rimozione di plug-in e connettori, supporto per la registrazione di eventi di query, supporto per l'analisi delle statistiche di query per qualsiasi Connessione or nel dashboard di Trino, supporto per il monitoraggio delle query, memorizzazione nella cache delle query, integrazione con Power BI Apache Superset, Redash, Supporto per più connettori
Flink	Supporto per l'interfaccia utente Web nativa Flink, il supporto Flink con HMS per DStream, inviare processi al cluster usando l'API REST e portale di Azure, eseguire programmi in pacchetto come file JAR tramite l'interfaccia della riga di comando Flink, supporto per i punti di salvataggio permanenti, supporto per aggiornare le opzioni di configurazione quando il processo è in esecuzione, Connessione ing a più servizi di Azure: Azure Cosmos DB, Azure Databricks, Azure Databricks Azure Esplora dati, Hub eventi di Azure, hub IoT di Azure, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Inviare processi al cluster usando l'interfaccia della riga di comando Flink e CDC con Flink
Spark	Jupyter Notebook, supporto per Delta lake 2.0, supporto zeppelin, supporto ATS, supporto per l'interfaccia del server di cronologia Yarn, invio di processi tramite SSH, invio di processi con SDK e Notebook di Machine Learning

Roadmap delle funzionalità

Funzionalità	Sequenza temporale di rilascio stimata	Status
Scalabilità automatica - Basato sul carico - Trino	Q1 2024	Completato
Ridimensionamento automatico basato sul carico basato su shuffle per Spark	Q2 2024	In corso
Aggiornamento sul posto	Q2 2024	Completato
Supporto per istanze riservate	Q2 2024	In corso
Autenticazione basata su MSI per Metastore (SQL)	Q1 2024	In corso
Spark 3.4	Q2 2024	In corso
Trino 426	Q1 2024	Completato
Ranger per controllo degli accessi in base al ruolo	Q2 2024	In corso
Supporto della modalità app per Flink	Q1 2024	Completato
Flink 1.17	Q1 2024	Completato
Supporto di Spark ACID	Q1 2024	In corso
SKU configurabili per Headnode, SSH	Q2 2024	In corso
Supporto del gateway SQL Flink	Q1 2024	Completato
Cluster privati per HDInsight nel servizio Azure Kubernetes	Q1 2024	Completato
Supporto di Ranger per Spark SQL	Q4 2024	In corso
ACL ranger nel livello Archiviazione	Q4 2024	In corso
Supporto per One Lake come contenitore primario	Q2 2024	In corso

Condividi tramite

Novità di HDInsight nel servizio Azure Kubernetes (anteprima)

Pool di cluster

Clusters (Cluster)

Funzionalità attualmente in anteprima

Roadmap delle funzionalità

Commenti e suggerimenti

Risorse aggiuntive