Novità di HDInsight nel servizio Azure Kubernetes (anteprima)
Importante
Questa funzionalità è attualmente disponibile solo in anteprima. Le condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure includono termini legali più validi applicabili alle funzionalità di Azure disponibili in versione beta, in anteprima o non ancora rilasciate nella disponibilità generale. Per informazioni su questa anteprima specifica, vedere Informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire microsoft per altri aggiornamenti nella community di Azure HDInsight.
In HDInsight nel servizio Azure Kubernetes, tutte le operazioni e la gestione dei cluster hanno supporto nativo per la gestione dei servizi in portale di Azure per singoli cluster.
In HDInsight nel servizio Azure Kubernetes sono stati introdotti due nuovi concetti:
- I pool di cluster vengono usati per raggruppare e gestire i cluster.
- I cluster vengono usati per i calcoli open source, che sono ospitati all'interno di un pool di cluster.
Pool di cluster
HDInsight nel servizio Azure Kubernetes viene eseguito in servizio Azure Kubernetes (servizio Azure Kubernetes). La risorsa di primo livello è il pool di cluster e gestisce tutti i cluster in esecuzione nello stesso cluster del servizio Azure Kubernetes. Quando si crea un pool di cluster, viene creato un cluster del servizio Azure Kubernetes sottostante contemporaneamente per ospitare tutti i cluster nel pool. I pool di cluster sono un raggruppamento logico di cluster, che consente di creare un'interoperabilità affidabile tra più tipi di cluster e consentire alle aziende di avere i cluster nella stessa rete virtuale. I pool di cluster offrono accesso rapido e conveniente a tutti i tipi di cluster creati su richiesta e su larga scala. Un pool di cluster corrisponde a un cluster nell'infrastruttura del servizio Azure Kubernetes.
Clusters (Cluster)
I cluster sono singoli carichi di lavoro di calcolo open source, ad esempio Apache Spark, Apache Flink e Trino, che possono essere creati rapidamente in pochi minuti con configurazioni predefinite e pochi clic. Anche se in esecuzione nello stesso pool di cluster, ogni cluster può avere configurazioni personalizzate, ad esempio il tipo di cluster, la versione, le dimensioni della macchina virtuale del nodo, il numero di nodi. I cluster vengono eseguiti in risorse di calcolo separate con i propri endpoint e DNS.
Funzionalità attualmente in anteprima
L'elenco seguente illustra le funzionalità di HDInsight nel servizio Azure Kubernetes attualmente in anteprima. Le funzionalità di anteprima vengono ordinate alfabeticamente.
Area | Funzionalità |
---|---|
Nozioni fondamentali | Creare pool e cluster usando il portale, il supporto di Web Secure Shell (ssh) e la possibilità di scegliere il numero di nodi di lavoro durante la creazione del cluster |
Storage | Supporto Archiviazione di ADLS Gen2 |
Metastore | Supporto metastore esterno per Trino, Spark e Flink, integrazione con HDInsight |
Sicurezza | Supporto per il controllo degli accessi in base al ruolo arm, supporto per l'autenticazione basata su MSI, opzione per fornire l'accesso al cluster ad altri utenti |
Registrazione e monitoraggio | Aggregazione dei log in Log Analytics di Azure per i log del server, le metriche del cluster e del servizio tramite Prometheus gestito e Grafana, metriche del server di supporto in Monitoraggio di Azure, pagina Stato del servizio per monitorare il Integrità dei servizi |
Scalabilità automatica | Scalabilità automatica basata sul carico e Scalabilità automatica basata su pianificazione |
Personalizzare e configurare i cluster | Supporto per le azioni script durante la creazione del cluster, Supporto per la gestione delle librerie, Impostazioni di configurazione del servizio dopo la creazione del cluster |
Trino | Supporto per cataloghi Trino, supporto dell'interfaccia della riga di comando di Trino, supporto DBeaver per l'invio di query, aggiunta o rimozione di plug-in e connettori, supporto per la registrazione di eventi di query, supporto per l'analisi delle statistiche di query per qualsiasi Connessione or nel dashboard di Trino, supporto per il monitoraggio delle query, memorizzazione nella cache delle query, integrazione con Power BI Apache Superset, Redash, Supporto per più connettori |
Flink | Supporto per l'interfaccia utente Web nativa Flink, il supporto Flink con HMS per DStream, inviare processi al cluster usando l'API REST e portale di Azure, eseguire programmi in pacchetto come file JAR tramite l'interfaccia della riga di comando Flink, supporto per i punti di salvataggio permanenti, supporto per aggiornare le opzioni di configurazione quando il processo è in esecuzione, Connessione ing a più servizi di Azure: Azure Cosmos DB, Azure Databricks, Azure Databricks Azure Esplora dati, Hub eventi di Azure, hub IoT di Azure, Azure Pipelines, Azure Data Factory Workflow Orchestration Manager, HDInsight Kafka, Inviare processi al cluster usando l'interfaccia della riga di comando Flink e CDC con Flink |
Spark | Jupyter Notebook, supporto per Delta lake 2.0, supporto zeppelin, supporto ATS, supporto per l'interfaccia del server di cronologia Yarn, invio di processi tramite SSH, invio di processi con SDK e Notebook di Machine Learning |
Roadmap delle funzionalità
Funzionalità | Sequenza temporale di rilascio stimata | Status |
---|---|---|
Scalabilità automatica - Basato sul carico - Trino | Q1 2024 | Completato |
Ridimensionamento automatico basato sul carico basato su shuffle per Spark | Q2 2024 | In corso |
Aggiornamento sul posto | Q2 2024 | Completato |
Supporto per istanze riservate | Q2 2024 | In corso |
Autenticazione basata su MSI per Metastore (SQL) | Q1 2024 | In corso |
Spark 3.4 | Q2 2024 | In corso |
Trino 426 | Q1 2024 | Completato |
Ranger per controllo degli accessi in base al ruolo | Q2 2024 | In corso |
Supporto della modalità app per Flink | Q1 2024 | Completato |
Flink 1.17 | Q1 2024 | Completato |
Supporto di Spark ACID | Q1 2024 | In corso |
SKU configurabili per Headnode, SSH | Q2 2024 | In corso |
Supporto del gateway SQL Flink | Q1 2024 | Completato |
Cluster privati per HDInsight nel servizio Azure Kubernetes | Q1 2024 | Completato |
Supporto di Ranger per Spark SQL | Q4 2024 | In corso |
ACL ranger nel livello Archiviazione | Q4 2024 | In corso |
Supporto per One Lake come contenitore primario | Q2 2024 | In corso |