HDInsight nel servizio Azure Kubernetes - Domande frequenti

Articolo
10/18/2023

Questo articolo illustra alcune domande comuni su Azure HDInsight nel servizio Azure Kubernetes.

Generale

Che cos'è HDInsight nel servizio Azure Kubernetes?

HDInsight nel servizio Azure Kubernetes è una nuova versione di HDInsight, che offre un servizio cluster gestito pronto per l'organizzazione con progetti di analisi open source emergenti come Apache Flink (per lo streaming), Trino (per l'analisi adhoc e BI) e Apache Spark. Per altre informazioni, vedere la panoramica.
Quali forme del cluster supportano HDInsight nel servizio Azure Kubernetes?

HDInsight nel servizio Azure Kubernetes supporta Trino, Apache Flink e Apache Spark per iniziare. Tuttavia, altre forme del cluster, ad esempio Kafka, Hive e così via, sono in programma di orientamento.
Ricerca per categorie iniziare a usare HDInsight nel servizio Azure Kubernetes?

Per iniziare, visitare Azure Marketplace e cercare Azure HDInsight nel servizio Servizio Azure Kubernetes e fare riferimento a Introduzione.
Cosa accade a HDInsight esistente nella macchina virtuale e ai cluster attualmente in esecuzione?

Non sono state apportate modifiche a HDInsight esistente (HDInsight nella macchina virtuale). Tutti i cluster esistenti continuano a essere eseguiti ed è possibile continuare a creare e ridimensionare nuovi cluster HDInsight.
Quale sistema operativo è supportato con HDInsight nel servizio Azure Kubernetes?

HDInsight nel servizio Azure Kubernetes si basa sul sistema operativo Mariner. Per altre informazioni, vedere Versione del sistema operativo.
In quali aree sono disponibili HDInsight nel servizio Azure Kubernetes?

Per un elenco delle aree supportate, vedere Disponibilità dell'area.
Qual è il costo per distribuire un cluster HDInsight nel servizio Azure Kubernetes?

Per altre informazioni sui prezzi, vedere Prezzi di HDInsight nel servizio Azure Kubernetes.

Gestione dei cluster

È possibile eseguire più cluster contemporaneamente?

Sì, è possibile eseguire contemporaneamente tutti i cluster desiderati per ogni pool di cluster. Tuttavia, assicurarsi di non essere vincolati per quota per la sottoscrizione. Il numero massimo di nodi consentiti in un pool di cluster è 250 (in anteprima pubblica).
È possibile installare o aggiungere più plug-in/librerie nel cluster?

Sì, è possibile installare plug-in e librerie personalizzate a seconda delle forme del cluster.
- Per Trino, vedere Installare plug-in personalizzati.
- Per Spark, vedere Gestione delle librerie in Spark.
È possibile connettersi tramite SSH al cluster?

Sì, è possibile connettersi tramite SSH al cluster tramite Webssh ed eseguire query e inviare processi direttamente da questa posizione.

Metastore

È possibile usare un metastore esterno per connettersi al cluster?

Sì, è possibile usare un metastore esterno. Tuttavia, è supportato solo database SQL di Azure come metastore personalizzato esterno.
È possibile condividere un metastore tra più cluster?

Sì, è possibile condividere un metastore tra più hdinsight del servizio Azure Kubernetes.
Qual è la versione del metastore Hive supportata?

Metastore Hive versione 3.1.2

Carichi di lavoro

Trino

Che cos'è Trino?

Trino è un motore di query SQL federato e distribuito open source, che consente di eseguire query sui dati che risiedono in origini dati diverse senza passare a un data warehouse centrale. È possibile eseguire query sui dati usando ANSI SQL, senza dover apprendere un nuovo linguaggio. Per altre informazioni, vedere Panoramica di Trino.
Quali connettori sono supportati?

HDInsight nel servizio Azure Kubernetes Trino supporta più connettori. Per altre informazioni, vedere questo elenco di connettori Trino. Continuiamo ad aggiungere nuovi connettori come e quando sono disponibili nuovi connettori nella versione open source.
È possibile aggiungere cataloghi a un cluster esistente?

Sì, è possibile aggiungere cataloghi supportati al cluster esistente. Per altre informazioni, vedere Aggiungere cataloghi a un cluster esistente.

Apache Flink

Che cos'è Apache Flink?

Apache Flink è un motore di analisi open source di classe migliore per l'elaborazione dei flussi e l'esecuzione di calcoli con stato su flussi di dati non associati e delimitati. Può eseguire calcoli a velocità in memoria e su qualsiasi scala. Flink in HDInsight nel servizio Azure Kubernetes offre apache Flink open source gestito. Per altre informazioni, vedere Panoramica di Flink.
È supportata sia la modalità sessione che la modalità app in Apache Flink?

In HDInsight nel servizio Azure Kubernetes il collegamento supporta attualmente i cluster in modalità sessione.
Che cos'è la gestione back-end di stato e come viene eseguita in HDInsight nel servizio Azure Kubernetes?

I back-end determinano dove viene archiviato lo stato. Quando viene attivato il checkpoint, lo stato viene mantenuto in caso di checkpoint per proteggersi dalla perdita di dati e ripristinare in modo coerente. Il modo in cui lo stato viene rappresentato internamente e come e dove viene salvato in modo permanente in base ai checkpoint dipende dal back-end di stato scelto. Per altre informazioni, vedere Panoramica di Flink

Apache Spark

Che cos'è Apache Spark?

Apache Spark è un framework di elaborazione dati che può eseguire rapidamente attività di elaborazione su set di dati di grandi dimensioni e può anche distribuire attività di elaborazione dati in più computer, autonomamente o in combinazione con altri strumenti di elaborazione distribuiti.
Quali API del linguaggio sono supportate in Spark?

Azure HDInsight nel servizio Azure Kubernetes supporta Python e Scala.
Il metastore esterno è supportato in HDInsight in Spark del servizio Azure Kubernetes?

HDInsight nel servizio Azure Kubernetes supporta la connettività del metastore esterno. Attualmente solo il database SQL di Azure supportato come metastore esterno.
Quali sono i vari modi per inviare processi in HDInsight in Spark del servizio Azure Kubernetes?

È possibile inviare processi in HDInsight in Spark del servizio Azure Kubernetes usando Jupyter Notebook, Notebook Zeppelin, SDK e terminale del cluster. Per altre informazioni, vedere Inviare e gestire processi in un cluster Spark in HDInsight nel servizio Azure Kubernetes

Condividi tramite

HDInsight nel servizio Azure Kubernetes - Domande frequenti

Generale

Gestione dei cluster

Metastore

Carichi di lavoro

Trino

Apache Flink

Apache Spark

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive