Introduzione all'archiviazione cluster
Nota
Azure HDInsight su AKS verrà ritirato il 31 gennaio 2025. Prima del 31 gennaio 2025, sarà necessario eseguire la migrazione dei carichi di lavoro a Microsoft Fabric o a un prodotto Azure equivalente per evitare interruzioni improvvise dei carichi di lavoro. I cluster rimanenti nella sottoscrizione verranno arrestati e rimossi dall’host.
Solo il supporto di base sarà disponibile fino alla data di ritiro.
Importante
Questa funzionalità è attualmente disponibile solo in anteprima. Le Condizioni per l'utilizzo supplementari per le anteprime di Microsoft Azure includono termini legali aggiuntivi che si applicano a funzionalità di Azure in versione beta, in anteprima o in altro modo non ancora disponibili a livello generale. Per informazioni su questa anteprima specifica, vedere Informazioni sull'anteprima di Azure HDInsight nel servizio Azure Kubernetes. Per domande o suggerimenti sulle funzionalità, inviare una richiesta in AskHDInsight con i dettagli e seguire Microsoft per altri aggiornamenti nella Community di Azure HDInsight.
Azure HDInsight nel servizio Azure Kubernetes può integrarsi facilmente con Archiviazione di Azure, una soluzione di archiviazione per utilizzo generico che funziona bene con molti altri servizi di Azure. Azure Data Lake Storage Gen2 (ADLS Gen 2) è il file system predefinito per i cluster.
L'account di archiviazione può essere usato come percorso predefinito per i dati, i log del cluster e altri output generati durante l'operazione del cluster. Potrebbe anche essere una risorsa di archiviazione predefinita per il catalogo Hive che dipende dal tipo di cluster.
Per altre informazioni, vedere Introduzione ad Azure Data Lake Storage Gen2.
Identità gestite per un accesso sicuro ai file
Azure HDInsight su AKS usa identità gestite (MSI) per proteggere l'accesso del cluster ai file in Azure Data Lake Storage Gen2. L'identità gestita è una funzionalità di Microsoft Entra ID che fornisce ai servizi di Azure un set di credenziali gestite automaticamente. Queste credenziali possono essere usate per eseguire l'autenticazione per qualsiasi servizio che supporti l'autenticazione Active Directory. Inoltre, le identità gestite non richiedono l'archiviazione delle credenziali in file di codice o di configurazione.
In Azure HDInsight nel servizio Azure Kubernetes, dopo aver selezionato un'identità gestita e una risorsa di archiviazione durante la creazione del cluster, l'identità gestita può funzionare senza problemi con l'archiviazione per la gestione dei dati, purché il ruolo di proprietario dei dati del BLOB di archiviazione sia assegnato all'identità del servizio gestito assegnata dall'utente.
La tabella seguente illustra le opzioni di archiviazione supportate per Azure HDInsight nel servizio Azure Kubernetes (anteprima pubblica):
Tipo di cluster | Archiviazione supportata | Connessione | Ruolo nell'archiviazione |
---|---|---|---|
Trino, Apache Flink e Apache Spark | ADLS Gen2 | Identità gestita assegnata dall'utente del cluster (MSI). | L'identità gestita assegnata dall'utente deve disporre del ruolo Proprietario dei dati del BLOB di archiviazione nell'account di archiviazione. |
Nota
Per condividere un account di archiviazione tra più cluster, è sufficiente assegnare la MSI assegnata dall'utente del cluster "proprietario dati blob di archiviazione" corrispondente nell'account di archiviazione condiviso. Informazioni su come assegnare un ruolo.
Successivamente, è possibile usare il percorso di archiviazione completo abfs://
per accedere ai dati tramite le applicazioni.
Per altre informazioni, vedere Identità gestite per le risorse di Azure.
Informazioni su come creare un account ADLS Gen2.
Architettura di archiviazione di Azure HDInsight nel servizio Azure Kubernetes
Nel diagramma seguente viene sintetizzata l'architettura Azure HDInsight su AKS di Archiviazione di Azure.
Gestione dell'archiviazione
Attualmente, Azure HDInsight nel servizio Azure Kubernetes non supporta gli account di archiviazione con eliminazione temporanea abilitata, assicurarsi di disabilitare l'eliminazione temporanea per l'account di archiviazione.