Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
I passaggi descritti in questo documento illustrano come creare un cluster HDInsight 4.0 usando l'interfaccia della riga di comando di Azure.
Avvertimento
La fatturazione dei cluster HDInsight viene calcolata al minuto, indipendentemente dal fatto che siano usati o meno. Assicurarsi di eliminare il cluster dopo aver finito di usarlo. Vedere Come eliminare un cluster HDInsight.
Se non si ha un account Azure, creare un account gratuito prima di iniziare.
Prerequisiti
È possibile utilizzare l'ambiente Bash in Azure Cloud Shell. Per altre informazioni, vedere Introduzione ad Azure Cloud Shell.
Se preferisci eseguire localmente i comandi di riferimento della CLI, installa l'Azure CLI. Se si esegue in Windows o macOS, è consigliabile eseguire l'interfaccia della riga di comando di Azure in un contenitore Docker. Per altre informazioni, vedere Come eseguire l'interfaccia della riga di comando di Azure in un contenitore Docker.
Se usi un'installazione locale, accedi all'interfaccia della riga di comando di Azure usando il comando az login. Per completare il processo di autenticazione, seguire i passaggi visualizzati nel terminale. Per altre opzioni di accesso, vedere Eseguire l'autenticazione ad Azure con l'interfaccia della riga di comando di Azure.
Quando ti viene richiesto, installa l'estensione Azure CLI al primo utilizzo. Per altre informazioni sulle estensioni, vedere Usare e gestire le estensioni con l'interfaccia della riga di comando di Azure.
Esegui az version per trovare la versione e le librerie dipendenti installate. Per eseguire l'aggiornamento alla versione più recente, avviare az upgrade.
Creare un cluster
Accedere alla sottoscrizione di Azure. Se si prevede di usare Azure Cloud Shell, selezionare Prova nell'angolo superiore destro del blocco di codice. In caso contrario, immettere il comando seguente:
az login # If you have multiple subscriptions, set the one to use # az account set --subscription "SUBSCRIPTIONID"Impostare le variabili di ambiente. L'uso delle variabili in questo articolo è basato su Bash. Per altri ambienti sono necessarie lievi variazioni. Per un elenco completo dei possibili parametri per la creazione del cluster, vedere az-hdinsight-create .
Parametro Descrizione --workernode-countNumero di nodi di ruolo di lavoro nel cluster. Questo articolo usa la variabile clusterSizeInNodescome valore passato a--workernode-count.--versionversione del cluster HDInsight. Questo articolo usa la variabile clusterVersioncome valore passato a--version. Vedere anche: Versioni supportate di HDInsight.--typeTipo di cluster HDInsight, ad esempio hadoop, hive interattivo, hbase, kafka, spark, rserver,mlservices. Questo articolo usa la variabileclusterTypecome valore passato a--type. Vedere anche: Tipi di cluster e configurazione.--component-versionLe versioni di vari componenti Hadoop, in versioni delimitate da spazio nel formato 'component=version'. Questo articolo usa la variabile componentVersioncome valore passato a--component-version. Vedere anche: Componenti hadoop.Sostituire
RESOURCEGROUPNAME,LOCATIONCLUSTERNAME,STORAGEACCOUNTNAME, ePASSWORDcon i valori desiderati. Modificare i valori per le altre variabili in base alle esigenze. Quindi, immettere i comandi CLI.export resourceGroupName=RESOURCEGROUPNAME export location=LOCATION export clusterName=CLUSTERNAME export AZURE_STORAGE_ACCOUNT=STORAGEACCOUNTNAME export httpCredential='PASSWORD' export sshCredentials='PASSWORD' export AZURE_STORAGE_CONTAINER=$clusterName export clusterSizeInNodes=1 export clusterVersion=4.0 export clusterType=hadoop export componentVersion=Hadoop=3.1Creare il gruppo di risorse immettendo il comando seguente:
az group create \ --location $location \ --name $resourceGroupNamePer un elenco di posizioni valide, utilizzare il comando
az account list-locationse quindi utilizzare una delle posizioni dal valorename.Creare un account di archiviazione di Azure immettendo il comando seguente:
# Note: kind BlobStorage is not available as the default storage account. az storage account create \ --name $AZURE_STORAGE_ACCOUNT \ --resource-group $resourceGroupName \ --https-only true \ --kind StorageV2 \ --location $location \ --sku Standard_LRSEstrarre la chiave primaria dall'account di archiviazione di Azure e archiviarla in una variabile immettendo il comando seguente:
export AZURE_STORAGE_KEY=$(az storage account keys list \ --account-name $AZURE_STORAGE_ACCOUNT \ --resource-group $resourceGroupName \ --query [0].value -o tsv)Creare un contenitore di Archiviazione di Azure immettendo il comando seguente:
az storage container create \ --name $AZURE_STORAGE_CONTAINER \ --account-key $AZURE_STORAGE_KEY \ --account-name $AZURE_STORAGE_ACCOUNTCreare il cluster HDInsight immettendo il comando seguente:
az hdinsight create \ --name $clusterName \ --resource-group $resourceGroupName \ --type $clusterType \ --component-version $componentVersion \ --http-password $httpCredential \ --http-user admin \ --location $location \ --workernode-count $clusterSizeInNodes \ --ssh-password $sshCredentials \ --ssh-user sshuser \ --storage-account $AZURE_STORAGE_ACCOUNT \ --storage-account-key $AZURE_STORAGE_KEY \ --storage-container $AZURE_STORAGE_CONTAINER \ --version $clusterVersionImportante
I cluster HDInsight sono disponibili in vari tipi, che corrispondono al carico di lavoro o alla tecnologia per cui è ottimizzato il cluster. Non esiste alcun metodo supportato per creare un cluster che combina più tipi, ad esempio HBase in un cluster.
Il completamento del processo di creazione del cluster può richiedere alcuni minuti. Di solito circa 15.
Pulire le risorse
Al termine dell'articolo, è consigliabile eliminare il cluster. Con HDInsight, i dati vengono archiviati in Archiviazione di Azure ed è possibile eliminare tranquillamente un cluster quando non è in uso. Vengono addebitati i costi anche per i cluster HDInsight che non sono in uso. Poiché i costi per il cluster sono decisamente superiori a quelli per l'archiviazione, eliminare i cluster quando non vengono usati è una scelta economicamente conveniente.
Immettere tutti o alcuni dei comandi seguenti per rimuovere le risorse:
# Remove cluster
az hdinsight delete \
--name $clusterName \
--resource-group $resourceGroupName
# Remove storage container
az storage container delete \
--account-name $AZURE_STORAGE_ACCOUNT \
--name $AZURE_STORAGE_CONTAINER
# Remove storage account
az storage account delete \
--name $AZURE_STORAGE_ACCOUNT \
--resource-group $resourceGroupName
# Remove resource group
az group delete \
--name $resourceGroupName
Risoluzione dei Problemi
Se si verificano problemi di creazione dei cluster HDInsight, vedere i requisiti dei controlli di accesso.
Passaggi successivi
Dopo aver creato un cluster HDInsight con l'interfaccia della riga di comando di Azure, usare quanto segue per informazioni su come usare il cluster: