Usare i nodi perimetrali vuoti sui cluster Apache Hadoop in HDInsight

Informazioni su come aggiungere un nodo perimetrale vuoto a un cluster HDInsight. Il nodo perimetrale vuoto è una macchina virtuale Linux con gli stessi strumenti client installati e configurati come nel nodo head. Ma senza i servizi Apache Hadoop in esecuzione. Il nodo perimetrale può essere usato per accedere al cluster e per testare e ospitare le applicazioni client.

È possibile aggiungere un nodo perimetrale vuoto a un cluster HDInsight esistente o a un nuovo cluster quando lo si crea. L'aggiunta di un nodo perimetrale vuoto si esegue usando un modello di Azure Resource Manager. L'esempio seguente illustra come eseguire questa operazione tramite un modello:

"resources": [
    {
        "name": "[concat(parameters('clusterName'),'/', variables('applicationName'))]",
        "type": "Microsoft.HDInsight/clusters/applications",
        "apiVersion": "2015-03-01-preview",
        "dependsOn": [ "[concat('Microsoft.HDInsight/clusters/',parameters('clusterName'))]" ],
        "properties": {
            "marketPlaceIdentifier": "EmptyNode",
            "computeProfile": {
                "roles": [{
                    "name": "edgenode",
                    "targetInstanceCount": 1,
                    "hardwareProfile": {
                        "vmSize": "{}"
                    }
                }]
            },
            "installScriptActions": [{
                "name": "[concat('emptynode','-' ,uniquestring(variables('applicationName')))]",
                "uri": "[parameters('installScriptAction')]",
                "roles": ["edgenode"]
            }],
            "uninstallScriptActions": [],
            "httpsEndpoints": [],
            "applicationType": "CustomApplication"
        }
    }
],

Come illustrato nell'esempio, è possibile chiamare facoltativamente un'azione script per eseguire una configurazione aggiuntiva, ad esempio per installare Apache Hue nel nodo perimetrale. Lo script dell'azione script deve essere pubblicamente accessibile sul web. Ad esempio, se lo script viene archiviato in Archiviazione di Azure, usare contenitori o BLOB pubblici.

Le dimensioni della macchina virtuale del nodo perimetrale devono soddisfare i requisiti di dimensioni per le macchine virtuali del nodo di lavoro del cluster HDInsight. Per conoscere le dimensioni consigliate per le macchine virtuali dei nodi di lavoro, vedere Creare cluster Apache Hadoop in HDInsight.

Dopo aver creato un nodo perimetrale, è possibile connettersi al nodo stesso tramite SSH ed eseguire gli strumenti client per accedere al cluster Hadoop in HDInsight.

Avviso

I componenti personalizzati che vengono installati nel nodo perimetrale ricevono supporto ragionevole a livello commerciale da Microsoft. Ciò può portare alla risoluzione dei problemi riscontrati. In alternativa è possibile fare riferimento alle risorse della community per ulteriore assistenza. Di seguito sono indicati alcuni dei siti più attivi per ricevere assistenza dalla community:

Se si usa una tecnologia Apache, è possibile ottenere assistenza tramite i siti di progetto Apache su https://apache.org, ad esempio il sito Apache Hadoop.

Importante

Le immagini di Ubuntu diventano disponibili per la nuova creazione del cluster HDInsight entro 3 mesi dalla pubblicazione. A partire da gennaio 2019, le patch non sono applicate automaticamente ai cluster in esecuzione (inclusi i nodi perimetrali). I clienti devono usare azioni script o altri meccanismi per applicare patch a un cluster in esecuzione. Per altre informazioni, vedere Applicazione di patch del sistema operativo per HDInsight.

Aggiungere un nodo perimetrale a un cluster esistente

In questa sezione si userà un modello di Resource Manager per aggiungere un nodo perimetrale a un cluster HDInsight esistente. Il modello di Resource Manager è disponibile in GitHub. Il modello di Resource Manager chiama un'azione script che si trova in https://raw.githubusercontent.com/Azure/azure-quickstart-templates/master/quickstarts/microsoft.hdinsight/hdinsight-linux-add-edge-node/scripts/EmptyNodeSetup.sh. Lo script non esegue alcuna azione. Viene usato per illustrare la chiamata all'azione script da un modello di Resource Manager.

  1. Selezionare l'immagine seguente per accedere ad Azure e aprire il modello di Azure Resource Manager nel portale di Azure.

    Deploy to Azure button for new cluster

  2. Configurare le proprietà seguenti:

    Proprietà Descrizione
    Abbonamento selezionare la sottoscrizione di Azure usata per creare il cluster.
    Gruppo di risorse selezionare il gruppo di risorse usato per il cluster HDInsight esistente.
    Ufficio selezionare la località del cluster HDInsight esistente.
    Nome del cluster immettere il nome di un cluster HDInsight esistente.
  3. Selezionare Accetto le condizioni riportate sopra e quindi selezionare Acquista per creare il nodo perimetrale.

Importante

Assicurarsi di selezionare il gruppo di risorse di Azure per il cluster HDInsight esistente. In caso contrario, verrà visualizzato il messaggio di errore "Non è possibile eseguire l'operazione richiesta su una risorsa annidata. Risorsa padre '<ClusterName>' non trovata."

Aggiungere un nodo perimetrale durante la creazione di un cluster

In questa sezione si userà un modello di Resource Manager per creare un cluster HDInsight con un nodo perimetrale. Il modello di Resource Manager è disponibile nella raccolta dei modelli di avvio rapido di Azure. Il modello di Resource Manager chiama un'azione script che si trova in https://raw.githubusercontent.com/Azure/azure-quickstart-templates/master/quickstarts/microsoft.hdinsight/hdinsight-linux-with-edge-node/scripts/EmptyNodeSetup.sh. Lo script non esegue alcuna azione. Viene usato per illustrare la chiamata all'azione script da un modello di Resource Manager.

  1. Creare un cluster HDInsight, se non ne è ancora disponibile uno. Vedere Introduzione all'uso di Hadoop in HDInsight.

  2. Selezionare l'immagine seguente per accedere ad Azure e aprire il modello di Azure Resource Manager nel portale di Azure.

    Deploy to Azure button for new cluster

  3. Configurare le proprietà seguenti:

    Proprietà Descrizione
    Abbonamento selezionare la sottoscrizione di Azure usata per creare il cluster.
    Gruppo di risorse creare un nuovo gruppo di risorse usato per il cluster.
    Ufficio Selezionare una Località per il gruppo di risorse.
    Nome del cluster immettere un nome per il nuovo cluster da creare.
    Nome utente dell'account di accesso del cluster immettere il nome utente HTTP di Hadoop. Il nome predefinito è admin.
    Password di accesso al cluster immettere la password utente HTTP di Hadoop.
    Nome utente SSH immettere il nome utente SSH. Il nome predefinito è sshuser.
    Password SSH immettere la password utente SSH.
    Installa azione script per eseguire le procedure descritte nell'articolo mantenere il valore predefinito.

    Alcune proprietà sono state impostate come hardcoded nel modello: il tipo di cluster, il numero di nodi del ruolo di lavoro del cluster e le dimensioni e il nome del nodo perimetrale.

  4. Selezionare Accetto le condizioni riportate sopra e quindi selezionare Acquista per creare il cluster con il nodo perimetrale.

Aggiungere più nodi perimetrali

È possibile aggiungere più nodi perimetrali a un cluster HDInsight. La configurazione basata su più nodi perimetrali può essere eseguita solo usando i modelli di Azure Resource Manager. Vedere l'esempio di modello all'inizio di questo articolo. Aggiornare il valore targetInstanceCount in base al numero di nodi perimetrali da creare.

Accedere a un nodo perimetrale

L'endpoint SSH del nodo perimetrale è <EdgeNodeName>.<ClusterName-ssh.azurehdinsight.net:22>. Ad esempio, new-edgenode.myedgenode0914-ssh.azurehdinsight.net:22.

Il nodo perimetrale viene visualizzato come un'applicazione nel portale di Azure. Il portale fornisce le informazioni per accedere al nodo perimetrale con SSH.

Per verificare l'endpoint SSH del nodo perimetrale

  1. Accedere al portale di Azure.
  2. Aprire il cluster HDInsight con un nodo perimetrale.
  3. Seleziona Candidature. Verrà visualizzato il nodo perimetrale. Il nome predefinito è new-edgenode.
  4. Selezionare il nodo perimetrale. Verrà visualizzato l'endpoint SSH.

Usare Hive nel nodo perimetrale

  1. Usare SSH per connettersi al nodo perimetrale. Per altre informazioni, vedere Usare SSH con HDInsight.

  2. Dopo essersi connessi al nodo perimetrale tramite SSH, usare il comando seguente per aprire la console di Hive:

    hive
    
  3. Eseguire il comando seguente per visualizzare le tabelle Hive nel cluster:

    show tables;
    

Eliminare un nodo perimetrale

È possibile eliminare un nodo perimetrale dal portale di Azure.

  1. Accedere al portale di Azure.
  2. Aprire il cluster HDInsight con un nodo perimetrale.
  3. Seleziona Candidature. Verrà visualizzato un elenco di nodi perimetrali.
  4. Fare clic con il pulsante destro del mouse sul nodo perimetrale che si vuole eliminare e quindi selezionare Elimina.
  5. Seleziona per confermare.

Passaggi successivi

In questo articolo si è appreso come aggiungere un nodo perimetrale e come accedervi. Per ulteriori informazioni, vedere gli articoli seguenti: