Criar clusters baseados em Linux no HDInsight usando o portal do Azure

O portal do Azure é uma ferramenta de gerenciamento baseada na Web para serviços e recursos hospedados na nuvem do Microsoft Azure. Neste artigo, você aprenderá como criar clusters Azure HDInsight baseados no Linux usando o portal. Detalhes adicionais estão disponíveis em Criar clusters HDInsight.

Aviso

A cobrança de clusters HDInsight é proporcional por minuto, independentemente de você utilizá-los ou não. Certifique-se de excluir o cluster após utilizá-lo. Consulte como excluir um cluster HDInsight.

O portal do Azure expõe a maioria das propriedades do cluster. Usando modelos do Azure Resource Manager, é possível ocultar muitos detalhes. Para obter mais informações, consulte Criar clusters Apache Hadoop no HDInsight usando modelos do Resource Manager.

Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.

Criar clusters

Observação

O recurso que exige transferência segura passa todas as solicitações para sua conta por uma conexão segura. Somente o cluster do HDInsight versão 3.6 ou mais recente oferece suporte a esse recurso. Para saber mais, confira Criar um cluster Apache Hadoop com contas de armazenamento para transferência segura no Azure HDInsight.

  1. Entre no portal do Azure.

  2. No menu superior, selecione + Criar um recurso.

    Create a new cluster in the Azure portal.

  3. Selecione Análise>Azure HDInsight para acessar a página Criar cluster HDInsight.

Noções básicas

Screenshot showing HDInsight 4.0 create cluster basics.

Na guia Informações Básicas, forneça as seguintes informações:

Propriedade Descrição
Subscription Na lista suspensa, selecione a assinatura do Azure usada para o cluster.
Resource group Na lista suspensa, selecione o grupo de recursos existente ou selecione Criar.
Nome do cluster Insira um nome global exclusivo.
Região Na lista suspensa, selecione uma região em que o cluster foi criado.
Zona de disponibilidade Opcionalmente, especifique uma zona de disponibilidade na qual implantar seu cluster.
Tipo de cluster Clique em Selecionar tipo de cluster para abrir uma lista. Na lista, selecione o tipo de cluster desejado. Os clusters do HDInsight são fornecidos em vários tipos. Eles correspondem à carga de trabalho ou tecnologia para a qual o cluster está sintonizado. Não há nenhum método com suporte para criar um cluster que combine vários tipos.
Versão Na lista suspensa, selecione uma versão. Use a versão padrão se não souber o que escolher. Para obter mais informações, consulte Versões de cluster do HDInsight.
Nome de usuário de logon do cluster Forneça o nome de usuário, o padrão é admin.
Senha de logon do cluster Forneça a senha.
Confirmar senha de logon do cluster Digitar novamente a senha
Nome de usuário do Secure Shell (SSH) Forneça o nome de usuário, o padrão é sshuser
Usar senha de logon do cluster para SSH Se desejar a mesma senha de SSH, como senha do administrador especificada anteriormente, marque a caixa de seleção Usar senha de logon do cluster de SSH. Caso contrário, forneça uma SENHA ou CHAVE PÚBLICA para autenticar o usuário SSH. Uma chave pública é a abordagem recomendada. Escolha Selecionar na parte inferior para salvar a configuração das credenciais. Para saber mais, confira Conectar ao HDInsight (Apache Hadoop) usando SSH.

Selecione Avançar>> Armazenamento para acessar a próxima guia.

Armazenamento

Aviso

A partir de 15 de junho de 2020, os clientes não conseguirão criar uma nova entidade de serviço usando o HDInsight. Consulte Criar entidade de serviço e certificados utilizando o Microsoft Entra ID.

HDInsight create cluster storage.

Armazenamento primário

Na lista suspensa de Tipo de armazenamento primário, selecione o tipo de armazenamento padrão. Os campos posteriores a serem concluídos variarão com base na sua seleção. Para Armazenamento do Azure:

  1. Para o Método de seleção, escolha Selecionar na lista ou Usar tecla de acesso.

    • Para Selecionar na lista, selecione sua Conta de armazenamento primário na lista suspensa ou selecione Criar nova.
    • Para Usar chave de acesso, insira o Nome da conta de armazenamento. Em seguida, forneça a Chave de acesso.
  2. Para Contêiner, aceite o valor padrão ou insira um novo.

Armazenamento adicional do Azure

Opcional: selecione Adicionar Armazenamento do Azure para armazenamento adicional de cluster. Não há suporte para o uso de uma conta de armazenamento adicional em uma região diferente do cluster do HDInsight.

Configurações de metastore

Opcional: especifique um Banco de Dados SQL existente para salvar os metadados do Apache Hive, do Apache Oozie e/ou do Apache Ambari fora do cluster. O Banco de Dados SQL do Azure usado para metastore deve permitir conectividade com outros serviços do Azure, incluindo o Azure HDInsight. Ao criar um metastore, não use traços nem hifens para nomear um banco de dados. Esses caracteres podem causar falha no processo de criação do cluster.

Importante

Para formas de cluster que dão suporte a metastores, o metastore padrão fornece um Banco de Dados SQL do Azure com um limite básico de DTU de camada 5 (não atualizável) ! Adequado para fins de testes básicos. Para cargas de trabalho grandes ou de produção, é recomendável migrar para um metastore externo.

Selecione Avançar: segurança + rede >> para acessar a próxima guia.

Segurança + rede

HDInsight create cluster security networking.

Na guia Segurança + rede, forneça as seguintes informações:

Propriedade Descrição
Pacote de segurança empresarial Opcional: marque a caixa de seleção para usar o Enterprise Security Package. Para obter mais informações, confira Configurar um cluster do HDInsight com o Enterprise Security Package utilizando o Microsoft Entra Domain Services.
TLS Opcional: selecione uma versão de TLS na lista suspensa. Para obter mais informações, confira Protocolo TLS.
Rede virtual Opcional: selecione uma rede virtual e uma sub-rede existentes na lista suspensa. Para obter informações, consulte Planejar uma implantação de rede virtual para clusters do Azure HDInsight. O artigo inclui requisitos de configuração específicos para a rede virtual.
Configurações de criptografia de disco Opcional: marque a caixa de seleção para usar criptografia. Para obter mais informações, confira Criptografia de disco de chave gerenciada pelo cliente.
Proxy REST do Kafka Essa configuração só está disponível para cluster do tipo Kafka. Para obter mais informações, consulte Usar um proxy REST.
Identidade Opcional: selecione uma identidade de serviço atribuída pelo usuário existente na lista suspensa. Para obter mais informações, consulte Identidades gerenciadas no Azure HDInsight.

Selecione Avançar: configuração + preços >> para acessar a próxima guia.

Configuração + preço

HDInsight create cluster configuration.

Na guia Configuração + preços, forneça as seguintes informações:

Propriedade Descrição
+ Adicionar aplicativo Opcional: selecione os aplicativos desejados. Você, a Microsoft ou os fornecedores independentes de software (ISVs) podem desenvolver esses aplicativos. Para obter mais informações, consulte Instalar aplicativos durante a criação do cluster.
Tamanho do nó Opcional: selecione um nó de tamanho diferente.
Número de nós Opcional: Insira o número de nós para o tipo de nó especificado. Se estiver planejando mais de 32 nós de trabalho, selecione um tamanho de headnode com, pelo menos, oito núcleos e 14 GB de RAM. Planeje os nós na criação de cluster ou, dimensionando o cluster após a criação.
Habilitar dimensionamento automático Opcional: marque a caixa de seleção para habilitar o recurso. Para obter mais informações, consulte Dimensionar automaticamente clusters do Azure HDInsight.
+ Adicionar ação de script Opcional: Essa opção funcionará caso deseje usar um script personalizado para personalizar um cluster, enquanto o cluster estiver sendo criado. Para obter mais informações sobre ações de script, consulte Personalizar clusters HDInsight baseados em Linux usando ações de script.

Selecione Examinar + criar >> para validar a configuração do cluster e avançar para a guia final.

Marcações

Na página Tags, forneça as seguintes informações:

Propriedade Descrição
Nome Opcional. Insira um nome de sua escolha para identificar facilmente todos os recursos.
Valor Deixe em branco.
Recurso Selecione Todos os recursos selecionados.

Examinar + criar

Screenshot showing HDInsight 4.0 create cluster summary.

Examine as configurações. Selecione Criar para criar o cluster.

Levará algum tempo para que o cluster seja criado, geralmente, cerca de 20 minutos. Monitore as Notificações para conferir o processo de provisionamento.

Pós-criação

Após o término do processo de criação, selecione Ir para Recurso na notificação Implantação com êxito. A janela do cluster fornece as informações a seguir.

Screenshot showing Azure HDInsight portal cluster overview.

Alguns ícones na janela são explicados da seguinte forma:

Propriedade Descrição
Visão geral Fornece todas informações essenciais sobre o cluster. Exemplos são o nome, o grupo de recursos ao qual ele pertence, a localização, o sistema operacional e a URL do painel do cluster.
Painéis de cluster Direciona você para o portal do Ambari associado ao cluster.
SSH + Logon do cluster Fornece informações necessárias para acessar o cluster usando SSH.
Excluir exclui o cluster HDInsight.

Excluir o cluster

Confira Excluir um cluster HDInsight usando o navegador, o PowerShell ou a CLI do Azure.

Solucionar problemas

Se você tiver problemas com a criação de clusters HDInsight, confira os requisitos de controle de acesso.

Próximas etapas

Você criou com êxito um cluster HDInsight. Saiba agora como trabalhar com o cluster.