Compartilhar via


Criar cluster Spark no HDInsight no AKS (versão prévia)

Observação

Desativaremos o Microsoft Azure HDInsight no AKS em 31 de janeiro de 2025. Para evitar o encerramento abrupto das suas cargas de trabalho, você precisará migrá-las para o Microsoft Fabric ou para um produto equivalente do Azure antes de 31 de janeiro de 2025. Os clusters restantes em sua assinatura serão interrompidos e removidos do host.

Somente suporte básico estará disponível até a data da aposentadoria.

Importante

Esse recurso está atualmente na visualização. Os Termos de uso complementares para versões prévias do Microsoft Azure incluem mais termos legais que se aplicam aos recursos do Azure que estão em versão beta, em versão prévia ou ainda não lançados em disponibilidade geral. Para obter informações sobre essa versão prévia específica, confira Informações sobre a versão prévia do Azure HDInsight no AKS. No caso de perguntas ou sugestões de recursos, envie uma solicitação no AskHDInsight com os detalhes e siga-nos para ver mais atualizações sobre a Comunidade do Azure HDInsight.

Depois que as etapas de pré-requisitos da assinatura e pré-requisitos do recurso forem concluídas e você tiver um pool de cluster implantado, continue a usar o portal do Azure para criar um cluster Spark. Você pode usar o portal do Azure para criar um cluster Do Apache Spark no pool de clusters. Em seguida, você pode criar um Jupyter Notebook e o usará para executar consultas SQL do Spark em tabelas do Apache Hive.

  1. No portal do Azure, digite pools de cluster e selecione pools de cluster para ir para a página de pools de cluster. Na página de pools de cluster, selecione o pool de clusters no qual você pode adicionar um novo cluster Spark.

  2. Na página do pool de clusters específica, clique em + Novo cluster.

    Captura de tela mostrando como criar um novo cluster spark.

    Esta etapa abre a página de criação do cluster.

    Captura de tela mostrando a guia de criação de uma página básica cluster.

    Propriedade Descrição
    Subscription A assinatura do Azure que foi registrada para uso com o HDInsight no AKS na seção Pré-requisitos com pré-população
    Grupo de recursos O mesmo grupo de recursos que o pool de clusters será preenchido previamente
    Region A mesma região que o pool de clusters e o virtual serão preenchidos previamente
    Pool de clusters O nome do pool de clusters será preenchido previamente
    Versão do Pool do HDInsight A versão do pool de clusters será preenchida previamente da seleção de criação do pool
    HDInsight na versão do AKS Especificar o HDI na versão do AKS
    Tipo de cluster Na lista suspensa, selecione Spark
    Versão do cluster Selecione a versão da versão da imagem a ser usada
    Nome do cluster Insira o nome do novo cluster
    Identidade gerenciada atribuída pelo usuário Selecione a identidade gerenciada atribuída pelo usuário que funcionará como uma cadeia de conexão com o armazenamento
    Conta de Armazenamento Selecione a conta de armazenamento pré-criada que deve ser usada como armazenamento primário para o cluster
    Nome do contêiner Selecione o nome do contêiner(exclusivo) se for criado ou criado previamente ou criar um novo contêiner
    Catálogo do Hive (opcional) Selecione o metastore do Hive pré-criado (banco de dados SQL do Azure)
    Banco de Dados SQL para Hive Na lista suspensa, selecione o Banco de Dados SQL no qual adicionar tabelas hive-metastore.
    Nome de usuário administrador do SQL Insira o nome de usuário do administrador do SQL
    Key vault Na lista suspensa, selecione o Key Vault, que contém um segredo com senha para o nome de usuário do administrador do SQL
    Nome do segredo da senha do SQL Insira o nome do segredo do Key Vault em que a senha do BD SQL é armazenada

    Observação

    • Atualmente, o HDInsight dá suporte apenas a bancos de dados do MS SQL Server.
    • Devido à limitação do Hive, não há suporte para o caractere "-" (hífen) no nome do banco de dados metastore.
  3. Selecione Avançar: Configuração + preço para continuar.

    Captura de tela mostrando a guia de preço 1.

    Captura de tela mostrando a guia de preço 2.

    Captura de tela mostrando a guia ssh.

    Propriedade Descrição
    Tamanho do nó Selecione o tamanho do nó a ser usado para os nós do Spark
    Número de nós de trabalho Selecione o número de nós para o cluster Spark. Desses, três nós são reservados para serviços de coordenador e sistema, os nós restantes são dedicados aos trabalhadores do Spark, um trabalho por nó. Por exemplo, em um cluster de cinco nós há dois trabalhos
    Autoscale Clique no botão de alternância para habilitar o Dimensionamento Automático
    Tipo de dimensionamento automático Selecione com base na carga ou no dimensionamento automático baseado em agendamento
    Tempo limite normal de decomission Especificar o tempo limite de desativação normal
    Nenhum nó de trabalho padrão Selecione o número de nós para dimensionamento automático
    Fuso Horário Selecione o fuso horário
    Regras de dimensionamento automático Selecione o dia, a hora de início, a hora de término, não. de nós de trabalho
    Habilitar SSH Se habilitado, permite definir prefixo e número de nós SSH
  4. Clique em Avançar: Integrações para habilitar e selecionar o Log Analytics para registro em log.

    O Azure Prometheus para monitoramento e métricas pode ser habilitado após a criação do cluster.

    Captura de tela mostrando a guia de integrações.

  5. Clique em Avançar: Marcas para continuar na próxima página.

    Captura de tela mostrando a guia de marcas.

  6. Na página Marcas, insira todas as marcas que você deseja adicionar ao recurso.

    Propriedade Descrição
    Nome Opcional. Insira um nome como Azure HDInsight na Visualização Privada do AKS para identificar facilmente todos os recursos associados a seus recursos
    Valor Deixe isso em branco
    Recurso Selecionar Todos os recursos selecionados
  7. Clique em Próximo: Examinar + criar.

  8. Na página Examinar + criarde, procure a mensagem de validação bem-sucedida na parte superior da página e clique em Criar.

  9. A página Implantação está em processo e é exibida, mostrando que o cluster está sendo criado. Leva de cinco a dez minutos para criar o cluster. Uma vez criado o cluster, será exibida a mensagem Sua implantação está concluída. Se você navegar para longe da página, poderá verificar o status de suas Notificações.

  10. Vá para a página de visão geral do cluster, você pode ver links de ponto de extremidade lá.

    Captura de tela mostrando a página de visão geral do cluster.