Quickstart: Criar uma nova piscina Apache Spark sem servidor utilizando o portal do Azure

Azure Synapse Analytics oferece vários motores de análise para ajudá-lo a ingerir, transformar, modelar, analisar e distribuir os seus dados. Um conjunto Apache Spark fornece capacidades de computação de dados de código aberto. Depois de criar uma piscina Apache Spark no seu espaço de trabalho Synapse, os dados podem ser carregados, modelados, processados e distribuídos para uma visão analítica mais rápida.

Neste arranque rápido, você aprende a usar o portal do Azure para criar uma piscina Apache Spark em um espaço de trabalho synapse.

Importante

A faturação de casos de Spark é prostimada por minuto, quer esteja a usá-las ou não. Certifique-se de que desliga a sua instância Spark depois de ter terminado de a utilizar ou de definir um curto período de tempo. Para obter mais informações, consulte a secção Limpar recursos deste artigo.

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Iniciar sessão no portal do Azure

Inicie sessão no portal do Azure

  1. Navegue para o espaço de trabalho da Sinaapse onde a piscina Apache Spark será criada digitando o nome de serviço (ou nome de recurso diretamente) na barra de pesquisa.

    Azure portal search bar with Synapse workspaces typed in.

  2. A partir da lista de espaços de trabalho, digite o nome (ou parte do nome) do espaço de trabalho para abrir. Para este exemplo, usaremos um espaço de trabalho chamado contosoanalytics. Listing of Synapse workspaces filtered to show those containing the name Contoso.

Criar nova piscina Apache Spark

  1. No espaço de trabalho da Sinaapse onde pretende criar a piscina Apache Spark, selecione New Apache Spark pool. Overview of Synapse workspace with a red box around the command to create a new Apache Spark pool

  2. Introduza os seguintes detalhes no separador Básicos :

    Definição Valor sugerido Descrição
    Nome da piscina Apache Spark Um nome de piscina válido Este é o nome que a piscina Apache Spark terá.
    Tamanho do nó Pequeno (4 vCPU / 32 GB) Deslote isto para o menor tamanho para reduzir custos para este arranque rápido
    Dimensionamento Automático Desativado Não precisamos de autoescala para este arranque rápido.
    Número de nós 5 Use um pequeno tamanho para limitar os custos para este arranque rápido

    Apache Spark pool create flow - basics tab.

    Importante

    Note que existem limitações específicas para os nomes que as piscinas Apache Spark podem usar. Os nomes devem conter apenas letras ou números, devem ter 15 ou menos caracteres, devem começar com uma letra, não conter palavras reservadas, e ser únicos no espaço de trabalho.

  3. Selecione Seguinte: definições adicionais e reveja as definições predefinidos. Não modifique quaisquer definições predefinidos. Screenshot that shows the

  4. Selecione Seguinte: tags. Não adicione nenhuma etiqueta. Apache Spark pool create flow - additional settings tab.

  5. Selecione Rever + criar.

  6. Certifique-se de que os detalhes parecem corretos com base no que foi previamente introduzido e selecione Criar. Apache Spark pool create flow - review settings tab.

  7. Neste ponto, o fluxo de fornecimento de recursos começará, indicando uma vez que esteja completo. Screenshot that shows the

  8. Após o a provisionamento concluído, navegar de volta para o espaço de trabalho mostrará uma nova entrada para a recém-criada piscina Apache Spark. Apache Spark pool create flow - resource provisioning.

  9. Neste momento, não há recursos em execução, nem encargos para a Spark, criaste metadados sobre as instâncias Spark que queres criar.

Limpar os recursos

Siga os passos abaixo para eliminar a piscina Apache Spark do espaço de trabalho.

Aviso

A eliminação de uma piscina Apache Spark removerá o motor de análise do espaço de trabalho. Não será mais possível ligar à piscina, e todas as consultas, oleodutos e cadernos que usam esta piscina Apache Spark deixarão de funcionar.

Se quiser eliminar a piscina Apache Spark, faça o seguinte:

  1. Navegue até à lâmina das piscinas Apache Spark no espaço de trabalho.
  2. Selecione a piscina Apache Spark a eliminar (neste caso, contosospark).
  3. Pressione para apagar. Listing of Apache Spark pools, with the recently created pool selected.
  4. Confirme a eliminação e prima O botão Eliminar. Confirmation dialog to delete the selected Apache Spark pool.
  5. Quando o processo estiver concluído com sucesso, a piscina Apache Spark deixará de estar listada nos recursos do espaço de trabalho.

Passos seguintes