Anexar e gerenciar um pool do Synapse Spark no Aprendizado de Máquina do Azure

APLICA-SE A:Azure CLI ml extension v2 (current)Python SDK azure-ai-ml v2 (current)

Neste artigo, você aprenderá a anexar um Pool de Faíscas Synapse no Aprendizado de Máquina do Azure. Você pode anexar um Pool de Faíscas Synapse no Aprendizado de Máquina do Azure de uma destas maneiras:

  • Usando a interface do usuário do estúdio do Azure Machine Learning
  • Usando a CLI do Azure Machine Learning
  • Usando o SDK Python do Azure Machine Learning

Pré-requisitos

Anexar um pool Synapse Spark no Azure Machine Learning

O Azure Machine Learning oferece diferentes maneiras de anexar e gerenciar um pool do Synapse Spark.

Para anexar um Synapse Spark Pool com a guia Studio Compute:

Captura de tela mostrando a criação de um novo Synapse Spark Pool.

  1. Na seção Gerenciar do painel esquerdo, selecione Computar.
  2. Selecione Cálculos anexados.
  3. Na tela Cálculos anexados, selecione Novo para ver as opções para anexar diferentes tipos de cálculos.
  4. Selecione Synapse Spark pool.

O painel Attach Synapse Spark pool é aberto no lado direito da tela. Neste painel:

  1. Insira um Nome, que se refere ao Synapse Spark Pool anexado dentro do recurso do Azure Machine Learning.

  2. Selecione uma Assinatura do Azure no menu suspenso.

  3. Selecione um espaço de trabalho Synapse no menu suspenso.

  4. Selecione um Pool de faíscas no menu suspenso.

  5. Alterne a opção Atribuir uma identidade gerenciada para habilitá-la.

  6. Selecione um tipo de Identidade gerenciada para usar com este Synapse Spark Pool anexado.

  7. Selecione Atualizar para concluir o processo de anexação do Synapse Spark Pool.

Adicionar atribuições de função no Azure Synapse Analytics

Para garantir que o Synapse Spark Pool anexado funcione corretamente, atribua a função de administrador a ele, a partir da interface do usuário do estúdio do Azure Synapse Analytics. Estas etapas mostram como fazê-lo:

  1. Abra seu espaço de trabalho Synapse no portal do Azure.

  2. No painel esquerdo, selecione Descrição geral.

    Captura de tela mostrando o Open Synapse Studio.

  3. Selecione Abrir Synapse Studio.

  4. No estúdio do Azure Synapse Analytics, selecione Gerenciar no painel esquerdo.

  5. Selecione Controle de Acesso na seção Segurança do painel esquerdo, segundo a partir da esquerda.

  6. Selecione Adicionar.

  7. O painel Adicionar atribuição de função será aberto no lado direito da tela. Neste painel:

    1. Selecione o item Espaço de trabalho para Escopo.

    2. No menu suspenso Tipo de item, selecione Apache Spark pool.

    3. No menu suspenso Item, selecione seu pool do Apache Spark.

    4. No menu suspenso Função , selecione Synapse Administrator.

    5. Na caixa Selecionar pesquisa de usuário, comece a digitar o nome do seu Espaço de Trabalho do Azure Machine Learning. Ele mostra uma lista de piscinas Synapse Spark anexadas. Selecione a piscina Synapse Spark desejada na lista.

    6. Selecione Aplicar.

      Captura de ecrã a mostrar Adicionar Atribuição de Função.

Atualizar o Synapse Spark Pool

Você pode gerenciar o pool Synapse Spark anexado a partir da interface do usuário do estúdio de Aprendizado de Máquina do Azure. A funcionalidade de gerenciamento do pool Spark inclui atualizações de identidade gerenciadas associadas para um pool Synapse Spark anexado. Você pode atribuir uma identidade atribuída pelo sistema ou pelo usuário ao atualizar um pool do Synapse Spark. Você deve criar uma identidade gerenciada atribuída pelo usuário no portal do Azure antes de atribuí-la a um pool do Synapse Spark.

Para atualizar a identidade gerenciada para o pool Synapse Spark anexado:

Captura de tela mostrando a atualização de identidade gerenciada do Synapse Spark Pool.

  1. Abra a página Detalhes do pool Synapse Spark no estúdio do Azure Machine Learning.

  2. Encontre o ícone de edição, localizado no lado direito da seção Identidade gerenciada.

  3. Para atribuir uma identidade gerenciada pela primeira vez, alterne Atribuir uma identidade gerenciada para habilitá-la.

  4. Para atribuir uma identidade gerenciada atribuída ao sistema:

    1. Selecione Sistema atribuído como o tipo de identidade.
    2. Selecione Atualizar.
  5. Para atribuir uma identidade gerenciada atribuída pelo usuário:

    1. Selecione Atribuído pelo usuário como o tipo de identidade.
    2. Selecione uma Assinatura do Azure no menu suspenso.
    3. Digite as primeiras letras do nome da identidade gerenciada atribuída pelo usuário na caixa que mostra o texto Pesquisar por nome. É apresentada uma lista com nomes de identidade geridos atribuídos pelo utilizador correspondentes. Selecione a identidade gerenciada atribuída pelo usuário desejada na lista. Você pode selecionar várias identidades gerenciadas atribuídas pelo usuário e atribuí-las ao pool Synapse Spark anexado.
    4. Selecione Atualizar.

Separe a piscina Synapse Spark

Podemos querer separar uma piscina Synapse Spark anexada, para limpar um espaço de trabalho.


A interface do usuário do estúdio do Azure Machine Learning também fornece uma maneira de desanexar um pool Synapse Spark anexado. Para o fazer, siga estes passos:

  1. Abra a página Detalhes do pool Synapse Spark, no estúdio do Azure Machine Learning.

  2. Selecione Desanexar para desanexar o pool Synapse Spark anexado.

Computação do Spark sem servidor no Azure Machine Learning

Alguns cenários de usuário podem exigir acesso a um recurso de computação do Spark sem servidor, durante um envio de trabalho do Azure Machine Learning, sem a necessidade de anexar um pool do Spark. A integração do Azure Synapse Analytics com o Azure Machine Learning também fornece uma experiência de computação do Spark sem servidor. Isso permite o acesso a uma computação do Spark em um trabalho, sem a necessidade de anexar a computação a um espaço de trabalho primeiro. Saiba mais sobre a experiência de computação do Spark sem servidor.

Próximos passos