Compartilhar via


Usar a rotulagem do Azure Machine Learning no Language Studio

A rotulagem de dados é uma parte importante da preparação do conjunto de dados. Com a experiência de rotulagem no Azure Machine Learning, você pode ter uma colaboração mais fácil, mais flexibilidade e a capacidade de terceirizar tarefas de rotulagem para fornecedores de rotulagem externa do Azure Marketplace. Você pode usar a rotulagem do Azure Machine Learning para:

Pré-requisitos

Antes de conectar seu projeto de rotulagem ao Azure Machine Learning, você precisará:

  • Um projeto do Language Studio criado com sucesso com uma conta de armazenamento de blobs do Azure configurada.
  • Dados de texto que foram carregados em sua conta de armazenamento.
  • Pelo menos:
    • Um rótulo de entidade para reconhecimento de entidade nomeada personalizada ou
    • Dois rótulos de classe para projetos de classificação de textos personalizada.
  • Um workspace do Azure Machine Learning que foi conectado à mesma conta de armazenamento de blobs do Azure que sua conta do Language Studio está usando.

Limitações

  • Conectar seu projeto de rotulagem ao Azure Machine Learning é uma conexão individual. Se você desconectar seu projeto, não poderá conectá-lo de volta ao mesmo projeto do Azure Machine Learning
  • Você não pode rotular no Language Studio e no Azure Machine Learning simultaneamente. A experiência de rotulagem é habilitada em um estúdio por vez.
  • Os arquivos de teste e treinamento na experiência de rotulagem da qual você está mudando serão ignorados ao treinar seu modelo.
  • Somente o formato de arquivo JSONL do Azure Machine Learning pode ser importado para o Language Studio.
  • Projetos com a opção de vários idiomas habilitada não podem ser conectados ao Azure Machine Learning e nem todos os idiomas são suportados.
  • O workspace do Azure Machine Learning ao qual você está se conectando deve ser atribuído à mesma conta de Armazenamento do Microsoft Azure à qual o Language Studio está conectado. Verifique se o workspace do Azure Machine Learning tem a permissão de leitor de dados de armazenamento de blobs na conta de armazenamento. O workspace precisa ter sido vinculado à conta de armazenamento durante o processo de criação no portal do Azure.
  • Alternar entre as duas experiências de rotulagem não é instantâneo. Pode demorar um pouco para concluir a operação com êxito.

Importar seus rótulos do Azure Machine Learning para o Language Studio

O Language Studio dá suporte ao formato de arquivo JSONL usado pelo Azure Machine Learning. Se você estiver rotulando dados no Azure Machine Learning, poderá importar seus rótulos atualizados em um novo projeto personalizado para utilizar os recursos de ambos os estúdios.

  1. Comece criando um novo projeto para classificação de textos personalizada ou reconhecimento de entidade nomeada personalizada.

    1. Na tela Criar um projeto exibida, siga os prompts para conectar sua conta de armazenamento e insira as informações básicas do seu projeto. Verifique se o recurso do Azure que você está usando já não tem outra conta de armazenamento conectada.

    2. Na seção Escolher contêiner, selecione a opção que indica que você já tem um arquivo formatado corretamente. Em seguida, selecione o arquivo de rótulos mais recente do Azure Machine Learning.

      Uma captura de tela mostrando a seleção de um arquivo de rótulo no Language Studio.

Conectar-se ao Azure Machine Learning

Antes de se conectar ao Azure Machine Learning, você precisa de uma conta do Azure Machine Learning com um plano de preços que possa acomodar as necessidades de computação do seu projeto. Consulte a seção de pré-requisitos para garantir que você tenha concluído com êxito todos os requisitos para começar a conectar seu projeto do Language Studio ao Azure Machine Learning.

  1. Use o portal do Azure para navegar até a conta de Armazenamento de Blobs do Azure conectada ao seu recurso de idioma.

  2. Verifique se a função Colaborador de Dados Blob de Armazenamento está atribuída ao workspace do AML dentro das atribuições de função para sua conta de Armazenamento de Blobs do Azure.

  3. Acesse o projeto no Language Studio. No menu de navegação à esquerda do seu projeto, selecione Rotulagem de dados.

  4. Selecione usar o Azure Machine Learning para rotular na descrição da Rotulagem de dados ou no painel de Atividade.

    Uma captura de tela mostrando o local do link do Azure Machine Learning.

  5. Selecione Conectar-se ao Azure Machine Learning para iniciar o processo de conexão.

    Uma captura de tela mostrando o botão de conexão do Azure Machine Learning no Language Studio.

  6. Na janela exibida, siga os prompts. Selecione o workspace do Azure Machine Learning que você criou anteriormente na mesma assinatura do Azure. Insira um nome para o novo projeto do Azure Machine Learning que será criado para habilitar a rotulagem no Azure Machine Learning.

    Dica

    Verifique se o workspace está vinculado à mesma conta de Armazenamento de Blobs do Azure e ao recurso de Idioma antes de continuar. Você pode criar um novo workspace e vincular à sua conta de armazenamento por meio do portal do Azure. Verifique se a conta de armazenamento está vinculada corretamente ao espaço de trabalho.

  7. (Opcional) ative a alternância de rotulagem de fornecedor para usar empresas fornecedoras de rotulagem. Antes de escolher as empresas fornecedoras de rotulagem, entre em contato com elas no Azure Marketplace para finalizar um contrato com elas. Para obter mais informações sobre como trabalhar com empresas fornecedoras, consulte Como terceirizar a rotulagem de dados.

    Você também pode deixar instruções de rotulagem para os rotuladores humanos que ajudarão você no processo de rotulagem. Essas instruções podem ajudá-los a entender a tarefa deixando definições claras dos rótulos e incluindo exemplos para alcançar melhores resultados.

  8. Examine as configurações da conexão com o Azure Machine Learning e faça alterações, se necessário.

    Importante

    A finalização da conexão é permanente. Tentar desconectar a conexão estabelecida a qualquer momento desabilitará permanentemente a capacidade do seu projeto do Language Studio se conectar ao mesmo projeto do Azure Machine Learning.

  9. Depois que a conexão for iniciada, sua capacidade de rotular dados no Language Studio será desabilitada por alguns minutos para preparar a nova conexão.

Alternar para a rotulagem com o Azure Machine Learning do Language Studio

Depois que a conexão for estabelecida, você poderá alternar para o Azure Machine Learning por meio do painel de Atividades no Language Studio a qualquer momento.

Uma captura de tela mostrando o botão para alternar para a rotulagem usando o Azure Machine Learning.

Quando você alternar, sua capacidade de rotular dados no Language Studio será desabilitada e você poderá rotular os dados no Azure Machine Learning. Você pode voltar para a rotulagem no Language Studio a qualquer momento através do Azure Machine Learning.

Para obter informações sobre como rotular o texto, consulte Como rotular no Azure Machine Learning. Para obter informações sobre como gerenciar e acompanhar o projeto de rotulagem de texto, consulte Configurar e gerenciar um projeto de rotulagem de texto no Azure Machine Learning.

Treinar o modelo usando rótulos do Azure Machine Learning

Ao alternar para usar a rotulagem no Azure Machine Learning, você ainda poderá treinar, avaliar e implantar seu modelo no Language Studio. Para treinar o modelo usando rótulos atualizar do Azure Machine Learning:

  1. Selecione Trabalhos de treinamento no menu de navegação à esquerda da tela do Language Studio para seu projeto.

  2. Selecione Importar rótulos mais recentes do Azure Machine Learning na seção Escolher origem do rótulo na página de treinamento. Isso sincroniza os rótulos do Azure Machine Learning antes de iniciar o trabalho de treinamento.

    Uma captura de tela mostrando o seletor para usar rótulos do Azure Machine Learning.

Alternar para a rotulagem com o Language Studio a partir do Azure Machine Learning

Depois de mudar para a rotulagem com o Azure Machine Learning, você pode voltar para a rotulagem com o projeto do Language Studio a qualquer momento.

Observação

  • Somente os usuários com as funções corretas no Azure Machine Learning têm a capacidade de alternar a rotulagem.
  • Quando você alternar para usar o Language Studio, a rotulagem no Azure Machine Learning será desabilitada.

Para voltar à rotulagem com o Language Studio:

  1. Navegue até seu projeto no Azure Machine Learning e selecione Rotulagem de dados no menu de navegação à esquerda.

  2. Selecione a guia Language Studio e selecione Alternar para o Language Studio.

    Uma captura de tela mostrando o seletor para usar rótulos do Language Studio.

  3. O processo leva alguns minutos para ser concluído e sua capacidade de rotular no Azure Machine Learning será desabilitada até que ela seja mudada de volta do Language Studio.

Desconectando-se do Azure Machine Learning

Desconectar seu projeto do Azure Machine Learning é um processo permanente e irreversível que não pode ser desfeito. Você não poderá mais acessar seus rótulos no Azure Machine Learning e não poderá reconectar o projeto do Azure Machine Learning a nenhum projeto do Language Studio no futuro. Para se desconectar do Azure Machine Learning:

  1. Verifique se todos os rótulos atualizados que você deseja manter são sincronizados com o Azure Machine Learning alternando a experiência de rotulagem de volta para o Language Studio.
  2. Selecione Configurações do projeto no menu de navegação à esquerda no Language Studio.
  3. Selecione o botão Desconectar do Azure Machine Learning na seção Gerenciar conexões do Azure Machine Learning.

Próximas etapas

Saiba mais sobre como rotular seus dados para Classificação de Texto Personalizado e Reconhecimento de Entidade Nomeada Personalizada.