Partilhar via


Como criar um projeto de classificação de texto personalizado

Use este artigo para saber como configurar os requisitos para começar com a classificação de texto personalizada e criar um projeto.

Pré-requisitos

Antes de começar a usar a classificação de texto personalizada, você precisará:

Criar um recurso de idioma

Antes de começar a usar a classificação de texto personalizada, você precisará de um recurso de Linguagem de IA do Azure. É recomendável criar seu recurso de idioma e conectar uma conta de armazenamento a ele no portal do Azure. Criar um recurso no portal do Azure permite criar uma conta de armazenamento do Azure ao mesmo tempo, com todas as permissões necessárias pré-configuradas. Você também pode ler mais no artigo para saber como usar um recurso pré-existente e configurá-lo para trabalhar com classificação de texto personalizada.

Você também precisará de uma conta de armazenamento do Azure onde carregará seus .txt documentos que serão usados para treinar um modelo para classificar texto.

Nota

  • Você precisa ter uma função de proprietário atribuída no grupo de recursos para criar um recurso de idioma.
  • Se você conectar uma conta de armazenamento pré-existente, deverá ter uma função de proprietário atribuída a ela.

Criar recurso de idioma e conectar conta de armazenamento

Nota

Você não deve mover a conta de armazenamento para um grupo de recursos ou assinatura diferente depois que ela estiver vinculada ao recurso Idioma.

Criar um novo recurso a partir do portal do Azure

  1. Vá para o portal do Azure para criar um novo recurso de linguagem de IA do Azure.

  2. Na janela exibida, selecione Classificação de texto personalizada & reconhecimento de entidade nomeada personalizada nos recursos personalizados. Selecione Continuar para criar seu recurso na parte inferior da tela.

    A screenshot showing the selection option for custom text classification and custom named entity recognition in Azure portal.

  3. Crie um recurso de idioma com os seguintes detalhes.

    Nome Valor obrigatório
    Subscrição A sua subscrição do Azure.
    Grupo de recursos Um grupo de recursos que conterá seu recurso. Você pode usar um existente ou criar um novo.
    País/Região Uma das regiões apoiadas. Por exemplo, "West US 2".
    Nome Um nome para o seu recurso.
    Escalão de preço Um dos níveis de preços suportados. Você pode usar a camada Gratuito (F0) para experimentar o serviço.

    Se você receber uma mensagem dizendo "sua conta de login não é proprietária do grupo de recursos da conta de armazenamento selecionada", sua conta precisará ter uma função de proprietário atribuída no grupo de recursos antes de poder criar um recurso de idioma. Entre em contato com o proprietário da assinatura do Azure para obter assistência.

    Você pode determinar o proprietário da assinatura do Azure pesquisando seu grupo de recursos e seguindo o link para sua assinatura associada. Em seguida:

    1. Selecione a guia Controle de acesso (IAM)
    2. Selecionar atribuições de função
    3. Filtrar por Função:Proprietário.
  4. Na seção Classificação de texto personalizada & reconhecimento de entidade nomeada personalizada, selecione uma conta de armazenamento existente ou selecione Nova conta de armazenamento. Observe que esses valores são para ajudá-lo a começar, e não necessariamente os valores da conta de armazenamento que você deseja usar em ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se a contas de armazenamento na mesma região do recurso Idioma.

    Valor da conta de armazenamento Valor recomendado
    Nome da conta de armazenamento Qualquer nome
    Storage account type LRS padrão
  5. Certifique-se de que o Aviso de IA Responsável está verificado. Selecione Rever + criar na parte inferior da página.

Nota

  • O processo de conexão de uma conta de armazenamento ao seu recurso de idioma é irreversível, não pode ser desconectado mais tarde.
  • Você só pode conectar seu recurso de idioma a uma conta de armazenamento.

Usando um recurso de idioma pré-existente

Requisito Description
Regiões Verifique se o recurso existente está provisionado em uma das regiões suportadas. Se você não tiver um recurso, precisará criar um novo em uma região suportada.
Escalão de preço O nível de preço do seu recurso.
Identidade gerida Verifique se a configuração de identidade gerenciada do recurso está habilitada. Caso contrário, leia a próxima seção.

Para usar a classificação de texto personalizada, você precisará criar uma conta de armazenamento do Azure se ainda não tiver uma.

Habilite o gerenciamento de identidades para seu recurso

Seu recurso de idioma deve ter gerenciamento de identidade, para habilitá-lo usando o portal do Azure:

  1. Ir para o seu recurso linguístico
  2. No menu à esquerda, na seção Gerenciamento de Recursos, selecione Identidade
  3. Na guia Sistema atribuído, certifique-se de definir Status como Ativado

Ativar recurso de classificação de texto personalizado

Certifique-se de habilitar o recurso Classificação de texto personalizada / Reconhecimento de entidade nomeada personalizada do portal do Azure.

  1. Vá para o seu recurso de idioma no portal do Azure
  2. No menu do lado esquerdo, na seção Gerenciamento de Recursos, selecione Recursos
  3. Habilitar classificação de texto personalizada / recurso de reconhecimento de entidade nomeada personalizada
  4. Conecte sua conta de armazenamento
  5. Selecione Aplicar

Importante

  • Verifique se o recurso de idioma tem a função de contribuidor de dados de blob de armazenamento atribuída na conta de armazenamento que você está conectando.

Definir funções para sua conta de armazenamento e recurso de idioma do Azure AI

Use as etapas a seguir para definir as funções necessárias para sua conta de armazenamento e recurso de idioma.

An animated image showing how to set roles in the Azure portal.

Funções para seu recurso de linguagem de IA do Azure

  1. Vá para sua conta de armazenamento ou recurso de idioma no portal do Azure.

  2. Selecione Controle de acesso (IAM) no menu de navegação à esquerda.

  3. Selecione Adicionar para Adicionar Atribuições de Função e escolha a função apropriada para sua conta.

    Você deve ter a função de proprietário ou colaborador atribuída em seu recurso de idioma.

  4. Em Atribuir acesso a, selecione Usuário, grupo ou entidade de serviço

  5. Selecionar membros

  6. Selecione seu nome de usuário. Você pode pesquisar nomes de usuário no campo Selecionar . Repita isso para todas as funções.

  7. Repita estas etapas para todas as contas de usuário que precisam acessar esse recurso.

Funções para sua conta de armazenamento

  1. Aceda à página da sua conta de armazenamento no portal do Azure.
  2. Selecione Controle de acesso (IAM) no menu de navegação à esquerda.
  3. Selecione Adicionar para Adicionar Atribuições de Função e escolha a função de contribuidor de dados de blob de armazenamento na conta de armazenamento.
  4. Em Atribuir acesso a, selecione Identidade gerenciada.
  5. Selecionar membros
  6. Selecione sua assinatura e Idioma como a identidade gerenciada. Você pode pesquisar nomes de usuário no campo Selecionar .

Importante

Se você tiver uma rede virtual ou ponto de extremidade privado, certifique-se de selecionar Permitir serviços do Azure na lista de serviços confiáveis para acessar essa conta de armazenamento no portal do Azure.

Ativar CORS para sua conta de armazenamento

Certifique-se de permitir métodos (GET, PUT, DELETE) ao habilitar o CORS (Cross-Origin Resource Sharing). Defina o campo origens permitidas como https://language.cognitive.azure.com. Permita todos os cabeçalhos adicionando * aos valores de cabeçalho permitidos e defina a idade máxima como 500.

A screenshot showing how to use CORS for storage accounts.

Criar um projeto de classificação de texto personalizado

Depois que o contêiner de recursos e armazenamento estiver configurado, crie um novo projeto de classificação de texto personalizado. Um projeto é uma área de trabalho para construir seus modelos de IA personalizados com base em seus dados. Seu projeto só pode ser acessado por você e outras pessoas que têm acesso ao recurso do Azure que está sendo usado. Se você tiver dados rotulados, poderá importá-los para começar.

  1. Entre no Language Studio. Será exibida uma janela para permitir que você selecione sua assinatura e recurso de idioma. Selecione o seu recurso Idioma.

  2. Na seção Classificar texto do Language Studio, selecione Classificação de texto personalizada.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. Selecione Criar novo projeto no menu superior da página de projetos. Criar um projeto permitirá que você rotule dados, treine, avalie, melhore e implante seus modelos.

    A screenshot of the custom text classification project creation page.

  4. Depois de clicar em Criar novo projeto, aparecerá uma janela para permitir que você conecte sua conta de armazenamento. Se você já tiver conectado uma conta de armazenamento, verá o armazenamento contabilizado conectado. Caso contrário, escolha sua conta de armazenamento na lista suspensa exibida e selecione Conectar conta de armazenamento, isso definirá as funções necessárias para sua conta de armazenamento. Esta etapa possivelmente retornará um erro se você não estiver atribuído como proprietário na conta de armazenamento.

    Nota

    • Você só precisa fazer essa etapa uma vez para cada novo recurso de idioma usado.
    • Esse processo é irreversível, se você conectar uma conta de armazenamento ao seu recurso de idioma, não poderá desconectá-la mais tarde.
    • Você só pode conectar seu recurso de idioma a uma conta de armazenamento.

    A screenshot of the storage connection screen for custom classification projects.

  5. Selecione o tipo de projeto. Você pode criar um projeto de classificação de rótulo múltiplo onde cada documento pode pertencer a uma ou mais classes ou um projeto de classificação de rótulo único onde cada documento pode pertencer a apenas uma classe. O tipo selecionado não pode ser alterado posteriormente. Saiba mais sobre os tipos de projeto

    A screenshot of the available custom classification project types.

  6. Insira as informações do projeto, incluindo um nome, uma descrição e o idioma dos documentos em seu projeto. Se você estiver usando o conjunto de dados de exemplo, selecione Inglês. Você não poderá alterar o nome do seu projeto mais tarde. Selecione Seguinte.

    Gorjeta

    Seu conjunto de dados não precisa estar totalmente no mesmo idioma. Você pode ter vários documentos, cada um com diferentes idiomas suportados. Se o conjunto de dados contiver documentos de idiomas diferentes ou se você esperar texto de idiomas diferentes durante o tempo de execução, selecione a opção habilitar conjunto de dados multilíngue ao inserir as informações básicas para seu projeto. Esta opção pode ser ativada posteriormente na página Configurações do projeto.

  7. Selecione o contêiner onde você carregou seu conjunto de dados.

    Nota

    Se você já rotulou seus dados, certifique-se de que eles seguem o formato suportado e selecione Sim, meus documentos já estão rotulados e eu formatei o arquivo de etiquetas JSON e selecione o arquivo de etiquetas no menu suspenso abaixo.

    Se você estiver usando um dos conjuntos de dados de exemplo, use o arquivo included webOfScience_labelsFile ou movieLabels json. Em seguida, selecione Seguinte.

  8. Revise os dados inseridos e selecione Criar projeto.

Importar um projeto de classificação de texto personalizado

Se você já tiver rotulado dados, poderá usá-los para começar a usar o serviço. Certifique-se de que os dados rotulados seguem os formatos de dados aceitos.

  1. Entre no Language Studio. Será exibida uma janela para permitir que você selecione sua assinatura e recurso de idioma. Selecione o seu recurso Idioma.

  2. Na seção Classificar texto do Language Studio, selecione Classificação de texto personalizada.

    A screenshot showing the location of custom text classification in the Language Studio landing page.

  3. Selecione Criar novo projeto no menu superior da página de projetos. Criar um projeto permitirá que você rotule dados, treine, avalie, melhore e implante seus modelos.

    A screenshot of the project creation page.

  4. Depois de selecionar Criar novo projeto, uma tela será exibida para permitir que você conecte sua conta de armazenamento. Se não conseguir encontrar a sua conta de armazenamento, certifique-se de que criou um recurso utilizando os passos recomendados. Se já tiver ligado uma conta de armazenamento ao seu recurso Idioma, verá a sua conta de armazenamento ligada.

    Nota

    • Você só precisa fazer essa etapa uma vez para cada novo recurso de idioma usado.
    • Esse processo é irreversível, se você conectar uma conta de armazenamento ao seu recurso de idioma, não poderá desconectá-la mais tarde.
    • Você só pode conectar seu recurso de idioma a uma conta de armazenamento.

    A screenshot of the storage connection screen for custom classification projects.

  5. Selecione o tipo de projeto. Você pode criar um projeto de classificação de rótulo múltiplo onde cada documento pode pertencer a uma ou mais classes ou um projeto de classificação de rótulo único onde cada documento pode pertencer a apenas uma classe. O tipo selecionado não pode ser alterado posteriormente.

    A screenshot of the available custom classification project types.

  6. Insira as informações do projeto, incluindo um nome, uma descrição e o idioma dos documentos em seu projeto. Você não poderá alterar o nome do seu projeto mais tarde. Selecione Seguinte.

    Gorjeta

    Seu conjunto de dados não precisa estar totalmente no mesmo idioma. Você pode ter vários documentos, cada um com diferentes idiomas suportados. Se o conjunto de dados contiver documentos de idiomas diferentes ou se você esperar texto de idiomas diferentes durante o tempo de execução, selecione a opção habilitar conjunto de dados multilíngue ao inserir as informações básicas para seu projeto. Esta opção pode ser ativada posteriormente na página Configurações do projeto.

  7. Selecione o contêiner onde você carregou seu conjunto de dados.

  8. Selecione Sim, meus documentos já estão rotulados e eu formatei o arquivo de etiquetas JSON e selecione o arquivo de etiquetas no menu suspenso abaixo para importar seu arquivo de etiquetas JSON. Certifique-se de que segue o formato suportado.

  9. Selecione Seguinte.

  10. Revise os dados inseridos e selecione Criar projeto.

Obter detalhes do projeto

  1. Vá para a página de configurações do projeto no Language Studio.

  2. Você pode ver os detalhes do projeto.

  3. Nesta página, você pode atualizar a descrição do projeto e ativar/desabilitar o conjunto de dados multilíngue nas configurações do projeto.

  4. Você também pode exibir a conta de armazenamento conectada e o contêiner ao seu recurso de idioma.

  5. Você também pode recuperar sua chave primária de recurso nesta página.

    A screenshot of the project settings page.

Excluir projeto

Quando você não precisar mais do seu projeto, poderá excluí-lo usando o Language Studio. Selecione Classificação de texto personalizada na parte superior e, em seguida, selecione o projeto que deseja excluir. Selecione Excluir no menu superior para excluir o projeto.

Próximos passos

  • Você deve ter uma ideia do esquema de projeto que usará para rotular seus dados.

  • Depois que seu projeto é criado, você pode começar a rotular seus dados, o que informará seu modelo de classificação de texto como interpretar o texto e é usado para treinamento e avaliação.