Share via


Início Rápido: sumarização personalizada (versão prévia)

Use este artigo para começar a criar um projeto de Sumarização de texto personalizada, no qual você pode treinar modelos personalizados com base na sumarização. Um modelo é um software de inteligência artificial treinado para fazer um determinada tarefa. Para esse sistema, os modelos resumem o texto e são treinados aprendendo com os dados importados.

Neste artigo, usamos o Language Studio para demonstrar os principais conceitos de sumarização personalizada. Como exemplo, compilaremos um modelo de sumarização personalizada para extrair a Unidade ou o local de tratamento das notas curtas de liberação.

Pré-requisitos

Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure

Antes de usar a sumarização personalizada, você precisará criar um recurso de Linguagem de IA do Azure, que fornecerá as credenciais necessárias para criar um projeto e começar a treinar um modelo. Você também precisará de uma conta de armazenamento do Azure, na qual poderá carregar o conjunto de dados que será usado para compilar o modelo.

Importante

Para obter uma introdução rápida, recomendamos criar um recurso de Linguagem de IA do Azure usando as etapas fornecidas neste artigo. Usar as etapas neste artigo permitirá que você crie o recurso de linguagem e a conta de armazenamento ao mesmo tempo, que é mais fácil do que fazer depois.

Criar um recurso usando o portal do Azure

  1. Vá para o portal do Azure para criar um novo recurso de Linguagem da IA do Azure.

  2. Na janela que aparece, selecione esse serviço nos recursos personalizados. Selecione Continuar para criar seu recurso na parte inferior da tela.

    Captura de tela mostrando a classificação de textos personalizada e o reconhecimento de entidade nomeada personalizada no portal do Azure.

  3. Crie um recurso de Linguagem com os seguintes detalhes.

    Nome Descrição
    Subscription Sua assinatura do Azure.
    Resource group O grupo de recursos que conterá seu recurso. É possível usar um grupo existente ou criar um do zero.
    Região A região para seu recurso de linguagem. Por exemplo, “Oeste dos EUA 2”.
    Nome Um nome para seu recurso.
    Tipo de preço O tipo de preço do recurso de Linguagem. Use a camada Gratuita (F0) para experimentar o serviço.

    Observação

    Se você receber uma mensagem dizendo que "sua conta de logon não é uma proprietária do grupo de recursos da conta de armazenamento selecionada", sua conta precisará ter uma função de proprietário atribuída no grupo de recursos antes de criar um recurso de linguagem. Entre em contato com o proprietário da assinatura do Azure para obter ajuda.

  4. Na seção desse serviço, selecione uma conta de armazenamento existente ou selecione Nova conta de armazenamento. Esses valores são para ajudar você a começar a usar o recurso, e não são necessariamente os valores de conta de armazenamento que você usará nos ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se às contas de armazenamento na mesma região que o recurso de Linguagem.

    Valor de conta de armazenamento Valor recomendado
    Nome da conta de armazenamento Qualquer nome
    Tipo de conta de armazenamento LRS Padrão
  5. Verifique se a opção Aviso de IA Responsável está marcada. Selecione Examinar + criar na parte inferior da página e depois Criar.

Baixar dados de exemplo

Se você precisar de dados de exemplo, fornecemos alguns para os cenários de resumo de texto e resumo de conversa para a finalidade deste início rápido.

Carregar dados de exemplo para o contêiner de blob

  1. Localize os arquivos a serem carregados em sua conta de armazenamento

  2. No portal do Azure, navegue até a conta de armazenamento que você criou e selecione-a.

  3. Em sua conta de armazenamento, selecione Contêineres no menu esquerdo localizado abaixo de Armazenamento de dados. Na tela exibida, selecione + Contêiner. Nomeie o contêiner como example-data e deixe o Nível de acesso público padrão.

    Uma captura de tela mostrando a página principal de uma conta de armazenamento.

  4. Após criar o contêiner, selecione-o. Em seguida, selecione o botão Carregar para selecionar os arquivos .txt e .json baixados anteriormente.

    Uma captura de tela mostrando o botão para fazer upload de arquivos para a conta de armazenamento.

Criar um projeto de sumarização personalizada

Depois que o recurso e a conta de armazenamento estiverem configurados, crie um novo projeto de Sumarização personalizada. Um projeto é uma área de trabalho para a criação de modelos de ML personalizados com base em seus dados. Seu projeto só pode ser acessado por você e por outras pessoas que têm acesso ao recurso de idioma sendo usado.

  1. Entre no Language Studio. Uma janela será exibida para permitir que você selecione sua assinatura e o recurso idioma. Selecione o recurso de idioma que você criou na etapa acima.

  2. Selecione o recurso que você deseja usar no Language Studio.

  3. Selecione Criar projeto no menu superior na página de projetos. A criação de um projeto permite que você rotule dados, treine, avalie, melhore e implante seus modelos.

    Uma captura de tela da página de criação do projeto.

  4. Insira as informações do projeto, incluindo um nome, uma descrição e o idioma dos arquivos em seu projeto. Se você estiver usando o conjunto de dados de exemplo, selecione Inglês. Você não pode alterar o nome do projeto posteriormente. Selecione Avançar

    Dica

    Seu conjunto de dados não precisa estar totalmente no mesmo idioma. Você pode ter vários documentos, cada um com diferentes idiomas compatíveis. Se o conjunto de dados contiver documentos de idiomas diferentes ou se você esperar um texto de diferentes idiomas durante o runtime, selecione Habilitar conjunto de dados multilíngue ao inserir as informações básicas no projeto. Essa opção pode ser habilitada posteriormente na página Configurações do projeto.

  5. Após você selecionar Criar um novo projeto, aparecerá uma janela para permitir que você conecte sua conta de armazenamento. Se você já tiver conectado uma conta de armazenamento, verá o armazenamento conectado. Caso contrário, escolha a conta de armazenamento na lista suspensa que aparece e selecione Conectar conta de armazenamento. Isso definirá as funções necessárias para a sua conta de armazenamento. É possível que essa etapa retorne um erro se você não for atribuído como proprietário na conta de armazenamento.

    Observação

    • Para começar logo, é recomendável criar um novo recurso de Linguagem do Azure por meio das etapas fornecidas abaixo, o que permitirá que você crie o recurso e configure uma conta de armazenamento ao mesmo tempo, o que é mais fácil do que fazê-lo mais tarde.
    • Esse processo é irreversível, se você conectar uma conta de armazenamento ao recurso de idioma, não poderá desconectá-la posteriormente.
    • É possível conectar o recurso de idioma a apenas uma conta de armazenamento.
  6. Selecione o contêiner em que você carregou o conjunto de dados.

  7. Se você já rotulou os dados, certifique-se de que seguem o formato com suporte e selecione Sim, meus arquivos já estão rotulados e formatei o arquivo de rótulos JSON e selecione o arquivo de rótulos no menu suspenso. Selecione Avançar. Se você estiver usando o conjunto de dados do Início Rápido, não será necessário revisar a formatação do arquivo de rótulos JSON.

  8. Revise os dados inseridos e selecione Criar Projeto.

Treinar seu modelo

Depois de criar um projeto, você começa a treinar seu modelo.

Para começar a treinar o modelo no Language Studio:

  1. Selecione Trabalhos de treinamento no menu à esquerda.

  2. Selecione Iniciar um trabalho de treinamento no menu superior.

  3. Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Também é possível substituir um modelo existente selecionando essa opção e escolhendo o modelo que você deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.

    Criar um trabalho de treinamento

  4. Por padrão, o sistema dividirá seus dados rotulados entre os conjuntos de treinamento e teste, de acordo com as porcentagens especificadas. Se você tiver documentos em seu conjunto de testes, poderá dividir manualmente os dados de treinamento e teste.

  5. Selecione o botão Treinar.

  6. Se você selecionar a ID de Trabalho de Treinamento da lista, será exibido um painel lateral no qual você poderá verificar o Progresso do treinamento, o Status do trabalho e outros detalhes para esse trabalho.

    Observação

    • Somente os trabalhos de treinamento concluídos com êxito vão gerar modelos.
    • O treinamento pode levar entre alguns minutos e várias horas de acordo com o tamanho dos dados rotulados.
    • É possível ter um trabalho de treinamento em execução por vez. Não é possível iniciar outro trabalho de treinamento no mesmo projeto até que o trabalho em execução seja concluído.

Implantar o seu modelo

Geralmente, depois de treinar um modelo, você pode revisar os detalhes da avaliação e fazer aprimoramentos, se necessário. Neste guia de início rápido, você apenas implantará seu modelo e o tornará disponível para sua tentativa no Language Studio.

Para implantar o modelo por meio do Language Studio:

  1. Selecione Implantar um modelo no menu à esquerda.

  2. Selecione Adicionar implantação para iniciar um novo trabalho de implantação.

    Uma captura de tela mostrando o botão de implantação

  3. Selecione Criar implantação para criar uma implantação e atribuir um modelo treinado na lista suspensa abaixo. Você também pode Substituir uma implantação existente selecionando essa opção e escolhendo o modelo treinado que deseja atribuir na lista suspensa abaixo.

    Observação

    A substituição de uma implantação existente não exige alterações na chamada à API de previsão, mas os resultados obtidos serão baseados no modelo recém-atribuído.

    Uma captura de tela mostrando a tela de implantação

  4. Selecione Implantar para iniciar a implantação.

  5. Depois que a implantação for realizada com sucesso, uma data de validade será exibida. A expiração da implantação consiste no momento em que o modelo implantado não estará disponível para ser usado para previsão, o que normalmente acontece 12 meses após a expiração de uma configuração de treinamento.

Testar o modelo

Para este início rápido, você usará o Language Studio para enviar a tarefa de sumarização de textos personalizada e visualizar os resultados. No conjunto de dados de exemplo que você baixou anteriormente, poderá encontrar alguns documentos de teste que podem ser usados nesta etapa.

Para testar os modelos implantados de dentro do Language Studio:

  1. Selecione Testar implantações no menu à esquerda.

  2. Selecione a implantação que deseja testar. Você só pode testar modelos atribuídos a implantações.

  3. Para projetos multilíngues, na lista suspensa de idiomas, selecione o idioma do texto que você está testando.

  4. Selecione a implantação que deseja consultar/testar na lista suspensa.

  5. É possível inserir o texto que deseja enviar à solicitação ou carregar um arquivo .txt a ser usado.

  6. Selecione Executar o teste no menu superior.

  7. Na guia Resultado, você pode ver as entidades extraídas de seu texto e seus tipos. Você também pode exibir a resposta JSON na guia JSON.

Uma captura de tela mostrando os resultado do teste de modelo.

Limpar os recursos

Quando não precisar mais do seu projeto, poderá excluí-lo do projeto usando o Language Studio. Selecione o recurso que você está usando na parte superior e selecione o projeto que deseja excluir. Selecione Excluir no menu superior para excluir o projeto.

Próximas etapas