Guia de início rápido: resumo personalizado (visualização)

Use este artigo para começar a criar um projeto de Sumarização personalizado onde você pode treinar modelos personalizados sobre o Sumarização. Um modelo é um software de inteligência artificial que é treinado para fazer uma determinada tarefa. Para este sistema, os modelos resumem o texto e são treinados aprendendo com dados importados.

Neste artigo, usamos o Language Studio para demonstrar conceitos-chave de sumarização personalizada. Como exemplo, construiremos um modelo de sumarização personalizado para extrair a instalação ou o local de tratamento de pequenas notas de descarga.

Pré-requisitos

Criar um novo recurso de linguagem de IA do Azure e uma conta de armazenamento do Azure

Antes de poder usar o Resumo personalizado, você precisará criar um recurso da Linguagem de IA do Azure, que lhe dará as credenciais necessárias para criar um projeto e começar a treinar um modelo. Você também precisará de uma conta de armazenamento do Azure, onde poderá carregar seu conjunto de dados que será usado para criar seu modelo.

Importante

Para começar rapidamente, recomendamos a criação de um novo recurso de linguagem de IA do Azure usando as etapas fornecidas neste artigo. Usar as etapas neste artigo permitirá que você crie o recurso de idioma e a conta de armazenamento ao mesmo tempo, o que é mais fácil do que fazê-lo mais tarde.

Criar um novo recurso a partir do portal do Azure

  1. Vá para o portal do Azure para criar um novo recurso de linguagem de IA do Azure.

  2. Na janela apresentada, selecione este serviço a partir das funcionalidades personalizadas. Selecione Continuar para criar seu recurso na parte inferior da tela.

    A screenshot showing custom text classification & custom named entity recognition in the Azure portal.

  3. Crie um recurso de idioma com os seguintes detalhes.

    Nome Descrição
    Subscrição A sua subscrição do Azure.
    Grupo de recursos Um grupo de recursos que conterá seu recurso. Você pode usar um existente ou criar um novo.
    País/Região A região do seu recurso Idioma. Por exemplo, "West US 2".
    Nome Um nome para o seu recurso.
    Escalão de preço A camada de preço para seu recurso de idioma. Você pode usar a camada Gratuito (F0) para experimentar o serviço.

    Nota

    Se você receber uma mensagem dizendo "sua conta de login não é proprietária do grupo de recursos da conta de armazenamento selecionada", sua conta precisará ter uma função de proprietário atribuída no grupo de recursos antes de poder criar um recurso de idioma. Entre em contato com o proprietário da assinatura do Azure para obter assistência.

  4. Na seção deste serviço, selecione uma conta de armazenamento existente ou selecione Nova conta de armazenamento. Esses valores são para ajudá-lo a começar, e não necessariamente os valores da conta de armazenamento que você desejará usar em ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se a contas de armazenamento na mesma região do recurso Idioma.

    Valor da conta de armazenamento Valor recomendado
    Nome da conta de armazenamento Qualquer nome
    Storage account type LRS padrão
  5. Certifique-se de que o Aviso de IA Responsável está verificado. Selecione Rever + criar na parte inferior da página e, em seguida, selecione Criar.

Transferir dados de exemplo

Se você precisar de dados de exemplo, fornecemos alguns para cenários de resumo de documentos e resumos de conversas para o propósito deste início rápido.

Carregar dados de amostra para o contêiner de blob

  1. Localize os ficheiros a carregar para a sua conta de armazenamento

  2. No portal do Azure, navegue até a conta de armazenamento que você criou e selecione-a.

  3. Na sua conta de armazenamento, selecione Contêineres no menu à esquerda, localizado abaixo de Armazenamento de dados. Na tela exibida, selecione + Contêiner. Dê ao contêiner o nome example-data e deixe o nível de acesso público padrão.

    A screenshot showing the main page for a storage account.

  4. Depois que o contêiner for criado, selecione-o. Em seguida, selecione o botão Carregar para selecionar os .txt arquivos que .json você baixou anteriormente.

    A screenshot showing the button for uploading files to the storage account.

Criar um projeto de resumo personalizado

Depois que sua conta de recursos e armazenamento estiver configurada, crie um novo projeto de Sumarização personalizado. Um projeto é uma área de trabalho para criar seus modelos de ML personalizados com base em seus dados. O seu projeto só pode ser acedido por si e por outras pessoas que tenham acesso ao recurso linguístico que está a ser utilizado.

  1. Entre no Language Studio. Será exibida uma janela para permitir que você selecione sua assinatura e recurso de idioma. Selecione o recurso de idioma que você criou na etapa acima.

  2. Selecione o recurso que você deseja usar no Language Studio.

  3. Selecione Criar novo projeto no menu superior da página de projetos. Criar um projeto permite rotular dados, treinar, avaliar, melhorar e implantar seus modelos.

    A screenshot of the project creation page.

  4. Insira as informações do projeto, incluindo um nome, uma descrição e o idioma dos arquivos em seu projeto. Se você estiver usando o conjunto de dados de exemplo, selecione Inglês. Não é possível alterar o nome do seu projeto mais tarde. Selecione Seguinte

    Gorjeta

    Seu conjunto de dados não precisa estar totalmente no mesmo idioma. Você pode ter vários documentos, cada um com diferentes idiomas suportados. Se o conjunto de dados contiver documentos de idiomas diferentes ou se você esperar texto de idiomas diferentes durante o tempo de execução, selecione a opção habilitar conjunto de dados multilíngue ao inserir as informações básicas para seu projeto. Esta opção pode ser ativada posteriormente na página Configurações do projeto.

  5. Depois de selecionar Criar novo projeto, uma janela será exibida para permitir que você conecte sua conta de armazenamento. Se você já tiver conectado uma conta de armazenamento, verá o armazenamento contabilizado conectado. Caso contrário, escolha sua conta de armazenamento na lista suspensa exibida e selecione Conectar conta de armazenamento, isso definirá as funções necessárias para sua conta de armazenamento. Esta etapa possivelmente retornará um erro se você não estiver atribuído como proprietário na conta de armazenamento.

    Nota

    • Você só precisa fazer essa etapa uma vez para cada novo recurso usado.
    • Esse processo é irreversível, se você conectar uma conta de armazenamento ao seu recurso de idioma, não poderá desconectá-la mais tarde.
    • Você só pode conectar seu recurso de idioma a uma conta de armazenamento.
  6. Selecione o contêiner onde você carregou seu conjunto de dados.

  7. Se você já tiver rotulado dados, certifique-se de que eles seguem o formato suportado e selecione Sim, meus arquivos já estão rotulados e eu formatei o arquivo de rótulos JSON e selecione o arquivo de rótulos no menu suspenso. Selecione Seguinte. Se você estiver usando o conjunto de dados do Guia de início rápido, não há necessidade de revisar a formatação do arquivo de rótulos JSON.

  8. Revise os dados inseridos e selecione Criar projeto.

Preparar o modelo

Depois de criar um projeto, você vai em frente e começa a treinar seu modelo.

Para começar a treinar o seu modelo a partir do Language Studio:

  1. Selecione Trabalhos de treinamento no menu do lado esquerdo.

  2. Selecione Iniciar um trabalho de treinamento no menu superior.

  3. Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Você também pode substituir um modelo existente selecionando essa opção e escolhendo o modelo que deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.

    Create a new training job

  4. Por padrão, o sistema dividirá seus dados rotulados entre os conjuntos de treinamento e teste, de acordo com as porcentagens especificadas. Se você tiver documentos em seu conjunto de testes, poderá dividir manualmente os dados de treinamento e teste.

  5. Selecione o botão Trem .

  6. Se você selecionar o ID do Trabalho de Treinamento na lista, um painel lateral aparecerá onde você poderá verificar o progresso do Treinamento, o status do Trabalho e outros detalhes para este trabalho.

    Nota

    • Apenas trabalhos de formação concluídos com sucesso gerarão modelos.
    • O treinamento pode levar algum tempo entre alguns minutos e várias horas com base no tamanho dos dados rotulados.
    • Só pode ter um trabalho de preparação em execução de cada vez. Não pode iniciar outro trabalho de preparação no mesmo projeto sem que o trabalho em execução esteja concluído.

Implementar o modelo

Geralmente, depois de treinar um modelo, você revisaria seus detalhes de avaliação e faria melhorias, se necessário. Neste início rápido, você apenas implantará seu modelo e o disponibilizará para você experimentar no Language Studio.

Para implantar seu modelo a partir do Language Studio:

  1. Selecione Implantando um modelo no menu do lado esquerdo.

  2. Selecione Adicionar implantação para iniciar um novo trabalho de implantação .

    A screenshot showing the deployment button

  3. Selecione Criar nova implantação para criar uma nova implantação e atribuir um modelo treinado na lista suspensa abaixo. Você também pode substituir uma implantação existente selecionando essa opção e selecionando o modelo treinado que deseja atribuir a ela na lista suspensa abaixo.

    Nota

    A substituição de uma implantação existente não requer alterações na chamada da API de previsão, mas os resultados obtidos serão baseados no modelo recém-atribuído.

    A screenshot showing the deployment screen

  4. Selecione Implantar para iniciar o trabalho de implantação.

  5. Depois que a implantação for bem-sucedida, uma data de expiração aparecerá ao lado dela. A expiração da implantação é quando o modelo implantado não estará disponível para ser usado para previsão, o que normalmente acontece doze meses após a expiração de uma configuração de treinamento.

Testar o seu modelo

Para este início rápido, você usará o Language Studio para enviar a tarefa de resumo personalizada e visualizar os resultados. No conjunto de dados de exemplo que você baixou anteriormente, você pode encontrar alguns documentos de teste que você pode usar nesta etapa.

Para testar seus modelos implantados de dentro do Language Studio:

  1. Selecione Testando implantações no menu do lado esquerdo.

  2. Selecione a implantação que você deseja testar. Você só pode testar modelos atribuídos a implantações.

  3. Para projetos multilingues, na lista pendente de línguas, selecione a língua do texto que está a testar.

  4. Selecione a implantação que você deseja consultar/testar na lista suspensa.

  5. Pode introduzir o texto que pretende submeter ao pedido ou carregar um .txt ficheiro para utilizar.

  6. Selecione Executar o teste no menu superior.

  7. Na guia Resultado, você pode ver as entidades extraídas do seu texto e seus tipos. Você também pode exibir a resposta JSON na guia JSON .

A screenshot showing the model test results.

Clean up resources (Limpar recursos)

Quando você não precisar mais do seu projeto, poderá excluí-lo usando o Language Studio. Selecione a funcionalidade que está a utilizar na parte superior e, em seguida, selecione o projeto que pretende eliminar. Selecione Excluir no menu superior para excluir o projeto.

Próximos passos