Compartilhar via


O que é resumo?

Importante

Nossa região de versão prévia, a Suécia Central, demonstra nossas técnicas de ajuste fino de LLM mais recentes e em constante evolução baseadas em modelos GPT. Você está convidado a experimentá-los com um recurso de idiomas na região da Suécia Central.

O resumo da conversa só está disponível usando:

  • API REST
  • Python
  • C#

A sumarização é um dos recursos oferecidos pela Linguagem de IA do Azure, uma coleção de aprendizado de máquina e algoritmos de IA na nuvem para o desenvolvimento de aplicativos inteligentes que envolvem linguagem escrita. Use este artigo para saber mais sobre esse recurso e como usá-lo nos seus aplicativos.

Embora os serviços sejam rotulados como resumo de documentos e de conversas, o resumo de texto só aceita blocos de texto simples, e o resumo de conversas aceita vários artefatos de fala para que o modelo aprenda mais. Se você quiser processar uma conversa, mas se preocupar apenas com o texto, poderá usar o resumo de texto para esse cenário.

Esta documentação contém os seguintes tipos de artigos:

  • Os guias de início rápido são instruções de introdução que orientam sobre como fazer solicitações ao serviço.
  • Os guias de instruções contêm instruções de uso do serviço de maneiras mais específicas ou personalizadas.

O resumo de texto usa técnicas de processamento de linguagem natural para gerar um resumo dos documentos. Há duas abordagens de API que dão suporte para a compactação automática: extrativa e abstrata.

A sumarização extrativa extrai frases que representam coletivamente as informações mais importantes ou relevantes do conteúdo original. A sumarização abstrata gera um resumo com frases ou palavras concisas e coerentes que não são frases extraídas literalmente do documento original. Esses recursos foram projetados para reduzir o conteúdo que possa ser considerado muito longo para ser lido.

Principais recursos do resumo de texto

Há dois aspectos do resumo de texto que esta API fornece:

  • Sumarização extrativa: produz um resumo extraindo frases salientes do documento.

    • Várias frases extraídas: essas frases transmitem em conjunto a ideia principal do documento. São frases originais extraídas do conteúdo do documento de entrada.
    • Pontuação de classificação: a pontuação de classificação indica o quanto uma frase é relevante para o tópico principal de um documento. O resumo de texto classifica as frases extraídas, e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com a classificação delas.
    • Várias frases retornadas: determina o número máximo de frases a serem retornadas. Por exemplo, se você solicitar um resumo de três frases, a sumarização extrativa retornará as três frases com maior pontuação.
    • Informações posicionais: a posição inicial e o comprimento das frases extraídas.
  • Resumo abstrato: gera um resumo que não usa as mesmas palavras do documento, mas captura a ideia principal.

    • Textos resumidos: a sumarização abstrativa retorna um resumo para cada intervalo de entrada contextual do documento. Um documento longo pode ser segmentado para que vários grupos de textos resumidos possam ser retornados com seu intervalo de entrada contextual.
    • Intervalo de entrada contextual: o intervalo dentro do documento de entrada que foi usado para gerar o texto de resumo.

Por exemplo, considere o seguinte parágrafo de texto:

"Na Microsoft, estamos em uma busca para levar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para o aprendizado e a compreensão. Como Diretor de Tecnologia dos Serviços de IA do Azure, tenho trabalhado para transformar essa busca em realidade com uma equipe de cientistas e engenheiros incríveis. Na minha função, eu adoto uma perspectiva exclusiva para visualizar a relação entre três atributos de cognição humana: texto (X), sinais sensoriais auditivos ou visuais (Y) e multilínge (Z). Na interseção de todos os três, há mágica, o que chamamos de código XYZ, conforme ilustrado na Figura 1, uma representação conjunta para criar uma IA mais poderosa que possa falar, ouvir, ver e entender melhor os seres humanos. Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes. A meta é ter modelos pré-treinados que possam aprender representações em conjunto para dar suporte a uma ampla variedade de tarefas de IA downstream, de maneira muito similar a como os humanos fazem hoje. Nos últimos cinco anos, alcançamos desempenho humano em parâmetros de comparação em reconhecimento de fala em conversação, tradução automática, resposta às perguntas em conversação, compreensão de leitura por computador e legendas de imagens. Esses cinco avanços nos forneceram fortes sinais em direção à nossa aspiração mais ambiciosa de produzir um salto nas funcionalidades de IA, alcançando um aprendizado multissensorial e multilíngue mais próximo de como os humanos aprendem e entendem. Acredito que o código XYZ conjunto é um componente fundamental dessa aspitação, se fundamentado com fontes de conhecimento externas nas tarefas de IA downstream."

A solicitação de API do resumo de texto é processada após o recebimento da solicitação criando um trabalho para o back-end da API. Se o trabalho tiver sido bem-sucedido, a saída da API é retornada. A saída está disponível para recuperação por 24 horas. Após esse período, a saída será limpa. Devido ao suporte multilíngue e a emojis, a resposta pode conter deslocamentos de texto. Para obter mais informações, confira como processar deslocamentos.

Se usarmos o exemplo anterior, a API poderá retornar estas frases resumidas:

Sumarização extrativa:

  • "Na Microsoft, estamos em uma busca para levar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para o aprendizado e a compreensão."
  • "Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes."
  • "A meta é ter modelos pré-treinados que possam aprender representações em conjunto para dar suporte a uma ampla variedade de tarefas de IA downstream, de maneira muito similar a como os humanos fazem hoje."

Sumarização abstrativa:

  • "A Microsoft está adotando uma abordagem mais holística e centrada no aprendizado e na compreensão das pessoas. Acreditamos que o código XYZ permitirá realizar nossa visão de longo prazo: aprendizado de transferência entre domínios, modalidades e idiomas abrangentes. Nos últimos cinco anos, alcançamos desempenho humano em parâmetros de comparação no reconhecimento de fala em conversação."

Introdução ao resumo

Para usar a compactação, envie para análise e trate a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem nenhuma personalização adicionada para o modelo usado nos seus dados. Há duas maneiras de usar o resumo:

Opção de desenvolvimento Descrição
Language Studio O Language Studio é uma plataforma baseada na Web que permite que você experimente a vinculação de entidade com exemplos de texto sem uma conta do Azure, e seus próprios dados quando você se inscreve. Para obter mais informações, confira o site do Language Studio ou o início rápido do Language Studio.
API REST ou biblioteca de clientes (SDK do Azure) Integre o resumo de texto nos seus aplicativos usando a API REST ou a biblioteca de clientes disponível em vários idiomas. Para obter mais informações, consulte o início rápido da sumarização.

Requisitos de entrada e limites de serviço

Documentação de referência e exemplos de código

Ao usar o resumo de texto nos seus aplicativos, consulte a seguinte documentação de referência e exemplos da Linguagem de IA do Azure:

Opção/idioma de desenvolvimento Documentação de referência Exemplos
C# Documentação do C# Exemplos do C#
Java Documentação do Java Exemplos do Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação do Python Exemplos em Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a utilizam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para resumo para saber mais sobre o uso e a implantação de IA responsável em seus sistemas. Para obter mais informações, consulte os seguintes artigos: