Partilhar via


O que é a sumarização?

Importante

Nossa região de visualização, Suécia Central, apresenta nossas técnicas de ajuste fino LLM mais recentes e em constante evolução baseadas em modelos GPT. Convidamo-lo a experimentá-los com um recurso linguístico na região central da Suécia.

O resumo da conversa só está disponível usando:

  • API REST
  • Python
  • C#

A sumarização é um recurso oferecido pelo Azure AI Language, que é uma combinação de modelos generativos de grande linguagem e modelos de codificador otimizados para tarefas que oferecem soluções de resumo com maior qualidade, eficiência de custos e menor latência. Use este artigo para saber mais sobre esse recurso e como usá-lo em seus aplicativos.

Pronto para usar, o serviço fornece soluções de resumo para três tipos de gênero, textos simples, conversas e documentos nativos. O resumo de texto só aceita blocos de texto simples, e o resumo de conversação aceita entrada de conversação, incluindo vários sinais de áudio de fala para que o modelo segmente e resuma de forma eficaz, e o documento nativo pode resumir diretamente para documentos em seus formatos nativos, como Palavras, PDF, etc.

Esta documentação contém os seguintes tipos de artigo:

  • Os guias de início rápido são instruções de introdução para guiá-lo ao fazer solicitações ao serviço.
  • Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.

Esses recursos são projetados para encurtar o conteúdo que pode ser considerado muito longo para ler.

Principais recursos para resumo de texto

A sumarização de texto usa técnicas de processamento de linguagem natural para gerar um resumo para textos simples, que podem ser de um documento ou conversa, ou quaisquer textos. Há duas abordagens de resumo que esta API fornece:

  • Sumarização extrativa: Produz um resumo extraindo frases salientes dentro do documento, juntamente com as informações de posicionamento dessas frases.

    • Várias frases extraídas: Estas frases transmitem coletivamente a ideia principal do documento. São frases originais extraídas do conteúdo do documento de entrada.
    • Rank score: A pontuação de classificação indica o quão relevante uma frase é para o tópico principal. O resumo de texto classifica as frases extraídas e você pode determinar se elas são retornadas na ordem em que aparecem ou de acordo com sua classificação. Por exemplo, se você solicitar um resumo extrativo de três frases, o resumo extrativo retornará as três frases com maior pontuação.
    • Informação posicional: A posição inicial e o comprimento das frases extraídas.
  • Sumarização abstrata: Gera um resumo com frases concisas e coerentes ou palavras que não são literalmente extrair frases do documento original.

    • Textos resumidos: A sumarização abstrata retorna um resumo para cada intervalo de entrada contextual. Uma entrada longa pode ser segmentada para que vários grupos de textos resumidos possam ser retornados com seu intervalo de entrada contextual.
    • Intervalo de entrada contextual: o intervalo dentro da entrada que foi usado para gerar o texto de resumo.

Como exemplo, considere o seguinte parágrafo do texto:

"Na Microsoft, estamos em uma busca para avançar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para aprender e compreender. Como Diretor de Tecnologia dos serviços de IA do Azure, tenho trabalhado com uma equipe de cientistas e engenheiros incríveis para transformar essa busca em realidade. Na minha função, desfruto de uma perspetiva única na visualização da relação entre três atributos da cognição humana: texto monolingue (X), sinais sensoriais áudio ou visuais (Y) e multilingue (Z). Na interseção de todos os três, há magia — o que chamamos de código XYZ, conforme ilustrado na Figura 1 — uma representação conjunta para criar uma IA mais poderosa que pode falar, ouvir, ver e entender melhor os seres humanos. Acreditamos que o código XYZ nos permite cumprir nossa visão de longo prazo: aprendizagem de transferência entre domínios, abrangendo modalidades e idiomas. O objetivo é ter modelos pré-treinados que possam aprender em conjunto representações para apoiar uma ampla gama de tarefas de IA a jusante, da mesma forma que os humanos fazem hoje. Nos últimos cinco anos, alcançamos o desempenho humano em benchmarks em reconhecimento de fala conversacional, tradução automática, resposta a perguntas conversacionais, compreensão de leitura automática e legendagem de imagem. Esses cinco avanços nos forneceram sinais fortes em direção à nossa aspiração mais ambiciosa de produzir um salto nas capacidades de IA, alcançando uma aprendizagem multissensorial e multilíngue que está mais próxima de como os humanos aprendem e entendem. Acredito que o código XYZ conjunto é um componente fundamental dessa aspiração, se fundamentado com fontes de conhecimento externas nas tarefas de IA a jusante."

A solicitação da API de resumo de texto é processada após o recebimento da solicitação, criando um trabalho para o back-end da API. Se o trabalho for bem-sucedido, a saída da API será retornada. A saída está disponível para recuperação por 24 horas. Após esse tempo, a saída é limpa. Devido ao suporte multilíngue e a emojis, a resposta pode conter deslocamentos de texto. Para obter mais informações, consulte como processar deslocamentos.

Se usarmos o exemplo acima, a API poderá retornar estes resumos:

Resumo extrativo:

  • "Na Microsoft, estamos em uma busca para avançar a IA além das técnicas existentes, adotando uma abordagem mais holística e centrada no ser humano para aprender e compreender."
  • "Acreditamos que o código XYZ nos permite cumprir nossa visão de longo prazo: aprendizagem de transferência entre domínios, abrangendo modalidades e idiomas."
  • "O objetivo é ter modelos pré-treinados que possam aprender conjuntamente representações para apoiar uma ampla gama de tarefas de IA a jusante, da mesma forma que os humanos fazem hoje."

Resumo abstrato:

  • "A Microsoft está adotando uma abordagem mais holística e centrada no ser humano para aprender e compreender. Acreditamos que o código XYZ nos permite cumprir nossa visão de longo prazo: aprendizagem de transferência entre domínios, abrangendo modalidades e idiomas. Nos últimos cinco anos, atingimos o desempenho humano em benchmarks em reconhecimento de fala conversacional."

Introdução à sumarização

Para usar o resumo, envie para análise e manipule a saída da API em seu aplicativo. A análise é realizada no estado em que se encontra, sem personalização adicional ao modelo usado em seus dados. Há duas maneiras de usar o resumo:

Opção de desenvolvimento Description
Estúdio de linguagem O Language Studio é uma plataforma baseada na Web que permite que você tente vincular entidades com exemplos de texto sem uma conta do Azure e seus próprios dados quando você se inscreve. Para obter mais informações, consulte o site do Language Studio ou o início rápido do language studio.
API REST ou biblioteca de cliente (SDK do Azure) Integre o resumo de texto em seus aplicativos usando a API REST ou a biblioteca de cliente disponível em vários idiomas. Para obter mais informações, consulte o guia de início rápido de resumo.

Requisitos de entrada e limites de serviço

  • A sumarização leva o texto para análise. Para obter mais informações, consulte Limites de dados e serviços no guia de instruções.
  • A sumarização trabalha com várias linguagens escritas. Para obter mais informações, consulte Suporte a idiomas.

Documentação de referência e exemplos de código

À medida que você usa o resumo de texto em seus aplicativos, consulte a seguinte documentação de referência e exemplos para o Azure AI Language:

Opção de desenvolvimento / linguagem Documentação de referência Exemplos
C# Documentação em C# Exemplos de C#
Java Documentação Java Amostras Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação Python Amostras de Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usam, as pessoas afetadas por ela e o ambiente de implantação. Leia a nota de transparência para resumir para saber mais sobre o uso e a implantação responsáveis de IA em seus sistemas. Para obter mais informações, consulte os seguintes artigos: