O que é o resumo de documentos e conversações (pré-visualização)?

Importante

  • A partir de 10 de abril de 2023, os clientes obtêm acesso a todas as capacidades de resumo no serviço Idioma. Entre elas, o resumo abstrativo de documentos, o resumo de problemas de conversação e resolução e o resumo narrativo de conversação com capítulos serão apenas em lote por predefinição. Para pedidos em tempo real, preencha este formulário e submeta o seu pedido.
  • Resumo abstrativo de documentos, resumo de problemas de conversação e resolução e resumo narrativo de conversação com funcionalidades de capítulos só estão disponíveis através de Recursos de idioma nas seguintes regiões:
    • Europa do Norte
    • E.U.A. Leste
    • Sul do Reino Unido
  • O resumo do problema de conversação e da resolução só está disponível com:
    • API REST
    • Python
    • C#

O resumo é uma das funcionalidades oferecidas pelo Serviço Cognitivo do Azure para Linguagem, uma coleção de algoritmos de machine learning e IA na cloud para desenvolver aplicações inteligentes que envolvem linguagem escrita. Utilize este artigo para saber mais sobre esta funcionalidade e como utilizá-la nas suas aplicações.

O Resumo Personalizado permite que os utilizadores criem modelos de IA personalizados para resumir texto não estruturado, como contratos ou romances. Ao criar um projeto de Resumo Personalizado, os programadores podem etiquetar dados de forma iterativa, preparar, avaliar e melhorar o desempenho do modelo antes de os disponibilizarem para consumo. A qualidade dos dados etiquetados afeta significativamente o desempenho do modelo. Para simplificar a criação e personalização do modelo, o serviço oferece um portal Web personalizado que pode ser acedido através do Language Studio. Pode facilmente começar a utilizar o serviço ao seguir os passos neste início rápido.

Esta documentação contém os seguintes tipos de artigo:

  • Os inícios rápidos são instruções de introdução para orientá-lo através da realização de pedidos para o serviço.
  • Os manuais de instruções contêm instruções para utilizar o serviço de formas mais específicas ou personalizadas.

O resumo de documentos utiliza técnicas de processamento de linguagem natural para gerar um resumo para documentos. Existem duas abordagens gerais para o resumo automático, ambas suportadas pela API: extrativa e abstrativa.

O resumo extrativo extrai frases que representam coletivamente as informações mais importantes ou relevantes no conteúdo original. O resumo abstrativo gera um resumo com frases ou palavras concisas e coerentes que não são simplesmente extraídas frases do documento original. Estas funcionalidades foram concebidas para encurtar conteúdos que podem ser considerados demasiado longos para serem lidos.

Principais funcionalidades

Existem dois tipos de resumo de documentos que esta API fornece:

  • Resumo extrativo: produz um resumo ao extrair frases importantes no documento.
    • Múltiplas frases extraídas: estas frases transmitem coletivamente a ideia principal do documento. São frases originais extraídas do conteúdo do documento de entrada.
    • Classificação: a classificação indica a relevância de uma frase para o tópico principal de um documento. O resumo do documento classifica as frases extraídas e pode determinar se são devolvidas pela ordem em que aparecem ou de acordo com a respetiva classificação.
    • Múltiplas frases devolvidas: determine o número máximo de frases a devolver. Por exemplo, se pedir um resumo extrativo de três frases, as três frases mais altas serão devolvidas.
    • Informações posicionais: a posição inicial e o comprimento das frases extraídas.
  • Resumo abstrativo: gera um resumo que pode não utilizar as mesmas palavras do documento, mas captura a ideia principal.
    • Textos de resumo: o resumo abstrativo devolve um resumo para cada intervalo de entrada contextual no documento. Um documento longo pode ser segmentado para que vários grupos de textos de resumo possam ser devolvidos com o respetivo intervalo de entrada contextual.
    • Intervalo de entrada contextual: o intervalo no documento de entrada que foi utilizado para gerar o texto de resumo.

Por exemplo, considere o seguinte parágrafo de texto:

"Na Microsoft, temos procurado fazer avançar a IA para além das técnicas existentes, através de uma abordagem mais holística e centrada no homem na aprendizagem e na compreensão. Como Diretor de Tecnologia dos Serviços Cognitivos da IA do Azure, tenho trabalhado com uma equipa de cientistas e engenheiros incríveis para transformar esta busca numa realidade. Na minha função, gosto de uma perspetiva única na visualização da relação entre três atributos da cognição humana: texto monolingual (X), sinais sensoriais de áudio ou visuais, (Y) e multilingues (Z). Na interseção dos três, existe magia (o que chamamos de código XYZ, como ilustrado na Figura 1), uma representação conjunta para criar IA mais poderosa que consiga falar, ouvir, ver e compreender melhor os seres humanos. Acreditamos que o código XYZ nos permitirá cumprir a nossa visão a longo prazo: aprendizagem de transferência entre domínios, abrangendo modalidades e linguagens. O objetivo é ter modelos pré-preparados que possam aprender representações em conjunto para apoiar uma vasta gama de tarefas de IA a jusante, tal como os humanos fazem hoje em dia. Ao longo dos últimos cinco anos, conseguimos o desempenho humano em referências em reconhecimento de voz conversacional, tradução automática, resposta a perguntas de conversação, compreensão da leitura automática e legendagem de imagens. Estes cinco avanços proporcionaram-nos sinais fortes em relação à nossa aspiração mais ambiciosa de produzir um salto nas capacidades de IA, conseguindo uma aprendizagem multissensirecional e multilingue que está mais próxima da forma como os humanos aprendem e compreendem. Acredito que o código XYZ conjunto é um componente fundamental desta aspiração, se baseado em fontes de conhecimento externas nas tarefas de IA a jusante."

O pedido da API de resumo de documentos é processado após a receção do pedido ao criar uma tarefa para o back-end da API. Se a tarefa tiver sido concluída com êxito, será devolvido o resultado da API. O resultado estará disponível para obtenção durante 24 horas. Após este período de tempo, o resultado é removido. Devido ao suporte multilingue e emoji, a resposta pode conter desvios de texto. Veja como processar desvios para obter mais informações.

Com o exemplo acima, a API pode devolver as seguintes frases resumidas:

Resumo extrativo:

  • "Na Microsoft, temos procurado fazer avançar a IA para além das técnicas existentes, através de uma abordagem mais holística e centrada no homem à aprendizagem e à compreensão."
  • "Acreditamos que o código XYZ nos permitirá cumprir a nossa visão a longo prazo: aprendizagem de transferência entre domínios, abrangendo modalidades e linguagens."
  • "O objetivo é ter modelos pré-preparados que possam aprender representações conjuntamente para apoiar uma vasta gama de tarefas de IA a jusante, tal como os humanos fazem hoje em dia."

Resumo abstrativo:

  • "A Microsoft está a ter uma abordagem mais holística e centrada no homem para aprender e compreender. Acreditamos que o código XYZ nos permitirá cumprir a nossa visão a longo prazo: aprendizagem de transferência entre domínios, abrangendo modalidades e linguagens. Ao longo dos últimos cinco anos, atingimos o desempenho humano em referências."

Introdução ao resumo

Para utilizar o resumo, submeta texto não estruturado não processado para análise e processe a saída da API na sua aplicação. A análise é efetuada tal como está, sem personalização adicional para o modelo utilizado nos seus dados. Existem duas formas de utilizar o resumo:

Opção de desenvolvimento Description
Estúdio de linguagem O Language Studio é uma plataforma baseada na Web que lhe permite experimentar a associação de entidades com exemplos de texto sem uma conta do Azure e os seus próprios dados quando se inscreve. Para obter mais informações, consulte o guia de início rápido do Language Studio ou do language studio.
API REST ou Biblioteca de cliente (SDK do Azure) Integre o resumo de documentos nas suas aplicações com a API REST ou a biblioteca de cliente disponível em vários idiomas. Para obter mais informações, veja o início rápido do resumo.

Requisitos de entrada e limites de serviço

  • O resumo utiliza texto não estruturado não processado para análise. Veja Limites de serviço e dados no guia de procedimentos para obter mais informações.
  • O resumo funciona com uma variedade de idiomas escritos. Consulte o suporte de idiomas para obter mais informações.

Documentação de referência e exemplos de código

À medida que utiliza o resumo de documentos nas suas aplicações, veja a seguinte documentação de referência e exemplos dos Serviços Cognitivos do Azure para idioma:

Opção de desenvolvimento/idioma Documentação de referência Amostras
API REST Documentação da API REST
C# Documentação do C# Amostras em C#
Java Documentação do Java Exemplos de Java
JavaScript Documentação do JavaScript Exemplos de JavaScript
Python Documentação do Python Amostras de Python

IA Responsável

Um sistema de IA inclui não só a tecnologia, mas também as pessoas que a utilizarão, as pessoas que serão afetadas pela mesma e o ambiente em que é implementada. Leia a nota de transparência do resumo para saber mais sobre a utilização e implementação responsáveis de IA nos seus sistemas. Também pode ver os seguintes artigos para obter mais informações: