¿Qué es el resumen de documentos y conversaciones?

Importante

Nuestra región de versión preliminar, Centro de Suecia, muestra nuestras técnicas de ajuste de LLM más recientes y en constante evolución basadas en modelos de GPT. Te invitamos a probarlas con un recurso lingüístico de la región Centro de Suecia.

El resumen de conversación solo está disponible mediante:

  • REST API
  • Python
  • C#

Resumen es una de las características que ofrece Lenguaje de Azure AI, una colección de algoritmos de aprendizaje automático e inteligencia artificial en la nube para el desarrollo de aplicaciones inteligentes que involucran el lenguaje escrito. En este artículo encontrará más información sobre esta característica y cómo usarla en sus aplicaciones.

Aunque los servicios están etiquetados como resumen de documentos y conversaciones, el resumen de documentos solo acepta bloques de texto sin formato y el resumen de conversación acepta varios artefactos de voz para que el modelo obtenga más información. Si desea procesar una conversación, pero solo le interesa el texto, puede usar el resumen de documentos para ese escenario.

Esta documentación contiene los siguientes tipos de artículos:

  • Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
  • Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

El resumen de documentos usa técnicas de procesamiento de lenguaje natural para generar un resumen de los documentos. Hay tres enfoques de API admitidos para el resumen automático: extractivo, abstracto y centrado en consultas.

El resumen mediante extracción extrae frases que representan la información general más importante o pertinente del contenido original. El resumen abstracto genera un resumen con frases concisas, coherentes o palabras que no son frases literales extraídas del documento original. Esta característica está diseñada para abreviar el contenido que podría considerarse demasiado largo para leerlo.

Compatibilidad con documentos nativos

Un documento nativo hace referencia al formato de archivo usado para crear el documento original, como Microsoft Word (docx) o un archivo de documento portátil (pdf). La compatibilidad con documentos nativos elimina la necesidad de preprocesamiento de texto antes de usar las funcionalidades de recursos de lenguaje de Azure AI. Actualmente, la compatibilidad con documentos nativos está disponible para las funcionalidades AbstractiveSummarization y ExtractiveSummarization.

Actualmente, el resumen de documentos admite los siguientes formatos de documento nativos:

Tipo de archivo Extensión de archivo Descripción
Texto .txt Documento de texto sin formato
PDF de Adobe .pdf Un documento portátil con formato de archivo de documento.
Microsoft Word .docx Un archivo de documento de Microsoft Word.

Para obtener más información, consultaUso de documentos nativos para el procesamiento de lenguaje

Características clave

Son los aspectos del resumen de documentos que proporciona esta API:

  • Resumen mediante extracción: genera un resumen mediante la extracción de oraciones destacadas en el documento.

    • Varias oraciones extraídas: estas oraciones transmiten en conjunto la idea principal del documento. Son oraciones originales extraídas del contenido del documento de entrada.
    • Puntuación de clasificación: indica lo pertinente que es una frase para el tema principal de un documento. El resumen de documentos clasifica las oraciones extraídas para que pueda determinar si se devuelven por orden de aparición o según su clasificación.
    • Varias oraciones devueltas: permite determinar el número máximo de oraciones que se devolverán. Por ejemplo, si solicita un resumen de tres oraciones, el resumen mediante extracción devuelve las tres oraciones con mayor puntuación.
    • Información posicional: la posición inicial y la longitud de las oraciones extraídas.
  • Resumen abstracto: genera un resumen que no usa las mismas palabras del documento, pero recoge la idea principal.

    • Textos de resumen: el resumen abstracto devuelve un resumen para cada intervalo de entrada contextual dentro del documento. Un documento largo se puede segmentar para que se devuelvan varios grupos de resúmenes con su intervalo de entrada contextual.
    • Intervalo de entrada contextual: es el intervalo dentro del documento de entrada que se usó para generar el texto de resumen.
  • Resumen centrado en consultas: genera un resumen basado en una consulta.

Por ejemplo, considere el siguiente párrafo:

"En Microsoft, estamos buscando la manera de hacer avanzar la IA más allá de las técnicas existentes, adoptando para ello un enfoque más holístico y centrado en el ser humano, para facilitar el aprendizaje y la comprensión. Como director de tecnología de servicios de Azure AI, he estado trabajando con un equipo de científicos e ingenieros increíbles para convertir esta misión en una realidad. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). En la intersección de los tres, hay magia—que llamamos código XYZ, como se muestra en la figura 1—, una representación conjunta para crear una inteligencia artificial más eficaz que pueda hablar, escuchar, ver y comprender mejor a los humanos. Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. En los últimos cinco años, hemos logrado el rendimiento humano en las pruebas comparativas en el reconocimiento de voz conversacional, la traducción automática, la respuesta a preguntas conversacionales, la comprensión de lectura automática y los subtítulos de imágenes. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."

La solicitud de la API del resumen de documentos se procesa al recibir la solicitud mediante la creación de un trabajo para el backend de la API. Si el trabajo se completa correctamente, se devolverá la salida de la API. La salida está disponible para su recuperación durante 24 horas. Después de este tiempo, se purgará. Debido a la compatibilidad con varios idiomas y con emoticonos, la respuesta puede contener desplazamientos de texto. Para saber más, consulta cómo procesar desplazamientos.

Si usamos el ejemplo anterior, la API podría devolver las siguientes oraciones resumidas:

Resumen mediante extracción:

  • "En Microsoft, estamos buscando la manera de hacer avanzar la IA más allá de las técnicas existentes, adoptando para ello un enfoque más holístico y centrado en el ser humano, para facilitar el aprendizaje y la comprensión."
  • "Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden".
  • "El objetivo es obtener modelos entrenados previamente que puedan aprender de forma combinada representaciones que admitan una amplia gama de tareas de IA descendentes, de forma similar a como lo hacen los usuarios hoy en día".

Resumen mediante extracción:

  • "Microsoft is taking a more holistic, human-centric approach to learning and understanding. Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden. En los últimos cinco años, hemos logrado el rendimiento humano en las pruebas comparativas en el reconocimiento de voz conversacional".

Introducción a la opción de resumen

Para usar el resumen, debes enviar texto para su análisis y administrar la salida de la API en la aplicación. El análisis se realiza tal cual, sin ninguna personalización agregada al modelo usado en los datos. Hay dos maneras de usar la opción de resumen:

Opción de desarrollo Descripción
Language Studio Language Studio es una plataforma basada en la web que le permitirá probar la vinculación de entidades con ejemplos de texto sin tener cuentas de Azure y usando sus propios datos al registrarse. Para obtener más información, consulte el sitio web de Language Studio o la guía de inicio rápido de Language Studio.
API de REST o biblioteca de cliente (SDK de Azure) Integra el resumen de documentos en las aplicaciones mediante la API de REST o la biblioteca cliente disponible en varios idiomas. Para obtener más información, consulte el inicio rápido de resumen.

Requisitos de entrada y límites del servicio

Documentación de referencia y ejemplos de código

A medida que utilice el resumen de documentos en sus aplicaciones, consulte la siguiente documentación de referencia y ejemplos para Lenguaje de Azure AI:

Idioma u opción de desarrollo Documentación de referencia Ejemplos
C# Documentación de C# Ejemplos de C#
Java Documentación de Java Ejemplos de Java
JavaScript Documentación de JavaScript Ejemplos de JavaScript
Python Documentación de Python Ejemplos de Python

Inteligencia artificial responsable

Los sistemas de inteligencia artificial no solo incluyen la tecnología, sino también las personas que la usan, las que se ven afectadas por ella y el entorno en el que se implementan. Lea la nota de transparencia del resumen de texto para obtener información sobre el uso responsable de la inteligencia artificial y la implementación en los sistemas. Para más información, consulte los siguientes artículos.