Compartir vía


¿Qué es el resumen?

Importante

Nuestra región de versión preliminar, Centro de Suecia, muestra nuestras técnicas de ajuste de LLM más recientes y en constante evolución basadas en modelos de GPT. Te invitamos a probarlas con un recurso lingüístico de la región Centro de Suecia.

El resumen de conversación solo está disponible mediante:

  • REST API
  • Python
  • C#

El resumen es una característica que ofrece Lenguaje de Azure AI, que es una combinación de modelos generativos de lenguaje grande y modelos de codificador optimizados para tareas que ofrecen soluciones de resumen con una mayor calidad, rentabilidad y menor latencia. En este artículo encontrará más información sobre esta característica y cómo usarla en sus aplicaciones.

De entrada, el servicio ofrece soluciones de resumen para tres tipos de género: textos sin formato, conversaciones y documentos nativos. El resumen de texto solo acepta bloques de texto sin formato, y el resumen de conversación acepta entradas conversacionales, incluidas varias señales de audio de voz para que el modelo segmente y resuma de forma eficaz, y el documento nativo puede resumir directamente los documentos en sus formatos nativos, como Word, PDF, etc.

Esta documentación contiene los siguientes tipos de artículos:

  • Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
  • Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Esta característica está diseñada para abreviar el contenido que podría considerarse demasiado largo para leerlo.

Características clave para el resumen de texto

El resumen de texto utiliza técnicas de procesamiento de lenguaje natural para generar un resumen de textos sin formato, que pueden ser de un documento o de una conversación, o de cualquier texto. Esta API proporciona dos enfoques de resumen:

  • Resumen mediante extracción: genera un resumen mediante la extracción de oraciones destacadas en el documento, junto con la información de posicionamiento de estas oraciones.

    • Varias oraciones extraídas: estas oraciones transmiten en conjunto la idea principal del documento. Son oraciones originales extraídas del contenido del documento de entrada.
    • Puntuación de clasificación: la puntuación de clasificación indica la relevancia de una frase para el tema principal. El resumen de texto clasifica las oraciones extraídas para que pueda determinar si se devuelven por orden de aparición o según su clasificación. Por ejemplo, si solicita un resumen de tres oraciones, el resumen mediante extracción devuelve las tres oraciones con mayor puntuación.
    • Información posicional: la posición inicial y la longitud de las oraciones extraídas.
  • Resumen abstracto: genera un resumen con frases concisas, coherentes o palabras que no son frases literales extraídas del documento original.

    • Textos de resumen: el resumen abstracto devuelve un resumen para cada intervalo de entrada contextual. Una entrada larga se puede segmentar para que se devuelvan varios grupos de resúmenes con su intervalo de entrada contextual.
    • Intervalo de entrada contextual: es el intervalo dentro de la entrada que se usó para generar el texto de resumen.

Por ejemplo, considere el siguiente párrafo:

"En Microsoft, estamos buscando la manera de hacer avanzar la IA más allá de las técnicas existentes, adoptando para ello un enfoque más holístico y centrado en el ser humano, para facilitar el aprendizaje y la comprensión. Como director de tecnología de servicios de Azure AI, he estado trabajando con un equipo de científicos e ingenieros increíbles para convertir esta misión en una realidad. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). En la intersección de los tres, hay magia—que llamamos código XYZ, como se muestra en la figura 1—, una representación conjunta para crear una inteligencia artificial más eficaz que pueda hablar, escuchar, ver y comprender mejor a los humanos. Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. En los últimos cinco años, hemos logrado el rendimiento humano en las pruebas comparativas en el reconocimiento de voz conversacional, la traducción automática, la respuesta a preguntas conversacionales, la comprensión de lectura automática y los subtítulos de imágenes. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."

La solicitud de la API de resumen de texto se procesa al recibir la solicitud mediante la creación de un trabajo para el backend de la API. Si el trabajo se completa correctamente, se devolverá la salida de la API. La salida está disponible para su recuperación durante 24 horas. Después de este tiempo, se purgará. Debido a la compatibilidad con varios idiomas y con emoticonos, la respuesta puede contener desplazamientos de texto. Para saber más, consulta cómo procesar desplazamientos.

Si usamos el ejemplo anterior, la API podría devolver estos resúmenes:

Resumen mediante extracción:

  • "En Microsoft, estamos buscando la manera de hacer avanzar la IA más allá de las técnicas existentes, adoptando para ello un enfoque más holístico y centrado en el ser humano, para facilitar el aprendizaje y la comprensión."
  • "Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden".
  • "El objetivo es obtener modelos entrenados previamente que puedan aprender de forma combinada representaciones que admitan una amplia gama de tareas de IA descendentes, de forma similar a como lo hacen los usuarios hoy en día".

Resumen mediante extracción:

  • "Microsoft is taking a more holistic, human-centric approach to learning and understanding. Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden. En los últimos cinco años, hemos logrado el rendimiento humano en las pruebas comparativas en el reconocimiento de voz conversacional".

Introducción a la opción de resumen

Para usar el resumen, debes enviar texto para su análisis y administrar la salida de la API en la aplicación. El análisis se realiza tal cual, sin ninguna personalización agregada al modelo usado en los datos. Hay dos maneras de usar la opción de resumen:

Opción de desarrollo Descripción
Language Studio Language Studio es una plataforma basada en la web que le permitirá probar la vinculación de entidades con ejemplos de texto sin tener cuentas de Azure y usando sus propios datos al registrarse. Para obtener más información, consulte el sitio web de Language Studio o la guía de inicio rápido de Language Studio.
API de REST o biblioteca de cliente (SDK de Azure) Integre el resumen de texto en las aplicaciones mediante la API REST o la biblioteca cliente disponible en varios idiomas. Para obtener más información, consulte el inicio rápido de resumen.

Requisitos de entrada y límites del servicio

Documentación de referencia y ejemplos de código

A medida que utilice el resumen de texto en las aplicaciones,vea la siguiente documentación de referencia y ejemplos para Lenguaje de Azure AI:

Idioma u opción de desarrollo Documentación de referencia Ejemplos
C# Documentación de C# Ejemplos de C#
Java Documentación de Java Ejemplos de Java
JavaScript Documentación de JavaScript Ejemplos de JavaScript
Python Documentación de Python Ejemplos de Python

Inteligencia artificial responsable

Los sistemas de inteligencia artificial no solo incluyen la tecnología, sino también las personas que la usan, las que se ven afectadas por ella y el entorno en el que se implementan. Lea la nota de transparencia del resumen de texto para obtener información sobre el uso responsable de la inteligencia artificial y la implementación en los sistemas. Para más información, consulte los siguientes artículos.