¿Qué es el resumen?

Artículo
09/03/2024

Importante

Nuestra región de versión preliminar, Centro de Suecia, muestra nuestras técnicas de ajuste de LLM más recientes y en constante evolución basadas en modelos de GPT. Te invitamos a probarlas con un recurso lingüístico de la región Centro de Suecia.

El resumen de conversación solo está disponible mediante:

REST API
Python
C#

El resumen es una característica que ofrece Lenguaje de Azure AI, que es una combinación de modelos generativos de lenguaje grande y modelos de codificador optimizados para tareas que ofrecen soluciones de resumen con una mayor calidad, rentabilidad y menor latencia. En este artículo encontrará más información sobre esta característica y cómo usarla en sus aplicaciones.

De entrada, el servicio ofrece soluciones de resumen para tres tipos de género: textos sin formato, conversaciones y documentos nativos. El resumen de texto solo acepta bloques de texto sin formato, y el resumen de conversación acepta entradas conversacionales, incluidas varias señales de audio de voz para que el modelo segmente y resuma de forma eficaz, y el documento nativo puede resumir directamente los documentos en sus formatos nativos, como Word, PDF, etc.

Esta documentación contiene los siguientes tipos de artículos:

Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Esta característica está diseñada para abreviar el contenido que podría considerarse demasiado largo para leerlo.

Características clave para el resumen de texto

El resumen de texto utiliza técnicas de procesamiento de lenguaje natural para generar un resumen de textos sin formato, que pueden ser de un documento o de una conversación, o de cualquier texto. Esta API proporciona dos enfoques de resumen:

Resumen mediante extracción: genera un resumen mediante la extracción de oraciones destacadas en el documento, junto con la información de posicionamiento de estas oraciones.
- Varias oraciones extraídas: estas oraciones transmiten en conjunto la idea principal del documento. Son oraciones originales extraídas del contenido del documento de entrada.
- Puntuación de clasificación: la puntuación de clasificación indica la relevancia de una frase para el tema principal. El resumen de texto clasifica las oraciones extraídas para que pueda determinar si se devuelven por orden de aparición o según su clasificación. Por ejemplo, si solicita un resumen de tres oraciones, el resumen mediante extracción devuelve las tres oraciones con mayor puntuación.
- Información posicional: la posición inicial y la longitud de las oraciones extraídas.
Resumen abstracto: genera un resumen con frases concisas, coherentes o palabras que no son frases literales extraídas del documento original.
- Textos de resumen: el resumen abstracto devuelve un resumen para cada intervalo de entrada contextual. Una entrada larga se puede segmentar para que se devuelvan varios grupos de resúmenes con su intervalo de entrada contextual.
- Intervalo de entrada contextual: es el intervalo dentro de la entrada que se usó para generar el texto de resumen.

Por ejemplo, considere el siguiente párrafo:

"En Microsoft, estamos buscando la manera de hacer avanzar la IA más allá de las técnicas existentes, adoptando para ello un enfoque más holístico y centrado en el ser humano, para facilitar el aprendizaje y la comprensión. Como director de tecnología de servicios de Azure AI, he estado trabajando con un equipo de científicos e ingenieros increíbles para convertir esta misión en una realidad. In my role, I enjoy a unique perspective in viewing the relationship among three attributes of human cognition: monolingual text (X), audio or visual sensory signals, (Y) and multilingual (Z). En la intersección de los tres, hay magia—que llamamos código XYZ, como se muestra en la figura 1—, una representación conjunta para crear una inteligencia artificial más eficaz que pueda hablar, escuchar, ver y comprender mejor a los humanos. Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden. The goal is to have pretrained models that can jointly learn representations to support a broad range of downstream AI tasks, much in the way humans do today. En los últimos cinco años, hemos logrado el rendimiento humano en las pruebas comparativas en el reconocimiento de voz conversacional, la traducción automática, la respuesta a preguntas conversacionales, la comprensión de lectura automática y los subtítulos de imágenes. These five breakthroughs provided us with strong signals toward our more ambitious aspiration to produce a leap in AI capabilities, achieving multi-sensory and multilingual learning that is closer in line with how humans learn and understand. I believe the joint XYZ-code is a foundational component of this aspiration, if grounded with external knowledge sources in the downstream AI tasks."

La solicitud de la API de resumen de texto se procesa al recibir la solicitud mediante la creación de un trabajo para el backend de la API. Si el trabajo se completa correctamente, se devolverá la salida de la API. La salida está disponible para su recuperación durante 24 horas. Después de este tiempo, se purgará. Debido a la compatibilidad con varios idiomas y con emoticonos, la respuesta puede contener desplazamientos de texto. Para saber más, consulta cómo procesar desplazamientos.

Si usamos el ejemplo anterior, la API podría devolver estos resúmenes:

Resumen mediante extracción:

"En Microsoft, estamos buscando la manera de hacer avanzar la IA más allá de las técnicas existentes, adoptando para ello un enfoque más holístico y centrado en el ser humano, para facilitar el aprendizaje y la comprensión."
"Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden".
"El objetivo es obtener modelos entrenados previamente que puedan aprender de forma combinada representaciones que admitan una amplia gama de tareas de IA descendentes, de forma similar a como lo hacen los usuarios hoy en día".

Resumen mediante extracción:

"Microsoft is taking a more holistic, human-centric approach to learning and understanding. Creemos que el código XYZ nos permitirá cumplir nuestra visión a largo plazo: conseguir un aprendizaje de transferencia entre dominios, así como modalidades e idiomas que se expanden. En los últimos cinco años, hemos logrado el rendimiento humano en las pruebas comparativas en el reconocimiento de voz conversacional".

Esta documentación contiene los siguientes tipos de artículos:

Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

Características clave para el resumen de conversaciones

El resumen de conversaciones admite las siguientes características:

Resumen: resume una conversación en un breve párrafo.
Resumen de problemas y soluciones: unas características específicas del centro de llamadas que proporcionan un resumen de los problemas y las soluciones en las conversaciones entre los agentes de servicio al cliente y sus clientes.
Resumen del título del capítulo: segmenta una conversación en capítulos basados en los temas tratados en la conversación y proporciona sugerencias de títulos de capítulo de la conversación de entrada.
Resumen narrativo: genera notas de llamada, notas de reunión o resúmenes de chat de la conversación de entrada.

Por ejemplo, considere la siguiente conversación de ejemplo:

Agente: "Hola, estás charlando con Rene. ¿Cómo puedo ayudarte?"

Cliente: "Hola, he intentado configurar una conexión WiFi para una cafetera tipo profesional Smart Brew 300, pero no ha funcionado."

Agente: "Lo siento. Veamos lo que podemos hacer para solucionar este problema. ¿Podrías presionar el botón de conexión wifi, y mantener presionado durante 3 segundos, hazme saber si la luz de energía parpadea lentamente?"

Cliente: "Sí, he presionado el botón de conexión Wi-Fi y ahora la luz de alimentación parpadea lentamente".

Agente: "Genial. ¡Gracias! Ahora, eche un vistazo la aplicación Contoso Coffee. ¿Le pide que se conecte con la máquina?".

Cliente: "No. No pasa nada".

Agente: "Ya veo. Gracias. Vamos a probar si un restablecimiento de fábrica puede resolver el problema. Podrías presionar y mantener presionado el botón central durante 5 segundos para iniciar el restablecimiento de fábrica".

Cliente: "He probado el restablecimiento de fábrica y he seguido los pasos anteriores de nuevo, pero sigue sin funcionar".

Agente: "Siento mucho escuchar eso. Déjame ver si hay otra manera de corregir el problema. Por favor, espera un minuto".

La característica de resumen de conversación simplificaría el texto de la siguiente forma:

Resumen del ejemplo	Comentario	Aspecto de la conversación
El cliente no puede configurar la conexión wifi para la cafetera Smart Brew 300	un problema de cliente en una conversación de cliente y agente	issue
El agente sugirió varios pasos de solución de problemas, como comprobar la conexión wifi, comprobar la aplicación Contoso Coffee y realizar un restablecimiento de fábrica. Sin embargo, ninguno de estos pasos resolvió el problema. A continuación, el agente pone el cliente en espera para buscar otra solución.	soluciones probadas en una conversación de cliente y agente	resolución
El cliente contactó con el agente para obtener ayuda con la configuración de una conexión wifi en su cafetera Smart Brew 300. El agente guió al cliente a través de varios pasos de solución de problemas, como una comprobación de conexión wifi, la comprobación de la luz de encendido y un restablecimiento de fábrica. A pesar de seguir estos pasos, el problema persiste. A continuación, el agente decidió explorar otras posibles soluciones	Resume una conversación en un párrafo	recap
Solución de problemas de la cafetera SmartBrew 300	Segmenta una conversación y genera un título para cada segmento; suele colaborar con el aspecto `narrative`	chapterTitle
El cliente tiene problemas para configurar una conexión wifi en su cafetera Smart Brew 300. El agente sugiere varias soluciones, incluido un restablecimiento de fábrica, pero el problema persiste.	Segmenta una conversación y genera un resumen para cada segmento; suele colaborar con el aspecto `chapterTitle`	narrativa

Esta documentación contiene los siguientes tipos de artículos:

Los inicios rápidos son instrucciones de inicio que le guiarán a la hora de hacer solicitudes al servicio.
Las guías de procedimientos contienen instrucciones para usar el servicio de una manera más específica o personalizada.

El resumen de documentos usa técnicas de procesamiento de lenguaje natural para generar un resumen de los documentos.

Un documento nativo hace referencia al formato de archivo usado para crear el documento original, como Microsoft Word (docx) o un archivo de documento portátil (pdf). La compatibilidad con documentos nativos elimina la necesidad de preprocesamiento de texto antes de usar las funcionalidades de recursos de lenguaje de Azure AI. Actualmente, la compatibilidad con documentos nativos está disponible para dos tipos de resumen:

Resumen mediante extracción: genera un resumen mediante la extracción de oraciones destacadas en el documento, junto con la información de posicionamiento de esas oraciones.
- Varias oraciones extraídas: estas oraciones transmiten en conjunto la idea principal del documento. Son oraciones originales extraídas del contenido del documento de entrada.
- Puntuación de clasificación: la puntuación de clasificación indica la relevancia de una frase para el tema principal. El resumen de texto clasifica las oraciones extraídas para que pueda determinar si se devuelven por orden de aparición o según su clasificación. Por ejemplo, si solicita un resumen de tres oraciones, el resumen mediante extracción devuelve las tres oraciones con mayor puntuación.
- Información posicional: la posición inicial y la longitud de las oraciones extraídas.
Resumen abstracto: genera un resumen con frases concisas, coherentes o palabras que no son frases literales extraídas del documento original.
- Textos de resumen: el resumen abstracto devuelve un resumen para cada intervalo de entrada contextual. Una entrada larga se puede segmentar para que se devuelvan varios grupos de resúmenes con su intervalo de entrada contextual.
- Intervalo de entrada contextual: es el intervalo dentro de la entrada que se usó para generar el texto de resumen.

Actualmente, el resumen de documentos admite los siguientes formatos de documento nativos:

Tipo de archivo	Extensión de archivo	Descripción
Texto	`.txt`	Documento de texto sin formato
PDF de Adobe	`.pdf`	Un documento portátil con formato de archivo de documento.
Microsoft Word	`.docx`	Un archivo de documento de Microsoft Word.

Para más información, consulte Uso de documentos nativos para el procesamiento de lenguaje

Introducción a la opción de resumen

Para usar el resumen, debes enviar texto para su análisis y administrar la salida de la API en la aplicación. El análisis se realiza tal cual, sin ninguna personalización agregada al modelo usado en los datos. Hay dos maneras de usar la opción de resumen:

Opción de desarrollo	Descripción
Language Studio	Language Studio es una plataforma basada en la web que le permitirá probar la vinculación de entidades con ejemplos de texto sin tener cuentas de Azure y usando sus propios datos al registrarse. Para obtener más información, consulte el sitio web de Language Studio o la guía de inicio rápido de Language Studio.
API de REST o biblioteca de cliente (SDK de Azure)	Integre el resumen de texto en las aplicaciones mediante la API REST o la biblioteca cliente disponible en varios idiomas. Para obtener más información, consulte el inicio rápido de resumen.

Opción de desarrollo	Descripción	Vínculos
API DE REST	Integre el resumen de conversación en las aplicaciones mediante la API de REST.	Inicio rápido: Uso del resumen de conversación

Opción de desarrollo	Descripción
Language Studio	Language Studio es una plataforma basada en la web que le permitirá probar la vinculación de entidades con ejemplos de texto sin tener cuentas de Azure y usando sus propios datos al registrarse. Para obtener más información, consulte el sitio web de Language Studio o la guía de inicio rápido de Language Studio.
API de REST o biblioteca de cliente (SDK de Azure)	Integre el resumen de texto en las aplicaciones mediante la API REST o la biblioteca cliente disponible en varios idiomas. Para obtener más información, consulte el inicio rápido de resumen.

Requisitos de entrada y límites del servicio

El resumen usa texto para el análisis. Consulta los límites de datos y del servicio en la guía paso a paso para obtener más información.
El resumen funciona con varios idiomas escritos. Para obtener más información, consulte Compatibilidad de idioma.

Documentación de referencia y ejemplos de código

A medida que utilice el resumen de texto en las aplicaciones,vea la siguiente documentación de referencia y ejemplos para Lenguaje de Azure AI:

Idioma u opción de desarrollo	Documentación de referencia	Ejemplos
C#	Documentación de C#	Ejemplos de C#
Java	Documentación de Java	Ejemplos de Java
JavaScript	Documentación de JavaScript	Ejemplos de JavaScript
Python	Documentación de Python	Ejemplos de Python

Inteligencia artificial responsable

Los sistemas de inteligencia artificial no solo incluyen la tecnología, sino también las personas que la usan, las que se ven afectadas por ella y el entorno en el que se implementan. Lea la nota de transparencia del resumen de texto para obtener información sobre el uso responsable de la inteligencia artificial y la implementación en los sistemas. Para más información, consulte los siguientes artículos.

Compartir a través de

¿Qué es el resumen?

Características clave para el resumen de texto

Características clave para el resumen de conversaciones

Introducción a la opción de resumen

Requisitos de entrada y límites del servicio

Documentación de referencia y ejemplos de código

Inteligencia artificial responsable

Comentarios

Recursos adicionales