Explicación del resumen extractivo
resumen extractivo genera un resumen mediante la extracción de oraciones esenciales directamente del texto original. En lugar de generar texto nuevo, usa técnicas de procesamiento de lenguaje natural para localizar las oraciones que transmiten colectivamente la idea o el contexto primario de un documento.
El resumen extractivo se realiza mediante la función summarize_extractive()
que se encuentra en el esquema azure_cognitive
de la extensión azure_ai
. El esquema azure_cognitive
contiene tres sobrecargas de la función summarize_extractive()
. La lista de argumentos que esperan las tres sobrecargas de función son:
Argumento | Tipo | Predeterminado | Descripción |
---|---|---|---|
Mensaje de texto | text o text[] |
Texto para el que se deben generar resúmenes. | |
language_text | text o text[] |
Código de idioma (o matriz de códigos de idioma) que representa el idioma del texto que se va a resumir. Revise la lista de idiomas admitidos para recuperar los códigos de idioma necesarios. | |
sentence_count | integer |
3 | Número de oraciones de resumen que se van a generar. |
ordenar_por | text |
'offset' | Criterio de ordenación de las oraciones de resumen generadas. Los valores aceptables son "offset " y "rank", siendo "offset" la posición inicial de cada frase extraída dentro del contenido original y "rank" un indicador generado por la IA de la relevancia de una frase para la idea principal del contenido. |
batch_size | integer |
25 | Solo para las dos sobrecargas que esperan una entrada de text[] . Especifica el número de registros que se van a procesar a la vez. |
disable_service_logs | boolean |
falso | Marca que indica si se van a desactivar los registros de servicio. |
tiempo_de_espera_ms | integer |
NULO | Tiempo de espera en milisegundos después del cual se detiene la operación. |
throw_on_error | boolean |
cierto | Marca que indica si la función debe (en caso de error) producir una excepción, lo que da lugar a una reversión de la transacción de ajuste. |
intentos_máximos | integer |
1 | Número de veces que se reintenta la llamada a Servicios de Azure AI en caso de error. |
retry_delay_ms | integer |
1 000 | Cantidad de tiempo, en milisegundos, que se debe esperar antes de intentar volver a llamar al punto de conexión de Servicios de Azure AI. |
Cada función devuelve una matriz de oraciones extraídas y una puntuación de clasificación para cada una, utilizando el tipo compuesto azure_cognitive.sentence
, como se muestra en la tabla siguiente:
Composite type "azure_cognitive.sentence"
Column | Type | Collation | Nullable | Default | Storage | Description
------------+------------------+-----------+----------+---------+----------+-------------
text | text | | | | extended |
rank_score | double precision | | | | plain |
El azure_cognitive.sentence
es un tipo compuesto que contiene el texto de una oración extractiva y una puntuación de clasificación para cada oración. La puntuación de clasificación, un valor entre 0 y 1 (inclusivo), indica la importancia de una frase para la idea principal del documento original. El resumen de documentos clasifica las oraciones extraídas y puede determinar si se devuelven en el orden en que aparecen o según su clasificación mediante el parámetro sort_by
de la función.
Generación de resúmenes extractivos para descripciones de propiedades
Como desarrollador de Margie's Travel, quiere evaluar la técnica de resumen extractivo accesible a través de la extensión azure_ai
y azure AI Services y evaluar la capacidad del método para generar resúmenes de lenguaje natural concisos de descripciones largas de propiedades, como esta descripción de la primera lista de la base de datos:
Siéntete como en casa en este acogedor apartamento de un dormitorio, ubicado en la zona oeste de Queen Anne Hill. Este apartamento privado elegantemente decorado (unidad inferior de un dúplex) cuenta con planta abierta, suelos de bambú, cocina totalmente equipada, TV, reproductor de DVD, cable básico y un dormitorio acogedor con cama queen-size. La unidad duerme hasta cuatro (dos en el dormitorio y dos en el cómodo sofá plegable, ropa de cama incluida) e incluye Wi-Fi gratis y lavandería. El apartamento se abre en una terraza privada, con su propia barbacoa, con vistas a un jardín y un bosque de bambú negro. El Apartment está perfectamente ubicado a solo una cuadra de las líneas de autobús donde se puede coger un autobús y estar en el centro de Seattle en 15 minutos o histórico Ballard en 10. Un rápido paseo de cinco minutos te lleva a una tienda natural de comestibles y cafeterías. O bien, a solo quince minutos a pie de la cima de Queen Anne Hill, donde se encuentran varias tiendas eclécticas, bares y restaurantes".
Se solicita un resumen de dos oraciones de la descripción de la propiedad anterior mediante la siguiente consulta:
SELECT
azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;
El resumen extractivo devuelve las dos oraciones con puntuación más alta del texto original, junto con la puntuación de clasificación para cada una:
{
"("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
"("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}