Expliquer le résumé extractif

Effectué

Le résumé extractif produit un résumé en extrayant des phrases essentielles directement à partir du texte d’origine. Au lieu de générer du nouveau texte, il utilise des techniques de traitement du langage naturel pour trouver les phrases qui ensemble transmettent l’esprit ou le contexte principal d’un document.

Un résumé extractif s’effectue à l’aide de la fonction summarize_extractive() qui se trouve dans le schéma azure_cognitive de l’extension azure_ai. Le schéma azure_cognitive contient trois surcharges de la fonction summarize_extractive(). La liste des arguments attendus par les trois surcharges de fonction comprend les éléments suivants :

Raisonnement Type Par défaut Descriptif
texte text ou text[] Le ou les textes pour lesquels les résumés doivent être générés.
language_text text ou text[] Le code de langue (ou tableau de codes de langues) représentant la langue du texte à résumer. Passez en revue la liste des langues prises en charge pour récupérer les codes de langue nécessaires.
sentence_count integer 3 Le nombre de phrases de résumé à générer.
sort_by text 'offset' L’ordre de tri des phrases de résumé générées. Les valeurs acceptables sont « offset » et « rank », où le décalage (« offset ») représente la position de départ de chaque phrase extraite dans le contenu d’origine et le classement (« rank ») est un indicateur généré par IA montrant la pertinence d’une phrase pour l’esprit du contenu.
batch_size integer 25 Uniquement pour les deux surcharges qui attendent une entrée de text[]. Spécifie le nombre d’enregistrements à traiter à la fois.
désactiver_les_logs_de_service boolean faux Indicateur précisant s’il faut désactiver les journaux de service.
timeout_ms integer ZÉRO Délai d’expiration en millisecondes après lequel l’opération est arrêtée.
throw_on_error boolean vrai Indicateur précisant si, en cas d’erreur, la fonction doit lever une exception entraînant une restauration des transactions d’enveloppement.
max_attempts integer 1 Nombre de fois où réessayer l’appel aux outils Foundry en cas d’échec.
retry_delay_ms integer 1 000 Durée, en millisecondes, d’attente avant de tenter de réessayer d’appeler le point de terminaison Foundry Tools.

Chaque fonction retourne un tableau de phrases extraites et un score de classement pour chacun d’entre eux, à l’aide du type composite azure_cognitive.sentence, comme indiqué dans le tableau suivant :

            Composite type "azure_cognitive.sentence"
    Column  |       Type       | Collation | Nullable | Default | Storage  | Description 
------------+------------------+-----------+----------+---------+----------+-------------
 text       | text             |           |          |         | extended | 
 rank_score | double precision |           |          |         | plain    |

La azure_cognitive.sentence est un type composite contenant le texte d’une phrase extractive et un score de classement pour chaque phrase. Le score de classement, qui est une valeur comprise entre 0 et 1 (inclus), indique la pertinence d’une phrase concernant l’esprit du document d’origine. Le résumé des documents classe les phrases extraites. Vous pouvez déterminer si elles sont retournées dans leur ordre d’apparition ou selon leur classement à l’aide du paramètre sort_by de la fonction.

Générer des résumés extractifs pour des descriptions immobilières

En tant que développeur pour Margie’s Travel, vous souhaitez évaluer la technique de résumé extractif accessible via l’extension azure_ai et Foundry Tools et évaluer la capacité de la méthode à générer des résumés concis et en langage naturel de descriptions de propriétés longues, comme cette description de la première description dans la base de données :

« Détendez-vous dans ce charmant appartement d’une chambre, idéalement situé sur le côté ouest de Queen Anne Hill. Cet appartement élégant et privé (unité du bas dans un duplex) dispose d’un plan d’étage ouvert, de planchers en bambou, d’une cuisine entièrement équipée, d’un téléviseur, d’un lecteur DVD, d’un bouquet de télé de base et d’une chambre douillette avec un lit taille queen. L’appartement peut accueillir jusqu’à quatre personnes (deux dans la chambre et deux sur le canapé-lit confortable, draps inclus). La lessive ainsi que le Wi-Fi sont gratuits. L’appartement s’ouvre sur une terrasse privative, assortie de son propre barbecue, avec vue sur un jardin et une forêt de bambou noir. L’appartement est parfaitement situé à un bloc seulement des lignes de bus, d’où vous pouvez accéder au centre-ville de Seattle en 15 minutes ou au quartier Ballard historique en 10 minutes. Une petite ballade de cinq minutes vous permet d’accéder à une supérette naturelle et aux cafés. Sinon, promenez-vous une quinzaine de minutes vers le sommet de Queen Anne Hill où vous trouverez différents magasins, bars et restaurants éclectiques. »

Demandez un résumé en deux phrases de la description immobilière ci-dessus avec la requête suivante :

SELECT
  azure_cognitive.summarize_extractive(description, 'en', 2) AS extractive_summary
FROM listings
WHERE id = 1;

Le résumé extractif retourne les deux phrases les mieux notées du texte d’origine, ainsi qu’un score de classement pour chacune d’entre elles :

{
  "("Make your self at home in this charming one-bedroom apartment, centrally-located on the west side of Queen Anne hill.",1)",
  "("This elegantly-decorated, completely private apartment (bottom unit of a duplex) has an open floor plan, bamboo floors, a fully equipped kitchen, a TV, DVD player, basic cable, and a very cozy bedroom with a queen-size bed.",0.49)"
}