Extraire des expressions clés

Effectué

L’extraction de phrases clés est une fonctionnalité offerte par le langage Azure. Il identifie les expressions clés, ou concepts principaux, dans le texte.

Il existe plusieurs façons d’appeler l’API d’extraction d’expressions clés. Ici, vous utilisez l’extension azure_ai pour extraire des expressions clés dans les requêtes SQL.

Conditions préalables

Vous avez besoin d’un serveur flexible Azure Database pour PostgreSQL, avec l’extension azure_aiactivée et configurée. Vous devez également l’autoriser avec Azure Cognitive Services en définissant la clé et le point de terminaison d’une ressource de langage.

Scénarios

L’extraction d’expressions clés s’applique à différentes tâches :

  • Résumé : utilisez des expressions clés pour réduire les documents longs aux rubriques principales, telles que l’identification des sujets abordés dans les transcriptions audio ou les notes de réunion.
  • Catégorisation du contenu : utilisez des expressions clés pour indexer des documents pour la recherche et la navigation. Les expressions clés peuvent également être utilisées pour visualiser des documents dans des nuages de mots.
  • L'analyse et le regroupement de grandes collections de tickets de support, d'avis sur les produits et d'autres entrées non structurées peuvent être effectués à l'aide de phrases clés.

Utilisation de SQL d’extraction de phrases clés avec Azure Cognitive Services

L’extension azure_ai pour le serveur flexible Azure Database pour PostgreSQL fournit des fonctions définies par l’utilisateur (UDF) pour accéder directement aux fonctionnalités d’IA à partir de SQL. L’API d’extraction de phrases clés est accessible avec la azure_cognitive.extract_key_phrases fonction :

azure_cognitive.extract_key_phrases(
 text TEXT,
 language TEXT,
 timeout_ms INTEGER DEFAULT 3600000,
 throw_on_error BOOLEAN DEFAULT TRUE,
 disable_service_logs BOOLEAN DEFAULT FALSE
)

Les paramètres requis sont text, l’entrée, language la langue dans laquelle text est écrit. Par exemple, en-us il s’agit de l’anglais américain et fr du français. Consultez la prise en charge linguistique pour obtenir la liste complète des langues disponibles.

Par défaut, l’extraction d’expressions clés est arrêtée si elle ne se termine pas dans 3 600 000 ms, soit 1 heure. Vous pouvez personnaliser ce délai en modifiant timeout_ms.

Si une erreur se produit, le comportement par défaut consiste à lever une exception, ce qui entraîne une restauration des transactions. Vous pouvez désactiver ce comportement en définissant throw_on_error sur false.

Consultez la documentation de l’extension Azure Cognitive Services pour obtenir la documentation complète sur les paramètres.

Par exemple, en invoquant cette requête :

SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');

Donne ce résultat :

 extract_key_phrases 
---------------------
 {food,staff}

Vous pouvez utiliser des colonnes de tableau pour le texte d’entrée :

SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;

Avec \x activé pour l’affichage étendu, cela retourne :

description    | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}

Résumé

L’extraction d’expressions clés sélectionne les principaux concepts du texte. Le modèle de langage Azure Cognitive Services est responsable de l’ébullition du langage naturel en mots clés ou expressions. L’extension azure_ai d’Azure Database pour PostgreSQL fournit l’API pour accéder à l’extraction azure_cognitive.extract_key_phrases d’expressions clés directement dans les requêtes SQL.