Qu’est-ce que la synthèse ?

2025-04-21

Important

Notre région de prévisualisation, Suède Centre, présente nos dernières techniques de réglage fin du LLM, en constante évolution, basées sur des modèles GPT. Nous vous encourageons à les essayer avec une ressource linguistique dans la région Centre de la Suède.

Le résumé de conversation est disponible uniquement à l’aide de :

API REST
Python
C#

Summarization est une fonctionnalité offerte par Azure AI Language, une combinaison de modèles de langage volumineux génératifs et de modèles d’encodeur optimisés pour les tâches qui offrent des solutions de synthèse avec une meilleure qualité, une rentabilité et une latence plus faible. Utilisez cet article pour en savoir plus sur cette fonctionnalité et son utilisation dans vos applications.

Prêt à l’emploi, le service fournit des solutions de résumé pour trois types de genre : les textes bruts, les conversations et les documents natifs. La synthèse de texte accepte uniquement les blocs de texte brut. La synthèse de conversation accepte l’entrée conversationnelle, y compris divers signaux audio vocaux. Le résumé des documents natifs accepte les documents dans leurs formats natifs, tels que Word, PDF ou texte brut. Pour plus d’informations, consultezFormats de document pris en charge.

Conseil

Essayez Summarization dans le portail Azure AI Foundry. Vous pouvez utiliser une ressource Language Studio existante ou créer une ressource Azure AI Foundry afin d’utiliser ce service.

Capacités

Cette documentation contient les types d’articles suivants :

Les guides de démarrage rapide sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Flux de travail standard

Pour utiliser cette fonctionnalité, vous envoyez des données à des fins d’analyse et gérez la sortie de l’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation supplémentaire du modèle utilisé sur vos données.

Créez une ressource Azure AI Language, qui vous permet d’accéder aux fonctionnalités offertes par Azure AI Language. Elle génère un mot de passe (appelé clé) et une URL de point de terminaison que vous utilisez pour authentifier les demandes d’API.
Créez une requête à l’aide de l’API REST ou de la bibliothèque de client pour C#, Java, JavaScript et Python. Vous pouvez également envoyer des appels asynchrones avec une requête de lot afin de combiner des requêtes d’API pour plusieurs fonctionnalités en un seul appel.
Envoyez la demande contenant vos données texte. Votre clé et votre point de terminaison sont utilisés pour l’authentification.
Diffusez ou stockez la réponse localement.

Fonctionnalités clés pour la synthèse de texte

La synthèse de texte utilise des techniques de traitement du langage naturel pour générer un résumé pour les textes bruts, qui peuvent provenir d’un document, d’une conversation ou d’un texte quelconque. Cette API propose deux approches aux résumés :

Résumé extractif : produit un résumé en extrayant des phrases saillantes dans le texte source, ensemble les informations de positionnement de ces phrases.
- Phrases extraites multiples : ces phrases transmettent collectivement l’idée principale du texte d’entrée. Il s’agit de phrases d’origine extraites du contenu de texte d’entrée.
- Score de classement : le score de classement indique la pertinence d’une phrase par rapport à l’idée principale. La synthèse du texte classe les phrases extraites et vous pouvez déterminer si elles sont retournées dans l’ordre dans lequel elles apparaissent ou en fonction de leur classement. Par exemple, si vous demandez un résumé en trois phrases, le résumé extractif renvoie les trois phrases qui ont les scores les plus élevés.
- Informations de position : position de départ et longueur des phrases extraites.
Résumé abstrait : génère un résumé avec des phrases concises, cohérentes ou des mots qui ne sont pas des phrases extraites de la source d’origine.
- Textes résumés : un résumé abstractif retourne un résumé pour chaque plage d’entrée contextuelle. Une entrée longue peut être segmentée de façon à ce que plusieurs groupes de textes résumés puissent être renvoyés avec leur plage d’entrée contextuelle.
- Plage d’entrée contextuelle : plage au sein de l’entrée qui a été utilisée pour générer le texte de synthèse.

À titre d’exemple, examinez le paragraphe de texte suivant :

« Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. En tant que directeur de la technologie d’Azure AI services, je collabore avec une équipe de scientifiques et d’ingénieurs exceptionnels pour faire de cette quête en réalité. Dans le cadre de mes fonctions, je bénéficie d’une perspective unique pour observer la relation entre trois attributs de la cognition humaine : le texte monolingue (X), les signaux sensoriels audio ou visuels (Y) et le texte multilingue (Z). La magie se produit à l’intersection de ces trois attributs : c’est ce que nous appelons le code XYZ, comme l’illustre la figure 1, une représentation conjointe permettant de créer une IA plus puissante, capable de mieux parler, entendre, voir et comprendre les humains. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. L’objectif est de disposer de modèles préentraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant, la traduction automatique, les réponses aux questions du langage courant, la compréhension de la lecture automatique et le sous-titrage d’images. Ces cinq percées nous ont fourni des signaux forts en direction de notre aspiration plus ambitieuse : faire un bond en avant dans les capacités de l’IA, en réalisant un apprentissage multisensoriel et multilingue plus proche de la façon dont les humains apprennent et comprennent. Je pense que le code XYZ conjoint constitue un élément fondamental de cette aspiration, s’il est fondé sur des sources de connaissances externes dans les tâches d’IA en aval.

La requête API de résumé de texte est traitée dès réception de la demande en créant une tâche pour le back-end de l’API. Si la tâche réussit, la sortie de l'API est renvoyée. Le résultat peut être récupéré pendant 24 heures. Passé ce délai, elle est vidée. En raison de la prise en charge de plusieurs langues et des émojis, la réponse peut contenir des décalages de texte. Pour plus d’informations, consultez le guide pratique pour traiter les décalages.

Si nous utilisons l’exemple précédent, l’API peut retourner ces résumés :

Résumé extractif :

« Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. »
«Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues.»
«L’objectif est de disposer de modèles pré-entraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui.»

Résumé abstractif :

« Microsoft adopte une approche plus holistique et humaine de l’apprentissage et de la compréhension. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant. »

Cette documentation contient les types d’articles suivants :

Les guides de démarrage rapide sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Fonctionnalités clés pour la synthèse des conversations

Le résumé de conversation prend en charge les fonctionnalités suivantes :

Récapitulatif : permet de résumer une conversation sous forme de court paragraphe.
Résumé de problème/résolution : fonctionnalités spécifiques aux centres d’appels qui fournissent un résumé des problèmes et résolutions abordés dans des conversations entre des agents de service clientèle et vos clients.
Résumé de titre de chapitre : permet de segmenter une conversation en chapitres basés sur les rubriques évoquées dans la conversation et vous suggère des titres de chapitres dans la conversation d’entrée.
Résumé narratif : permet de générer des notes d’appel détaillées, des notes de réunion ou des résumés de discussion de la conversation d’entrée.

Prenons par exemple la conversation suivante :

Agent : « Bonjour, vous parlez avec René. Comment puis-je vous aider ? »

Client : « Bonjour, j’essaie de configurer la connexion Wi-Fi de ma machine à expresso Smart Brew 300, mais cela ne fonctionne pas. »

Agent : « Je suis désolé. Voyons ce que nous pouvons faire pour résoudre ce problème. Pouvez-vous appuyer sur le bouton de connexion Wi-Fi en le maintenant enfoncé pendant 3 secondes, puis me dire si le voyant de l’alimentation clignote lentement ? »

Client :« Oui. J’ai appuyé le bouton de connexion Wi-Fi ; maintenant, la lumière de l’alimentation clignote lentement. »

Agent :« Parfait. Je vous remercie ! À présent, consultez votre application Contoso Coffee. Vous est-il demandé de vous connecter à la machine ? »

Client :« Non. Rien ne se passe. »

Agent : « Je vois. Nous vous remercions. Voyons si une réinitialisation aux paramètres d’usine peut résoudre le problème. Pouvez-vous appuyer longuement sur le bouton central pendant 5 secondes pour démarrer la réinitialisation aux paramètres d’usine. »

Client : « J’ai essayé la réinitialisation aux paramètres d’usine et j’ai suivi à nouveau cette procédure, mais cela ne fonctionne toujours pas. »

Agent : « Je suis désolé. Voyons s’il y a un autre moyen de résoudre le problème. Veuillez patienter. »

La fonctionnalité de résumé des conversations simplifie le texte de cette façon :

Résumé de l’exemple	Remarque	Aspect de la conversation
Le client ne parvient pas à configurer la connexion Wi-Fi de la machine à expresso Smart Brew 300	problème client dans une conversation entre client et agent	problème
L’agent a suggéré plusieurs étapes de dépannage, notamment la vérification de la connexion Wi-Fi, la vérification de l’application Contoso Coffee et l’exécution d’une réinitialisation aux paramètres d’usine. Cependant, aucune de ces étapes n’a résolu le problème. L’agent met ensuite le client en attente pour rechercher une autre solution.	solutions tentées dans une conversation entre client et agent	resolution
Le client a contacté l’agent pour obtenir de l’aide sur la configuration d’une connexion Wi-Fi pour sa machine à expresso Smart Brew 300. L’agent a guidé le client à travers plusieurs étapes de résolution des problèmes, notamment une vérification de la connexion Wi-Fi, la vérification du voyant d’alimentation et une réinitialisation aux paramètres d’usine. Malgré le suivi de ces étapes, le problème persiste. L’agent a ensuite décidé d’explorer d’autres solutions potentielles	Résume une conversation en un paragraphe	récapitulatif
Résolution des problèmes liés à la machine à expresso SmartBrew 300	Segmente une conversation et génère un titre pour chaque segment ; fonctionne généralement de pair avec l’aspect `narrative`	titreDuChapitre
Le client n’arrive pas à configurer une connexion Wi-Fi pour sa machine à expresso Smart Brew 300. L’agent suggère plusieurs solutions, notamment une réinitialisation aux paramètres d’usine, mais le problème persiste.	Segmente une conversation et génère un résumé pour chaque segment ; fonctionne généralement de pair avec l’aspect `chapterTitle`	narratif

Cette documentation contient les types d’articles suivants :

Les guides de démarrage rapide sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Le résumé des documents natifs utilise des techniques de traitement du langage naturel pour générer un résumé pour les documents natifs. Un document natif fait référence au format de fichier utilisé pour créer le document d’origine, comme un fichier Microsoft Word (docx) ou un fichier de document portable (pdf). La prise en charge des documents natifs évite de prétraiter le texte avant d’utiliser les fonctionnalités des ressources Azure AI Language. Actuellement, la prise en charge des documents natifs est disponible pour deux types de résumé :

Résumé extractif : produit un résumé en extrayant des phrases saillantes dans le document, ensemble les informations de positionnement de ces phrases.
- Multiples phrases extraites : ces phrases traduisent collectivement l’idée principale du document. Il s’agit de phrases d’origine extraites du contenu du document d’entrée.
- Score de classement : le score de classement indique la pertinence d’une phrase par rapport à l’idée principale. La synthèse du texte classe les phrases extraites et vous pouvez déterminer si elles sont retournées dans l’ordre dans lequel elles apparaissent ou en fonction de leur classement. Par exemple, si vous demandez un résumé en trois phrases, le résumé extractif renvoie les trois phrases qui ont les scores les plus élevés.
- Informations de position : position de départ et longueur des phrases extraites.
Résumé abstractif : génère un résumé avec des phrases concises et cohérentes, ou des mots qui ne sont pas extraits mot à mot du document d’origine.
- Textes résumés : un résumé abstractif retourne un résumé pour chaque plage d’entrée contextuelle. Une entrée longue peut être segmentée de façon à ce que plusieurs groupes de textes résumés puissent être renvoyés avec leur plage d’entrée contextuelle.
- Plage d’entrée contextuelle : plage au sein de l’entrée qui a été utilisée pour générer le texte de synthèse.

Actuellement, la synthèse des documents prend en charge les formats de document natifs suivants :

Type de fichier	Extension de fichier	Descriptif
Texte	`.txt`	Document texte non mis en forme.
Adobe PDF	`.pdf`	Document au format de fichier de document portable.
Microsoft Word	`.docx`	Fichier de document Microsoft Word.

Pour plus d’informations, consultezRésumer les documents natifs

S'initier à la synthèse

Pour utiliser le résumé, vous envoyez du texte pour analyse et gérez la sortie d’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation supplémentaire du modèle utilisé sur vos données. Il existe deux façons d’utiliser les résumés :

Option de développement	Descriptif
Azure AI Foundry	Azure AI Foundry est une plateforme web qui vous permet d’utiliser la liaison d’entités avec des exemples de texte avec vos propres données lorsque vous vous inscrivez. Pour plus d’informations, consultez le site web Azure AI Foundry ou la documentation Azure AI Foundry.
API REST ou bibliothèque de client (SDK Azure)	Intégrez le résumé du texte à vos applications à l’aide de l’API REST ou de la bibliothèque cliente disponible dans différentes langues. Pour plus d’informations, consultez le guide de démarrage rapide du résumé.

Option de développement	Descriptif	Liens
API REST	Intégrez le résumé de conversation à vos applications à l’aide de l’API REST.	Démarrage rapide : Utilisation du résumé de conversation

Option de développement	Descriptif
Azure AI Foundry	Azure AI Foundry est une plateforme web qui vous permet d’utiliser la liaison d’entités avec des exemples de texte avec vos propres données lorsque vous vous inscrivez. Pour plus d’informations, consultez le site web Azure AI Foundry ou la documentation Azure AI Foundry.
API REST ou bibliothèque de client (SDK Azure)	Intégrez le résumé du texte à vos applications à l’aide de l’API REST ou de la bibliothèque cliente disponible dans différentes langues. Pour plus d’informations, consultez le guide de démarrage rapide du résumé.

Exigences d’entrée et limites du service

Le résumé prend du texte pour l’analyser. Pour plus d’informations, consultez Limites de données et de service dans le guide pratique.
Le résumé fonctionne avec diverses langues écrites. Consultez Prise en charge linguistique pour plus d'informations.

Documentation de référence et exemples de code

Lorsque vous utilisez le résumé du texte dans vos applications, consultez la documentation de référence et les exemples suivants pour Azure AI Language :

Option de développement/langage	Documentation de référence	Exemples
C#	Documentation C#	Exemples C#
Java	Documentation Java	Exemples Java
JavaScript	Documentation JavaScript	Exemples JavaScript
Python	Documentation Python	Exemples Python

Intelligence artificielle responsable

Un système d’IA englobe non seulement la technologie, mais aussi ses utilisateurs, les personnes concernées et l’environnement de déploiement. Lisez la note de transparence sur le résumé pour en savoir plus sur l’utilisation et le déploiement d’une IA responsable dans vos systèmes. Pour plus d’informations, consultez les articles suivants :

Partage via

Qu’est-ce que la synthèse ?

Capacités

Flux de travail standard

Fonctionnalités clés pour la synthèse de texte

S'initier à la synthèse

Exigences d’entrée et limites du service

Documentation de référence et exemples de code

Intelligence artificielle responsable

Commentaires

Ressources supplémentaires