Partager via


Qu’est-ce que la synthèse ?

Important

Notre région de prévisualisation, Suède Centre, présente nos dernières techniques de réglage fin du LLM, en constante évolution, basées sur des modèles GPT. Nous vous invitons à les essayer avec une ressource Language de la région Suède Centre.

Le résumé de conversation est disponible uniquement à l’aide de :

  • API REST
  • Python
  • C#

Le résumé est une fonctionnalité proposée par Azure AI Language, qui est une combinaison de modèles de langage volumineux génératifs et de modèles d’encodeur optimisés pour les tâches qui offrent des solutions de résumé avec une meilleure qualité, une efficacité des coûts et une latence plus faible. Utilisez cet article pour en savoir plus sur cette fonctionnalité et son utilisation dans vos applications.

Prêt à l’emploi, le service fournit des solutions de résumé pour trois types de genre : les textes bruts, les conversations et les documents natifs. Le résumé du texte accepte uniquement les blocs de texte brut et le résumé des conversations accepte des entrées conversationnelles, y compris divers signaux audio vocaux que le modèle segmente et résume efficacement, et le document natif peut directement résumer les documents dans leurs formats natifs, tels que Words, PDF, etc.

Cette documentation contient les types d’articles suivants :

  • Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
  • Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Cette fonctionnalité est conçue pour raccourcir un contenu pouvant être considéré comme trop long à lire.

Fonctionnalités clés pour la synthèse de texte

Le résumé de texte utilise des techniques de traitement du langage naturel pour générer un résumé pour les textes bruts, qui peuvent provenir d’un document ou d’une conversation, ou de n’importe quels textes. Cette API propose deux approches aux résumés :

  • Résumé extractif : produit un résumé en extrayant des phrases principales du document, ainsi que les informations de positionnement de ces phrases.

    • Multiples phrases extraites : ces phrases traduisent collectivement l’idée principale du document. Il s’agit de phrases d’origine extraites du contenu du document d’entrée.
    • Score de classement : le score de classement indique la pertinence d’une phrase par rapport à l’idée principale. La synthèse du texte classe les phrases extraites et vous pouvez déterminer si elles sont retournées dans l’ordre dans lequel elles apparaissent ou en fonction de leur classement. Par exemple, si vous demandez un résumé en trois phrases, le résumé extractif renvoie les trois phrases qui ont les scores les plus élevés.
    • Informations de position : position de départ et longueur des phrases extraites.
  • Résumé abstractif : génère un résumé avec des phrases concises et cohérentes, ou des mots qui ne sont pas extraits mot à mot du document d’origine.

    • Textes résumés : un résumé abstractif retourne un résumé pour chaque plage d’entrée contextuelle. Une entrée longue peut être segmentée de façon à ce que plusieurs groupes de textes résumés puissent être renvoyés avec leur plage d’entrée contextuelle.
    • Plage d’entrée contextuelle : plage dans l’entrée, qui a été utilisée pour générer le texte résumé.

À titre d’exemple, examinez le paragraphe de texte suivant :

« Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. En tant que directeur de la technologie d’Azure AI services, je collabore avec une équipe de scientifiques et d’ingénieurs exceptionnels pour faire de cette quête en réalité. Dans le cadre de mes fonctions, je bénéficie d’une perspective unique pour observer la relation entre trois attributs de la cognition humaine : le texte monolingue (X), les signaux sensoriels audio ou visuels (Y) et le texte multilingue (Z). La magie se produit à l’intersection de ces trois attributs : c’est ce que nous appelons le code XYZ, comme l’illustre la figure 1, une représentation conjointe permettant de créer une IA plus puissante, capable de mieux parler, entendre, voir et comprendre les humains. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. L’objectif est de disposer de modèles préentraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant, la traduction automatique, les réponses aux questions du langage courant, la compréhension de la lecture automatique et le sous-titrage d’images. Ces cinq percées nous ont fourni des signaux forts en direction de notre aspiration plus ambitieuse : faire un bond en avant dans les capacités de l’IA, en réalisant un apprentissage multisensoriel et multilingue plus proche de la façon dont les humains apprennent et comprennent. Je pense que le code XYZ conjoint constitue un élément fondamental de cette aspiration, s’il est fondé sur des sources de connaissances externes dans les tâches d’IA en aval.

La requête API de résumé de texte est traitée dès réception de la demande en créant une tâche pour le back-end de l’API. Si la tâche réussit, la sortie de l’API est retournée. La sortie peut être récupérée pendant 24 heures. après quoi elle est vidée. En raison de la prise en charge multilingue et des émojis, la réponse peut contenir des décalages de texte. Pour plus d’informations, consultez le guide pratique pour traiter les décalages.

Si nous utilisons l’exemple ci-dessus, l’API peut renvoyer ces résumés :

Résumé extractif :

  • « Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. »
  • «Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme   l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues.»
  • «L’objectif est de disposer de modèles pré-entraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui.»

Résumé abstractif :

  • « Microsoft adopte une approche plus holistique et humaine de l’apprentissage et de la compréhension. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant. »

Bien démarrer avec les résumés

Pour utiliser le résumé, vous envoyez du texte pour analyse et gérez la sortie d’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation supplémentaire du modèle utilisé sur vos données. Il existe deux façons d’utiliser les résumés :

Option de développement Description
Language studio Language Studio est une plateforme web qui vous permet d’essayer la liaison d’entités avec des exemples de texte sans compte Azure et vos propres données lorsque vous vous inscrivez. Pour plus d’informations, consultez le site web Language Studio ou le démarrage rapide de Language Studio.
API REST ou bibliothèque de client (SDK Azure) Intégrez le résumé du texte à vos applications à l’aide de l’API REST ou de la bibliothèque cliente disponible dans différentes langues. Pour plus d’informations, consultez le guide de démarrage rapide du résumé.

Exigences d’entrée et limites du service

Documentation de référence et exemples de code

Lorsque vous utilisez le résumé du texte dans vos applications, consultez la documentation de référence et les exemples suivants pour Azure AI Language :

Option de développement/langage Documentation de référence Exemples
C# Documentation C# Exemples C#
Java Documentation Java Exemples Java
JavaScript Documentation JavaScript Exemples JavaScript
Python Documentation Python Exemples Python

Intelligence artificielle responsable

Un système d’IA englobe non seulement la technologie, mais aussi ses utilisateurs, les personnes concernées et l’environnement de déploiement. Lisez la note de transparence sur le résumé pour en savoir plus sur l’utilisation et le déploiement d’une IA responsable dans vos systèmes. Pour plus d’informations, consultez les articles suivants :