Présentation du résumé des documents et des conversations

Important

Notre région de prévisualisation, Suède Centre, présente nos dernières techniques de réglage fin du LLM, en constante évolution, basées sur des modèles GPT. Nous vous invitons à les essayer avec une ressource Language de la région Suède Centre.

Le résumé de conversation est disponible uniquement à l’aide de :

  • API REST
  • Python
  • C#

Le résumé est l’une des fonctionnalités offertes par Azure AI Language, un ensemble d’algorithmes d’apprentissage automatique et d’IA dans le cloud pour le développement d’applications intelligentes qui impliquent du langage écrit. Utilisez cet article pour en savoir plus sur cette fonctionnalité et son utilisation dans vos applications.

Bien que les services soient étiquetés pour le résumé des documents et des conversations, le résumé des documents accepte seulement les blocs de texte brut et le résumé des conversations accepte différents artefacts vocaux pour que le modèle en apprenne davantage. Si vous souhaitez traiter une conversation tout en vous souciant uniquement du texte, vous pouvez utiliser le résumé des documents pour ce scénario.

Cette documentation contient les types d’articles suivants :

  • Les Démarrages rapides sont des instructions de prise en main qui vous guident dans la formulation de vos requêtes au service.
  • Les Guides pratiques contiennent des instructions sur l’utilisation du service de manière plus spécifique ou personnalisée.

Le résumé des documents utilise des techniques de traitement du langage naturel pour générer un résumé de documents. Il existe trois approches d’API prises en charge pour le résumé automatique : extractive, abstractive et axée sur une requête.

Un résumé extractif extrait des phrases qui représentent collectivement les informations les plus importantes ou pertinentes du contenu d’origine. Un résumé abstractif génère une synthèse avec des phrases concises et cohérentes, ou des mots qui ne sont pas des extraits mot pour mot de phrases du document d’origine. Cette fonctionnalité est conçue pour raccourcir un contenu pouvant être considéré comme trop long à lire.

Prise en charge des documents natifs

Un document natif fait référence au format de fichier utilisé pour créer le document d’origine, comme un fichier Microsoft Word (docx) ou un fichier de document portable (pdf). La prise en charge des documents natifs évite de prétraiter le texte pour pouvoir utiliser les fonctionnalités des ressources Azure AI Language. Actuellement, la prise en charge des documents natifs est disponible pour les deux fonctionnalités AbstractiveSummarization et ExtractiveSummarization.

Actuellement, Résumé des documents prend en charge les formats de documents natifs suivants :

Type de fichier Extension de fichier Description
Texte .txt Document texte non mis en forme.
Adobe PDF .pdf Document au format de fichier de document portable.
Microsoft Word .docx Fichier de document Microsoft Word.

Pour plus d’informations, consultezUtiliser des documents natifs pour le traitement du langage

Fonctionnalités clés

Voici les aspects du résumé des documents que fournit cette API :

  • Résumé extractif : produit un résumé en extrayant des phrases saillantes du document.

    • Multiples phrases extraites : ces phrases traduisent collectivement l’idée principale du document. Il s’agit de phrases d’origine extraites du contenu du document d’entrée.
    • Score de classement : Le scorede classement indique la pertinence d’une phrase par rapport à l’idée principale d’un document. Le résumé de document classe les phrases extraites. Vous pouvez déterminer si elles sont retournées dans l’ordre dans lequel elles apparaissent ou en fonction de leur classement.
    • Multiples phrases retournées : déterminez le nombre maximal de phrases à retourner. Par exemple, si vous demandez un résumé en trois phrases, le résumé extractif renvoie les trois phrases qui ont les scores les plus élevés.
    • Informations de position : position de départ et longueur des phrases extraites.
  • Résumé abstractif : génère un résumé n’utilisant pas nécessairement les mêmes mots que ceux du document, mais capture l’idée principale.

    • Textes récapitulatifs : un résumé abstractif retourne une synthèse pour chaque plage d’entrée contextuelle du document. Un document long peut être segmenté de façon à ce que plusieurs groupes de textes résumés puissent être renvoyés avec leur plage d’entrée contextuelle.
    • Plage d’entrée contextuelle : plage dans le document d’entrée qui a été utilisée pour générer le texte récapitulatif.
  • Résumé axé sur une requête : génère un résumé basé sur une requête

À titre d’exemple, examinez le paragraphe de texte suivant :

« Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. En tant que directeur de la technologie d’Azure AI services, je collabore avec une équipe de scientifiques et d’ingénieurs exceptionnels pour faire de cette quête en réalité. Dans le cadre de mes fonctions, je bénéficie d’une perspective unique pour observer la relation entre trois attributs de la cognition humaine : le texte monolingue (X), les signaux sensoriels audio ou visuels (Y) et le texte multilingue (Z). La magie se produit à l’intersection de ces trois attributs : c’est ce que nous appelons le code XYZ, comme l’illustre la figure 1, une représentation conjointe permettant de créer une IA plus puissante, capable de mieux parler, entendre, voir et comprendre les humains. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. L’objectif est de disposer de modèles préentraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant, la traduction automatique, les réponses aux questions du langage courant, la compréhension de la lecture automatique et le sous-titrage d’images. Ces cinq percées nous ont fourni des signaux forts en direction de notre aspiration plus ambitieuse : faire un bond en avant dans les capacités de l’IA, en réalisant un apprentissage multisensoriel et multilingue plus proche de la façon dont les humains apprennent et comprennent. Je pense que le code XYZ conjoint constitue un élément fondamental de cette aspiration, s’il est fondé sur des sources de connaissances externes dans les tâches d’IA en aval.

La requête d’API de résumé des documents est traitée à la réception en créant un travail pour le backend d’API. Si la tâche réussit, la sortie de l’API est retournée. La sortie peut être récupérée pendant 24 heures. après quoi elle est vidée. En raison de la prise en charge multilingue et des émojis, la réponse peut contenir des décalages de texte. Pour plus d’informations, consultez le guide pratique pour traiter les décalages.

Si nous utilisons l’exemple ci-dessus, l’API peut renvoyer ces phrases résumées :

Résumé extractif :

  • « Chez Microsoft, nous cherchons à faire progresser l’IA au-delà des techniques existantes, en adoptant une approche plus holistique et plus humaine de l’apprentissage et de la compréhension. »
  • «Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme   l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues.»
  • «L’objectif est de disposer de modèles pré-entraînés capables d’apprendre conjointement des représentations pour prendre en charge un large éventail de tâches d’IA en aval, comme les humains le font aujourd’hui.»

Résumé abstractif :

  • « Microsoft adopte une approche plus holistique et humaine de l’apprentissage et de la compréhension. Nous pensons que le code XYZ nous permet de réaliser notre vision à long terme : l’apprentissage de transfert entre domaines, couvrant différentes modalités et différentes langues. Au cours des cinq dernières années, nous avons atteint des performances humaines dans des tests d’évaluation portant sur la reconnaissance vocale du langage courant. »

Bien démarrer avec les résumés

Pour utiliser le résumé, vous envoyez du texte pour analyse et gérez la sortie d’API dans votre application. L’analyse est effectuée telle quelle, sans personnalisation supplémentaire du modèle utilisé sur vos données. Il existe deux façons d’utiliser les résumés :

Option de développement Description
Language studio Language Studio est une plateforme web qui vous permet d’essayer la liaison d’entités avec des exemples de texte sans compte Azure et vos propres données lorsque vous vous inscrivez. Pour plus d’informations, consultez le site web Language Studio ou le démarrage rapide de Language Studio.
API REST ou bibliothèque de client (SDK Azure) Intégrez le résumé des documents dans vos applications en utilisant l’API REST ou la bibliothèque de client disponible dans différente langues. Pour plus d’informations, consultez le guide de démarrage rapide du résumé.

Exigences d’entrée et limites du service

Documentation de référence et exemples de code

Quand vous utilisez le résumé de documents dans vos applications, consultez la documentation de référence et les exemples suivants pour Azure AI Language :

Option de développement/langage Documentation de référence Exemples
C# Documentation C# Exemples C#
Java Documentation Java Exemples Java
JavaScript Documentation JavaScript Exemples JavaScript
Python Documentation Python Exemples Python

Intelligence artificielle responsable

Un système d’IA englobe non seulement la technologie, mais aussi ses utilisateurs, les personnes concernées et l’environnement de déploiement. Lisez la note de transparence sur le résumé pour en savoir plus sur l’utilisation et le déploiement d’une IA responsable dans vos systèmes. Pour plus d’informations, consultez les articles suivants :