Partager via


Interagir avec des documents dans les applications Microsoft 365 avec un agent déclaratif

Lorsque des agents déclaratifs sont utilisés dans l’expérience Copilot dans les applications Microsoft 365, ils sont en mesure d’interagir avec le document ouvert. Les utilisateurs peuvent fournir une section sélectionnée du document ouvert à l’agent, et les agents peuvent insérer des images dans le document ouvert.

Remarque

L’accès à la sélection de document n’est pris en charge que dans Word. L’insertion d’images est prise en charge dans Word et PowerPoint.

Accéder à la sélection de document

La fonctionnalité de sélection de document permet aux utilisateurs de fournir la section sélectionnée actuelle du document ouvert à l’agent déclaratif. L’utilisateur peut interroger l’agent sur la sélection ou demander à l’agent de prendre des mesures en fonction de celle-ci.

Par exemple, un utilisateur travaille sur un document de description de travail et souhaite ajouter une image générée par l’IA au document pour ajouter un attrait visuel. L’utilisateur commence par sélectionner une section du document comme contexte pour l’image. La sélection d’une section du document active le bouton Ajouter une sélection dans le volet de conversation Copilot.

Capture d’écran de Copilot pour Word montrant l’option Ajouter une sélection

L’utilisateur sélectionne Ajouter une sélection , puis demande à l’agent de générer une image en fonction de la sélection.

Capture d’écran de Copilot pour Word montrant l’invite de l’utilisateur, y compris la sélection du document

L’agent génère des images et répond à l’utilisateur.

Capture d’écran de Copilot pour Word montrant les images générées

Utilisation de la sélection de documents dans votre agent

Les agents déclaratifs ont accès à la sélection de documents par défaut. Aucune modification n’est nécessaire à votre agent pour activer la prise en charge de cette fonctionnalité.

Utilisation de la sélection de documents dans les plug-ins d’API

Si votre agent inclut des plug-ins d’API comme actions personnalisées, l’agent peut fournir la sélection du document à l’API. L’agent traduit la sélection de document en fonction de la spécification de votre API. Vous devez vous assurer que la sélection est traduite de manière appropriée pour votre API.

  1. Commencez par tester votre agent sans ajouter d’instructions spéciales à votre agent. Dans la plupart des cas, l’agent doit traduire la sélection de manière appropriée pour votre API sans aucune configuration supplémentaire.
  2. Si votre agent ne traduit pas correctement pour votre API, ajoutez des instructions dans l’objet d’état du manifeste du reasoning plug-in pour indiquer à l’agent le formulaire à choisir.
  3. Testez différentes sélections pour vérifier que votre agent gère les différents types et longueurs de sélection de manière appropriée.

Voici quelques exemples d’instructions pour influencer la façon dont l’agent traduit la sélection de document. Les instructions réelles nécessaires pour obtenir le résultat souhaité dépendent de votre agent et de votre API.

Exemple de pass-through verbatim
You **MUST** pass the exact user's current selection without any modifications as part of the `text` param.
Résumé/exemple de transformation
You **MUST** pass the short, summarized version of the user's current selection as `prompt`
instead of the entire selected document context.
Exemple d’extraction structurée
You **MUST** pass the structured version of the user's current selection as part of the `data` param.
You should get the required context from the user's current selection based on the user's query and
**MUST** structure the context in JSON format.

insertion d’images ;

La fonctionnalité d’insertion d’image permet aux utilisateurs d’insérer des images de l’agent dans le document ouvert. L’image peut être insérée à la position actuelle du curseur, en haut du document ou en bas du document.

Par exemple, un agent qui récupère des images à partir d’un référentiel d’images externe peut montrer à l’utilisateur un bouton pour insérer l’image.

Capture d’écran de Copilot pour Word montrant un agent avec la fonctionnalité Insérer une image

Insertion d’images à partir de votre agent

L’activation de l’insertion d’image dans un agent déclaratif nécessite un plug-in d’API qui utilise des modèles de réponse de carte adaptative. Le modèle de carte adaptative inclut une Action.InsertImage action que l’utilisateur sélectionne pour insérer l’image.

{
  "type": "ActionSet",
  "actions": [
    {
      "type": "Action.InsertImage",
      "title": "Insert",
      "altText": "An image of people on the beach",
      "url": "https://contoso.com/images/beach.jpeg",
      // fallback MUST be set to "drop"
      "fallback": "drop",
      // Other valid values: "Top", "Bottom"
      "insertPosition": "Selection"
    }
  ]
}

Remarque

Les types d’images pris en charge sont .bmp, .gif, .jpeg, .jpg et .png.