Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
S’applique uniquement à :le portail classique Foundry. Cet article n’est pas disponible pour le nouveau portail Foundry.
En savoir plus sur le nouveau portail.
Note
Les liens de cet article peuvent ouvrir du contenu dans la nouvelle documentation Microsoft Foundry au lieu de la documentation Foundry (classique) que vous affichez maintenant.
Note
L’API des assistants est obsolète et sera retirée le 26 août 2026. Utilisez le service Microsoft Foundry Agents, généralement disponible. Suivez le guide de migration pour mettre à jour vos charges de travail. En savoir plus.
Les assistants, une fonctionnalité d’Azure OpenAI dans Microsoft Modèles Foundry, sont conçus pour faciliter la création d’applications avec des expériences copilotes sophistiquées qui peuvent parcourir des données, suggérer des solutions et automatiser des tâches.
- Les assistants peuvent appeler Azure models avec des instructions spécifiques pour régler leur personnalité et leurs capacités.
- Les assistants peuvent accéder à plusieurs outils en parallèle. Il peut s’agir à la fois d’outils hébergés par Azure OpenAI tels que interpréteur de code et recherche de fichiers ou d’outils que vous créez, hébergez et auxquels vous accédez via un appel de fonction.
- Les assistants peuvent accéder aux threads persistants. Les threads simplifient le développement d’applications IA en stockant l’historique des messages et en le tronquant lorsque la conversation est trop longue pour la longueur du contexte du modèle. Vous créez un thread une seule fois et ajoutez des messages à celui-ci lorsque vos utilisateurs y répondent.
- Les assistants peuvent accéder aux fichiers dans plusieurs formats. Soit dans le cadre de leur création, soit dans le cadre de fils de discussion entre utilisateurs et assistants. Lorsque vous utilisez des outils, les Assistants peuvent également créer des fichiers (tels que des images ou des feuilles de calcul) et citer des fichiers qu’ils référencent dans les messages qu’ils créent.
Aperçu
Auparavant, la création d’assistants IA personnalisés avait besoin d’un travail lourd même pour les développeurs expérimentés. Bien que l'API de complétion de chat soit légère et puissante, elle est intrinsèquement sans état, ce qui signifie que les développeurs ont dû gérer l'état des conversations et les fils de discussion, les intégrations d'outils, les documents et les index de récupération, et exécuter le code manuellement.
L’API des Assistants, en tant qu’évolution étatique de l’API de complétion de chat, offre une solution à ces défis. L’API Assistants prend en charge les threads managés automatiquement persistants. Cela signifie que, en tant que développeur, vous n’avez plus besoin de développer des systèmes de gestion des états de conversation et de contourner les contraintes de fenêtre de contexte d’un modèle. L’API Assistants gère automatiquement les optimisations pour conserver le thread sous la fenêtre de contexte maximale de votre modèle choisi. Une fois que vous avez créé un thread, vous pouvez y ajouter de nouveaux messages lorsque les utilisateurs répondent. Les assistants peuvent également accéder à plusieurs outils en parallèle, si nécessaire. Ces outils sont les suivants :
Conseil
Il n’existe aucune tarification ou quota supplémentaire pour l’utilisation d’Assistants, sauf si vous utilisez l’interpréteur de code ou les outils de recherche de fichiers .
L’API Assistants repose sur les mêmes fonctionnalités que le produit GPT d’OpenAI. Certains cas d’usage possibles vont de l’outil de recommandation de produit alimenté par l’IA, de l’application analyste des ventes, de l’assistant codage, du chatbot Q&A des employés, etc. Commencez à créer sur le terrain de jeu Assistant sans code sur le portail Foundry ou commencez à créer avec l’API.
Important
La récupération de données non approuvées à l’aide de l’appel de fonction, de l’interpréteur de code ou de la recherche de fichiers avec des fonctionnalités d’entrée de fichier et de threads d’assistant peut compromettre la sécurité de votre Assistant ou l’application qui utilise l’Assistant. Découvrez les approches d’atténuation ici.
Utilisation d’assistants
Pour plus d’informations sur l’utilisation des assistants, consultez la documentation de référence suivante.
Modèles disponibles
Pour afficher la liste des modèles OpenAI Azure que vous pouvez utiliser avec les assistants, consultez l’article Models.
Terrain de jeu d’assistants
Avant d’utiliser des assistants, vous avez besoin des éléments suivants :
- Modèle compatible déployé. Pour plus d’informations sur le déploiement de modèles, consultez le guide de déploiement de ressources.
- Projet Foundry dans le portail Foundry.
Composants d'assistants
| Composant | Description |
|---|---|
| Assistant | IA personnalisée qui utilise Azure modèles OpenAI conjointement avec les outils. |
| Fil | Session de conversation entre un Assistant et un utilisateur. Les threads stockent les messages et gèrent automatiquement la troncation pour ajuster le contenu dans le contexte d’un modèle. |
| Message | Message créé par un Assistant ou un utilisateur. Les messages peuvent inclure du texte, des images et d’autres fichiers. Les messages sont stockés sous forme de liste sur le thread. |
| Courir | Activation d’un Assistant pour commencer à s’exécuter en fonction du contenu du thread. L’Assistant utilise sa configuration et les messages du thread pour effectuer des tâches en appelant des modèles et des outils. Dans le cadre d’une exécution, l’Assistant ajoute des messages au thread. |
| Étape d’exécution | Liste détaillée des étapes que l’Assistant a effectuées dans le cadre d’un processus. Un Assistant peut appeler des outils ou créer des messages pendant son exécution. L’examen des étapes d’exécution vous permet de comprendre comment l’Assistant obtient ses résultats finaux. |
Accès aux données des assistants
Actuellement, les assistants, les threads, les messages et les fichiers pour les Assistants sont définis au niveau de la ressource Azure OpenAI. Par conséquent, toute personne ayant accès à la ressource Azure OpenAI ou disposant de la clé API peut lire ou écrire des assistants, des conversations, des messages et des fichiers.
Nous vous recommandons vivement les contrôles d’accès aux données suivants :
- Implémenter l’autorisation. Avant d’effectuer des lectures ou des écritures sur des assistants, des threads, des messages et des fichiers, assurez-vous que l’utilisateur final est autorisé à le faire.
- Limitez l’accès à la ressource Azure OpenAI et à la clé API. Considérez attentivement qui a accès à Azure ressources OpenAI où les assistants sont utilisés et les clés API associées.
- Auditez régulièrement les comptes/personnes qui ont accès à la ressource OpenAI Azure. Les clés API et l’accès au niveau des ressources permettent un large éventail d’opérations, notamment la lecture et la modification de messages et de fichiers.
- Activez les paramètres diagnostic pour permettre le suivi à long terme de certains aspects du journal d'activité de la ressource OpenAI Azure.
Paramètres
L’API Assistants prend en charge plusieurs paramètres qui vous permettent de personnaliser la sortie des Assistants. Le tool_choice paramètre vous permet de forcer l’Assistant à utiliser un outil spécifié. Vous pouvez également créer des messages avec le assistant rôle pour créer des historiques de conversation personnalisés dans Threads.
temperature, top_p et response_format vous permettent d’ajuster davantage les réponses. Pour plus d'informations, consultez la documentation référence.
Gestion des fenêtres de contexte
Les assistants tronquent automatiquement le texte pour s'assurer qu'il reste dans la longueur maximale du contexte du modèle. Vous pouvez personnaliser ce comportement en spécifiant les jetons maximum que vous souhaitez exécuter pour utiliser et/ou le nombre maximal de messages récents que vous souhaitez inclure dans une exécution.
Complétion maximale et jetons d’invite maximale
Pour contrôler l’utilisation des jetons dans une seule exécution, définissez max_prompt_tokens et max_completion_tokens lorsque vous créez l’exécution. Ces limites s’appliquent au nombre total de jetons utilisés dans toutes les complétions durant tout le cycle de vie du Run.
Démarrer une exécution avec max_prompt_tokens réglé à 500 et max_completion_tokens réglé à 1000 signifie que la première complétion tronquera le thread à 500 jetons et limitera la sortie à 1 000 jetons. Si seuls 200 jetons d’invite et 300 jetons d’achèvement sont utilisés lors de la première saisie semi-automatique, la deuxième saisie semi-automatique aura des limites disponibles de 300 jetons d’invite et de 700 jetons d’achèvement.
Si un achèvement atteint la max_completion_tokens limite, le Run se terminera par un état incomplet, et les détails seront fournis dans le champ incomplete_details de l’objet Run.
Lorsque vous utilisez l’outil Recherche de fichiers, nous vous recommandons de régler le max_prompt_tokens à au moins 20 000. Pour des conversations plus longues ou plusieurs interactions avec la recherche de fichiers, envisagez d’augmenter cette limite à 50 000, ou idéalement, en supprimant complètement les max_prompt_tokens limites pour obtenir les résultats de qualité les plus élevés.
Stratégie de troncation
Vous pouvez également spécifier une stratégie de troncation pour contrôler le rendu de votre thread dans la fenêtre de contexte du modèle. L’utilisation d’une stratégie de troncation de type auto utilise la stratégie de troncation par défaut d’OpenAI. L’utilisation d’une stratégie de troncation de type last_messages vous permet de spécifier le nombre de messages les plus récents à inclure dans la fenêtre de contexte.
Voir aussi
- En savoir plus sur les assistants et la recherche de fichiers
- En savoir plus sur les assistants et l’interpréteur de code
- En savoir plus sur les assistants et les appels de fonction
- Exemples d'API Azure Assistants OpenAI