Filtrage de contenu dans le portail Azure AI Foundry

2025-06-06

Azure AI Foundry inclut un système de filtrage de contenu qui fonctionne avec les modèles principaux et les modèles de génération d’images.

Important

Le système de filtrage de contenu n’est pas appliqué aux invites et complétions traitées par le modèle Whisper dans Azure OpenAI dans les modèles Azure AI Foundry. Apprenez-en davantage sur le modèle Whisper dans Azure OpenAI.

Fonctionnement

Le système de filtrage de contenu est alimenté par Azure AI Content Safety et fonctionne en exécutant à la fois la saisie de l’invite du modèle et la sortie du modèle via un ensemble de modèles de classification qui sont conçus pour détecter et prévenir la génération de contenu nuisible. Les écarts au niveau des configurations d’API et de la conception de l’application pourraient affecter les achèvements et, par conséquent, le comportement de filtrage.

Avec les déploiements de modèles Azure OpenAI, vous pouvez utiliser le filtre de contenu par défaut ou créer votre propre filtre de contenu (décrit plus loin). Les modèles disponibles via les déploiements d’API serverless ont le filtrage de contenu activé par défaut. Pour en savoir plus sur le filtre de contenu par défaut activé pour les déploiements d’API serverless, consultez Sécurité du contenu pour les modèles vendus directement par Azure .

Assistance linguistique

Les modèles de filtrage du contenu ont été formés et testés dans les langues suivantes : anglais, allemand, japonais, espagnol, français, italien, portugais et chinois. Toutefois, le service peut fonctionner dans de nombreuses autres langues, mais la qualité peut varier. Dans tous les cas, vous devez effectuer vos propres tests pour vous assurer qu’il fonctionne pour votre application.

Filtres de risque de contenu (filtres d’entrée et de sortie)

Les filtres spéciaux suivants fonctionnent à la fois pour l’entrée et la sortie des modèles IA générative :

Catégories

Catégorie	Descriptif
Haine	La catégorie Haine décrit des attaques ou des utilisations de langage qui incluent des termes péjoratifs ou discriminatoires faisant référence à une personne ou à un groupe identitaire sur la base de certains attributs de différenciation de ces groupes, notamment la race, l’origine ethnique, la nationalité, l’identité et l’expression de genre, l’orientation sexuelle, la religion, le statut d’immigration, les aptitudes, l’apparence personnelle et la taille du corps.
Contenu sexuel	La catégorie Contenu sexuel décrit le langage relatif aux organes anatomiques et génitaux, aux relations amoureuses, aux actes présentés en termes érotiques ou affectueux, aux actes sexuels physiques, y compris les actes présentés comme une agression ou un acte violent sexuel forcé contre sa volonté, la prostitution, la pornographie et les abus.
Violence	La catégorie Violence décrit le langage relatif aux actes physiques visant à blesser quelqu’un ou quelque chose, à lui porter atteinte ou à le tuer ; décrit les armes, etc.
Automutilation	La catégorie Automutilation décrit le langage lié aux actes physiques destinés à se blesser, à porter atteinte à son corps ou à se tuer.

Niveaux de gravité

Catégorie	Descriptif
Sûr	Le contenu peut être lié à la catégorie de violence, d’automutilation, de sexualité ou de haine, mais les termes sont utilisés dans le domaine général, journalistique, scientifique, médical et dans des contextes professionnels similaire qui conviennent à la plupart des publics.
Faible	Contenu qui exprime des préjugés, des jugements ou des opinions, qui inclut une utilisation choquante du langage, des stéréotypes, des cas d’usage appartenant à un monde fictif (par exemple, les jeux, la littérature) et des représentations à faible intensité.
Moyenne	Contenu qui utilise des propos offensants, insultants, moqueurs, intimidants ou dégradants envers des groupes identitaires spécifiques, comprend des représentations de recherche et d’exécution d’instructions nuisibles, des fantasmes, de la glorification, de la promotion des atteintes à une intensité moyenne.
Élevé	Contenu qui présente des instructions, des actes, des atteintes ou des abus explicites et graves, qui comprend l’approbation, la glorification ou la promotion d’actes nuisibles graves, de formes extrêmes ou illégales de préjudice, de radicalisation ou d’échange ou d’abus de pouvoir non consentis.

Autres filtres d’entrée

Vous pouvez également activer des filtres spéciaux pour les scénarios d’IA générative :

Attaques de jailbreak : les attaques de jailbreak sont des invites utilisateur conçues pour provoquer le modèle d’IA générative dans des comportements qu’elle a été formée pour éviter ou pour rompre les règles définies dans le message système.
Attaques indirectes : les attaques indirectes, également appelées attaques par prompt indirectes ou attaques par injection de prompt inter-domaines, constituent une vulnérabilité potentielle dans laquelle des tiers placent des instructions malveillantes à l’intérieur de documents auxquels le système d’IA générative peut accéder et traiter.

Autres filtres de sortie

Vous pouvez également activer les filtres de sortie spéciaux suivants :

Matériau protégé pour le texte : le texte de matériau protégé décrit le contenu texte connu (par exemple, les paroles de chanson, les articles, les recettes et le contenu web sélectionné) qui peuvent être générés par de grands modèles de langage.
Matériau protégé pour le code : le code de matériau protégé décrit le code source qui correspond à un ensemble de code source à partir de référentiels publics, qui peuvent être générés par de grands modèles de langage sans citation appropriée des référentiels sources.
Fondement : le filtre de détection du fondement détecte si les réponses textuelles de grands modèles de langage (LLM) sont fondées dans les documents sources fournis par les utilisateurs.

Créer un filtre de contenu dans Azure AI Foundry

Pour n’importe quel modèle de déploiement dans Azure AI Foundry, vous pouvez utiliser directement le filtre de contenu par défaut, mais vous souhaiterez peut-être avoir plus de contrôle. Par exemple, vous pouvez rendre un filtre plus ou moins strict, ou activer des fonctionnalités plus avancées telles que les boucliers d’invite et la détection de matériel protégé.

Important

Le modèle GPT-image-1 ne prend pas en charge la configuration du filtrage de contenu : seul le filtre de contenu par défaut est utilisé.

Conseil / Astuce

Pour obtenir des conseils d’aide sur les filtres de contenu dans votre projet Azure AI Foundry, consultez Filtrage de contenu Azure AI Foundry.

Pour créer un filtre de contenu, effectuez les étapes suivantes :

Conseil / Astuce

Étant donné que vous pouvez personnaliser le volet gauche dans le portail Azure AI Foundry, vous pouvez voir différents éléments que ceux indiqués dans ces étapes. Si vous ne voyez pas ce que vous recherchez, sélectionnez ... Plus en bas du volet gauche.

Accédez à Azure AI Foundry et naviguez jusqu’à votre projet. Sélectionnez ensuite la page Garde-fous + contrôles dans le menu de gauche, puis sélectionnez l’onglet Filtres de contenu .
Sélectionnez + Créer un filtre de contenu.
Sur la page Informations de base, saisissez un nom pour votre configuration de filtrage de contenu. Sélectionnez une connexion à associer au filtre de contenu. Ensuite, sélectionnez Suivant.

Vous pouvez maintenant configurer les filtres d'entrée (pour les invites utilisateur) et les filtres de sortie (pour l'achèvement du modèle).
Sur la page Filtres d’entrée, vous pouvez définir le filtre pour l’invite d’entrée. Pour les quatre premières catégories de contenu, il existe trois niveaux de gravité configurables : faible, moyen et élevé. Vous pouvez utiliser les curseurs pour définir le seuil de gravité si vous déterminez que votre application ou votre scénario d’utilisation nécessite un filtrage différent des valeurs par défaut. Certains filtres, par exemple les boucliers d’invite et la détection de matériel protégé, vous permettent de déterminer si le modèle doit annoter et/ou bloquer le contenu. La sélection d’Annoter exécute uniquement le modèle respectif et retourne des annotations via la réponse de l’API, mais elle ne filtre pas le contenu. En plus d’annoter, vous pouvez également choisir de bloquer du contenu.

Si votre cas d’usage a été approuvé pour les filtres de contenu modifiés, vous disposez d’un contrôle total sur les configurations de filtrage de contenu, et vous avez le choix entre désactiver partiellement ou totalement le filtrage, ou activer seulement l’annotation pour les catégories de contenu nuisible (violence, haine, contenu à caractère sexuel et automutilation).

Le contenu est annoté par catégorie et bloqué en fonction du seuil que vous définissez. Pour les catégories violence, haine, sexuel et automutilation, ajustez le curseur pour bloquer le contenu de gravité haute, moyenne ou faible.
Sur la page Filtres de sortie, vous pouvez configurer le filtre de sortie, qui sera appliqué à tout le contenu de sortie généré par votre modèle. Configurez les filtres individuels comme avant. Cette page propose également l’option Mode de diffusion en continu, qui vous permet de filtrer le contenu en quasi-temps réel au fur et à mesure qu’il est généré par le modèle, réduisant ainsi la latence. Lorsque vous avez terminé, sélectionnez Suivant.

Le contenu est annoté pour chaque catégorie et bloqué en fonction du seuil. Pour le contenu violence, haine, sexuel et automutilation, ajustez le seuil pour bloquer le contenu dangereux avec des niveaux de gravité égaux ou supérieurs.
Si vous le souhaitez, sur la page Déploiement, vous pouvez associer le filtre de contenu à un déploiement. Si un déploiement sélectionné a déjà un filtre attaché, vous devez confirmer que vous souhaitez le remplacer. Vous pouvez également associer le filtre de contenu à un déploiement ultérieurement. Cliquez sur Créer.

Les configurations de filtrage de contenu sont créées au niveau du hub dans le portail Azure AI Foundry. En savoir plus sur la configurabilité dans la documentation Azure OpenAI dans Azure AI Foundry Models.
Sous l’onglet Vérifier, passez en revue les paramètres, puis sélectionnez Créer le filtre.

Utilisation d’une liste de blocage comme filtre

Vous pouvez appliquer une liste de blocage en tant que filtre d’entrée ou de sortie, ou les deux. Activez l’option Liste de blocage sur la page Filtre d’entrée et/ou Filtre de sortie. Sélectionnez une ou plusieurs listes de blocage dans la liste déroulante, ou utilisez la liste de blocage de profanité intégrée. Vous pouvez combiner plusieurs listes de blocage dans le même filtre.

Application d’un filtre de contenu

Le processus de création de filtre vous donne la possibilité d’appliquer le filtre aux déploiements que vous souhaitez. Vous pouvez également modifier ou supprimer les filtres de contenu de vos déploiements à tout moment.

Procédez comme suit pour appliquer un filtre de contenu à un déploiement :

Accédez à Azure AI Foundry et sélectionnez un projet.
Sélectionnez Modèles + points de terminaison dans le volet gauche, puis choisissez l’un de vos déploiements, puis sélectionnez Modifier.
Dans la fenêtre Mettre à jour le déploiement, sélectionnez le filtre de contenu que vous souhaitez appliquer au déploiement. Sélectionnez ensuite Enregistrer et fermer.

Vous pouvez également modifier et supprimer une configuration de filtre de contenu si nécessaire. Avant de supprimer une configuration de filtrage de contenu, vous devez cesser ses affectations et les remplacer dans tous les déploiements sous l’onglet Déploiements.

Maintenant, vous pouvez accéder au terrain de jeu pour tester si le filtre de contenu fonctionne comme prévu.

Conseil / Astuce

Vous pouvez également créer et mettre à jour des filtres de contenu à l’aide des API REST. Pour plus d’informations, consultez les informations de référence sur l’API. Les filtres de contenu peuvent être configurés au niveau de la ressource. Une fois qu’une configuration est créée, elle peut être associée à un ou plusieurs déploiements. Pour plus d’informations sur le déploiement de modèles, consultez le guide de déploiement de ressources.

Configuration (préversion)

Azure OpenAI dans les modèles Azure AI Foundry inclut les paramètres de sécurité par défaut appliqués à tous les modèles (à l’exclusion des modèles d’API audio tels que Whisper). Ces configurations vous offrent une expérience responsable par défaut, notamment des modèles de filtrage de contenu, des listes de blocage, la transformation des invites, des autorisations de contenu, et bien d’autres encore. Apprenez-en plus à ce sujet ici.

Tous les clients peuvent également configurer des filtres de contenu et créer des stratégies de contenu personnalisées adaptées à leurs besoins en cas d’usage. La fonctionnalité de configurabilité permet aux clients d’ajuster les paramètres, séparément pour les prompts et les achèvements, afin de filtrer le contenu pour chaque catégorie de contenu à différents niveaux de gravité, comme décrit dans le tableau ci-dessous. Le contenu détecté au niveau de gravité « sécurisé » est étiqueté dans la sortie d’annotation, mais n’est pas soumis au filtrage et n’est pas configurable.

Gravité filtrée	Configurable pour les invites	Configurable pour la saisie semi-automatique	Descriptions
Faible, moyen, élevé	Oui	Oui	Configuration de filtrage la plus stricte. Le contenu détecté aux niveaux de gravité bas, moyen et élevé est filtré.
Moyen, élevé	Oui	Oui	Le contenu détecté au niveau de gravité faible n’est pas filtré. Le contenu moyen et élevé est filtré.
Élevé	Oui	Oui	Le contenu détecté aux niveaux de gravité faible et moyen n'est pas filtré. Seul le contenu au niveau de gravité élevé est filtré.
Aucun filtre	En cas d’approbation¹	En cas d’approbation¹	Aucun contenu n’est filtré quel que soit le niveau de gravité détecté. Nécessite une approbation¹.
Annoter seulement	En cas d’approbation¹	En cas d’approbation¹	Désactive la fonctionnalité de filtrage de sorte que le contenu n’est pas bloqué, mais les annotations sont retournées par la réponse de l’API. Nécessite une approbation¹.

¹ Pour les modèles Azure OpenAI, seuls les clients qui ont été approuvés pour le filtrage de contenu modifié disposent d’un contrôle total du filtrage de contenu et peuvent désactiver les filtres de contenu. Demander des filtres de contenu modifiés via ce formulaire : Révision d’accès limité Azure OpenAI : filtres de contenu modifiés. Pour les clients Azure Government, appliquez des filtres de contenu modifiés via ce formulaire : Azure Government - Demander un filtrage de contenu modifié pour Azure OpenAI.

Les filtres de contenu configurables pour les entrées (requêtes) et les sorties (complétions) sont disponibles pour tous les modèles Azure OpenAI.

Les configurations de filtrage de contenu sont créées dans une ressource dans le portail Azure AI Foundry et peuvent être associées à des déploiements. En savoir plus sur la configuration des filtres de contenu ici.

Les clients sont chargés de s’assurer que les applications intégrant Azure OpenAI sont conformes au Code de conduite.

Découvrez-en plus sur les modèles sous-jacents d’Azure OpenAI.
Le filtrage de contenu Azure AI Foundry est optimisé par Azure AI Sécurité du Contenu.
En savoir plus sur la compréhension et l’atténuation des risques associés à votre application : Vue d’ensemble des pratiques d’IA responsable pour les modèles Azure OpenAI.
En savoir plus sur l’évaluation de vos modèles IA et systèmes d’IA générative via Azure AI Evaluation.

Partager via

Filtrage de contenu dans le portail Azure AI Foundry

Fonctionnement

Assistance linguistique

Filtres de risque de contenu (filtres d’entrée et de sortie)

Catégories

Niveaux de gravité

Autres filtres d’entrée

Autres filtres de sortie

Créer un filtre de contenu dans Azure AI Foundry

Utilisation d’une liste de blocage comme filtre

Application d’un filtre de contenu

Configuration (préversion)

Contenu connexe

Commentaires

Ressources supplémentaires