Filtrage du contenu

Article
01/29/2024

Important

Le système de filtrage de contenu n’est pas appliqué aux invites et aux complétions traitées par le modèle Whisper dans Azure OpenAI Service. Apprenez-en davantage sur le modèle Whisper dans Azure OpenAI.

Azure OpenAI Service inclut un système de filtrage du contenu qui fonctionne avec les modèles de base. Ce système fonctionne en exécutant l’invite et l’achèvement par le biais d’un ensemble de modèles de classification visant à détecter et à empêcher la sortie de contenu nuisible. Le système de filtrage du contenu détecte les catégories spécifiques de contenu potentiellement nuisible dans les invites d’entrée et les achèvements de sortie et prend des mesures correspondantes. Les écarts au niveau des configurations d’API et de la conception de l’application pourraient affecter les achèvements et, par conséquent, le comportement de filtrage.

Les modèles de filtrage de contenu pour les catégories haine, sexualité, violence et automutilation ont été spécifiquement entraînés et testés sur les langues suivantes : anglais, allemand, japonais, espagnol, français, italien, portugais et chinois. Le service peut toutefois fonctionner dans de nombreuses autres langues, mais il est possible que la qualité varie. Dans tous les cas, vous devez effectuer vos propres tests pour vous assurer qu’il fonctionne pour votre application.

En plus du système de filtrage du contenu, Azure OpenAI Service effectue une supervision pour détecter le contenu et/ou les comportements qui suggèrent une utilisation du service d’une manière susceptible de violer les conditions du produit applicables. Pour plus d’informations sur la compréhension et l’atténuation des risques associés à votre application, consultez la note de transparence pour Azure OpenAI. Pour plus d’informations sur le traitement des données pour le filtrage de contenu et la surveillance des abus, consultez Données, confidentialité et sécurité pour azure OpenAI Service.

Les sections ci-après fournissent des informations sur les catégories de filtrage du contenu, les niveaux de gravité de filtrage et leurs configuration et les scénarios d’API à prendre en compte lors de la conception et de l’implémentation d’applications.

Catégories de filtrage du contenu

Le système de filtrage de contenu intégré dans Azure OpenAI Service contient :

Des modèles de classification multiclasse neuronaux destinés à détecter et à filtrer le contenu nuisible. Les modèles couvrent quatre catégories (haine, sexualité, violence et automutilation) selon quatre niveaux de gravité (sans risque, faible, moyen et élevé). Le contenu détecté au niveau de gravité « sûr » est étiqueté dans les annotations mais n'est pas soumis au filtrage et n'est pas configurable.
Autres modèles de classification facultatifs visant à détecter le risque de jailbreak et le contenu connu pour le texte et le code ; ces modèles sont des classifieurs binaires qui indiquent si le comportement de l’utilisateur ou du modèle est qualifié d’attaque de jailbreak ou de correspondance avec du texte ou du code source connu. L’utilisation de ces modèles est facultative, mais l’utilisation d’un modèle de code de matériel protégé peut être nécessaire pour la couverture de l’engagement du droit d’auteur du client.

Catégories préjudiciables

Category	Description
Haine et impartialité	Les préjudices liés à la haine et à l’impartialité décrit des attaques ou des utilisations de termes péjoratifs ou discriminatoires faisant référence à une personne ou à des groupes d’identité sur la base de certains attributs de différenciation de ces groupes, notamment la race, l’origine ethnique, la nationalité, les groupes et l’expression d’identité de genre, l’orientation sexuelle, la religion, le statut d’immigration, les aptitudes, l’apparence personnelle et la taille du corps.  L’impartialité consiste à veiller à ce que les systèmes d’IA traitent tous les groupes de personnes de manière équitable sans contribuer aux inégalités sociales existantes. À l’instar du discours haineux, les préjudices liés à l’impartialité dépendent du traitement disparate des groupes d’identité.
Contenu sexuel	La sexualité décrit le langage relatif aux organes anatomiques et génitaux, aux relations amoureuses, aux actes présentés en termes érotiques ou affectueux, à la grossesse, aux actes sexuels physiques, y compris les actes présentés comme une agression ou un acte violent sexuel forcé contre la volonté d’une personne, la prostitution, la pornographie et les abus.
Violence	La violence décrit le langage lié aux actions physiques destinées à blesser, nuire, endommager ou tuer quelqu’un ou quelque chose ; cela décrit les armes, les fusils et les entités connexes, telles que les fabricants, les associations, la législation, etc.
Automutilation	L’automutilation décrit le langage lié aux actions physiques destinées à blesser ou nuire le corps d’une personne ou à se tuer.
Risque de jailbreak	Les attaques de jailbreak sont des invites utilisateur conçues pour provoquer le modèle d’IA Générative afin de présenter des comportements qu’il a été entraîné pour éviter ou pour briser les règles définies dans le message système. Ces attaques peuvent varier d’un jeu rôle complexe à une subversion subtile de l’objectif de sécurité.
Matériel protégé pour le texte^*	Le texte matériel protégé décrit le contenu texte connu (par exemple, les paroles de chanson, les articles, les recettes et le contenu web sélectionné) qui peut être généré par de grands modèles de langage.
Matériel protégé pour le code	Le code matériel protégé décrit le code source qui correspond à un ensemble de codes sources provenant de référentiels publics, qui peuvent être produits par de grands modèles de langage sans que les référentiels de sources soient correctement cités.

^* Si vous êtes propriétaire de matériel texte et que vous souhaitez envoyer du contenu texte à des fins de protection, envoyez une demande.

Avertissement

L’onglet Définitions de gravité de ce document contient des exemples de contenu dangereux qui peut déranger certains lecteurs.

Niveaux de gravité de haine et d’équité

Niveau de gravité	Description	Exemple de texte
Safe	Le contenu est sûr, mais peut contenir des termes liés à la haine et à l’impartialité utilisés dans des contextes génériques et sûrs tels que : Education Média Statistiques officielles Historique Médecine Science Autres contextes similaires	`"Black people should not be killed by police or mistreated just because of their skin color."`
Faible	Le contenu qui contient une caractérisation positive ou une protection des groupes d’identité, affiche une discrimination, des stéréotypes ainsi que des préjugés, des jugements ou des opinions ou attitudes liés à un discours de haine ou ciblant des groupes d’identité. notamment : Des insultes dans des articles de recherche, des dictionnaires ou des médias avec une citation directe Discours général de haine ciblant des objets, des individus ou des groupes Discours de haine limité ou représentations de sentiments négatifs dans des contextes fictifs (par exemple, jeux, films, littérature)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Moyenne	Contenu contenant des insultes, des brimades, de l’intimidation, de la déshumanisation ou du dénigrement d’individus ou de groupes. notamment : Un langage qui se moque et imite les attributs des groupes d’identité Décrire des individus ou des groupes comme inférieurs ou déficients Nier ou rabaisser l’existence de groupes d’identité Des textes qui nient des événements historiques, bien documentés et violents tels que l’Holocauste, l’esclavage ou la colonisation	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Élevée	Du contenu qui contient un discours de haine comme de la propagande menaçant ou appelant à la violence contre des groupes d’identité, qui radicalise, recrute ou incite des personnes à rejoindre des efforts extrémistes ou à répandre un discours de haine. notamment : Un langage provocateur, offensant et vulgaire visant des individus ou des groupes d’identité spécifiques Des revendications de supériorité pour justifier la discrimination, la ségrégation ou l’exclusion Des textes qui contiennent toute forme de glorification du symbolisme nazi et SS, du KKK et du drapeau confédéré en dehors de tout contexte historique, éducatif ou artistique Des textes qui préparent à des crimes de haine, qui font l’éloge et la glorification de la violence contre des groupes d’identité, ou qui font l’éloge, la glorification ou l’approbation de génocides	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Niveaux de gravité sexuelle

Niveau de gravité	Description	Exemple de texte
Safe	Le contenu est sûr mais peut contenir des termes à connotation sexuelle utilisés dans des contextes génériques et sûrs, tels que : Formation Multimédia Statistiques officielles Historique Médecine Science Mentions de relations familiales ou amoureuses	`"Fewer young adults are having sex than in previous generations."`
Faible	Contenu exprimant des préjugés, des jugements ou des opinions sur des sujets liés à la sexualité ou mentionnant des termes liés à la sexualité dans des expériences fictives ou réelles qui ne sont pas extrêmement graphiques. notamment : Des mentions d’anatomie sexuelle ou de scènes de sexe dans des contextes fictionnels et artistiques Des prescriptions médicales et des diagnostics Des expériences personnelles, des problèmes sexuels et des traumatismes avec un contenu graphique, y compris des mécanismes et des ressources pour y faire face	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Moyenne	Du contenu qui décrit l’excitation et l’activité sexuelles en termes explicites et graphiques, y compris des fantasmes sur le sexe et les abus sexuels. notamment : Des mentions de la stimulation sexuelle et de la masturbation La pornographie limitée au commerce et la prostitution, l’escorte, etc. en tant que carrières sans scènes de sexe Des publicités pour des produits pour adultes tels que des jouets sexuels Des expériences personnelles et des descriptions liées à des massages sexuels, érotiques ou tantriques, à des clubs de strip-tease, à des spectacles érotiques, à des attributs et pratiques BDSM	`"We both climaxed at the same time."`
Niveau 7	Du contenu décrivant la sollicitation de services commerciaux sexuels, contenant des descriptions détaillées d’activités sexuelles, de violences sexuelles et de viols, ainsi que d’échanges de pouvoir non consensuels, d’abus et de voyeurisme. Cela inclut également le contenu utilisé pour promouvoir, approuver ou glorifier des actes sexuels extrêmes ou illégaux. notamment : Toute représentation de matériel pédopornographique, y compris toute référence explicite ou potentielle à des relations sexuelles avec des mineurs Exploitation sexuelle, maltraitance et autres formes d’exploitation des enfants Des références explicites ou potentielles à l’inceste, à la zoophilie, à la nécrophilie, etc. Du recrutement pour la traite des êtres humains à des fins sexuelles, y compris la manipulation des victimes	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Niveaux de gravité de violence

Niveau de gravité	Description	Exemple de texte
Safe	Le contenu est sûr mais peut contenir des termes liés à la violence utilisés dans des contextes génériques et sûrs, tels que : Formation Multimédia Statistiques officielles Historique Médecine Science Des objets communs lorsqu’ils ne sont pas utilisés comme armes Des spécifications techniques d’armes à feu de chasse ou de tir	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Faible	Contenu dans des contextes fictifs (par exemple jeux, littérature, arts) qui dépeint des scènes violentes ou graphiques sans glorification, approbation ou intention malveillante. notamment : Des expériences personnelles de violence (sans intention violente) Des opinions biaisées, des préjugés, des jugements ou des avis sur la violence Des mentions d’actes violents et de la mort à une faible intensité	`"Some people just need to be slapped."`
Moyenne	Du contenu qui contient des représentations graphiques de la violence et de la mort à une intensité moyenne, ainsi que des fantasmes d’actes violents ou de menaces. notamment : Des textes qui blâment une victime ou qui décrivent les auteurs d’une façon positive Des références historiques au génocide et à l’Holocauste, sans approbation ni glorification Des références à des fusillades de masse connues, sans approbation ni glorification Des références à des groupes et événements terroristes et extrémistes violents, sans approbation ni glorification Des textes qui demandent des conseils ou des recommandations ou des textes qui fournissent des instructions sur la manière d’exécuter un acte violent contre un animal, un individu, un groupe d’individus ou un objet ou une infrastructure qui peut entraîner des dommages individuels ou collectifs Du harcèlement et de l’intimidation	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Élevée	Du contenu contenant de la propagande terroriste ou extrémiste violente et une idéologie violente sur Internet qui décrit, loue, soutient, approuve ou glorifie les meurtres dans le cadre d’une activité terroriste, aide les organisations ou les causes terroristes. notamment : Des textes demandant des instructions sur l’affiliation à des groupes terroristes et extrémistes violents Des textes fournissant des instructions sur la manière de recruter des adeptes, d’influencer les gens en faveur d’une cause terroriste ou d’une idéologie extrémiste, d’adopter des opinions radicales ou de fournir une formation sur la manière dont les groupes terroristes et extrémistes violents fonctionnent, ou de fournir des informations sur leurs dirigeants et leurs membres Des textes qui planifient et coordonnent des attaques contre des individus ou des groupes de personnes, y compris des fusillades, l’utilisation de bombes et d’explosifs sur des infrastructures civiles, ou des attaques à l’arme blanche lorsqu’elles sont menées par des non-combattants ou des non-terroristes Du contenu qui fait référence au travail forcé, y compris des enfants, à la servitude domestique, au harcèlement et aux procédures médicales forcées	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Niveaux de gravités d’automutilation

Niveau de gravité	Description	Exemple de texte
Safe	Le contenu est sûr mais peut contenir des termes liés à l’automutilation utilisés dans des contextes génériques et sûrs tels que : Statistiques officielles Formation Multimédia Médecine Des actions qui décrivent une automutilation accidentelle, les conseils de premier secours, etc.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Faible	Contenu contenant des références à des personnages planifiant ou commettant un suicide dans un contexte fictif (par exemple, littérature, films) ou contenant des représentations d’actes d’automutilation ou de suicide à une faible intensité. notamment : Des opinions personnelles biaisées, pleines de préjugés, de jugements ou des avis tranchés sur l’automutilation Des associations à des troubles alimentaires, la recherche ou la fourniture d’instructions pour une perte de poids drastique et malsaine Des expériences personnelles liées à l’automutilation, y compris la recherche d’une aide professionnelle	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Moyenne	Du contenu qui se moque des victimes ou des survivants d’actes d'automutilation tels que les troubles alimentaires ou le suicide, ainsi que des brimades et des intimidations qui incitent à des actes d’automutilation et en font la promotion. notamment : L’automutilation présentée comme une solution à un problème Des fantasmes, des désirs, des souhaits ou des expériences personnelles concernant l’automutilation ou le suicide Des textes qui cherchent ou donnent des conseils, des instructions ou des recommandations sur la manière de s’automutiler Des brimades et des intimidations qui incitent à l’automutilation et l’encouragent	`"Go kill yourself, you are worthless."`
Élevée	Du contenu qui comprend la recherche de conseils ou qui fournit des instructions et des méthodes sur la manière de s’infliger des blessures mortelles ou de se suicider, ainsi que la glorification et l’approbation du suicide ou d’autres formes graves d’automutilation. notamment : Des textes qui indiquent comment écrire un message d’adieu à votre famille L’auto-décapitation L’immolation	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Contenu du fichier image

Avertissement
Définitions de gravité

Avertissement

L’onglet Définitions de gravité de ce document contient des exemples de contenu dangereux qui peut déranger certains lecteurs.

Niveaux de gravité de haine et d’équité

Niveau de gravité	Description	Exemple d’image
Niveau 0 – Sûr	Le contenu est sûr, mais peut contenir des images liées à la haine et à l’équité sans sentiment ou un sentiment neutre de manière non discriminatoire dans les contextes suivants ou ceux similaires à : Le journalisme Historique Médecine Informations juridiques Éducatif Géographique	Les drapeaux non confédérés, par exemple des drapeaux de pays ou d’États qui contiennent des croix Une image du drapeau Union Jack de la Grande-Bretagne Une représentation de l’émancipation des personnes esclaves aux États-Unis dans des photos historiques
Niveau 2 – Faible	Du contenu qui contient des sentiments positifs, des faux sentiments positifs ou des sentiments négatifs et biaisés différenciant les groupes d’identités. Ce contenu est destiné à déclencher une réponse émotionnelle. notamment : Protection Du symbolisme nazi, un drapeau confédéré, du symbolisme Ku Klux Klan Les stéréotypes Discrimination à l’embauche	Les représentations du mouvement « No Hate Speech » Les représentations des candidats d’emploi dépriorisés tels que les candidats handicapés dans les milieux d’entretien
Niveau 4 – Moyen	Du contenu qui contient un sentiment négatif sur les groupes d’identités et d’autres personnes qui mènent à la promotion d’une action contre des groupes d’identité et des sentiments de supériorité. notamment : Des insultes, de l’isolation, des moqueries Des drapeaux nazis, des drapeaux confédérés, et des variations et de la marchandise LGBTQIA+	Des images promouvant l’évitement social de [groupes d’identité] Des images représentant la théorie de l’amélioration raciale et l’eugénique
Niveau 6 – Élevé	Du contenu qui contient des sentiments négatifs et des discours haineux envers les groupes d’identité menant à la génération de discours haineux ou à des crimes haineux. notamment : Le racisme Des attaques sur les LGBTQIA+ La discrimination fondée sur le handicap La discrimination fondée sur le sexe La glorification du symbolisme nazi, d’un drapeau confédéré, ou du symbolisme Ku Klux Klan Un drapeau confédéré violent	De l’imagerie antisémite De l’imagerie représentant la « Croix sud » qui présente une saltire bleue (croix diagonale) avec l’affiliation d’une violence évidente (par exemple, l’affichage ou l’utilisation d’armes à feu)

Niveaux de gravité sexuelle

Niveau de gravité	Description	Exemple d’image
Niveau 0 – Sûr	Le contenu est sûr, mais contient des images liées au sexe utilisées dans un sens général. notamment : Les relations familiales et romantiques La nudité non-sexuelle Clothing Les objets courants Une pose ou activité non sexuelle L’accouplement animal Le bien-être sexuel	Des représentations de câlins ou de contact physique non-sexuel Des représentations de marques physiques d’affections comme des baisers sans la langue et sans nudité
Niveau 2 – Faible	Du contenu qui contient des comportements ou des actes sexuellement suggestifs. notamment : Les expériences personnelles Le mannequinat La nudité dans l’art L’art du corps Un spectacle osé	Des représentations de personnes
Niveau 4 – Moyen	Du contenu qui contient des contenus érotiques et/ou pornographiques commerciaux et/ou amateurs sans pénétration photographique visuelle et des participants nus ou semi-nus impliqués dans des scènes sexuelles destinées à l’excitation sexuelle. notamment : Du mannequinat sexuel De la nudité soft dans l’art Des emplois sexuels ou sex shops Une activité sexuelle masquée Les coulisses des productions pornographiques Du pole dancing	Des représentations de rapports qui peuvent être partiellement obstrués mais toujours clairement présents dans l’image
Niveau 6 – Élevé	Du contenu qui contient des représentations détaillées explicites des organes sexuels et des actes sexuels, y compris des actes illégaux. notamment : De la pornographie amateur softcore et hardcore De la sollicitation sexuelle Du voyeurisme Du sexe dans l’art Du BDSM sans consentement ou du viol De l’exploitation sexuelle et des abus sexuels d’enfants Du pédopiégeage De l’inceste	Des représentations d’activités sexuelles avec des animaux ou des cadavres

Niveaux de gravité de violence

Niveau de gravité	Description	Exemple d’image
Niveau 0 – Sûr	Le contenu est sûr, mais contient des images liés à la violence utilisées dans un sens général. notamment : Une pose de sommeil ou de repos Les objets courants Une activité non violente Des cordes non utilisées comme nœud coulant Des outils à lame utilisés dans la cuisine/couture Des blessures, des cicatrices et les traitements chirurgicaux Les sports de chasse et de tir Les armes jouets et factices Les pratiques de combat Les dommages aux objets et le vandalisme Le symbolisme terroriste non marqué	Des représentations d’armes et d’outils à lames non réalistes
Niveau 2 – Faible	Du contenu qui contient des images et des actes liés à la violence dans le monde réel ou des contextes fictifs avec un niveau de gore faible. notamment : L’affichage et l’utilisation d’armes à feu, d’armes et d’outils à lame Un cadavre non réaliste De la violence non réaliste Des armes animées Des blessures faibles et des expériences personnelles Des cordes utilisées en tant que nœud coulant La mort dans des contextes historiques, éducatifs ou funéraires Le symbolisme terroriste non réaliste Des combats de taureaux	Des représentations de drapeaux d’ISIS/al-Qaïda
Niveau 4 – Moyen	Du contenu qui contient une violence graphique modérée et des actes violents visant une cible identifiée. notamment : Une autopsie Une scène de crime ou de mort Une mort animale (naturelle ou de chasse), du sacrifice animal, de la cruauté envers les d’animaux L’esclavage Le génocide et les meurtres de masse dans des contextes historiques et éducatifs Un abattoir La violence familiale et les violences physiques L’intimidation Les armes et armes à feu utilisées contre une cible	Des représentations de l’usage de la force et de la contrainte pour dominer ou intimider agressivement un individu
Niveau 6 – Élevé	Du contenu qui contient des représentations détaillées explicites de la violence et des actes violents avec un niveau de gore élevé. notamment : Des blessures graphiques et des décès Un démembrement, une décapitation, une immolation Un cadavre en décomposition Le terrorisme, les groupes et drapeaux terroristes La servitude et le travail forcés, les procédures médicales forcées Le harcèlement Un cadavre dans le contexte de terrorisme et de crime de guerre Les tueries par arme à feu Toute autre forme d’extrémisme	Les représentations de la mort lorsqu’elles sont effectuées par des groupes terroristes identifiables par des drapeaux et des symboles d’ISIS

Niveaux de gravités d’automutilation

Niveau de gravité	Description	Exemple d’image
Niveau 0 – Sûr	Le contenu est sûr, mais contient des images liées à l’automutilation utilisées dans un sens général. notamment : Un faible taux de graisse corporelle Les actes non liés à l’automutilation Une blessure accidentelle du corps	Des représentations de saut avec un parachute hors d’un avion
Niveau 2 – Faible	Du contenu qui contient des images et des actes liés à l’automutilation dans le monde réel ou des contextes fictifs avec un niveau de gore faible. notamment : Des cicatrices Une blessure d’automutilation en cours de guérison Une automutilation non réaliste Des individus ou animaux émaciés	Des représentations des actes, des outils, des blessures et de l’état émotionnel liés à l’automutilation
Niveau 4 – Moyen	Du contenu qui contient des images graphiques modérées liées à l’automutilation et au suicide. notamment : Une autopsie Une scène de crime ou de mort L’intimidation	Des représentations de l’usage de la force et de la contrainte pour dominer ou intimider agressivement un individu et le forcer à s’automutiler
Niveau 6 – Élevé	Du contenu qui contient des représentations détaillées explicites de l’automutilation avec un niveau de gore élevé. notamment : Un acte d’automutilation imminente Les actes d’automutilation Le suicide	Des représentations du suicide intentionnel, où une personne s’est suicidée en sautant d’un grand bâtiment

Configuration (préversion)

La configuration du filtrage du contenu par défaut est définie pour filtrer au niveau de gravité moyen pour les quatre catégories de contenu pour les invites et les achèvements. Cela signifie que le contenu détecté au niveau de gravité moyen ou élevé est filtré, tandis que le contenu détecté au niveau de gravité faible n'est pas filtré par les filtres de contenu. La fonctionnalité de configuration est disponible en préversion et permet aux clients d’ajuster les paramètres, séparément pour les invites et la saisie semi-automatique, afin de filtrer le contenu pour chaque catégorie de contenu à différents niveaux de gravité, comme décrit dans le tableau ci-dessous :

Gravité filtrée	Configurable pour les invites	Configurable pour la saisie semi-automatique	Descriptions
Faible, moyen, élevé	Oui	Oui	Configuration de filtrage la plus stricte. Le contenu détecté aux niveaux de gravité bas, moyen et élevé est filtré.
Moyen, élevé	Oui	Oui	Paramètre par défaut. Le contenu détecté au niveau de gravité faible n’est pas filtré. Le contenu moyen et élevé est filtré.
Élevé	Oui	Oui	Le contenu détecté aux niveaux de gravité faible et moyen n'est pas filtré. Seul le contenu au niveau de gravité élevé est filtré.
Aucun filtre	En cas d’approbation^*	En cas d’approbation^*	Aucun contenu n’est filtré quel que soit le niveau de gravité détecté. Nécessite une approbation^*.

^* Seuls les clients qui ont été approuvés pour le filtrage de contenu modifié ont un contrôle de filtrage de contenu complet et peuvent désactiver partiellement ou complètement les filtres de contenu. Le contrôle de filtrage de contenu ne s’applique pas aux filtres de contenu pour DALL-E (préversion) ou GPT-4 Turbo avec Vision (préversion). Appliquez des filtres de contenu modifiés à l'aide de ce formulaire : Azure OpenAI Limited Access Review : Filtrage de contenu modifié (microsoft.com).

Les clients sont chargés de s’assurer que les applications intégrant Azure OpenAI sont conformes au Code de conduite.

Les configurations de filtrage de contenu sont créées dans une ressource dans Azure AI Studio et peuvent être associées à des déploiements. Apprenez-en plus sur la configuration ici.

Détails du scénario

Lorsque le système de filtrage de contenu détecte le contenu dangereux, vous recevez une erreur lors de l’appel d’API si l’invite a été jugée inappropriée, ou le finish_reason sur la réponse sera content_filter pour indiquer que la saisie semi-automatique a été filtrée. Lors de la génération de votre application ou de votre système, vous devez tenir compte de ces scénarios où le contenu retourné par l’API d’achèvement est filtré, ce qui peut entraîner un contenu incomplet. La façon dont vous agissez sur ces informations sera spécifique à l’application. Le comportement peut être résumé dans les points suivants :

Les invites classées dans une catégorie filtrée à un niveau de gravité donné retournent une erreur HTTP 400.
Les appels de saisie semi-automatique sans diffusion en continu ne retournent aucun contenu lorsque le contenu est filtré. La valeur finish_reason est définie sur content_filter. Dans de rares cas avec des réponses longues, un résultat partiel peut être retourné. Dans ce cas, finish_reason est mis à jour.
Pour les appels de saisie semi-automatique de diffusion en continu, les segments sont renvoyés à l’utilisateur à mesure qu’ils sont terminés. Le service continue la diffusion en continu jusqu’à ce qu’il atteigne un jeton d’arrêt ou une certaine longueur ou que du contenu classé dans une catégorie filtrée à un niveau de gravité donné soit détecté.