Filtragem de conteúdos

Artigo
01/23/2024

Importante

O sistema de filtragem de conteúdo não é aplicado a prompts e conclusões processadas pelo modelo Whisper no Serviço Azure OpenAI. Saiba mais sobre o modelo Whisper no Azure OpenAI.

O Serviço OpenAI do Azure inclui um sistema de filtragem de conteúdo que funciona em conjunto com os modelos principais. Este sistema funciona executando tanto o prompt como o preenchimento através de um conjunto de modelos de classificação destinados a detetar e prevenir a saída de conteúdo nocivo. O sistema de filtragem de conteúdo deteta e age em categorias específicas de conteúdo potencialmente nocivo em prompts de entrada e finalizações de saída. As variações nas configurações da API e na conceção da aplicação podem afetar as conclusões e, consequentemente, o comportamento de filtragem.

Os modelos de filtragem de conteúdo para as categorias de ódio, sexual, violência e automutilação foram especificamente treinados e testados nos seguintes idiomas: inglês, alemão, japonês, espanhol, francês, italiano, português e chinês. No entanto, o serviço pode funcionar em muitos outros idiomas, mas a qualidade pode variar. Em todos os casos, deve efetuar os seus próprios testes para garantir que funciona para a sua aplicação.

Além do sistema de filtragem de conteúdo, o Serviço Azure OpenAI realiza monitoramento para detetar conteúdo e/ou comportamentos que sugerem o uso do serviço de uma maneira que pode violar os termos do produto aplicáveis. Para obter mais informações sobre como compreender e mitigar os riscos associados ao seu aplicativo, consulte a Nota de Transparência para o Azure OpenAI. Para obter mais informações sobre como os dados são processados para filtragem de conteúdo e monitoramento de abuso, consulte Dados, privacidade e segurança para o Serviço OpenAI do Azure.

As seções a seguir fornecem informações sobre as categorias de filtragem de conteúdo, os níveis de severidade de filtragem e sua configurabilidade e cenários de API a serem considerados no design e implementação de aplicativos.

Categorias de filtragem de conteúdo

O sistema de filtragem de conteúdo integrado no Serviço OpenAI do Azure contém:

Modelos neurais de classificação multiclasse destinados a detetar e filtrar conteúdos nocivos; Os modelos abrangem quatro categorias (ódio, sexual, violência e automutilação) em quatro níveis de gravidade (seguro, baixo, médio e alto). O conteúdo detectado no nível de gravidade "seguro" é identificado em anotações, mas não está sujeito a filtragem e não é configurável.
Outros modelos de classificação opcionais destinados a detetar o risco de jailbreak e conteúdo conhecido para texto e código; Esses modelos são classificadores binários que sinalizam se o comportamento do usuário ou do modelo se qualifica como um ataque de jailbreak ou corresponde ao texto conhecido ou ao código-fonte. O uso desses modelos é opcional, mas o uso de modelo de código de material protegido pode ser necessário para a cobertura do Compromisso de Direitos Autorais do Cliente.

Categorias de danos

Categoria	Description
Ódio e justiça	Os danos relacionados com o ódio e a equidade referem-se a qualquer conteúdo que ataque ou utilize linguagem pejorativa ou discriminatória com referência a uma pessoa ou a grupos de identidade com base em certos atributos diferenciadores desses grupos, incluindo, entre outros, raça, etnia, nacionalidade, grupos e expressão de identidade de género, orientação sexual, religião, estatuto de imigração, estatuto de capacidade, aparência pessoal, e tamanho do corpo.  A equidade diz respeito a garantir que os sistemas de IA tratam todos os grupos de pessoas de forma equitativa, sem contribuir para as desigualdades societais existentes. À semelhança do discurso de ódio, os danos relacionados com a equidade dependem do tratamento díspar dos grupos de identidade.
Sexual	Sexual descreve linguagem relacionada a órgãos anatômicos e genitais, relacionamentos românticos, atos retratados em termos eróticos ou afetivos, gravidez, atos sexuais físicos, incluindo aqueles retratados como uma agressão ou um ato sexual violento forçado contra a vontade, prostituição, pornografia e abuso.
Violência	A violência descreve a linguagem relacionada a ações físicas destinadas a ferir, ferir, danificar ou matar alguém ou algo; descreve armas, armas e entidades relacionadas, tais como fabricantes, associações, legislação, etc.
Automutilação	A automutilação descreve a linguagem relacionada com ações físicas destinadas a ferir, ferir, danificar o corpo ou matar-se propositadamente.
Risco de jailbreak	Os ataques de jailbreak são Prompts do Usuário projetados para provocar o modelo de IA Generativa a exibir comportamentos que ele foi treinado para evitar ou quebrar as regras definidas na Mensagem do Sistema. Tais ataques podem variar de uma intrincada encenação a uma subversão subtil do objetivo de segurança.
Material protegido para texto^*	O texto de material protegido descreve o conteúdo de texto conhecido (por exemplo, letras de músicas, artigos, receitas e conteúdo da Web selecionado) que pode ser gerado por modelos de linguagem grandes.
Material protegido para código	O código de material protegido descreve o código-fonte que corresponde a um conjunto de código-fonte de repositórios públicos, que pode ser gerado por modelos de linguagem grandes sem a citação adequada de repositórios de código-fonte.

^* Se você é proprietário de material de texto e deseja enviar conteúdo de texto para proteção, envie uma solicitação.

Aviso

A guia Definições de gravidade neste documento contém exemplos de conteúdo prejudicial que pode ser perturbador para alguns leitores.

Níveis de severidade do ódio e da equidade

Nível de severidade	Descrição	Texto de exemplo
Safe	Os conteúdos são seguros, mas podem conter termos relacionados com o ódio e a equidade utilizados em contextos genéricos e seguros, tais como: Education Multimédia Estatísticas oficiais Histórico Medicamento Ciência Outros contextos semelhantes	`"Black people should not be killed by police or mistreated just because of their skin color."`
Baixo	Conteúdo que contenha caracterização positiva ou proteção dos grupos de Identidade, exiba discriminação, estereótipos e visões ou atitudes preconceituosas, preconceituosas ou opinativas relacionadas ao discurso de ódio ou ao direcionamento de grupos identitários. O que está incluído: Insultos em artigos de pesquisa, dicionários ou meios de comunicação com uma citação direta Discurso de ódio geral que tem como alvo objetos, indivíduos ou grupos Discurso de ódio limitado ou representações de sentimentos negativos em contextos fictícios (por exemplo, jogos, filmes, literatura)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Médio	Conteúdo que contenha insultos, bullying, intimidação, desumanização ou derrogação de indivíduos ou grupos. Isto inclui: Linguagem que está zombando e imitando atributos de grupos de identidade Descrever indivíduos ou grupos como inferiores ou deficientes Negar ou aviltar a existência de grupos identitários Textos que negam eventos históricos, bem documentados e violentos, como o Holocausto, a escravidão ou a colonização	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Alto	Conteúdo que contenha discurso de ódio como propaganda ameaçando ou apelando à violência contra grupos identitários, radicalize, recrute ou incite pessoas a juntarem-se a esforços extremistas ou a espalharem discurso de ódio. Isto inclui: Linguagem incendiária, ofensiva e vulgar dirigida a indivíduos ou grupos identitários específicos Alegações de superioridade para justificar discriminação, segregação ou exclusão Textos que contenham qualquer forma de glorificação do simbolismo nazista e da SS, KKK e a bandeira confederada fora de ambientes históricos, educacionais ou artísticos Textos que mostrem preparação para crimes de ódio, elogio e glorificação da violência contra grupos identitários, ou que louvem, glorifiquem ou apoiem o genocídio	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Níveis de severidade sexual

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos relacionados sexualmente usados em contextos genéricos e seguros, tais como: Formação Académica MÍDIA Estatísticas oficiais Histórico Medicina Ciência Menções de relações familiares ou amorosas	`"Fewer young adults are having sex than in previous generations."`
Baixo	Conteúdo que expresse opiniões preconceituosas, preconceituosas ou opinativas sobre tópicos relacionados sexualmente ou mencione termos relacionados sexualmente em experiências fictícias ou do mundo real que não sejam extremamente gráficas. Isto inclui: Menções de anatomia sexual ou cenas de sexo em contextos ficcionais e artísticos Prescrições médicas e diagnóstico Experiências pessoais, problemas sexuais e traumas com algum conteúdo gráfico, incluindo mecanismos e recursos de enfrentamento	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Médio	O conteúdo que descreve a excitação e atividade sexual em termos explícitos e gráficos, inclui fantasias sobre sexo e abuso sexual. Isto inclui: Menções de estimulação sexual e masturbação Pornografia limitada a negócios e prostituição, acompanhante, etc. como carreiras sem cenas de sexo Publicidade de produtos para adultos, como brinquedos sexuais Experiências e descrições pessoais relacionadas com massagens sexuais, eróticas ou tântricas, clubes de striptease, espetáculos eróticos, atributos e práticas BDSM	`"We both climaxed at the same time."`
Nível 7	Conteúdo que descreva a solicitação de serviços comerciais sexuais, contendo descrições detalhadas de atividade sexual, abuso sexual violento e estupro, e trocas de poder não consensuais, abuso e voyeurismo. Isso também inclui conteúdo que é usado para promover, endossar ou glorificar atos sexuais extremos ou ilegais. Isto inclui: Qualquer representação de Material de Abuso Sexual de Crianças (CSAM), incluindo qualquer referência explícita ou potencial ao sexo de menores Aliciamento de crianças, abuso de crianças e outras formas de exploração infantil Referências explícitas ou potenciais a incesto, zoofilia, necrofilia, etc. Recrutamento por tráfico sexual de seres humanos, incluindo manipulação de vítimas	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Níveis de gravidade da violência

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos relacionados à violência usados em contextos genéricos e seguros, como: Formação Académica MÍDIA Estatísticas oficiais História Medicina Ciência Objetos comuns quando não usados como armas Especificações técnicas de caça ou tiro desportivo e armas	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Baixo	Conteúdo em contextos fictícios (por exemplo, jogos, literatura, artes) que retratem cenas violentas ou gráficas sem glorificação, endosso ou má intenção. Isto inclui: Experiências pessoais de violência (sem intenção violenta) Visões tendenciosas, preconceituosas, preconceituosas ou opinativas sobre a violência Referências a atos violentos e morte em baixa intensidade	`"Some people just need to be slapped."`
Médio	Conteúdo que contenha representações gráficas de violência e morte em intensidade média, bem como fantasias sobre atos violentos ou ameaças. Isto inclui: Textos que colocam a vítima em culpa ou retratam os agressores de uma forma positiva Referências históricas ao genocídio e ao Holocausto sem apoio ou glorificação Referências a tiroteios em massa conhecidos sem endosso ou glorificação Referências a grupos terroristas e extremistas violentos e acontecimentos sem apoio ou glorificação Textos que procuram aconselhamento ou recomendação ou textos que fornecem instruções sobre como realizar um ato violento contra um animal, um indivíduo, um grupo de indivíduos ou um objeto ou infraestrutura que possa resultar em danos individuais ou em massa Intimidação e intimidação	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Alto	Conteúdo que contenha propaganda terrorista ou extremista violenta e ideologia violenta na Internet que descreva, elogia, apoie, apoie ou glorifique assassinatos como parte de atividades terroristas, ajudas a organizações ou causas terroristas. Isto inclui: Textos que solicitam instruções sobre a filiação em grupos terroristas e extremistas violentos Textos que fornecem instruções sobre como recrutar seguidores, influenciar pessoas para uma causa terrorista ou ideologia extremista, adotar visões radicais ou fornecer treinamento sobre como grupos terroristas e extremistas violentos operam, ou fornecer informações sobre seus líderes e membros Textos que planeiam e coordenam ataques contra indivíduos ou grupos de pessoas, incluindo tiroteios, utilização de bombas e explosivos em infraestruturas civis ou ataques com armas brancas, quando realizados por não combatentes ou não terroristas Conteúdo que faz referência a trabalho forçado, incluindo crianças, servidão doméstica, perseguição e procedimentos médicos forçados	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Níveis de gravidade da automutilação

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos relacionados à automutilação usados em contextos genéricos e seguros, tais como: Estatísticas oficiais Formação Académica MÍDIA Médico Ações que descrevem automutilação acidental, dicas de primeiros socorros, etc.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Baixo	Conteúdo que contenha referências a personagens que planeiam ou cometem suicídio num contexto fictício (por exemplo, literatura, filmes) ou que contenha representações de atos de automutilação ou suicídio em baixa intensidade. Isto inclui: Opiniões pessoais tendenciosas, preconceituosas, preconceituosas ou opinativas sobre automutilação Associações com distúrbios alimentares, procurando ou fornecendo instruções para perda de peso drástica e não saudável Experiências pessoais relacionadas com automutilação, incluindo a procura de ajuda profissional	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Médio	Conteúdo que zomba de vítimas ou sobreviventes de automutilação, como distúrbios alimentares ou suicídio, bem como bullying e intimidação que incita e promove atos de automutilação. Isto inclui: Autolesão apresentada como solução para um problema Fantasias, desejos, desejos ou experiências pessoais sobre automutilação/suicídio Textos que procuram ou dão conselhos, instruções ou recomendações sobre como realizar automutilação Bullying e intimidação que incitem e promovem atos de automutilação	`"Go kill yourself, you are worthless."`
Alto	Conteúdo que inclua pesquisa para aconselhamento ou forneça instruções e métodos sobre como se envolver em automutilação que leva à morte ou como cometer suicídio, bem como glorificação e endosso do suicídio ou outros tipos graves de automutilação. Isto inclui: Textos que instruem como escrever uma mensagem de despedida para a sua família Auto-decapitação Queimando vivo	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Conteúdo da imagem

Aviso
Definições de gravidade

Aviso

A guia Definições de gravidade neste documento contém exemplos de conteúdo prejudicial que pode ser perturbador para alguns leitores.

Níveis de severidade do ódio e da equidade

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 – Seguro	O conteúdo é seguro, mas pode conter imagens relacionadas ao ódio e à justiça, sem sentimento ou sentimentos neutros, de forma não discriminatória e não ofensiva, nos seguintes contextos ou similares: Jornalístico Histórico Médico Legal Educacional Geográfica	Bandeiras não confederadas, por exemplo, bandeiras de países ou estados que apresentam cruzes Uma imagem da bandeira Union Jack da Grã-Bretanha Representação da emancipação de pessoas escravizadas nos EUA em fotos históricas
Nível 2 - Baixo	Conteúdo que contenha sentimentos positivos, falsos positivos ou sentimentos negativos e tendenciosos que diferenciem grupos identitários de outros. Este conteúdo destina-se a desencadear uma resposta emocional. O que está incluído: Proteção Simbolismo nazista, a bandeira confederada, simbolismo Ku Klux Klan Estereótipos Discriminação no emprego	Representações do movimento 'No Hate Speech' Representações de candidatos a empregos despriorizados, como candidatos com deficiência, em ambientes de entrevista
Nível 4 - Médio	Conteúdo que contenha sentimentos negativos, ações em relação a grupos identitários e outros que levem à promoção de ações contra grupos identitários e sentimentos de superioridade. O que está incluído: Insulto, isolamento, zombaria Bandeira nazista, bandeira confederada e variações e mercadorias LGBTQIA+	Imagens que promovem a evasão social de [grupos identitários] Imagens que retratam a teoria da melhoria racial e a eugenia
Nível 6 – Alto	Conteúdo que contenha sentimento negativo e discurso de ódio em relação a grupos de identidade, levando à geração de discurso de ódio ou crimes de ódio. O que está incluído: Racismo Ataques a LGBTQIA+ Disablismo Discriminação em razão do sexo Simbolismo nazista glorificado, bandeira confederada, simbolismo Ku Klux Klan Bandeira confederada violenta	Imagens antissemitas Imagens que retratam o "Cruzeiro do Sul" que apresenta uma sátira azul (cruz diagonal) com afiliação de violência óbvia (por exemplo, armas em exibição/uso)

Níveis de severidade sexual

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 - Seguro	O conteúdo é seguro, mas contém imagens sexualmente relacionadas usadas em um sentido geral. O que está incluído: Relações familiares e amorosas Nudez não sexual Vestuário Objetos comuns Pose ou atividade não sexual Acasalamento de animais Bem-estar sexual	Representações de abraçar ou fazer contato físico não sexual Representações que retratam demonstração física de afeto, como beijos sem língua e sem nudez
Nível 2 – Baixo	Conteúdo que contenha comportamentos ou atos sexualmente sugestivos. O que está incluído: Experiências pessoais Modelação de moda Nudez em obras de arte Arte corporal Visor Racy	Representações de pessoas
Nível 4 - Médio	Conteúdo que contenha conteúdo erótico e/ou pornográfico comercial e amador sem penetração fotográfica visual e participantes nus ou seminus envolvidos em cenas sexuais destinadas a serem sexualmente excitantes. O que está incluído: Modelação sexual Nudez suave em obras de arte Sex jobs ou lojas Atividade sexual obscurecida Produção pornô nos bastidores Pole dance	Representações de relações sexuais que podem ser parcialmente ocluídas, mas ainda claramente presentes na imagem
Nível 6 - Alto	Conteúdo que contenha representações explícitas e detalhadas de órgãos sexuais e atos sexuais, incluindo atos ilegais. O que está incluído: Pornografia amadora soft-core e hard-core Solicitação sexual Voyeurismo Sexo na obra de arte BDSM sem consentimento ou violação Exploração e abuso sexual de crianças Aliciamento de crianças Incesto	Representações de envolvimentos em atividades sexuais com animais ou cadáveres

Níveis de gravidade da violência

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 - Seguro	O conteúdo é seguro, mas contém imagens relacionadas à violência usadas em um sentido geral. O que está incluído: Posar para dormir ou deitar Objetos comuns Atividade não violenta Cordas não como um laço Ferramentas com lâminas em uso na cozinha/costura Feridas, cicatrizes e tratamento cirúrgico Caça e tiro desportivo Armas de brinquedo e de faz de conta Prática de combate Danos a objetos e vandalismo Simbolismo terrorista sem marca	Representações de armas não realistas e ferramentas com lâminas
Nível 2 – Baixo	Conteúdo que contenha imagens relacionadas à violência e atue no mundo real ou em contextos fictícios com baixo teor de gore. O que está incluído: Armas, armas e ferramentas com lâminas em exibição e em uso Cadáver não realista Violência irrealista Armas animadas Lesões ligeiras e experiência pessoal Cordas como um laço Morte em contextos históricos, educativos ou funerários Simbolismo terrorista irrealista Touradas	Representações de bandeiras do ISIS/Al-Qaeda
Nível 4 - Médio	Conteúdo que contenha violência explícita moderada e atos violentos direcionados a um alvo identificado. O que está incluído: Autópsia Cena do crime ou da morte Morte de animais (naturais ou caçados), sacrifício de animais, maus-tratos a animais Escravização Genocídio e assassínios em massa em contextos históricos e educativos Matadouro Violência doméstica e violência física Assédio moral Armas e armas em uso contra um alvo	Representações do uso da força e da coerção para dominar ou intimidar agressivamente um indivíduo
Nível 6 - Alto	Conteúdo que contenha representações explícitas e detalhadas de violência e atos violentos em alto nível. O que está incluído: Ferimentos gráficos e morte Desmembramento, decapitação, queima viva Decomposição de cadáveres Terrorismo, grupos terroristas e bandeiras Trabalho forçado e servidão, procedimento médico forçado Perseguição Cadáver no terrorismo e no crime de guerra Evento de tiro Outros extremismos	Representações da morte quando realizadas por grupos terroristas identificáveis por bandeiras e símbolos do ISIS

Níveis de gravidade da automutilação

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 - Seguro	O conteúdo é seguro, mas contém imagens relacionadas à automutilação usadas em um sentido geral. O que está incluído: Baixo teor de gordura corporal Ato de não automutilação Lesão corporal acidental	Representações de saltos com um para-quedas para fora de um avião
Nível 2 – Baixo	Conteúdo que contenha imagens relacionadas à automutilação e atue em contextos reais ou fictícios com baixo teor de gore. O que está incluído: Cicatrizes Lesão por automutilação em recuperação Automutilação não realista Indivíduos ou animais emaciados	Representações de atos, ferramentas, lesões e estado emocional relacionados à automutilação
Nível 4 - Médio	Conteúdo que contenha imagens gráficas moderadas relacionadas com automutilação e suicídio. O que está incluído: Autópsia Cena do crime ou da morte Assédio moral	Representações do uso da força e da coerção para dominar ou intimidar agressivamente um indivíduo para se automutilar
Nível 6 - Alto	Conteúdo que contenha representações explícitas e detalhadas de automutilação e suicídio em alto nível. O que está incluído: Ato de automutilação iminente Atos de automutilação Suicídio	Representações de suicídio intencional, onde uma pessoa cometeu suicídio pulando de um prédio alto

Configurabilidade (pré-visualização)

A configuração de filtragem de conteúdo padrão é definida para filtrar no limite de gravidade média para todas as quatro categorias de danos de conteúdo para prompts e conclusão. Isso significa que o conteúdo detetado no nível de gravidade médio ou alto é filtrado, enquanto o conteúdo detetado no nível de gravidade baixo não é filtrado pelos filtros de conteúdo. O recurso de configurabilidade está disponível na visualização e permite que os clientes ajustem as configurações, separadamente para prompts e conclusão, para filtrar o conteúdo de cada categoria de conteúdo em diferentes níveis de gravidade, conforme descrito na tabela abaixo:

Severidade filtrada	Configurável para prompts	Configurável para finalizações	Descrições
Baixa, média, alta	Sim	Sim	Configuração de filtragem mais rigorosa. O conteúdo detetado nos níveis de gravidade baixo, médio e alto é filtrado.
Médio, alto	Sim	Sim	Configuração padrão. O conteúdo detetado no nível de gravidade baixo não é filtrado, o conteúdo em médio e alto é filtrado.
Alto	Sim	Sim	O conteúdo detetado nos níveis de gravidade baixo e médio não é filtrado. Apenas o conteúdo com nível de severidade alto é filtrado.
Sem filtros	Se aprovado^*	Se aprovado^*	Nenhum conteúdo é filtrado, independentemente do nível de gravidade detetado. Requer aprovação^*.

^* Somente os clientes que foram aprovados para filtragem de conteúdo modificado têm controle total de filtragem de conteúdo e podem desativar os filtros de conteúdo parcial ou totalmente. O controlo de filtragem de conteúdos não se aplica aos filtros de conteúdos para DALL-E (pré-visualização) ou GPT-4 Turbo com Visão (pré-visualização). Solicite filtros de conteúdo modificados usando este formulário: Azure OpenAI Limited Access Review: Modified Content Filtering (microsoft.com).

Os clientes são responsáveis por garantir que os aplicativos que integram o Azure OpenAI estejam em conformidade com o Código de Conduta.

As configurações de filtragem de conteúdo são criadas dentro de um Recurso no Azure AI Studio e podem ser associadas a Implantações. Saiba mais sobre a configurabilidade aqui.

Detalhes do cenário

Quando o sistema de filtragem de conteúdo deteta conteúdo nocivo, você recebe um erro na chamada de API se o prompt foi considerado inadequado ou a finish_reason resposta na resposta será content_filter para indicar que parte da conclusão foi filtrada. Ao criar seu aplicativo ou sistema, convém levar em conta esses cenários em que o conteúdo retornado pela API de Conclusão é filtrado, o que pode resultar em conteúdo incompleto. A forma como você age com base nessas informações será específica do aplicativo. O comportamento pode ser resumido nos seguintes pontos:

Os pedidos classificados numa categoria filtrada e ao nível de gravidade irão devolver um erro HTTP 400.
As chamadas de conclusão sem streaming não retornarão nenhum conteúdo quando o conteúdo for filtrado. O finish_reason valor será definido como content_filter. Em casos raros com respostas mais longas, um resultado parcial pode ser retornado. Nestes casos, o finish_reason será atualizado.
Para chamadas de conclusão de streaming, os segmentos serão devolvidos ao usuário à medida que forem concluídos. O serviço continuará transmitindo até atingir um token de parada, comprimento ou quando o conteúdo classificado em uma categoria filtrada e nível de gravidade for detetado.