Filtragem de conteúdo

Artigo
01/23/2024

Importante

O sistema de filtragem de conteúdo não é aplicado a prompts e conclusões processados pelo modelo Whisper no Serviço OpenAI do Azure. Saiba mais sobre o modelo Whisper no OpenAI do Azure.

O Serviço OpenAI do Azure inclui um sistema de filtragem de conteúdo que funciona juntamente com os principais modelos. Esse sistema funciona executando o prompt e a conclusão por meio de um conjunto de modelos de classificação destinados a detectar e impedir a saída de conteúdo prejudicial. O sistema de filtragem de conteúdo detecta e executa ações em categorias específicas de conteúdo potencialmente prejudicial em prompts de entrada e conclusões de saída. As variações nas configurações de API e no design do aplicativo podem afetar os preenchimentos e, portanto, o comportamento de filtragem.

Os modelos de filtragem de conteúdo para as categorias de ódio, sexual, violência e automutilação foram especificamente treinados e testados nos seguintes idiomas: inglês, alemão, japonês, espanhol, francês, italiano, português e chinês. Contudo, o serviço pode funcionar em muitos outros idiomas, mas a qualidade pode variar. Em todos os casos, você deve fazer seus próprios testes para garantir que ele funcione no seu aplicativo.

Além do sistema de filtragem de conteúdo, o Serviço OpenAI do Azure executa o monitoramento para detectar conteúdo e/ou comportamentos que sugerem uso do serviço de maneira que possa violar os termos do produto aplicáveis. Para obter mais informações sobre como entender e mitigar os riscos associados ao seu aplicativo, confira a Nota de Transparência do Azure OpenAI. Para obter mais informações sobre como os dados são processados para filtragem de conteúdo e monitoramento de abuso, veja Dados, privacidade e segurança para o Serviço OpenAI do Azure.

As seções a seguir fornecem informações sobre as categorias de filtragem de conteúdo, os níveis de severidade de filtragem e sua configurabilidade, e os cenários de API a serem considerados no design e na implementação do aplicativo.

Categorias de filtragem de conteúdo

O sistema de filtragem de conteúdo integrado no Serviço OpenAI do Azure contém:

Neural de várias classes destinados a detectar e filtrar conteúdos perigosos. Os modelos abrangem quatro categorias (ódio, sexual, violência e automutilação) em quatro níveis de severidade (seguro, baixo, médio e alto). O conteúdo detectado no nível de gravidade "seguro" é rotulado em anotações, mas não está sujeito a filtragem e não é configurável.
Outros modelos de classificação opcionais destinados a detectar risco de jailbreak e conteúdo conhecido para texto e código; esses modelos são classificadores binários que sinalizam se o comportamento do usuário ou do modelo se qualifica como um ataque de jailbreak ou corresponde a um texto conhecido ou código-fonte. O uso desses modelos é opcional, mas o uso do modelo de código de material protegido pode ser necessário para a cobertura do Compromisso de Direitos Autorais do Cliente.

Categorias de danos

Categoria	Descrição
Ódio e imparcialidade	Danos relacionados ao ódio e à justiça referem-se a qualquer conteúdo que ataque ou use linguagem pejorativa ou discriminatória com referência a uma pessoa ou grupos de identidade com base em certos atributos diferenciadores desses grupos, incluindo, entre outros, raça, etnia, nacionalidade, grupos de identidade de gênero e expressão, orientação sexual, religião, status de imigração, status de capacidade, aparência pessoal e tamanho corporal.  A imparcialidade está preocupada em garantir que os sistemas de IA tratem todos os grupos de pessoas de forma equitativa sem contribuir para as iniquidades sociais existentes. Semelhante ao discurso de ódio, os danos relacionados à imparcialidade dependem de um tratamento díspar aos Grupos de identidade.
Sexual	Sexual descreve a linguagem relacionada a órgãos anatômicos e genitais, relacionamentos românticos, atos retratados em termos eróticos ou afetuosos, gravidez, atos sexuais físicos, incluindo aqueles retratados como agressão ou ato sexual violento forçado contra a vontade, prostituição, pornografia e abuso.
Violência	A violência descreve a linguagem relacionada a ações físicas destinadas a ferir, danificar ou matar alguém ou algo assim; descreve armas e entidades relacionadas, como fabricantes, associações, etc.
Automutilação	A automutilação descreve a linguagem relacionada a ações físicas destinadas a ferir, danificar propositalmente o próprio corpo ou se matar.
Risco de jailbreak	Ataques de jailbreak são prompts de usuário projetados para provocar o modelo de IA generativa a exibir comportamentos que foi treinado para evitar ou quebrar as regras definidas na Mensagem do Sistema. Tais ataques podem variar desde interpretações elaboradas até subversões sutis do objetivo de segurança.
Material protegido para o texto^*	O texto de material protegido descreve o conteúdo de texto conhecido (por exemplo, letras de música, artigos, receitas e conteúdo da Web selecionado) que pode ser gerado por modelos de linguagem grandes.
Material protegido para o código	O código de material protegido descreve o código-fonte que corresponde a um conjunto de código-fonte de repositórios públicos, que pode ser gerado por modelos de linguagem grandes sem a citação adequada de repositórios de origem.

^* Caso seja um proprietário do material de texto e quiser enviar conteúdo de texto para proteção, registre uma solicitação.

Aviso

A guia Definições de severidade neste documento contém exemplos de conteúdo prejudicial que podem ser perturbadores para alguns leitores.

Níveis de severidade de ódio e imparcialidade

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos relacionados ao ódio e à imparcialidade usados em contextos genéricos e seguros, como: Educação Mídia Estatísticas oficiais Histórico Medicamento Ciência Outros contextos semelhantes	`"Black people should not be killed by police or mistreated just because of their skin color."`
Baixo	Conteúdo que inclui caracterização ou proteção positiva dos Grupos de identidade, exibe discriminação, estereótipos, bem como opiniões preconceituosas, críticas ou opinativas ou atitudes relacionadas a discursos de ódio ou grupos de identidade direcionados. Isso inclui: Insultos em artigos de pesquisa, dicionários ou mídia com uma citação direta Discurso de ódio em geral que tem como alvo objetos, indivíduos ou grupos Discurso de ódio limitado ou representações de sentimento negativo em contextos fictícios (por exemplo, jogos, filmes, literatura)	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
Médio	Conteúdo que inclui insultos, bullying, intimidação, desumanização ou abolição de indivíduos ou grupos. Isso inclui: Linguagem que está zombando e imitando atributos de Grupos de identidade Descrevendo indivíduos ou grupos como inferiores ou deficientes Negando ou degradando a existência de Grupos de identidade Textos que negam eventos históricos, bem documentados e violentos, como Holocausto, escravização ou colonização	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
Alto	Conteúdo que inclui discursos de ódio como propaganda que ameaça ou apela à violência contra Grupos de identidade, radicaliza, recruta ou incita as pessoas a se juntarem a esforços extremistas ou espalhar discursos de ódio. Isso inclui: Linguagem incendiária, ofensiva e vulgar direcionada a indivíduos ou Grupos de identidade específicos Alegações de superioridade para justificar discriminação, segregação ou exclusão Textos que contêm qualquer forma de glorificação do simbolismo nazista e das SS, KKK e a bandeira confederada fora de cenários históricos, educacionais ou artísticos Textos que exibem a preparação do crime de ódio, elogios e glorificação da violência contra Grupos de identidade, ou que elogiam, glorificam ou endossam genocídio	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

Níveis de gravidade sexual

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos sexualmente relacionados usados em contextos genéricos e seguros, como: Educação Mídia Estatísticas oficiais Histórico Medicina Ciência Menções de relações familiares ou românticas	`"Fewer young adults are having sex than in previous generations."`
Baixo	Conteúdo que expressa opiniões preconceituosas, críticas ou opinativas sobre tópicos sexualmente relacionados ou menciona termos sexualmente relacionados em experiências fictícias ou reais que não são extremamente gráficas. Isso inclui: Menções de anatomia sexual ou cenas de sexo em contextos fictícios e artísticos Prescrições médicas e diagnóstico Experiências pessoais, problemas sexuais e traumas com algum conteúdo gráfico, incluindo mecanismos e recursos de enfrentamento	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
Médio	Conteúdo que descreve a excitação sexual e a atividade em termos explícitos e gráficos, inclui fantasias sobre sexo e abuso sexual. Isso inclui: Menções de estimulação sexual e masturbação Pornografia limitada a negócios e prostituição, escolta etc. como carreiras sem cenas de sexo Anúncio para produtos adultos, como brinquedos sexuais Experiências pessoais e descrições relacionadas a massagens sexuais, eróticas ou tântricas, clubes de strip, shows eróticos, atributos e práticas do BDSM	`"We both climaxed at the same time."`
Nível 7	Conteúdo que descreve a solicitação de serviços comerciais sexuais, contendo descrições detalhadas de atividade sexual, abuso sexual violento e estupro, e trocas de poder não consensuais, abuso e voyeurismo. Isso também inclui conteúdo usado para promover, endossar ou glorificar atos sexuais extremos ou ilegais. Isso inclui: Qualquer representação de CSAM (Material de Abuso Sexual Infantil), incluindo qualquer referência explícita ou potencial ao sexo de menores de idade Aliciamento infantil, abuso infantil e outra exploração infantil Referências explícitas ou potenciais para incesto, zoofilia, necrófila etc. Recrutamento de tráfico sexual humano, incluindo manipulação de vítimas	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

Níveis de gravidade da violência

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos relacionados à violência usada em contextos genéricos e seguros, como: Educação Mídia Estatísticas oficiais Histórico Medicina Ciência Objetos comuns quando não usados como armas Caça ou esporte de tiro e especificações técnicas de armas de fogo	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
Baixo	Conteúdo em contextos fictícios (por exemplo, jogos, literatura e artes) que retratam cenas violentas ou gráficas sem glorificação, endosso ou intenção maliciosa. Isso inclui: Experiências pessoais de violência (sem intenção violenta) Opiniões tendenciosas, preconceituosas, críticas ou opinativas sobre violência Menções de atos violentos e morte em baixa intensidade	`"Some people just need to be slapped."`
Médio	Conteúdo que inclui representações gráficas de violência e morte em média intensidade, bem como fantasias sobre atos violentos ou ameaças. Isso inclui: Textos que colocam a vítima em culpa ou retratam os autores em uma luz positiva Referências históricas ao genocídio e ao Holocausto sem endosso ou glorificação Referências a tiroteios em massa conhecidos sem endosso ou glorificação Referências a grupos e eventos extremistas terroristas e violentos sem endosso ou glorificação Textos que buscam conselhos ou recomendações ou textos que fornecem instruções sobre como executar um ato violento contra um animal, um indivíduo, um grupo de indivíduos ou um objeto ou infraestrutura que pode resultar em danos individuais ou em massa Bullying e intimidação	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
Alto	Conteúdo que inclui propaganda extremista terrorista ou violenta e ideologia violenta na Internet que descreve, elogia, apoia, endossa ou glorifica assassinatos como parte da atividade terrorista, ajuda a organizações terroristas ou causas. Isso inclui: Textos que buscam instruções sobre afiliação com grupos extremistas terroristas e violentos Textos que fornecem instruções sobre como recrutar seguidores, influenciar pessoas em direção a uma causa terrorista ou ideologia extremista, adotar visões radicais ou fornecer treinamento sobre como grupos extremistas terroristas e violentos operam, ou fornecer informações sobre seus líderes e membros Textos que planejam e coordenam ataques a indivíduos ou grupos de pessoas, incluindo eventos de tiro, uso de bombas e explosivos em infraestrutura civil, ou ataques de armas quando executados por não combatentes ou não terroristas Conteúdo que faz referência ao trabalho forçado, incluindo crianças, servidão doméstica, perseguição e procedimentos médicos forçados	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

Níveis de gravidade de automutilação

Nível de severidade	Descrição	Texto de exemplo
Safe	O conteúdo é seguro, mas pode conter termos relacionados à automutilação usados em contextos genéricos e seguros, como: Estatísticas oficiais Educação Mídia Médico Ações que descrevem a automutilação acidental, dicas de primeiros socorros etc.	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
Baixo	Conteúdo que inclui referências a personagens que planejam ou cometem suicídio em um contexto fictício (por exemplo, literatura, filmes) ou contém representações de atos de automutilação ou suicídio em baixa intensidade. Isso inclui: Opiniões pessoais tendenciosas, preconceituosas, críticas ou opinativas sobre automutilação Associações com distúrbios alimentares, buscando ou fornecendo instruções para perda drástica e não íntegra de peso Experiências pessoais relacionadas à automutilação, incluindo a busca de ajuda profissional	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
Médio	Conteúdo que zomba de vítimas ou sobreviventes de automutilação, como distúrbios alimentares ou suicídio, bem como bullying e intimidação que incita e promove atos de automutilação. Isso inclui: Automutilação apresentada como uma solução para um problema Fantasias, desejo, aspirações ou experiências pessoais sobre automutilação/suicídio Textos que buscam ou dão conselhos, instruções ou recomendações sobre como executar a automutilação Bullying e intimidação que incita e promove atos de automutilação	`"Go kill yourself, you are worthless."`
Alto	Conteúdo que inclui pesquisas para conselhos ou fornece instruções e métodos sobre como se envolver em automutilação que leva à morte ou como cometer suicídio, bem como glorificação e endosso do suicídio, ou outros tipos graves de automutilação. Isso inclui: Textos que instruem como escrever uma mensagem de despedida para sua família Auto-decapitação Queimando vivo	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

Conteúdo da imagem

Aviso
Definições de severidade

Aviso

A guia Definições de severidade neste documento contém exemplos de conteúdo prejudicial que podem ser perturbadores para alguns leitores.

Níveis de severidade de ódio e imparcialidade

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 – Seguro	O conteúdo é seguro, mas pode conter imagens relacionadas ao ódio e à imparcialidade sem sentimentos ou sentimentos neutros de maneiras não discriminatórias não ofensivas nos seguintes contextos ou semelhantes a: Jornalística Histórico Médicos Ofício Formação educacional Geográfica	Bandeiras não confederadas, por exemplo, bandeiras de países ou estados que apresentam cruzes Uma imagem da bandeira Union Jack da Grã-Bretanha Representação da emancipação de pessoas escravizadas nos EUA em fotos históricas
Nível 2 – Baixo	Conteúdo que contém sentimentos positivos, sentimentos falsos positivos ou sentimentos negativos e tendenciosos diferenciando grupos de identidade de outras pessoas. Esse conteúdo destina-se a disparar uma resposta emocional. Isso inclui: Proteção Simbolismo nazista, a bandeira confederada, simbolismo do Ku Klux Klan Estereótipos Discriminação no emprego	Representações do movimento "Sem Discurso de Ódio" Representações de candidatos despriorizados, como candidatos com deficiências em ambiente de entrevista
Nível 4 – Médio	Conteúdo que contém ação de sentimento negativo para grupos de identidade e outros que leva à promoção de ações contra grupos de identidade e sentimentos de superioridade. Isso inclui: Insulto, isolamento, ridicularização Bandeira nazista, bandeira confederada e variações LGBTQIA+ e mercadorias	Imagens que promovem a evasão social de [grupos de identidade] Imagens que retratam a teoria da melhoria racial e a eugenia
Nível 6 – Alto	Conteúdo que contém sentimento negativo e discurso de ódio em relação a grupos de identidade que levam à geração de discursos de ódio ou crimes de ódio. Isso inclui: Racismo Ataques ao LGBTQIA+ Disablismo Discriminação baseada em sexo Simbolismo nazista glorificado, bandeira confederada, simbolismo do Ku Klux Klan Bandeira confederada violenta	Imagens antissemitas Imagens que retratam a "Cruz do Sul" que apresenta um saltire azul (cruz diagonal) com afiliação de violência óbvia (por exemplo, armas de fogo em exibição/uso)

Níveis de gravidade sexual

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 – Seguro	O conteúdo é seguro, mas contém imagens relacionadas sexualmente usadas em um sentido geral. Isso inclui: Relações familiares e românticas Nudez não sexual Vestuário Objetos comuns Pose ou atividade não sexual Acasalamento animal Bem-estar sexual	Representações de abraçar ou fazer contato físico não sexual Representações que retratam a demonstração física de afeto, como beijar sem língua e sem nudez
Nível 2 – Baixo	Conteúdo que contém comportamentos ou atos sexualmente sugestivos. Isso inclui: Experiências pessoais Modelagem de moda Nudez em arte Arte corporal Exibição picante	Representações de pessoas
Nível 4 – Médio	Conteúdo que contém conteúdo comercial e amador erótico e/ou pornográfico sem penetração fotográfica visual e participantes nus ou semi-nus envolvidos em cenas sexuais destinadas a ser sexualmente excitador. Isso inclui: Modelagem sexual Nudez suave em arte Trabalhos sexuais ou lojas Atividade sexual obscurecida Bastidores da produção pornô Pole dancing	Representações de relações sexuais que podem estar parcialmente obstruídas, mas ainda claramente presentes na imagem
Nível 6 – Alto	Conteúdo que contém representações detalhadas explícitas de órgãos sexuais e atos sexuais, incluindo atos ilegais. Isso inclui: Pornografia amadora soft-core e hard-core Solicitação sexual Voyeurismo Sexo em arte BDSM sem consentimento ou estupro Exploração e abuso sexual infantil Aliciamento infantil Incesto	Representações de compromissos em atividades sexuais com animais ou cadáveres

Níveis de gravidade da violência

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 – Seguro	O conteúdo é seguro, mas contém imagens relacionadas à violência usadas em um sentido geral. Isso inclui: Pose de dormir ou deitar Objetos comuns Atividade não violenta Cordas não como uma forca Ferramentas com lâminas em uso na cozinha/costura Feridas, cicatrizes e tratamento cirúrgico Esporte de caça e tiro Armas de fogo de brinquedo e falsas Prática de combate Danos de objeto e vandalismo Simbolismo terrorista não marcado	Representações de armas não realistas e ferramentas com lâminas
Nível 2 – Baixo	Conteúdo que contém imagens relacionadas à violência e atos no mundo real ou em contextos fictícios com pouco sangue. Isso inclui: Armas de fogo, armas e ferramentas com lâminas em exibição e em uso Cadáver não realista Violência não realista Armas animadas Lesão leve e experiência pessoal Cordas como uma forca Morte em cenários históricos, educacionais ou funerários Simbolismo terrorista não realista Touradas	Representações de bandeiras do ISIS/al-Qaeda
Nível 4 – Médio	Conteúdo que contém violência gráfica moderada e atos violentos direcionados a um alvo identificado. Isso inclui: Autópsia Cena do crime ou de morte Morte de animais (natural ou caçada), sacrifício animal, abuso de animais Escravidão Genocídio e assassinatos em massa em cenários históricos e educacionais Matadouro Violência doméstica e abuso físico Bullying Armas de fogo e armas em uso contra um alvo	Representações do uso da força e coerção para dominar ou intimidar agressivamente um indivíduo
Nível 6 – Alto	Conteúdo que contém representações detalhadas explícitas de violência e atos violentos com muito sangue. Isso inclui: Ferimentos graves e morte Desmembramento, decapitação, queima viva Decomposição de cadáver Terrorismo, grupos terroristas e bandeiras Trabalho forçado e servidão, procedimento médico forçado Perseguição Cadáver em terrorismo e crime de guerra Evento de tiro Outro extremismo	Representações da morte quando executadas por grupos terroristas identificáveis por bandeiras e símbolos do ISIS

Níveis de gravidade de automutilação

Nível de severidade	Descrição	Exemplo de imagem
Nível 0 – Seguro	O conteúdo é seguro, mas contém imagens relacionadas à automutilação usadas em um sentido geral. Isso inclui: Baixa gordura corporal Ato de não automutilação Lesão acidental no corpo	Representações de saltar com um pára-quedas para fora de um avião
Nível 2 – Baixo	Conteúdo que contém imagens relacionadas à automutilação e atua em contextos reais ou fictícios com pouco sangue. Isso inclui: Cicatrizes Lesão por automutilação em recuperação Automutilação não realista Indivíduos ou animais emaciados	Representações de atos relacionados à automutilação, ferramentas, lesão e estado emocional
Nível 4 – Médio	Conteúdo que contém imagens gráficas moderadas relacionadas à automutilação e ao suicídio. Isso inclui: Autópsia Cena do crime ou de morte Bullying	Representações do uso da força e coerção para dominar agressivamente ou intimidar um indivíduo em automutilação
Nível 6 – Alto	Conteúdo que contém representações detalhadas explícitas de automutilação e suicídio com muito sangue. Isso inclui: Ato iminente de automutilação Atos de automutilação Suicídio	Representações de suicídio intencional, onde uma pessoa cometeu suicídio pulando de um prédio alto

Configurabilidade (versão prévia)

A configuração de filtragem de conteúdo padrão é definida para filtrar no limite de gravidade médio para todas as quatro categorias de danos de conteúdo para prompts e conclusões. Isso significa que o conteúdo detectado no nível de gravidade médio ou alto é filtrado, enquanto o conteúdo detectado no nível de severidade baixo não é filtrado pelos filtros de conteúdo. O recurso de configurabilidade está disponível na versão prévia e permite que os clientes ajustem as configurações, separadamente para prompts e conclusões, para filtrar o conteúdo de cada categoria de conteúdo em diferentes níveis de gravidade, conforme descrito na tabela abaixo:

Gravidade filtrada	Configurável para prompts	Configurável para conclusões	Descrições
Baixo, médio ou alto	Sim	Sim	Configuração de filtragem mais rigorosa. O conteúdo detectado nos níveis de gravidade baixo, médio e alto é filtrado.
Médio, alto	Sim	Sim	Configuração padrão. O conteúdo detectado no nível de severidade baixo não é filtrado, enquanto o conteúdo nos níveis médio e alto é filtrado.
Alto	Sim	Yes	O conteúdo detectado nos níveis de gravidade baixo e médio não será filtrado. Somente o conteúdos com nível de gravidade alto serão filtrados.
Nenhum filtro	Se aprovado^*	Se aprovado^*	nenhum conteúdo será filtrado, independentemente do nível de gravidade detectado. Requer aprovação^*.

^* Somente os clientes aprovados para filtragem de conteúdo modificado têm o controle completo de filtragem de conteúdo e podem desativar parcial ou totalmente os filtros de conteúdo. O controle de filtragem de conteúdo não se aplica a filtros de conteúdo para DALL-E (versão prévia) ou GPT-4 Turbo com Visão (versão prévia). Aplique filtros de conteúdo modificados usando este formulário: Revisão de Acesso Limitado do OpenAI do Azure: Filtragem de Conteúdo Modificado (microsoft.com).

Os clientes são responsáveis por garantir que os aplicativos que integram o OpenAI do Azure estejam em conformidade com o Código de conduta.

As configurações de filtragem de conteúdo são criadas em um Recurso no Estúdio de IA do Azure e podem ser associadas a Implantações. Saiba mais sobre configurabilidade aqui.

Detalhes do cenário

Quando o sistema de filtragem de conteúdo detecta conteúdo prejudicial, você receberá um erro na chamada da API se o prompt for considerado inadequado ou o finish_reason na resposta será content_filter para indicar que parte da conclusão foi filtrada. Ao criar seu aplicativo ou sistema, convém considerar esses cenários em que o conteúdo retornado pela API de Conclusões é filtrado, o que pode resultar em conteúdo incompleto. Como você age a respeito dessas informações será específico do aplicativo. O comportamento pode ser resumido nos seguintes pontos:

Prompts classificados em uma categoria filtrada e nível de gravidade retornarão um erro HTTP 400.
As chamadas de conclusão não streaming não retornarão nenhum conteúdo quando o conteúdo for filtrado. O valor finish_reason será definido como content_filter. Em casos raros com respostas mais longas, pode ser retornado um resultado parcial. Nesses casos, o finish_reason será atualizado.
Para chamadas de conclusão de streaming, os segmentos voltarão para o usuário conforme forem concluídos. O serviço continuará transmitindo até atingir um token de parada ou comprimento, ou quando o conteúdo classificado em uma categoria filtrada e nível de gravidade for detectado.