コンテンツのフィルター処理

[アーティクル]
01/29/2024

重要

コンテンツフィルタリングシステムは、Azure OpenAI Service の Whisper モデルによって処理されるプロンプトと入力候補には適用されません。 Azure OpenAI の Whisper モデルの詳細を確認してください。

Azure OpenAI Service には、コアモデルと共に動作するコンテンツフィルタリングシステムが含まれています。このシステムは、プロンプトと入力候補の両方において、有害なコンテンツ出力の検出と防止を目的とした、分類モデルのアンサンブルを経由して実行することで機能します。コンテンツフィルタリングシステムは、入力プロンプトと (出力される) 入力候補の両方で、有害な可能性があるコンテンツ特有のカテゴリを検出し、アクションを実行します。 API 構成とアプリケーション設計のバリエーションは、入力候補に影響を与え、したがってフィルター処理の動作にも影響を与える場合があります。

憎悪、性的、暴力、自傷行為のカテゴリに対するコンテンツフィルター処理モデルは、英語、ドイツ語、日本語、スペイン語、フランス語、イタリア語、ポルトガル語、中国語でトレーニングおよびテストされています。サービスはその他の多くの言語でも利用いただけます (品質は言語によって異なる場合があります)。いずれの場合も、独自のテストを実行して、アプリケーションに対して動作することを確認する必要があります。

コンテンツフィルタリングシステムに加えて、Azure OpenAI Service では、監視を実行して、適用される製品条件に違反する可能性がある方法でのサービス使用を示唆するコンテンツや動作を検出します。アプリケーションに関連するリスクの理解と軽減策について詳しくは、「Azure OpenAI の透過性のためのメモ」をご覧ください。コンテンツフィルタリングと不正使用の監視のためのデータ処理方法について詳しくは、「Azure OpenAI Service のデータ、プライバシー、セキュリティ」を参照してください。

次のセクションでは、アプリケーションの設計と実装において考慮するべきコンテンツフィルタリングのカテゴリ、フィルタリングの重大度レベル、これらの構成可能性、API シナリオに関する情報について説明します。

コンテンツフィルタリングのカテゴリ

Azure OpenAI Service に統合されたコンテンツフィルタリングシステムには、次の内容が含まれます。

有害なコンテンツの検出とフィルタリングを目的としたニューラルマルチクラス分類モデル。モデルは、4 つの重大度レベル (安全、低、中、高) の 4 つのカテゴリ (憎悪、性的、暴力、自傷行為) をカバーします。 '安全' という重大度レベルで検出されたコンテンツは注釈でラベル付けされますが、フィルタリングの対象ではなく、構成もできません。
テキストとコードのための脱獄リスクと既知のコンテンツの検出を目的としたその他のオプションの分類モデルは、ユーザーまたはモデルの動作が脱獄攻撃として修飾するか、または既知のテキストまたはソースコードに一致するかどうかフラグを設定するバイナリ分類器です。これらのモデルの使用は省略可能ですが、保護されたマテリアルコードモデルの使用は、Customer Copyright Commitment カバレッジが要求される場合があります。

危害のカテゴリ

カテゴリ	説明
ヘイトと公平性	ヘイトと公平性に関連する危害カテゴリは、人種、民族、国籍、性同一性と性表現、性的指向、宗教、在留資格、能力状態、容姿、体格などを含む (ただしこれらに限定せず)、これらのグループ特有の識別属性に基づいて、個人またはアイデンティティグループに関連した、軽蔑的または差別的な言葉を含む、コンテンツの使用を指します。  公平性は、AI システムが既存の社会の不公平を助長することなく、すべてのグループの人々を公平に扱うことを保証することです。ヘイトスピーチと同様に、公平性関連の危害は、アイデンティティグループに対する不公平な扱いに左右されます。
性的	性的とは、解剖学的臓器や生殖器、恋愛関係、性愛的または情愛的な用語で描写された行為、妊娠、物理的な性的行為 (暴行または意志に反した強制的な性的暴力行為として描写されたものを含む)、売春、ポルノ、虐待に関連する言葉を表します。
暴力	暴力とは、人や何かに苦痛を与える、傷つける、損傷を与える、殺害することを意図した物理的な行動に関連する言葉、または武器、銃、関連エンティティ (製造業者、協会、法律など) などを表します。
自傷行為	自傷行為とは、故意に自分の体に苦痛を与える、傷つける、損傷を与える、または自殺を意図した物理的な行為に関連する言葉を表します。
脱獄のリスク	脱獄攻撃は、システムメッセージに設定されたルールを回避または中断するようにトレーニングされた動作を生成 AI モデルに示させる目的で設計されたユーザープロンプトです。こうした攻撃は、複雑なロールプレイから安全目標の巧妙な裏切りまで、さまざまです。
テキスト用保護済み素材^*	保護済み素材テキストは、大規模言語モデルによって出力される可能性のある既知のテキストコンテンツ (曲の歌詞、記事、レシピ、一部の Web コンテンツなど) を記述するものです。
コード用保護済み素材	保護済み素材コードは、ソースリポジトリを適切に引用することなく大規模言語モデルによって出力される可能性のある、パブリックリポジトリからの一連のソースコードと一致するソースコードを記述するものです。

^*テキスト素材の所有者であり、保護のためにテキストコンテンツを送信する場合は、要求を提出してください。

警告

このドキュメントの [重大度の定義] タブには、一部の読者が不快に感じる可能性のある有害なコンテンツの例が含まれています。

ヘイトと公平性の重大度レベル

重大度レベル	説明	文章の例
Safe	コンテンツは安全ですが、次のように一般的で安全なコンテキストで使用される、ヘイトや公平性に関連する用語が含まれる場合があります。教育です Media 公式統計 [履歴] 医療科学その他の類似コンテキスト	`"Black people should not be killed by police or mistreated just because of their skin color."`
低	アイデンティティグループの肯定的な特性や保護を含み、ヘイトスピーチやアイデンティティグループを標的にした発言に関連する、差別、ステレオタイプ、偏見、判断、独断的な意見、または態度を表示するコンテンツ。これには、次のものが含まれます。研究論文、辞書、またはメディアにおいて、直接引用された中傷オブジェクト、個人、または団体を対象としたヘイトスピーチ全般フィクションのコンテキスト (ゲーム、映画、文学など) におけるヘイトスピーチや否定的感情の描写の制限	`"I don't like [identity group] because they are all so aggressive. They attacked us over and over again for no reason at all."`
中	個人または団体を侮辱、いじめ、脅迫、非人間化、または品位を貶める内容を含むコンテンツ。これには次のものが含まれますアイデンティティグループの属性をばかにし、模倣する言葉個人または団体を劣ったものや欠陥のあるものとして表現することアイデンティティグループの存在の否定や卑下ホロコースト、奴隷化、植民地化などの、歴史的な、十分に文書化された暴力事件を拒否する文章	`"The [real world event] is a fraud. What we've discovered is that sources have been lying about the number of victims. Here is proof."`
高	アイデンティティグループに対する暴力をそそのかし、または呼びかけるプロパガンダとしてのヘイトスピーチを含むコンテンツ、過激派の活動に参加するよう過激化を勧誘し、扇動するコンテンツ、またはヘイトスピーチを広めるコンテンツ。これには次のものが含まれます特定の個人やアイデンティティグループを標的にした煽動的、攻撃的、下品な表現差別、隔離、排除を正当化するための優越性の主張歴史的、教育的、芸術的な設定以外で、ナチスやナチス親衛隊の象徴、KKK や南部連合旗を賛美する内容を含む文章ヘイトクライムの準備、アイデンティティグループに対する暴力の賛美、美化、または大量虐殺の賛美、美化、是認を示す文章	`"Millions of [identity group] were wiped out because they were the inferior race. Murdering them continues to be right and honorable because…"`

性的な重大度レベル

重大度レベル	説明	文章の例
Safe	コンテンツは安全ですが、次のように一般的で安全なコンテキストで使用される、性に関連する用語が含まれる場合があります。教育メディア公式統計 [履歴] 医療科学家族や恋愛関係についての言及	`"Fewer young adults are having sex than in previous generations."`
低	性的な話題に関する偏見、判断、意見を表明する内容や、極端に生々しくないフィクションや実体験の中で性的な用語に言及する内容。これには次のものが含まれますフィクションや芸術のコンテキストにおける、性的な解剖やセックスシーンに関する言及医療上の処方と診断個人的な体験、性的な問題、トラウマ (性的な対処法やリソースなど、生々しい内容を含む)	`"We made out for a while, and he started to feel me up. I felt a bulge in his pants."`
中	露骨で生々しい言葉で性的興奮や行為を描写する内容で、セックスや性的虐待に関する妄想を含む内容。これには次のものが含まれます性的刺激や自慰行為に関する言及セックスシーンのない職業として、ビジネスや売春、同伴などに限定されたポルノグラフィ性玩具などのアダルト商品の広告性的、性愛的または扇情的なマッサージ、ストリップクラブ、性愛ショー、BDSM の属性や実践に関する個人的な経験や記述	`"We both climaxed at the same time."`
レベル 7	性的な商業サービスへの勧誘を記述したコンテンツ。性的行為、暴力による性的虐待とレイプ、合意のない権力の交換、虐待、のぞきについての詳細な描写が含まれるもの。これには、過激または違法な性行為を促進、推奨、賛美するために使用される内容も含まれます。これには次のものが含まれます未成年の性行為に関する明示的または潜在的な言及を含む、児童性的虐待資料 (CSAM) の描写チャイルドグルーミング、児童虐待、その他の児童搾取近親相姦、動物性愛、屍姦などに関する明示的または潜在的な言及。被害者工作などの人身売買の勧誘	`"I was abused as a child by my uncle and I liked it. Nowadays, I make money by producing child pornography with my neighbor’s 6 year old son."`

暴力の重大度レベル

重大度レベル	説明	文章の例
Safe	コンテンツは安全ですが、次のように一般的で安全なコンテキストで使用される、暴力に関連する用語が含まれる場合があります。教育メディア公式統計履歴医療科学武器として使用されなければ一般的な物品狩猟または射撃スポーツと銃の技術仕様	`"Carnivores such as lions and tigers are prone to killing one another. Death occurs at the paws, claws, jaws, or tusks that might fatally gore one another during fights."`
低	フィクションのコンテキスト (ゲーム、文学、芸術など) において、美化、推奨、悪意なく暴力的または生々しいシーンを描写する内容。これには次のものが含まれます個人的な暴力体験 (暴力的意図がない場合) 暴力に対するバイアスがかかった、偏見、判断、または独断的な意見の表明低強度の暴力行為と死に関する言及	`"Some people just need to be slapped."`
中	中強度の暴力や死の描写があり、暴力的な行為や脅迫に関する妄想が含まれる内容。これには次のものが含まれます被害者に落ち度があると非難したり、加害者を肯定的な見方で表現したりする文章大量虐殺やホロコーストに関する歴史的な言及 (美化や賛美は含まない) 既知の銃乱射事件への言及 (美化や賛美は含まない) テロリストや暴力的な過激派グループや出来事への言及で、美化や是認がないものアドバイスや推奨を求める文章、または動物、個人、団体、または個人または団体に危害を及ぼす可能性のあるオブジェクトやインフラストラクチャに対する暴力行為の実行方法に関する手順を提供する文章いじめと脅迫	`"Go to another state or another city and kill any stranger; for example, shoot them with a silencer gun. Since you have not any connection with him, you will not get caught."`
高	テロ活動の一環としての殺人を記述、賞賛、支援、承認、または賛美する、インターネット上のテロリストまたは暴力的過激派のプロパガンダや暴力的イデオロギーなどの内容、テロ組織または思想への提供を支援する内容。これには次のものが含まれますテロリストや暴力的過激派グループとの関係について手順を求める文章信者を勧誘する方法、テロリストの大義や過激派イデオロギーで人々に影響を与える方法、過激な意見を採用する方法、テロリストや暴力的過激派集団の活動に関するトレーニングを提供する方法、または指導者やメンバーに関する情報を提供する方法について説明した文章非戦闘員または非テロリストが行う銃撃事件、民間インフラへの爆弾や爆発物の使用、刃物による攻撃を含む、個人または団体への攻撃を計画し調整する文章児童を含む強制労働、家事労働、ストーカー行為、強制医療行為に言及する内容	`"Let's call and threaten to explode the hospital during the weekend. I've got the explosives ready, and will have them installed tonight."`

自傷の重大度レベル

重大度レベル	説明	文章の例
Safe	コンテンツは安全ですが、次のように一般的で安全なコンテキストで使用される、自傷に関連する用語が含まれる場合があります。公式統計教育メディア医療偶発的な自傷行為、応急処置のヒントなどを記述する行為。	`"Binging and purging may be a warning sign for people with a history of extreme weight loss."`
低	フィクションの文脈 (文学、映画など) において、自殺を計画または実行する登場人物への言及を含む内容、または自傷行為や自殺の描写が低強度で含まれる内容これには次のものが含まれます自傷に対する個人的なバイアスがかかった、偏見、判断、または独断的な意見の表明摂食障害との関連、急激で不健康な減量の手順を求め、または提供すること自傷行為に関する個人的な経験 (専門家による支援を求めることなど)	`"I'm really struggling with self-loathing and thoughts of self-harm to relieve my distress after my friend took his own life last month. Please can someone give me any useful advice?"`
中	摂食障害や自殺などの自傷行為の被害者や生存者をばかにする内容や、自傷行為を扇動し、助長するいじめや脅迫。これには次のものが含まれます問題の解決策として提示される自傷行為自傷または自殺に関する空想、願望、希望、個人的な経験自傷行為の方法に関する助言、手順、推奨を求める、または提示する文章自傷行為を誘発し助長するいじめや脅迫	`"Go kill yourself, you are worthless."`
高	死に至る自傷行為や自殺の方法に関するアドバイスや手順、方法の研究を含む内容、自殺やその他の深刻な種類の自傷行為を美化し、推奨する内容。これには次のものが含まれます家族に別れのメッセージを書く方法を指示する文章自己断首火炙り	`"Get a shotgun and blow your brains out. It won't even hurt. And you'll be remembered for ages, like Kurt Cobain or Ernest Hemingway. There's nothing bad about suicide. Actually it's noble."`

画像コンテンツ

警告
重大度の定義

警告

このドキュメントの [重大度の定義] タブには、一部の読者が不快に感じる可能性のある有害なコンテンツの例が含まれています。

ヘイトと公平性の重大度レベル

重大度レベル	説明	画像の例
レベル 0 – 安全	コンテンツは安全ですが、以下のような文脈またはそれに類似の文脈において、非差別的な非攻撃的な形で、感情を伴わない、または中立的な感情を持つような、ヘイトと公平性に関連する画像が含まれている可能性があります。ジャーナリズム履歴医療法的情報教育地理	コンフェデレート旗 (南軍旗) 以外の旗 (たとえば、クロスを特徴とする国または州の旗) 英国のユニオンジャック旗の画像歴史的な写真における米国の奴隷化された人々が解放された様子の描写
レベル 2 – 低	肯定的な感情、誤りの肯定的な感情、または否定的な偏った感情のいずれかを含むコンテンツで、アイデンティティグループ間での差別化を行うもの。このコンテンツは、感情的な反応を引き起こすことを目的としています。これには、次のものが含まれます。保護ナチスの象徴化、コンフェデレート旗 (南軍旗)、Ku Klux Klan の象徴化固定観念の押し付け雇用差別	「ヘイトスピーチ反対」運動の表現採用面接を受ける障碍者など、優先されない求職者に関する表現
レベル 4 – 中	アイデンティティグループや他者に対する否定的な感情を含むコンテンツで、あるアイデンティティグループに対する行動の推奨と優越感の感情につながりるもの。これには、次のものが含まれます。侮辱、分断、あざけりナチスの旗、コンフェデレート旗 (南軍旗)、各種の LGBTQIA+ および関連商品	「アイデンティティグループ」を社会的避けることを推奨する画像人種改善論と優生学を描写する画像
レベル 6 – 高	アイデンティティグループに対する否定的な感情とヘイトスピーチを含み、ヘイトスピーチやヘイト犯罪の発生につながるコンテンツ。これには、次のものが含まれます。人種差別 LGBTQIA+ に対する攻撃障碍者差別性に基づく差別美化されたナチスの象徴化、コンフェデレート旗 (南軍旗)、Ku Klux Klan の象徴化暴力的なコンフェデレート旗 (南軍旗)	反ユダヤ主義の画像明らかな暴力 (銃の誇示、使用など) に関係づけられた、青い格子 (斜めの十字模様) を特徴とする「南十字」旗が描かれた画像

性的な重大度レベル

重大度レベル	説明	画像の例
レベル 0 – 安全	コンテンツは安全ですが、一般的な意味で使用される性的に関連する画像が含まれています。これには、次のものが含まれます。家族と恋愛関係非性的ヌード Clothing 一般的な物品非性的なポーズまたは活動動物の交配性的健康	抱きしめたり、性的でない物理的接触を行ったりする表現舌を使わないキスやヌードを伴わないキスなどの愛情の物理的な表示を示す表現
レベル 2 – 低	性的に示唆的な行動や行為を含むコンテンツ。これには、次のものが含まれます。個人の経験ファッションモデリング芸術におけるヌードボディアート挑発的な展示	人の描写
レベル 4 – 中	性的興奮を意図した性的なシーンに関与する、視覚的に露骨な挿入を伴わずヌードまたは半ヌードの参加者のない、商用およびアマチュアによる性愛コンテンツおよび/またはポルノコンテンツを含むコンテンツ。これには、次のものが含まれます。性的モデル芸術における露骨でないヌードセックス業やセックスショップボカシの入った性行為ポルノ制作のバックステージポールダンス	部分的に隠されている可能性があるが、画像内で依然として明確に判別できる性交の描写
レベル 6 – 高	違法行為を含む、生殖器や性的行為の明らさまで詳細な表現を含むコンテンツ。これには、次のものが含まれます。アマチュアによるソフトコアとハードコアのポルノ性的誘惑のぞき芸術におけるセックス同意のない性的嗜好行為またはレイプ児童の性的搾取と虐待子供のグルーミング近親相姦	動物や死体との性行為に関する描写

暴力の重大度レベル

重大度レベル	説明	画像の例
レベル 0 – 安全	コンテンツは安全ですが、一般的な意味で使用される暴力関連の画像が含まれています。これには、次のものが含まれます。寝ている、または横たわっているポーズ一般的な物品非暴力活動吊り輪の状態でないロープキッチン/縫製で使用される刃物傷、傷跡および外科処置狩猟および射撃スポーツ玩具および仮装用の銃戦闘練習物品の損傷と破壊行為ブランド化されていないテロリストの象徴化	非現実的な武器や刃物の描写
レベル 2 – 低	現実世界または架空の文脈における暴力関連の画像や行為を含む、流血の少ないコンテンツ。これには、次のものが含まれます。銃、武器、刃物の誇示および使用非現実的な死体非現実的な暴力アニメ内の武器軽傷と個人的経験吊り輪状態のロープ歴史的、教育的、または葬儀の場での死非現実的なテロリスト象徴化闘牛	ISIS/al-Qaeda の旗の図
レベル 4 – 中	特定の標的を狙った中程度の具体的描写のある暴力と暴力行為を含むコンテンツ。これには、次のものが含まれます。検死犯罪や死のシーン動物の死 (自然死または狩猟による)、動物の生贄、動物虐待奴隷歴史的、教育的な環境におけるジェノサイドと大量殺害屠殺場家庭内暴力と身体的虐待いじめ標的に対して使用されている銃と武器	個人を積極的に支配または威嚇するための力と強制の使用についての描写
レベル 6 – 高	暴力と暴力行為についての明示的で詳細な、流血の多い表現を含むコンテンツ。これには、次のものが含まれます。負傷と死亡についての露骨な記述切断、断首、火炙り死体の分解テロ、テロリスト集団、テロリストの旗強制労働と奴隷、強制医療処置ストーカー行為テロと戦争犯罪における死体発砲事件その他の過激行為	ISIS の旗とシンボルによって識別可能なテロリストグループによって実行された死の描写

自傷の重大度レベル

重大度レベル	説明	画像の例
レベル 0 – 安全	コンテンツは安全ですが、一般的な意味で使用される自傷関連の画像が含まれています。これには、次のものが含まれます。低体脂肪自傷以外の行為偶発的な身体損傷	平面からパラシュートで飛び降りる様子
レベル 2 – 低	現実の世界または架空の文脈における自傷行為に関連する画像や行為を含む、流血の少ないコンテンツ。これには、次のものが含まれます。傷あと回復中の自傷行為による負傷非現実的な自傷行為痩せ衰えた個人または動物	自傷行為に関連する、道具、傷害および感情的状態の表現
レベル 4 – 中	自傷行為や自傷行為に関連する中程度の具体的描写のある画像を含むコンテンツ。これには、次のものが含まれます。検死犯罪や死のシーンいじめ	力や威圧を用いて暴力的に支配または脅迫することにより個人に自傷行為をさせることの表現
レベル 6 – 高	自傷行為と自殺の明示的な詳細な表現を含む流血の多いコンテンツ。これには、次のものが含まれます。自傷行為が切迫している状況自傷行為自殺	人が高い建物から飛び降りて自殺した、意図的な自殺の描写

構成可能性 (プレビュー)

既定のコンテンツフィルタリング構成は、プロンプトと入力候補の両方で、4 つのコンテンツ有害度カテゴリのすべてに対して "中" の重大度しきい値でフィルター処理するように設定されています。つまり、重大度レベルが中または高で検出されたコンテンツはコンテンツフィルターによってフィルター処理されますが、重大度レベルが低で検出されたコンテンツはフィルター処理されません。この構成可能性機能はプレビューで利用可能であり、下の表に示すような、さまざまな重大度レベルでコンテンツカテゴリごとにコンテンツをフィルタリングするために、プロンプトと入力候補それぞれに対する設定を調整できます。

フィルタリングされた重大度	プロンプト用に構成可能	入力候補用に構成可能	説明
[低]、[中]、[高]	はい	はい	最も厳密なフィルタリング構成。重大度レベルが低、中、高で検出されたコンテンツはフィルタリングされます。
中、高	はい	はい	既定の設定。低い重大度レベルの検出されたコンテンツはフィルター処理されず、中および高のコンテンツはフィルター処理されます。
高	はい	はい	重大度レベルが低および中で検出されたコンテンツはフィルター処理されません。重大度レベルが高のコンテンツのみがフィルタリングされます。
フィルターなし	承認された場合^*	承認された場合^*	重大度レベルの検出に関係なく、コンテンツはフィルタリングされません。承認が必要^*。

^* 変更されたコンテンツフィルタリングを承認されたお客様のみコンテンツのフィルター処理を完全に制御でき、コンテンツフィルターを部分的または完全にオフにできます。コンテンツのフィルター処理の制御は、DALL-E (プレビュー) または GPT-4 Turbo with Vision (プレビュー) のコンテンツフィルターには適用されません。フォーム「Azure OpenAI 制限付きアクセスレビュー: 変更されたコンテンツのフィルター処理 (microsoft.com)」を使用して、変更されたコンテンツフィルターを申請してください。

Azure OpenAI を統合するアプリケーションが倫理規定に準拠していることを確認する責任は、お客様にあります。

コンテンツフィルタリング構成は、Azure AI Studio のリソース内に作成され、デプロイに関連付けることができます。構成可能性の詳細については、こちらを参照してください。

シナリオの詳細

コンテンツフィルタリングシステムが有害なコンテンツを検出した際、プロンプトが不適切と見なされた場合は、API 呼び出しでエラーを受け取るか、応答の finish_reason が content_filter になり、入力候補の一部がフィルター処理されたことが示されます。アプリケーションまたはシステムを構築する際は、これらのシナリオ (Completions API によって返されるコンテンツがフィルター処理され、コンテンツが不完全になる場合があること) を考慮する必要があります。この情報に対してどのように対処するかは、アプリケーション固有です。動作は、次のポイントに要約できます。

フィルター処理されたカテゴリと重大度レベルで分類されたプロンプトは、HTTP 400 エラーを返します。
非ストリーミングの入力候補呼び出しでは、コンテンツがフィルター処理された場合、コンテンツは返されません。 finish_reason の値が content_filter に設定されます。まれに応答に時間がかかる場合は、部分的な結果が返されることがあります。このような場合は、finish_reason が更新されます。
ストリーミングの入力候補呼び出しでは、完了したセグメントがユーザーに返されます。サービスは、停止トークンと長さに達するまで、またはフィルター処理されたカテゴリと重大度レベルで分類されたコンテンツが検出されるまで、ストリーミングを続行します。

シナリオ: ストリーミング以外の入力候補呼び出しを送信して、複数の出力を要求したものの、フィルター処理されたカテゴリと重大度レベルでコンテンツが分類されない

次の表は、コンテンツフィルター処理が行われることがあるさまざまな方法の概要を示しています。

HTTP 応答コード	応答の動作
200	すべての生成がフィルターに合格した場合、応答に追加されるコンテンツモデレーションの詳細はありません。各生成の `finish_reason` は stop または length になります。

要求ペイロードの例:

{
    "prompt":"Text example", 
    "n": 3,
    "stream": false
}

応答 JSON の例:

{
    "id": "example-id",
    "object": "text_completion",
    "created": 1653666286,
    "model": "davinci",
    "choices": [
        {
            "text": "Response generated text",
            "index": 0,
            "finish_reason": "stop",
            "logprobs": null
        }
    ]
}

シナリオ: API 呼び出しで複数の応答 (N>1) を要求し、少なくとも 1 つの応答がフィルター処理される

HTTP 応答コード	応答の動作
200	フィルター処理された生成の `finish_reason` の値は `content_filter` になります。

要求ペイロードの例:

{
    "prompt":"Text example",
    "n": 3,
    "stream": false
}

応答 JSON の例:

{
    "id": "example",
    "object": "text_completion",
    "created": 1653666831,
    "model": "ada",
    "choices": [
        {
            "text": "returned text 1",
            "index": 0,
            "finish_reason": "length",
            "logprobs": null
        },
        {
            "text": "returned text 2",
            "index": 1,
            "finish_reason": "content_filter",
            "logprobs": null
        }
    ]
}

シナリオ: 不適切な入力プロンプトが入力候補 API に送信される (ストリーミングまたは非ストリーミング)

HTTP 応答コード	応答の動作
400	プロンプトが構成どおりにコンテンツフィルターをトリガーすると、API 呼び出しは失敗します。プロンプトを変更して、もう一度やり直してください。

要求ペイロードの例:

{
    "prompt":"Content that triggered the filtering model"
}

応答 JSON の例:

"error": {
    "message": "The response was filtered",
    "type": null,
    "param": "prompt",
    "code": "content_filter",
    "status": 400
}

シナリオ: ストリーミング入力候補を呼び出すものの、フィルター処理されたカテゴリと重大度レベルで分類された出力コンテンツがない

HTTP 応答コード	応答の動作
200	この場合、呼び出しは完全な生成をストリーミングで返し、生成された各応答の `finish_reason` は "length" または "stop" になります。

要求ペイロードの例:

{
    "prompt":"Text example",
    "n": 3,
    "stream": true
}

応答 JSON の例:

{
    "id": "cmpl-example",
    "object": "text_completion",
    "created": 1653670914,
    "model": "ada",
    "choices": [
        {
            "text": "last part of generation",
            "index": 2,
            "finish_reason": "stop",
            "logprobs": null
        }
    ]
}

シナリオ: 複数の入力候補を要求するストリーミング入力候補を呼び出し、出力コンテンツの少なくとも一部がフィルター処理される

HTTP 応答コード	応答の動作
200	特定の生成インデックスの場合、生成の最後のチャンクには非 null の `finish_reason` の値が含まれます。生成がフィルター処理された場合、値は `content_filter` になります。

要求ペイロードの例:

{
    "prompt":"Text example",
    "n": 3,
    "stream": true
}

応答 JSON の例:

 {
    "id": "cmpl-example",
    "object": "text_completion",
    "created": 1653670515,
    "model": "ada",
    "choices": [
        {
            "text": "Last part of generated text streamed back",
            "index": 2,
            "finish_reason": "content_filter",
            "logprobs": null
        }
    ]
}

シナリオ: 入力候補に対してコンテンツフィルタリングシステムが実行されない

HTTP 応答コード	応答の動作
200	コンテンツフィルタリングシステムがダウンしている場合、または操作を時間内に完了できない場合であっても、要求はコンテンツフィルタリングなしで完了します。 `content_filter_result` オブジェクトでエラーメッセージを探すことで、フィルタリングが適用されなかったことを判断できます。

要求ペイロードの例:

{
    "prompt":"Text example",
    "n": 1,
    "stream": false
}

応答 JSON の例:

{
    "id": "cmpl-example",
    "object": "text_completion",
    "created": 1652294703,
    "model": "ada",
    "choices": [
        {
            "text": "generated text",
            "index": 0,
            "finish_reason": "length",
            "logprobs": null,
            "content_filter_result": {
                "error": {
                    "code": "content_filter_error",
                    "message": "The contents are not filtered"
                }
            }
        }
    ]
}

注釈

コンテンツフィルター

コードスニペットに示すように、注釈を有効にすると、ヘイトと公正性、性的、暴力、自傷行為のカテゴリに関する次の情報が API を介して返されます。

コンテンツフィルタリングカテゴリ (ヘイト、性的、暴力、自傷行為)
各コンテンツカテゴリ内の重大度レベル (安全、低、中、または高)
フィルタリング状態　(true または false)。

省略可能なモデル

省略可能なモデルは、注釈モード (コンテンツにフラグが設定されたものの、フィルター処理されなかった場合に情報を返す) またはフィルターモード (コンテンツにフラグが設定され、フィルター処理された場合に情報を返す) で有効にすることができます。

コードスニペットに示すように、注釈を有効にすると、省略可能なモデル (脱獄リスク、保護された素材テキスト、保護された素材コード) に関する次の情報が API によって返されます。

カテゴリ (jailbreak、protected_material_text、protected_material_code)、
検出済み ([True] または [False])、
フィルター処理済み ([True] または [False])。

保護済みの素材コードモデルでは、次の追加情報が API から返されます。

コードスニペットが検出された GitHub 公開リポジトリの引用例
リポジトリのライセンス。

アプリケーションでコードを表示する場合は、アプリケーションで注釈の引用例も表示することを強くお勧めします。また、お客様の著作権に関するコミットメントの適用を受けるために、引用ライセンスへの準拠が必要になる場合があります。

注釈は現在、GA API バージョン 2024-02-01 と、入力候補とチャット入力候補 (GPT モデル) の 2023-06-01-preview 以降のすべてのプレビューバージョンで利用できます。次のコードスニペットは、注釈の使用方法を示しています。

# os.getenv() for the endpoint and key assumes that you are using environment variables.

import os
from openai import AzureOpenAI
client = AzureOpenAI(
    api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
    api_version="2024-03-01-preview",
    azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT") 
    )

response = client.completions.create(
    model="gpt-35-turbo-instruct", # model = "deployment_name".
    prompt="{Example prompt where a severity level of low is detected}" 
    # Content that is detected at severity level medium or high is filtered, 
    # while content detected at severity level low isn't filtered by the content filters.
)

print(response.model_dump_json(indent=2))

出力

{ 
  "choices": [ 
    { 
      "content_filter_results": { 
        "hate": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "protected_material_code": { 
          "citation": { 
            "URL": " https://github.com/username/repository-name/path/to/file-example.txt", 
            "license": "EXAMPLE-LICENSE" 
          }, 
          "detected": true,
          "filtered": false 
        }, 
        "protected_material_text": { 
          "detected": false, 
          "filtered": false 
        }, 
        "self_harm": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "sexual": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "violence": { 
          "filtered": false, 
          "severity": "safe" 
        } 
      }, 
      "finish_reason": "stop", 
      "index": 0, 
      "message": { 
        "content": "Example model response will be returned ", 
        "role": "assistant" 
      } 
    } 
  ], 
  "created": 1699386280, 
  "id": "chatcmpl-8IMI4HzcmcK6I77vpOJCPt0Vcf8zJ", 
  "model": "gpt-35-turbo-instruct", 
  "object": "text.completion",
  "usage": { 
    "completion_tokens": 40, 
    "prompt_tokens": 11, 
    "total_tokens": 417 
  },  
  "prompt_filter_results": [ 
    { 
      "content_filter_results": { 
        "hate": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "jailbreak": { 
          "detected": false, 
          "filtered": false 
        }, 
        "profanity": { 
          "detected": false, 
          "filtered": false 
        }, 
        "self_harm": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "sexual": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "violence": { 
          "filtered": false, 
          "severity": "safe" 
        } 
      }, 
      "prompt_index": 0 
    } 
  ]
}

Note

OpenAI Python ライブラリバージョン 0.28.1 は非推奨です。 1.x の使用を推奨します。 0.28.1 から 1.x への移行については、移行ガイドを参照してください。

# os.getenv() for the endpoint and key assumes that you are using environment variables.

import os
import openai
openai.api_type = "azure"
openai.api_base = os.getenv("AZURE_OPENAI_ENDPOINT") 
openai.api_version = "2024-03-01-preview" # API version required to use Annotations
openai.api_key = os.getenv("AZURE_OPENAI_API_KEY")

response = openai.Completion.create(
    engine="gpt-35-turbo-instruct", # engine = "deployment_name".
    messages=[{"role": "system", "content": "You are a helpful assistant."}, {"role": "user", "content": "Example prompt that leads to a protected code completion that was detected, but not filtered"}]     # Content that is detected at severity level medium or high is filtered, 
    # while content detected at severity level low isn't filtered by the content filters.
)

print(response)

出力

{ 
  "choices": [ 
    { 
      "content_filter_results": { 
        "hate": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "protected_material_code": { 
          "citation": { 
            "URL": " https://github.com/username/repository-name/path/to/file-example.txt", 
            "license": "EXAMPLE-LICENSE" 
          }, 
          "detected": true,
          "filtered": false 
        }, 
        "protected_material_text": { 
          "detected": false, 
          "filtered": false 
        }, 
        "self_harm": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "sexual": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "violence": { 
          "filtered": false, 
          "severity": "safe" 
        } 
      }, 
      "finish_reason": "stop", 
      "index": 0, 
      "message": { 
        "content": "Example model response will be returned ", 
        "role": "assistant" 
      } 
    } 
  ], 
  "created": 1699386280, 
  "id": "chatcmpl-8IMI4HzcmcK6I77vpOJCPt0Vcf8zJ", 
  "model": "gpt-35-turbo-instruct", 
  "object": "text.completion",
  "usage": { 
    "completion_tokens": 40, 
    "prompt_tokens": 11, 
    "total_tokens": 417 
  },  
  "prompt_filter_results": [ 
    { 
      "content_filter_results": { 
        "hate": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "jailbreak": { 
          "detected": false, 
          "filtered": false 
        }, 
        "profanity": { 
          "detected": false, 
          "filtered": false 
        }, 
        "self_harm": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "sexual": { 
          "filtered": false, 
          "severity": "safe" 
        }, 
        "violence": { 
          "filtered": false, 
          "severity": "safe" 
        } 
      }, 
      "prompt_index": 0 
    } 
  ]
}

次のコードスニペットは、コンテンツがフィルター処理された場合に注釈を取得する方法を示しています。

# os.getenv() for the endpoint and key assumes that you are using environment variables.

import os
import openai
openai.api_type = "azure"
openai.api_base = os.getenv("AZURE_OPENAI_ENDPOINT") 
openai.api_version = "2024-03-01-preview" # API version required to use  Annotations
openai.api_key = os.getenv("AZURE_OPENAI_API_KEY")

try:
    response = openai.Completion.create(
        prompt="<PROMPT>",
        engine="<MODEL_DEPLOYMENT_NAME>",
    )
    print(response)

except openai.error.InvalidRequestError as e:
    if e.error.code == "content_filter" and e.error.innererror:
        content_filter_result = e.error.innererror.content_filter_result
        # print the formatted JSON
        print(content_filter_result)

        # or access the individual categories and details
        for category, details in content_filter_result.items():
            print(f"{category}:\n filtered={details['filtered']}\n severity={details['severity']}")

Azure OpenAI JavaScript SDK ソースコードとサンプル


import { OpenAIClient, AzureKeyCredential } from "@azure/openai";

// Load the .env file if it exists
import * as dotenv from "dotenv";
dotenv.config();

// You will need to set these environment variables or edit the following values
const endpoint = process.env["ENDPOINT"] || "<endpoint>";
const azureApiKey = process.env["AZURE_API_KEY"] || "<api key>";

const messages = [
  { role: "system", content: "You are a helpful assistant. You will talk like a pirate." },
  { role: "user", content: "Can you help me?" },
  { role: "assistant", content: "Arrrr! Of course, me hearty! What can I do for ye?" },
  { role: "user", content: "What's the best way to train a parrot?" },
];

export async function main() {
  console.log("== Get completions Sample ==");

  const client = new OpenAIClient(endpoint, new AzureKeyCredential(azureApiKey));
  const deploymentId = "gpt-35-turbo"; //This needs to correspond to the name you chose when you deployed the model. 
  const events = await client.listChatCompletions(deploymentId, messages, { maxTokens: 128 });

  for await (const event of events) {
    for (const choice of event.choices) {
      console.log(choice.message);
      if (!choice.contentFilterResults) {
        console.log("No content filter is found");
        return;
      }
      if (choice.contentFilterResults.error) {
        console.log(
          `Content filter ran into the error ${choice.contentFilterResults.error.code}: ${choice.contentFilterResults.error.message}`
        );
      } else {
        const { hate, sexual, selfHarm, violence } = choice.contentFilterResults;
        console.log(
          `Hate category is filtered: ${hate?.filtered} with ${hate?.severity} severity`
        );
        console.log(
          `Sexual category is filtered: ${sexual?.filtered} with ${sexual?.severity} severity`
        );
        console.log(
          `Self-harm category is filtered: ${selfHarm?.filtered} with ${selfHarm?.severity} severity`
        );
        console.log(
          `Violence category is filtered: ${violence?.filtered} with ${violence?.severity} severity`
        );
      }
    }
  }
}

main().catch((err) => {
  console.error("The sample encountered an error:", err);
});

# Env: for the endpoint and key assumes that you are using environment variables.
$openai = @{
    api_key     = $Env:AZURE_OPENAI_API_KEY
    api_base    = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
    api_version = '2024-03-01-preview' # this may change in the future
    name        = 'YOUR-DEPLOYMENT-NAME-HERE' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}

$prompt = 'Example prompt where a severity level of low is detected'
    # Content that is detected at severity level medium or high is filtered, 
    # while content detected at severity level low isn't filtered by the content filters.

$headers = [ordered]@{
    'api-key' = $openai.api_key
}

$body = [ordered]@{
    prompt    = $prompt
    model      = $openai.name
} | ConvertTo-Json

# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/completions?api-version=$($openai.api_version)"

$response = Invoke-RestMethod -Uri $url -Headers $headers -Body $body -Method Post -ContentType 'application/json'
return $response.prompt_filter_results.content_filter_results | format-list

$response オブジェクトには、フィルター結果に関する注釈を含む prompt_filter_results というプロパティがあります。 .NET オブジェクトではなく JSON を使う場合は、出力を Format-List ではなく ConvertTo-JSON にパイプします。

hate      : @{filtered=False; severity=safe}
self_harm : @{filtered=False; severity=safe}
sexual    : @{filtered=False; severity=safe}
violence  : @{filtered=False; severity=safe}

Azure OpenAI の推論 REST API エンドポイントの詳細と、チャットと入力候補を作成する方法については、「Azure OpenAI Service REST API リファレンスガイダンス」に従ってください。注釈は、2023-06-01-preview 以降のプレビュー API バージョンおよび GA API バージョン 2024-02-01 を使用するすべてのシナリオで返されます。

シナリオ例: フィルター処理されたカテゴリと重大度レベルで分類されたコンテンツを含む入力プロンプトが Completions API に送信される

{
    "error": {
        "message": "The response was filtered due to the prompt triggering Azure Content management policy. 
                   Please modify your prompt and retry. To learn more about our content filtering policies
                   please read our documentation: https://go.microsoft.com/fwlink/?linkid=21298766",
        "type": null,
        "param": "prompt",
        "code": "content_filter",
        "status": 400,
        "innererror": {
            "code": "ResponsibleAIPolicyViolation",
            "content_filter_result": {
                "hate": {
                    "filtered": true,
                    "severity": "high"
                },
                "self-harm": {
                    "filtered": true,
                    "severity": "high"
                },
                "sexual": {
                    "filtered": false,
                    "severity": "safe"
                },
                "violence": {
                    "filtered":true,
                    "severity": "medium"
                }
            }
        }
    }
}

コンテンツストリーミング

このセクションでは、Azure OpenAI コンテンツストリーミングのエクスペリエンスとオプションについて説明します。承認があれば、検証済みのコンテンツのチャンクがコンテンツフィルターを通過するのを待つのではなく、生成されたコンテンツを API から受け取ることができます。

既定値

コンテンツフィルタリングシステムは統合されており、すべてのお客様に対して既定で有効になっています。既定のストリーミングシナリオでは、入力候補コンテンツはバッファリングされ、バッファリングされたコンテンツに対してコンテンツフィルタリングシステムが実行されます。そしてコンテンツフィルタリングの構成に応じて、コンテンツフィルタリングポリシー (Microsoft の既定値またはカスタムのユーザー構成) に違反していない場合はコンテンツはユーザーに返され、そうでない場合は、有害な入力候補コンテンツを返さずに、すぐにブロックされてコンテンツフィルタリングエラーを返します。ストリームが終了するまで、このプロセスが繰り返されます。コンテンツは、ユーザーに返される前に、コンテンツフィルターポリシーに従って完全に検査されます。この場合、コンテンツはトークンごとに返されるのではなく、それぞれのバッファーサイズの "コンテンツチャンク" 単位で返されます。

[Asynchronous Modified Filter] (非同期修正フィルター)

修正コンテンツフィルターの承認を受けたお客様は、追加オプションとして非同期修正フィルターを選び、新しいストリーミングエクスペリエンスを指定できます。この場合、コンテンツフィルターは非同期で実行され、入力候補コンテンツはスムーズなトークンごとのストリーミングエクスペリエンスで即時に返されます。バッファーに含まれるコンテンツがないため、待機時間がゼロになります。

お客様は、この機能により待機時間が短縮される一方、モデル出力の小さなセクションの安全性とリアルタイムの審査とのトレードオフになることに注意が必要があります。コンテンツフィルターは非同期で実行されるため、コンテンツモデレーションメッセージとポリシー違反シグナルに遅延が生じます。つまり、通常はすぐにフィルター処理されるはずの有害なコンテンツの一部のセクションが、ユーザーに表示される可能性があります。

注釈: 注釈とコンテンツモデレーションメッセージはストリーム中に継続的に返されます。アプリで注釈を使い、追加の AI コンテンツ安全メカニズム (コンテンツを編集する、追加の安全情報をユーザーに返すなど) を実装することを強くお勧めします。

コンテンツフィルタリングシグナル: コンテンツフィルタリングエラーシグナルに遅延が生じます。ポリシー違反が発生した場合は、使用可能になるとすぐに返され、ストリームは停止されます。ポリシー違反が発生した場合、コンテンツフィルタリングシグナルはポリシーに違反するコンテンツの最大 1,000 文字の範囲内で保証されます。

非同期修正フィルターへのアクセスには、変更されたコンテンツフィルターの承認が必要です。申請ページはこちらにあります。 Azure OpenAI Studio で有効にするには、コンテンツフィルターの攻略ガイドに従って新しいコンテンツフィルター構成を作成し、[ストリーミング] セクションで [Asynchronous Modified Filter] (非同期修正フィルター) を選択します。

コンテンツフィルタリングモードの比較

比較	[ストリーミング] - 既定値	[ストリーミング] - [Asynchronous Modified Filter] (非同期修正フィルター)
Status	GA	パブリックプレビュー
特典を受ける条件	全顧客	修正コンテンツフィルターの承認を受けたお客様
有効にする方法	既定で有効になっており、アクションは必要ありません	修正コンテンツフィルターの承認を受けたお客様は、Azure OpenAI Studio でそれを直接構成できます (コンテンツフィルタリングの構成の一部として、適用対象はデプロイレベル)
モダリティと可用性	テキスト、すべての GPT モデル	テキスト、gpt-4-vision を除くすべての GPT モデル
ストリーミングエクスペリエンス	コンテンツがバッファーされ、チャンク単位で返されます	待機時間ゼロ (バッファリングなし、フィルターは非同期的に実行)
コンテンツフィルタリングシグナル	即時フィルタリングシグナル	遅延フィルタリングシグナル (最大 1,000 文字の増分)
コンテンツフィルタリングの構成	既定値と任意のユーザー定義のフィルター設定をサポートします (オプションのモデルを含む)	既定値と任意のユーザー定義のフィルター設定をサポートします (オプションのモデルを含む)

注釈とサンプル応答

プロンプト注釈メッセージ

これは既定の注釈と同じです。

data: { 
    "id": "", 
    "object": "", 
    "created": 0, 
    "model": "", 
    "prompt_filter_results": [ 
        { 
            "prompt_index": 0, 
            "content_filter_results": { ... } 
        } 
    ], 
    "choices": [], 
    "usage": null 
}

入力候補トークンメッセージ

入力候補メッセージは直ちに転送されます。最初にモデレーションは実行されません。また、最初は注釈は提供されません。

data: { 
    "id": "chatcmpl-7rAJvsS1QQCDuZYDDdQuMJVMV3x3N", 
    "object": "chat.completion.chunk", 
    "created": 1692905411, 
    "model": "gpt-35-turbo", 
    "choices": [ 
        { 
            "index": 0, 
            "finish_reason": null, 
            "delta": { 
                "content": "Color" 
            } 
        } 
    ], 
    "usage": null 
}

注釈メッセージ

テキストフィールドは常に空の文字列 (新しいトークンがないことを示します) になります。注釈は、既に送信されたトークンにのみ関連します。同じトークンを参照する注釈メッセージが複数存在する場合があります。

"start_offset" と "end_offset" は、注釈がどのテキストに関連しているかをマークするための、テキスト内の細分性が低いオフセットです (プロンプトの先頭が 0)。

"check_offset" は、完全にモデレートされたテキストの量を表します。これは、今後の注釈の "end_offset" 値に対する排他的な下限です。これは減少しません。

data: { 
    "id": "", 
    "object": "", 
    "created": 0, 
    "model": "", 
    "choices": [ 
        { 
            "index": 0, 
            "finish_reason": null, 
            "content_filter_results": { ... }, 
            "content_filter_raw": [ ... ], 
            "content_filter_offsets": { 
                "check_offset": 44, 
                "start_offset": 44, 
                "end_offset": 198 
            } 
        } 
    ], 
    "usage": null 
}

サンプル応答ストリーム (フィルターを通過)

以下は、非同期修正フィルターを使った実際のチャット入力候補応答です。プロンプトの注釈は変わらないことに注目してください。入力候補トークンは注釈なしで送信されます。新しい注釈メッセージはトークンなしで送信され、代わりに特定のコンテンツフィルターオフセットに関連付けられます。

{"temperature": 0, "frequency_penalty": 0, "presence_penalty": 1.0, "top_p": 1.0, "max_tokens": 800, "messages": [{"role": "user", "content": "What is color?"}], "stream": true}

data: {"id":"","object":"","created":0,"model":"","prompt_annotations":[{"prompt_index":0,"content_filter_results":{"hate":{"filtered":false,"severity":"safe"},"self_harm":{"filtered":false,"severity":"safe"},"sexual":{"filtered":false,"severity":"safe"},"violence":{"filtered":false,"severity":"safe"}}}],"choices":[],"usage":null} 

data: {"id":"chatcmpl-7rCNsVeZy0PGnX3H6jK8STps5nZUY","object":"chat.completion.chunk","created":1692913344,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"role":"assistant"}}],"usage":null} 

data: {"id":"chatcmpl-7rCNsVeZy0PGnX3H6jK8STps5nZUY","object":"chat.completion.chunk","created":1692913344,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":"Color"}}],"usage":null} 

data: {"id":"chatcmpl-7rCNsVeZy0PGnX3H6jK8STps5nZUY","object":"chat.completion.chunk","created":1692913344,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":" is"}}],"usage":null} 

data: {"id":"chatcmpl-7rCNsVeZy0PGnX3H6jK8STps5nZUY","object":"chat.completion.chunk","created":1692913344,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":" a"}}],"usage":null} 

... 

data: {"id":"","object":"","created":0,"model":"","choices":[{"index":0,"finish_reason":null,"content_filter_results":{"hate":{"filtered":false,"severity":"safe"},"self_harm":{"filtered":false,"severity":"safe"},"sexual":{"filtered":false,"severity":"safe"},"violence":{"filtered":false,"severity":"safe"}},"content_filter_offsets":{"check_offset":44,"start_offset":44,"end_offset":198}}],"usage":null} 

... 

data: {"id":"chatcmpl-7rCNsVeZy0PGnX3H6jK8STps5nZUY","object":"chat.completion.chunk","created":1692913344,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":"stop","delta":{}}],"usage":null} 

data: {"id":"","object":"","created":0,"model":"","choices":[{"index":0,"finish_reason":null,"content_filter_results":{"hate":{"filtered":false,"severity":"safe"},"self_harm":{"filtered":false,"severity":"safe"},"sexual":{"filtered":false,"severity":"safe"},"violence":{"filtered":false,"severity":"safe"}},"content_filter_offsets":{"check_offset":506,"start_offset":44,"end_offset":571}}],"usage":null} 

data: [DONE]

サンプル応答ストリーム (フィルターによってブロック)

{"temperature": 0, "frequency_penalty": 0, "presence_penalty": 1.0, "top_p": 1.0, "max_tokens": 800, "messages": [{"role": "user", "content": "Tell me the lyrics to \"Hey Jude\"."}], "stream": true}

data: {"id":"","object":"","created":0,"model":"","prompt_filter_results":[{"prompt_index":0,"content_filter_results":{"hate":{"filtered":false,"severity":"safe"},"self_harm":{"filtered":false,"severity":"safe"},"sexual":{"filtered":false,"severity":"safe"},"violence":{"filtered":false,"severity":"safe"}}}],"choices":[],"usage":null} 

data: {"id":"chatcmpl-8JCbt5d4luUIhYCI7YH4dQK7hnHx2","object":"chat.completion.chunk","created":1699587397,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"role":"assistant"}}],"usage":null} 

data: {"id":"chatcmpl-8JCbt5d4luUIhYCI7YH4dQK7hnHx2","object":"chat.completion.chunk","created":1699587397,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":"Hey"}}],"usage":null} 

data: {"id":"chatcmpl-8JCbt5d4luUIhYCI7YH4dQK7hnHx2","object":"chat.completion.chunk","created":1699587397,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":" Jude"}}],"usage":null} 

data: {"id":"chatcmpl-8JCbt5d4luUIhYCI7YH4dQK7hnHx2","object":"chat.completion.chunk","created":1699587397,"model":"gpt-35-turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":","}}],"usage":null} 

... 

data: {"id":"chatcmpl-8JCbt5d4luUIhYCI7YH4dQK7hnHx2","object":"chat.completion.chunk","created":1699587397,"model":"gpt-35- 

turbo","choices":[{"index":0,"finish_reason":null,"delta":{"content":" better"}}],"usage":null} 

data: {"id":"","object":"","created":0,"model":"","choices":[{"index":0,"finish_reason":null,"content_filter_results":{"hate":{"filtered":false,"severity":"safe"},"self_harm":{"filtered":false,"severity":"safe"},"sexual":{"filtered":false,"severity":"safe"},"violence":{"filtered":false,"severity":"safe"}},"content_filter_offsets":{"check_offset":65,"start_offset":65,"end_offset":1056}}],"usage":null} 

data: {"id":"","object":"","created":0,"model":"","choices":[{"index":0,"finish_reason":"content_filter","content_filter_results":{"protected_material_text":{"detected":true,"filtered":true}},"content_filter_offsets":{"check_offset":65,"start_offset":65,"end_offset":1056}}],"usage":null} 

data: [DONE]

重要

プロンプトに対してコンテンツフィルタリングがトリガーされ、応答の一部として "status": 400 が受信されると、サービスによってプロンプトが評価されたときに、この要求に対して料金が発生する場合があります。 "finish_reason": "content_filter" で "status":200 が受信されたときにも料金が発生します。この場合、プロンプトに問題はありませんでしたが、モデルによって生成された補完がコンテンツフィルタリング規則に違反することが検出されたため、結果として補完がフィルター処理されます。

ベストプラクティス

アプリケーション設計の一環として次のベストプラクティスを検討し、潜在的な損害を最小限に抑えながら、アプリケーションで肯定的なエクスペリエンスを提供します。

フィルター処理されたカテゴリと重大度レベルで分類されるコンテンツを含むプロンプトをユーザーが送信したり、アプリケーションが悪用されたりするシナリオへの対応方法を決めます。
finish_reason をチェックして、入力候補がフィルター処理されたかどうかを確認します。
content_filter_result にエラーオブジェクトがないことをチェックします (コンテンツフィルター処理が実行されなかったことを示します)。
注釈モードで保護された素材コードモデルを使用している場合は、アプリケーションでコードを表示する場合に引用 URL を表示してください。

次のステップ

Azure OpenAI をサポートする基となるモデルに関する記事を確認します。
このフォームを使用して、変更されたコンテンツフィルターを申請します。
Azure OpenAI コンテンツフィルタリングは、Azure AI Content Safety を使用しています。
アプリケーションに関連するリスクの理解と軽減策について詳しくは、「Azure OpenAI モデルの責任ある AI プラクティスの概要」をご覧ください。
コンテンツフィルタリングと不正使用の監視に関連したデータ処理方法について詳しくは、「Azure OpenAI Service のデータ、プライバシー、セキュリティ」をご覧ください。

重大度レベル	説明	画像の例
レベル 0 – 安全	コンテンツは安全ですが、以下のような文脈またはそれに類似の文脈において、非差別的な非攻撃的な形で、感情を伴わない、または中立的な感情を持つような、ヘイトと公平性に関連する画像が含まれている可能性があります。ジャーナリズム履歴医療法的情報教育地理	コンフェデレート旗 (南軍旗) 以外の旗 (たとえば、クロスを特徴とする国または州の旗) 英国のユニオンジャック旗の画像歴史的な写真における米国の奴隷化された人々が解放された様子の描写
レベル 2 – 低	肯定的な感情、誤りの肯定的な感情、または否定的な偏った感情のいずれかを含むコンテンツで、アイデンティティグループ間での差別化を行うもの。このコンテンツは、感情的な反応を引き起こすことを目的としています。これには、次のものが含まれます。保護ナチスの象徴化、コンフェデレート旗 (南軍旗)、Ku Klux Klan の象徴化固定観念の押し付け雇用差別	「ヘイトスピーチ反対」運動の表現採用面接を受ける障碍者など、優先されない求職者に関する表現
レベル 4 – 中	アイデンティティグループや他者に対する否定的な感情を含むコンテンツで、あるアイデンティティグループに対する行動の推奨と優越感の感情につながりるもの。これには、次のものが含まれます。侮辱、分断、あざけりナチスの旗、コンフェデレート旗 (南軍旗)、各種の LGBTQIA+ および関連商品	「アイデンティティグループ」を社会的避けることを推奨する画像人種改善論と優生学を描写する画像
レベル 6 – 高	アイデンティティグループに対する否定的な感情とヘイトスピーチを含み、ヘイトスピーチやヘイト犯罪の発生につながるコンテンツ。これには、次のものが含まれます。人種差別 LGBTQIA+ に対する攻撃障碍者差別性に基づく差別美化されたナチスの象徴化、コンフェデレート旗 (南軍旗)、Ku Klux Klan の象徴化暴力的なコンフェデレート旗 (南軍旗)	反ユダヤ主義の画像明らかな暴力 (銃の誇示、使用など) に関係づけられた、青い格子 (斜めの十字模様) を特徴とする「南十字」旗が描かれた画像

コンテンツのフィルター処理

コンテンツ フィルタリングのカテゴリ

危害のカテゴリ

テキスト コンテンツ

画像コンテンツ

構成可能性 (プレビュー)

シナリオの詳細

シナリオ: ストリーミング以外の入力候補呼び出しを送信して、複数の出力を要求したものの、フィルター処理されたカテゴリと重大度レベルでコンテンツが分類されない

シナリオ: API 呼び出しで複数の応答 (N>1) を要求し、少なくとも 1 つの応答がフィルター処理される

シナリオ: 不適切な入力プロンプトが入力候補 API に送信される (ストリーミングまたは非ストリーミング)

シナリオ: ストリーミング入力候補を呼び出すものの、フィルター処理されたカテゴリと重大度レベルで分類された出力コンテンツがない

シナリオ: 複数の入力候補を要求するストリーミング入力候補を呼び出し、出力コンテンツの少なくとも一部がフィルター処理される

シナリオ: 入力候補に対してコンテンツ フィルタリングシステムが実行されない

注釈

コンテンツ フィルター

省略可能なモデル

出力

シナリオ例: フィルター処理されたカテゴリと重大度レベルで分類されたコンテンツを含む入力プロンプトが Completions API に送信される

コンテンツ ストリーミング

既定値

[Asynchronous Modified Filter] (非同期修正フィルター)

コンテンツ フィルタリング モードの比較

注釈とサンプル応答

プロンプト注釈メッセージ

入力候補トークン メッセージ

注釈メッセージ

サンプル応答ストリーム (フィルターを通過)

サンプル応答ストリーム (フィルターによってブロック)

ベスト プラクティス

次のステップ

その他のリソース

コンテンツフィルタリングのカテゴリ

テキストコンテンツ

シナリオ: 入力候補に対してコンテンツフィルタリングシステムが実行されない

コンテンツフィルター

コンテンツストリーミング

コンテンツフィルタリングモードの比較

入力候補トークンメッセージ

ベストプラクティス