保護された材料検出フィルターは、大規模言語モデル (LLM) の出力をスキャンして、既知の保護されたマテリアルを識別してフラグを設定します。 これは、著作権で保護されたテキストやコードと密接に一致するコンテンツの生成を組織が防ぐのに役立ちます。
保護された素材テキスト フィルターは、大きな言語モデルが出力する可能性がある既知のテキスト コンテンツ (曲の歌詞、記事、レシピ、選択した Web コンテンツなど) にフラグを設定します。
保護されたマテリアル コード フィルターは、大きな言語モデルが出力する可能性がある保護されたコード コンテンツにフラグを設定します。 これは、既知のGitHub リポジトリにあるコンテンツであり、ソフトウェア ライブラリ、ソース コード、アルゴリズム、およびその他の独自のプログラミング コンテンツが含まれます。
重要
保護された材料の検出、接地検出、およびカスタム カテゴリ (標準) のガードレールと制御モデルは、英語でのみ機能します。
その他のコンテンツ フィルタリング モデルは、中国語、英語、フランス語、ドイツ語、スペイン語、イタリア語、日本語、ポルトガル語の言語で特別にトレーニングおよびテストされます。 ただし、これらの機能は他の多くの言語で動作しますが、品質は異なる場合があります。 いずれの場合も、アプリケーションで動作することを確認するために、独自のテストを行う必要があります。
ヒント
アプリケーションで保護された素材検出を使用する方法については、「 クイック スタート: テキストの保護された素材 」と「 クイック スタート: コードの保護された素材」を参照してください。
注意
Content Safety サービスのコード スキャナー/インデクサーは、2023 年 4 月 6 日までのみ最新です。 この日付より後にGitHubに追加されたコードは検出されません。 コードを検出するためにプロテクトされたマテリアルを使用して最新のコード群を見つけ出すには、自分の裁量で判断してください。
保護された素材の表示を検出して防止することで、組織は知的財産法への準拠を確保し、コンテンツの独創性を維持し、評判を保護することができます。
このガイドでは、保護されたマテリアル API が検出するコンテンツの種類について詳しく説明します。
ユーザー シナリオ
クリエイティブライティングのためのコンテンツ生成プラットフォーム
- シナリオ: クリエイティブな文章作成に生成 AI を使用するコンテンツ生成プラットフォーム (ブログ投稿、ストーリー、マーケティング コピーなど) は、テキスト保護素材機能を統合して、既知の著作権で保護された素材と密接に一致するコンテンツの生成を防ぎます。
- ユーザー: プラットフォーム管理者とコンテンツ作成者。
- アクション: プラットフォームは、ユーザーに提供される前に、Azure AI Content Safetyを使用して AI によって生成されたコンテンツをスキャンします。 生成されたテキストが保護された素材と一致する場合、コンテンツにフラグが設定され、ブロックまたは変更されます。
- 結果:プラットフォームは潜在的な著作権侵害を回避し、生成されたすべてのコンテンツがオリジナルであり、知的財産法に準拠していることを保証します。
ソーシャル メディア コンテンツの自動作成
- シナリオ: デジタル マーケティングエージェンシーは、生成 AI を使用してソーシャル メディア コンテンツの作成を自動化します。 この機関は、テキスト保護素材機能を統合して、曲の歌詞や書籍からの抜粋など、著作権で保護されたテキストを含む AI によって生成されたコンテンツを発行しないようにします。
- ユーザー: デジタル マーケティング担当者とソーシャル メディア マネージャー。
- アクション: 機関は、Azure AI Content Safetyを使用して、保護された素材のデータベースに対する一致がないか、AI によって生成されたすべてのソーシャル メディア コンテンツを確認します。 一致するコンテンツにはリビジョンのフラグが設定されるか、投稿がブロックされます。
- 結果: 機関は、著作権法への準拠を維持し、承認されていないコンテンツの投稿に関連する評判のリスクを回避します。
AI 支援のニュース作成
- シナリオ: ニュース アウトレットでは、生成 AI を使用して、ジャーナリストが記事やレポートの作成を支援します。 コンテンツが誤って保護されたニュース記事やその他の著作権で保護された資料を複製しないように、アウトレットはテキスト用保護素材機能を使用します。
- ユーザー: ジャーナリスト、編集者、コンプライアンス責任者。
- アクション: ニュース アウトレットは、Azure AI Content Safetyをコンテンツ作成ワークフローに統合します。 AI によって生成された下書きは、編集レビューのために提出する前に、保護されたコンテンツを自動的にスキャンします。
- 結果:ニュースアウトレットは偶発的な著作権侵害を防ぎ、その報告の完全性と独創性を維持します。
AI を使用してコンテンツを生成する E ラーニング プラットフォーム
- シナリオ: e ラーニング プラットフォームでは、生成 AI を使用して、概要、クイズ、説明テキストなどの教育コンテンツを生成します。 プラットフォームでは、テキスト用保護素材機能を使用して、生成されたコンテンツに教科書、記事、学術論文から保護された素材が含まれていないことを確認します。
- ユーザー: 教育コンテンツ作成者およびコンプライアンス責任者。
- アクション: プラットフォームは、AI によって生成された教材をスキャンする機能を統合します。 既知の保護された学術資料と一致するコンテンツがある場合は、リビジョンのフラグが設定されるか、自動的に削除されます。
- 結果: プラットフォームは教育コンテンツの品質を維持し、著作権法に準拠し、AI によって生成された学習リソースで保護された資料を使用することを回避します。
AI を利用したレシピ ジェネレーター
- シナリオ: 食品とレシピの Web サイトでは、生成 AI を使用して、ユーザーの好みに基づいて新しいレシピを生成します。 有名なクックブックや Web サイトから保護されたレシピに一致するコンテンツを生成しないように、Web サイトにはテキスト保護素材機能が統合されています。
- ユーザー: コンテンツ マネージャーとプラットフォーム管理者。
- アクション: Web サイトでは、Azure AI Content Safetyを使用して、既知の保護されたコンテンツのデータベースに対して AI によって生成されたレシピを確認します。 生成されたレシピが保護されたレシピと一致する場合、フラグが設定され、修正またはブロックされます。
- 結果: Web サイトは、AI によって生成されたすべてのレシピが元のものであることを保証し、著作権侵害のリスクを軽減します。
保護された素材テキストの例
保護されたマテリアル テキスト検出の主要カテゴリの詳細については、この表を参照してください。 API を呼び出すと、4 つのカテゴリすべてが適用されます。
| カテゴリ | Scope | 許容可能と見なされる | 有害と見なされる |
|---|---|---|---|
| レシピ | レシピに関連する著作権コンテンツ。 他の有害または機密性の高いテキストは、Recipes IP 著作権の害と交差しない限り、このタスクの範囲外です。 |
|
|
| Web コンテンツ | URL ドメイン名として webmd.com を持つすべての Web サイト。 選択した Web コンテンツに関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。 その他の有害または機密性の高いテキストは、選択された Web コンテンツの害と交差しない限り、このタスクの範囲外です。 |
|
|
| News | ニュースに関する著作権コンテンツの問題にのみ焦点を当てます。 その他の有害または機密性の高いテキストは、ニュース IP 著作権の害と交差しない限り、このタスクの範囲外です。 |
|
|
| 歌詞 | 曲に関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。 その他の有害または機密性の高いテキストは、曲 IP 著作権の害と交差しない限り、このタスクの範囲外です。 |
|
|
トラブルシューティング
偽陽性
保護された素材検出が、実際には保護されていないコンテンツにフラグを設定する場合:
- 検出カテゴリ (歌詞、ニュース、レシピ、コード) がユース ケースと一致するかどうかを確認する
- フラグ付きコンテンツが文字/単語のしきい値を超えているかどうかを確認します (レシピの場合は 40 文字、ニュースの場合は 200 文字、歌詞の場合は 11 単語)
- 検出カテゴリテーブルの [許容可能と見なされる] 条件を確認する
コンテンツが検出されない
予想される保護対象の資料にフラグが設定されていない場合:
- コードの場合: 2023 年 4 月 6 日より前にリポジトリのインデックスが作成されたことを確認する
- テキストの場合: コンテンツが 4 つの検出カテゴリ (レシピ、Web コンテンツ、ニュース、歌詞) のいずれかに一致することの確認
- 言語サポート要件が満たされていることを確認します (Guardrails モデルの場合は英語)
統合の問題
統合の問題の場合:
- Azure AI Content Safety リソースが正しく構成されていることを確認する
- API 認証資格情報が有効であることを確認する
- 適切な API の使用方法については、 コンテンツの安全性 に関するクイック スタートを確認してください