保護材料検出フィルター

保護された材料検出フィルターは、大規模言語モデル (LLM) の出力をスキャンして、既知の保護されたマテリアルを識別してフラグを設定します。 これは、著作権で保護されたテキストやコードと密接に一致するコンテンツの生成を組織が防ぐのに役立ちます。

保護された素材テキスト フィルターは、大きな言語モデルが出力する可能性がある既知のテキスト コンテンツ (曲の歌詞、記事、レシピ、選択した Web コンテンツなど) にフラグを設定します。

保護されたマテリアル コード フィルターは、大きな言語モデルが出力する可能性がある保護されたコード コンテンツにフラグを設定します。 これは、既知のGitHub リポジトリにあるコンテンツであり、ソフトウェア ライブラリ、ソース コード、アルゴリズム、およびその他の独自のプログラミング コンテンツが含まれます。

重要

保護された材料の検出、接地検出、およびカスタム カテゴリ (標準) のガードレールと制御モデルは、英語でのみ機能します。

その他のコンテンツ フィルタリング モデルは、中国語、英語、フランス語、ドイツ語、スペイン語、イタリア語、日本語、ポルトガル語の言語で特別にトレーニングおよびテストされます。 ただし、これらの機能は他の多くの言語で動作しますが、品質は異なる場合があります。 いずれの場合も、アプリケーションで動作することを確認するために、独自のテストを行う必要があります。

ヒント

アプリケーションで保護された素材検出を使用する方法については、「 クイック スタート: テキストの保護された素材 」と「 クイック スタート: コードの保護された素材」を参照してください。

注意

Content Safety サービスのコード スキャナー/インデクサーは、2023 年 4 月 6 日までのみ最新です。 この日付より後にGitHubに追加されたコードは検出されません。 コードを検出するためにプロテクトされたマテリアルを使用して最新のコード群を見つけ出すには、自分の裁量で判断してください。

保護された素材の表示を検出して防止することで、組織は知的財産法への準拠を確保し、コンテンツの独創性を維持し、評判を保護することができます。

このガイドでは、保護されたマテリアル API が検出するコンテンツの種類について詳しく説明します。

ユーザー シナリオ

クリエイティブライティングのためのコンテンツ生成プラットフォーム

  • シナリオ: クリエイティブな文章作成に生成 AI を使用するコンテンツ生成プラットフォーム (ブログ投稿、ストーリー、マーケティング コピーなど) は、テキスト保護素材機能を統合して、既知の著作権で保護された素材と密接に一致するコンテンツの生成を防ぎます。
  • ユーザー: プラットフォーム管理者とコンテンツ作成者。
  • アクション: プラットフォームは、ユーザーに提供される前に、Azure AI Content Safetyを使用して AI によって生成されたコンテンツをスキャンします。 生成されたテキストが保護された素材と一致する場合、コンテンツにフラグが設定され、ブロックまたは変更されます。
  • 結果:プラットフォームは潜在的な著作権侵害を回避し、生成されたすべてのコンテンツがオリジナルであり、知的財産法に準拠していることを保証します。

ソーシャル メディア コンテンツの自動作成

  • シナリオ: デジタル マーケティングエージェンシーは、生成 AI を使用してソーシャル メディア コンテンツの作成を自動化します。 この機関は、テキスト保護素材機能を統合して、曲の歌詞や書籍からの抜粋など、著作権で保護されたテキストを含む AI によって生成されたコンテンツを発行しないようにします。
  • ユーザー: デジタル マーケティング担当者とソーシャル メディア マネージャー。
  • アクション: 機関は、Azure AI Content Safetyを使用して、保護された素材のデータベースに対する一致がないか、AI によって生成されたすべてのソーシャル メディア コンテンツを確認します。 一致するコンテンツにはリビジョンのフラグが設定されるか、投稿がブロックされます。
  • 結果: 機関は、著作権法への準拠を維持し、承認されていないコンテンツの投稿に関連する評判のリスクを回避します。

AI 支援のニュース作成

  • シナリオ: ニュース アウトレットでは、生成 AI を使用して、ジャーナリストが記事やレポートの作成を支援します。 コンテンツが誤って保護されたニュース記事やその他の著作権で保護された資料を複製しないように、アウトレットはテキスト用保護素材機能を使用します。
  • ユーザー: ジャーナリスト、編集者、コンプライアンス責任者。
  • アクション: ニュース アウトレットは、Azure AI Content Safetyをコンテンツ作成ワークフローに統合します。 AI によって生成された下書きは、編集レビューのために提出する前に、保護されたコンテンツを自動的にスキャンします。
  • 結果:ニュースアウトレットは偶発的な著作権侵害を防ぎ、その報告の完全性と独創性を維持します。

AI を使用してコンテンツを生成する E ラーニング プラットフォーム

  • シナリオ: e ラーニング プラットフォームでは、生成 AI を使用して、概要、クイズ、説明テキストなどの教育コンテンツを生成します。 プラットフォームでは、テキスト用保護素材機能を使用して、生成されたコンテンツに教科書、記事、学術論文から保護された素材が含まれていないことを確認します。
  • ユーザー: 教育コンテンツ作成者およびコンプライアンス責任者。
  • アクション: プラットフォームは、AI によって生成された教材をスキャンする機能を統合します。 既知の保護された学術資料と一致するコンテンツがある場合は、リビジョンのフラグが設定されるか、自動的に削除されます。
  • 結果: プラットフォームは教育コンテンツの品質を維持し、著作権法に準拠し、AI によって生成された学習リソースで保護された資料を使用することを回避します。

AI を利用したレシピ ジェネレーター

  • シナリオ: 食品とレシピの Web サイトでは、生成 AI を使用して、ユーザーの好みに基づいて新しいレシピを生成します。 有名なクックブックや Web サイトから保護されたレシピに一致するコンテンツを生成しないように、Web サイトにはテキスト保護素材機能が統合されています。
  • ユーザー: コンテンツ マネージャーとプラットフォーム管理者。
  • アクション: Web サイトでは、Azure AI Content Safetyを使用して、既知の保護されたコンテンツのデータベースに対して AI によって生成されたレシピを確認します。 生成されたレシピが保護されたレシピと一致する場合、フラグが設定され、修正またはブロックされます。
  • 結果: Web サイトは、AI によって生成されたすべてのレシピが元のものであることを保証し、著作権侵害のリスクを軽減します。

保護された素材テキストの例

保護されたマテリアル テキスト検出の主要カテゴリの詳細については、この表を参照してください。 API を呼び出すと、4 つのカテゴリすべてが適用されます。

カテゴリ Scope 許容可能と見なされる 有害と見なされる
レシピ レシピに関連する著作権コンテンツ。

他の有害または機密性の高いテキストは、Recipes IP 著作権の害と交差しない限り、このタスクの範囲外です。
  • レシピに関する情報を含む Web ページへのリンク
  • IP/著作権保護がない、または低いレシピのコンテンツ:
    • 成分一覧
    • 食材の組み合わせと調理の基本手順
  • 著作権で保護されたコンテンツを拒絶または提供することを拒否する:
    • 著作権で保護されたコンテンツを共有しないようにトピックを変更する
    • 著作権で保護されたコンテンツの共有を拒否する
    • 応答しない情報の提供
  • レシピのその他の文学コンテンツ
    • レシピに関する一致する逸話、物語、または個人的な解説(40文字以上)
    • 料理の既知の名前に限定されないレシピのクリエイティブ名、または主な成分が何であるかを示す料理のわかりやすい要約 (40 文字以上)
    • 食材を組み合わせたり調理したりするための材料やステップの創造的な説明(料理の作成に必要以上の情報を含む説明、不正確な言葉使い、不適切な表現(40文字以上)を含む説明など)
  • 著作権で保護されたコンテンツにアクセスする方法:
    • レシピにアクセスするためにペイウォールをバイパスする方法
Web コンテンツ URL ドメイン名として webmd.com を持つすべての Web サイト。 選択した Web コンテンツに関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。

その他の有害または機密性の高いテキストは、選択された Web コンテンツの害と交差しない限り、このタスクの範囲外です。
  • Web ページへのリンク
  • 選択した Web コンテンツの短い抜粋またはスニペットは、次の場合に限ります。
    • ユーザーのクエリに関連します。
    • 200 文字未満
  • 選択した Web コンテンツの実質的なコンテンツ
    • 200 文字を超える応答セクションで、選択した Web コンテンツのテキスト ブロックと大きな類似性を持つ
    • 200 文字を超える選択した Web コンテンツからの抜粋
    • 200 文字を超える選択した Web コンテンツからの引用符
  • 著作権で保護されたコンテンツにアクセスする方法:
    • ペイウォールまたは DRM 保護をバイパスして、著作権で保護された選択された Web コンテンツにアクセスする方法
News ニュースに関する著作権コンテンツの問題にのみ焦点を当てます。

その他の有害または機密性の高いテキストは、ニュース IP 著作権の害と交差しない限り、このタスクの範囲外です。
  • ニュース、雑誌、またはブログ記事に関するニュースや情報をホストする Web ページへのリンクは、次の場合に限られます。
    • 正当なアクセス許可を持っている
    • 彼らはニュースの報道をライセンスを持っています
    • これらは承認されたプラットフォームです
  • 以下の場合に限り、埋め込みオーディオ/ビデオ プレーヤーを含む承認された Web ページへのリンク。
    • 正当なアクセス許可を持っている
    • 彼らはニュースの報道をライセンスを持っています
    • これらは、承認されたストリーミング プラットフォームです
    • 彼らは公式のYouTubeチャンネルです
  • ニュース記事からの見出しやキャプションなどの短い抜粋/スニペットは、次の場合に限ります。
    • ユーザーのクエリに関連します。
    • これらは、この記事の実質的な部分ではありません
    • これらは記事全体ではありません
  • ニュース記事の概要は次のように長くなります。
    • これはユーザーのクエリに関連します
    • それは簡単で事実です
    • 記事のかなりの部分をコピー/言い換えることはありません
    • これは、明確かつ目に見えて要約として引用されている
  • 以下の場合に限り、ニュース記事の分析/批判/レビュー:
    • これはユーザーのクエリに関連します
    • それは簡単で事実です
    • 記事のかなりの部分をコピー/言い換えることはありません
    • これは、分析/批判/レビューとして明確かつ目に見えて引用されています
  • IP/著作権保護のないニュース コンテンツ:
    • パブリック ドメイン内のニュース/雑誌/ブログ
    • 著作権保護が経過した、放棄された、または存在しなかったニュース/雑誌/ブログ
  • 著作権で保護されたコンテンツの提供を拒否すること:
    • 著作権で保護されたコンテンツを共有しないようにトピックを変更する
    • 著作権で保護されたコンテンツの共有を拒否する
    • 応答しない情報の提供
  • 以下の場合を除き、ニュース/雑誌/ブログ記事の全文を含むPDFまたはその他のファイルへのリンク:
    • 正当なアクセス許可とライセンスを持つ承認されたプラットフォームから提供されます
  • ニュースコンテンツ
    • 任意のニュース記事から200文字以上が逐語的に取られました
    • 200 文字を超える文字は、ニュース記事のテキスト ブロックとほぼ同じです
    • ペイウォールの背後にあるニュース/雑誌/ブログ記事に直接アクセスする
  • 著作権で保護されたコンテンツにアクセスする方法:
    • 承認されていない Web サイトからニュースをダウンロードする手順
    • ペイウォールや DRM 保護をバイパスして著作権で保護されたニュースやビデオにアクセスする方法
歌詞 曲に関する著作権で保護されたコンテンツの問題にのみ焦点を当てます。

その他の有害または機密性の高いテキストは、曲 IP 著作権の害と交差しない限り、このタスクの範囲外です。
  • 次のような曲に関する情報を含む Web ページへのリンク:
    • 曲の歌詞
    • 関連する音楽のコードまたはタブ
    • 曲/音楽の分析またはレビュー
  • 以下の場合に限り、埋め込みオーディオ/ビデオ プレーヤーを含む承認された Web ページへのリンク。
    • 正当なアクセス許可を持っている
    • 彼らは音楽のライセンスを持っています
    • これらは、承認されたストリーミング プラットフォームです
    • 彼らは公式のYouTubeチャンネルです
  • 次の条件を満たす、曲の歌詞の短い抜粋やスニペット:
    • ユーザーのクエリに関連します。
    • 歌詞の重要な部分ではない
    • それらは歌詞全体ではない
    • 長さ 11 語以下
  • 次の条件を満たす、楽曲のコードやタブからの短い抜粋やスニペット:
    • ユーザーのクエリに関連します。
    • 彼らはコード/タブの実質的な部分ではありません
    • それらはコード/タブの全体ではありません
  • IP/著作権保護のない曲のコンテンツ:
    • パブリック ドメイン内にある曲/歌詞/コード/タブ
    • 著作権保護が経過した、放棄された、または存在しない曲/歌詞/コード/タブ
  • 著作権で保護されたコンテンツの提供を拒否すること:
    • 著作権で保護されたコンテンツを共有しないようにトピックを変更する
    • 著作権で保護されたコンテンツの共有を拒否する
    • 応答しない情報の提供
  • 曲の歌詞
    • 歌詞全体
    • 歌詞のかなりの部分
    • 11 語を超える単語を含む歌詞の一部
  • 曲のコードまたはタブ
    • コード全体/タブ
    • コード/タブのかなりの部分
  • 以下の埋め込みオーディオ/ビデオ プレーヤーを含む Web ページへのリンク:
    • 正当なアクセス許可がない
    • ライセンスを取得した音楽を持っていない
    • 承認されていないストリーミング プラットフォーム
    • 公式の YouTube チャンネルではありません
  • 著作権で保護されたコンテンツにアクセスする方法:
    • 承認されていない Web サイトから曲をダウンロードする手順
    • ペイウォールや DRM 保護をバイパスして著作権で保護された曲やビデオにアクセスする方法

トラブルシューティング

偽陽性

保護された素材検出が、実際には保護されていないコンテンツにフラグを設定する場合:

  • 検出カテゴリ (歌詞、ニュース、レシピ、コード) がユース ケースと一致するかどうかを確認する
  • フラグ付きコンテンツが文字/単語のしきい値を超えているかどうかを確認します (レシピの場合は 40 文字、ニュースの場合は 200 文字、歌詞の場合は 11 単語)
  • 検出カテゴリテーブルの [許容可能と見なされる] 条件を確認する

コンテンツが検出されない

予想される保護対象の資料にフラグが設定されていない場合:

  • コードの場合: 2023 年 4 月 6 日より前にリポジトリのインデックスが作成されたことを確認する
  • テキストの場合: コンテンツが 4 つの検出カテゴリ (レシピ、Web コンテンツ、ニュース、歌詞) のいずれかに一致することの確認
  • 言語サポート要件が満たされていることを確認します (Guardrails モデルの場合は英語)

統合の問題

統合の問題の場合:

  • Azure AI Content Safety リソースが正しく構成されていることを確認する
  • API 認証資格情報が有効であることを確認する
  • 適切な API の使用方法については、 コンテンツの安全性 に関するクイック スタートを確認してください

次の手順