カスタムの機密情報の種類を作成する
構成済みの機密情報の種類 (SID) がニーズを満たしていない場合は、ニーズを満たすカスタマイズされた SID を作成して定義できます。 組み込みの SIT をコピーして編集することもできます。
カスタム SID は、 Microsoft.SCCManaged.CustomRulePack
ルール パッケージに追加されます。
新しい SIT を作成するには、次の 2 つの方法があります。
ヒント
E5 のお客様でない場合は、90 日間の Microsoft Purview ソリューション試用版を使用して、Purview の追加機能が組織のデータ セキュリティとコンプライアンスのニーズの管理にどのように役立つかを確認してください。 Microsoft Purview コンプライアンス ポータルのトライアル ハブで今すぐ開始してください。 サインアップと試用期間の詳細については、こちらをご覧ください。
開始する前に
機密情報の種類と、その種類の構成に精通している必要があります。 この理解を得るには、「 機密情報の種類について」を参照してください。 次の役割を理解することが重要です。
- 正規表現 - Microsoft 365 の機密情報の種類は Boost.RegEx 5.1.3 エンジンを使用する
- キーワード リスト - 機密情報の種類を定義する際に独自のキーワードを作成することも、既存のキーワード リストから選択することもできます。
- キーワード辞書
- 機密情報の種類の機能
- 信頼度レベル
機密情報の種類の 制限について理解します。
SKU/サブスクリプションとライセンス
DLP ポリシーの使用を開始する前に、 Microsoft 365 サブスクリプション とアドオンを確認してください。
ライセンスの詳細については、「Microsoft 365、Office 365、Enterprise Mobility + Security、Windows 11 Subscriptions for Enterprises」を参照してください。
重要
Microsoft カスタマー サービス/サポートでは、カスタム分類または正規表現パターンの作成をサポートしていません。 サポート エンジニアは、シミュレーション目的でサンプル正規表現パターンを提供したり、予期したとおりにトリガーされない既存の正規表現パターンのトラブルシューティングを支援するなど、この機能に対する限定的なサポートを提供できます。 ただし、カスタム コンテンツ マッチング開発が要件または義務を満たすことを保証することはできません。
カスタム SIT をゼロから作成する
注:
Microsoft Purview では、中国語、日本語、韓国語などの 2 バイト文字言語を使用するカスタム SID の作成がサポートされています。 これらの言語では、1 バイト言語と同様に区切り記号が使用されないため、Purview は 2 バイト文字を使用する言語の各単語間にスペースを追加します。 また、句読点などの特殊文字も削除されます。
次の手順に従って、まったく新しい機密情報の種類を完全に定義します。
現在使用しているポータルに該当するタブを選択してください。 Microsoft Purview ポータルの詳細については、Microsoft Purview ポータルを参照してください。 コンプライアンス ポータルの詳細については、「Microsoft Purview コンプライアンス ポータル」を参照してください。
Microsoft Purview ポータルにサインインします。
Microsoft Purview コンプライアンス ポータルで、[Information Protection>Classifiers>Sensitive info types] に移動し、[機密情報の種類の作成] を選択します。
[名前] および [説明] の値を入力し、[次へ] を選択します。
[パターンの作成] を選択します。 新しい機密情報の種類を定義するときに、それぞれ異なる要素と信頼度レベルを持つ複数のパターンを作成できます。
パターンの既定の信頼度レベルを選択します。 値は、[低い信頼度]、[中程度の信頼度]、および [高い信頼度] です。
Primary 要素を選択して定義します。 主要要素は、オプションの検証を使用した [正規表現]、[キーワード リスト]、[キーワード辞書]、または事前構成の [関数] のいずれかです。 データ損失防止に使用される SIT 関数の詳細については、「 機密情報の種類の関数」を参照してください。 日付とチェックサム 検証コントロールの詳細については、「 機密情報の種類の正規表現検証コントロール」を参照してください。
[文字の近接度] の値を入力します。
(省略可能) サポート要素がある場合は追加します。 サポートされる要素には、省略可能な検証コントロール、キーワード (keyword) リスト、キーワード (keyword)ディクショナリ、または定義済みの関数のいずれかを含む正規表現を指定できます。 サポート要素は、独自の 文字近接構成を 持つことができます。
(省略可能) 使用可能なチェックのリストから 追加チェックを追加します。
[作成] を選択します。
[次へ] を選択します。
この機密情報の種類に対して、推奨される信頼度レベルを選択します。
設定を確認し、[ 保存] を選択します。
重要
Microsoft 365 では、検索クローラーを使用して、SharePoint サイトと OneDrive サイトの機密情報を特定して分類します。 既存のコンテンツで新しいカスタムの機密情報の種類を特定するには、そのコンテンツを再クロールする必要があります。 コンテンツは、スケジュールに基づいてクロールされますが、サイト コレクション、リスト、またはライブラリのコンテンツを手動で再クロールすることができます。 詳細については、「サイト、ライブラリ、またはリストのクロールおよび再インデックスの手動要求」を参照してください。
[分類子] ページの [機密情報の種類] タブには、すべての機密情報の種類が一覧表示されます。 [ 最新の情報に更新 ] を選択するか、検索ツールを使用するか、一覧を参照して新しい SIT を見つけます。
既存の SIT をコピーして変更する
この手順では、 コンプライアンス ポータルを使用して既存の SIT をコピーして変更する方法について説明します。
または、PowerShell を使用してカスタム SID をコピーおよび変更し、Purview の完全データ 一致 (EDM) 機能を利用することもできます。 これらの方法の詳細については、次を参照してください。
注:
これらの SID はコピーできません。
- カナダの運転免許証番号
- EU 運転免許証番号
- EU の国民識別番号
- EU のパスポート番号
- EU の社会保障番号または同等の ID
- EU の税識別番号
- 国際疾病分類 (ICD-10-CM)
- 国際疾病分類 (ICD-9-CM)
- 米国の運転免許証番号
Microsoft Purview またはコンプライアンス ポータルを使用して既存の SIT をコピーして変更する
現在使用しているポータルに該当するタブを選択してください。 Microsoft Purview ポータルの詳細については、Microsoft Purview ポータルを参照してください。 コンプライアンス ポータルの詳細については、「Microsoft Purview コンプライアンス ポータル」を参照してください。
Microsoft Purview ポータルにサインインします。
Information Protection>Classifiers>Sensitive info types を選択し、コピーする機密情報の種類を選択します。
機密情報の種類の概要ページが開きます。 [コピー] を選択します。 コピーの準備ができたら、コピーが作成されたことを示すメッセージが表示され、編集するオプションが表示されます。 [ はい] を選択します。
新しい機密情報の種類に新しい[名前] および [説明] を指定します。
新しいパターンを作成するか、既存のパターンの一部またはすべてを編集または削除することができます。
- 新しいパターンを作成するには、[ 作成] を選択します。
- 既存のパターンを編集するには、変更するパターンの横にある [編集 ] (鉛筆) アイコンを選択します。
- パターンを削除するには、削除するパターンの横にある [ 削除 ] アイコンを選択します。
パターンを作成または編集するときは、パターンの既定の信頼レベルを選択します。 値は、[低い信頼度]、[中程度の信頼度]、および [高い信頼度] です。
[主要要素] を選択して定義します。 プライマリ要素には、 正規表現、 キーワード リスト、 キーワード ディクショナリ、または構成済みの 関数のいずれかを指定できます。 機密情報の種類の関数に関するページを参照してください。
[文字の近接度] の値を入力します。
(省略可能) 実行するサポート要素 または 追加のチェック がある場合は、それらを追加します。 必要に応じて、 サポート要素 をグループに編成できます。
新しいパターンを作成する場合は、[ 作成] を選択します。 既存のパターンを編集する場合は、[ 更新] を選択します。
[次へ]を選択します。
この機密情報の種類の信頼レベルの選択を確認し、[ 次へ] を選択します。
設定を確認し、[保存] を選択 します。
新しい機密情報の種類が作成されます。 確認メッセージで、[*完了] を選択します
注:
Microsoft Purview 情報保護では、次の 2 バイト文字セット言語がサポートされています。
- 中国語 (簡体字)
- 中国語 (繁体字)
- 韓国語
- 日本語
このサポートは、機密情報の種類で使用できます。 詳細については、「2 バイト文字セットの情報保護サポートリリース ノート (プレビュー)」を参照してください。
ヒント
中国語/日本語文字と 1 バイト文字を含むパターンを検出する場合、または中国語/日本語と英語を含むパターンを検出するには、キーワード (keyword)または正規表現の 2 つのバリアントを定義します。
- たとえば、「机密的ドキュメント」のようなキーワードを検出するには、キーワードの 2 つのバリエーションを使用します。 1 つは日本語と英語のテキストの間にスペースがあり、もう 1 つは日本語と英語のテキストの間にスペースがありません。 したがって、SITに追加するキーワードは、"机密的 document" と "机密的document" である必要があります。 同様に、"東京オリンピック2020" というフレーズを検出するには、"東京オリンピック 2020" と "東京オリンピック2020" の 2 つのバリエーションを使用する必要があります。
中国語/日本語/2 バイト文字と共に、キーワード/フレーズのリストに中国語/日本語以外の単語も含まれている場合 (英語のみなど)、2 つの辞書/キーワード (keyword) リストを作成することをお勧めします。 1 つは中国語/日本語/2 バイト文字を含むキーワード用に作成し、もう 1 つは英語専用で作成します。
- たとえば、"機密性の高い"、"機密性の高い高い"、"机密的文書" という 3 つの語句を含むキーワード (keyword)辞書/リストを作成する場合は、2 つのキーワード (keyword)リストを作成する必要があります。
- Highly confidential
- 機密性が高い、机密的document、机密的 document
2 バイト ハイフンまたは 2 バイトピリオドを使用して正規表現を作成するときは、正規表現でハイフンまたはピリオドをエスケープするのと同じ方法で両方の文字をエスケープしてください。 参考までに、サンプルの正規表現を次に示します。
(?<!\d)([4][0-9]{3}[\-?\-\t]*[0-9]{4})
キーワード (keyword)では、2 バイトの特殊文字を使用しないでください。
キーワード リストでは、単語の一致ではなく文字列の一致を使用することをお勧めします。