Microsoft Purview でデータ ソースをスキャンする

Microsoft Purview では、 データ ソースを登録した後、ソースをスキャンして技術的なメタデータをキャプチャし、スキーマを抽出し、データに分類を適用できます。

この記事では、データ ソースをスキャンするための基本的な手順について説明します。

ヒント

各ソースには、独自の手順とスキャンの前提条件があります。 最も完全なスキャン手順については、 サポートされているソースの一覧からソース を選択し、そのスキャン手順を確認します。

前提条件

Microsoft Purview で現在登録およびスキャンできるすべてのソースの一覧を次に示します。

データ ソースをスキャンする前に、次の手順を実行する必要があります。

  1. データ ソースを登録する - これは基本的に Microsoft Purview にデータ ソースのアドレスを提供し、Microsoft Purview データ マップのコレクションにマップします。
  2. ネットワークを検討する - ソースがオンプレミス ネットワークまたは仮想プライベート ネットワーク (VPN) 内にある場合、または Microsoft Purview アカウントでプライベート エンドポイントを使用している場合は、セルフホステッド統合ランタイムが必要です。これは、スキャン中にソースと Microsoft Purview が接続できるように、プライベート ネットワーク内のマシン上に置かれるツールです。 セルフホステッド統合ランタイムを作成する手順を次に示します。
  3. ソースへの接続に使用する資格情報を検討します。 すべての ソース ページ には、[ スキャン ] セクションがあり、使用可能な認証の種類に関する詳細が含まれます。

スキャンを作成する

次の手順では、例として Azure Blob Storage を使用し、Microsoft Purview マネージド ID を使用して認証します。

重要

これらはスキャンを作成するための一般的な手順ですが、 ソース固有の 事前要求とスキャンの手順についてはソース ページを参照する必要があります。

  1. 次の方法で Microsoft Purview ガバナンス ポータルを開きます。

    Azure portalの Microsoft Purview ウィンドウのスクリーンショット。Microsoft Purview ガバナンス ポータル ボタンが強調表示されています。

  2. [データ マップ] ->[ソース] に移動して、マップ ビューまたはテーブル ビューで登録済みのソースを表示します。

  3. ソースを見つけて、[ 新しいスキャン ] アイコンを選択します。

    登録済みソースと新しいスキャン ウィンドウで強調表示されている新しいスキャン ボタンのスクリーンショット。

  4. スキャンの [名前] を指定します。

  5. 認証方法を選択します。 ここでは、Purview MSI (マネージド ID) を選択しました。

    スキャンを実行するマネージド ID オプションを示すスクリーンショット。

  6. 現在のコレクション、またはスキャンのサブ コレクションを選択します。 選択したコレクションには、スキャン中に検出されたメタデータが格納されます。

  7. [ 接続のテスト] を選択します。 成功しない場合は、「トラブルシューティング」セクションを参照してください。 接続に成功したら、[続行] を選択 します

  8. ソースに応じて、スキャンの範囲を特定のデータのサブセットにすることができます。 Azure Blob Storageの場合は、リスト内の適切な項目を選択することで、フォルダーとサブフォルダーを選択できます。

    ファイルとフォルダーが選択されたスキャン ウィンドウのスコープを示すスクリーンショット。

  9. スキャン ルール セットを選択します。 スキャン ルール セットには、スキャンでチェックされるデータ分類の種類が含まれています。 システムの既定値 (ソースで使用できるすべての分類が含まれます)、organization内の他のユーザーによって行われた既存のカスタム ルール セット、またはインラインで新しいルール セットを作成することができます。

    既定の設定が選択されているスキャン ルール セットの選択ページのスクリーンショット。

  10. スキャン トリガーを選択します。 スケジュール (月単位または週単位) を設定することも、スキャンを 1 回実行することもできます。

    注:

    で繰り返しを開始 するには、 スケジュール スキャン時間より少なくとも 1 分短くする必要があります。それ以外の場合は、次回の繰り返しでスキャンがトリガーされます。

    定期的な毎月のスケジュールを示す [スキャン トリガーの設定] ページのスクリーンショット。

  11. スキャンを確認し、[ 保存して実行] を選択します。

    [保存して実行] ボタンが強調表示されているスキャン レビュー ページのスクリーンショット。

スキャンを表示する

データ ソース内のデータ量によっては、スキャンの実行に時間がかかる場合があるため、進行状況をチェックし、スキャンが完了したときに結果を確認する方法を次に示します。

  1. スキャンはコレクションから、またはソース自体から表示できます。

  2. コレクションから表示するには、データ マップの [コレクション ] に移動し、[ スキャン ] ボタンを選択します。

    [スキャン] ボタンが強調表示されているコレクション ページのスクリーンショット。

  3. スキャン名を選択して詳細を表示します。

    最新のスキャン名が強調表示されているコレクション リスト内のスキャンのスクリーンショット。

  4. または、コレクション内のデータ ソースに直接移動し、[詳細の表示] を選択してスキャンの状態をチェックすることもできます。

    ソースの [ビューの詳細] ボタンが強調表示されているデータ マップのスクリーンショット。

  5. スキャンの詳細は、前回の実行状態でのスキャンの進行状況と、スキャンおよび分類された資産の数を示します。

    アセットとスキャンが強調表示されているソース詳細ページのスクリーンショット。

  6. スキャン全体が正常に実行されると、[ 最終実行] 状態[進行中 ] に更新され、[ 完了] に更新されます

    進行中の状態を示すスキャンを含むソースの詳細ページのスクリーンショット。

    完了した状態を示すスキャンを含むソースの詳細ページのスクリーンショット。

スキャンを管理する

スキャンが完了すると、そのスキャンを管理または再実行できます。

  1. コレクションの一覧またはソース ページから [ スキャン名 ] を選択して、スキャンを管理します。

    [スキャン名] リンクが強調表示されているソースの詳細ページのスクリーンショット。

  2. スキャンをもう一度実行し、スキャンを編集しスキャンを削除できます

    実行、編集、削除のボタンが強調表示された [スキャンの管理] ページのスクリーンショット。

  3. フル スキャンを実行すると、スコープ内のすべてのコンテンツがスキャンされますが、一部のソースでは 増分スキャン も使用できます。 増分スキャンでは、前回のスキャン以降に更新されたリソースのみがスキャンされます。 ソース ページで サポートされている機能 テーブルを確認して、最初のスキャン後にソースで増分スキャンを使用できるかどうかを確認します。

    [今すぐスキャンを実行] ボタンのスクリーンショット。完全なスキャン オプションと増分スキャン オプションが表示されています。

トラブルシューティング

スキャンの接続の設定は、ネットワークと資格情報のカスタム 設定であるため、複雑になる可能性があります。

ソースに接続できない場合は、次の手順に従います。

  1. ソース ページの前提条件を確認して、見逃したことがないことを確認します。
  2. ソース ページの [スキャン ] セクションで認証オプションを確認して、認証方法が正しく設定されていることを確認します。
  3. [ 接続のトラブルシューティング] ページを確認します。
  4. サポート リクエストを作成して、サポート チームが特定の環境のトラブルシューティングを支援できるようにします。

次の手順