次の方法で共有


データ カタログ

データ カタログでは、データ情報を一元的に登録して管理し、それを組織で使用できるようにします。 これによって企業では、異なるプロジェクト チームによる冗長なデータ インジェストによって発生する、重複したデータ製品が確実に回避されます。

データ ランディング ゾーン全体にわたって格納されるデータ製品のメタデータを定義するため、データ カタログ サービスをプロビジョニングすることをお勧めします。

クラウド規模の分析は、Microsoft Purview に依存して以下のサービスを提供します。

  • 登録のシステム
  • エンタープライズ データ ソースの検出
  • データ分類エンジン
  • ポリシー ストア
  • データ情報の登録と読み取りのための API
  • コンプライアンス ダッシュボード ハブ

データ カタログは、データ管理ランディング ゾーンの一部であるため、仮想ネットワーク (VNet) ピアリングとセルフホステッド統合ランタイムを介して、各データ ランディング ゾーンと通信できます。 オンプレミス ストアおよびその他のパブリック クラウド内のデータセットの検出は、より多くのセルフホステッド統合ランタイムをデプロイすることによって実現されます。

Note

このドキュメントは主に、データ カタログ機能とデータ分類のために Microsoft Purview を使用することに焦点を当てていますが、企業は Alation、Okera、Collibra などの他の製品に投資している場合があります。 これに該当する場合は、お使いのベンダーと協力して、データ管理ランディング ゾーンについて説明されている原則に可能な限り近づけて適用してください。 何らかのカスタム統合が必要になる可能性があることにご注意ください。

データの検出

データ検出には、企業が所有しているすべてのデータの状態が反映されます。 このデータは、データ資産と呼ばれます。 データ検出を行うと、データ資産がスキャンおよび分類されます。 このデータ スキャン プロセスは、設定されたスケジュールに従ってデータ ソースに直接接続します。

新しいデータ ランディング ゾーンを環境に追加すると、関連付けられているデータ レイクとポリグロットな永続化ソースが、データ カタログ クローラーによってスキャンされるソースとして登録されます。

カタログを設定するためにデータ資産の自動検出を使用すると、次のことができます。

  • Azure とオンプレミスのデータ ソースからメタデータをクロールする
  • データ レイク、BLOB、およびその他のサポートされているターゲットをスキャンする
  • XML、TSV、CSV、PSV、SSV、JSON、Parquet、Avro、ORC のファイルの種類のデータ ターゲットからスキーマを抽出する
  • 構成可能なスキャンのスケジュールとスキャン ルール セットを使用して、カタログの自動更新を許可する

重要

新しいデータ ランディング ゾーンを環境に追加するときは、関連付けられているデータ レイクとポリグロットなストレージを、Azure DevOps を使用して、データ カタログ クローラーによってスキャンされるソースとして登録する必要があります。

データ分類

Microsoft Purview では、ファイル、テーブル、または列の資産に、システムまたはカスタムのデータ分類を適用できます。

データ分類は、サブジェクト タグに似ています。 Microsoft Purview は、スキャン中にデータ資産内で見つかった特定のデータ型のコンテンツをマークして識別します。 秘密度ラベルを使用すると、組織データ内の分類の種類のカテゴリを識別できます。 また、秘密度ラベルを使用して、各カテゴリに適用したいポリシーをグループ化することもできます。 Microsoft Purview では、Microsoft 365 と同じ機密情報の種類が使用されているため、コンテンツとデータ資産全体に既存のセキュリティ ポリシーと保護を拡張することができます。

Azure Purview では、ドキュメントをスキャンし、自動的に分類することができます。 たとえば、multiple.docx という名前のファイルがあり、その内容に国民識別番号が含まれている場合、Microsoft Purview によって、EU National Identification Number のような分類が資産の詳細ページに追加されます。

Microsoft Defender for SQL は、Azure SQL Database、Azure SQL Managed Instance、Azure Synapse Analytics に使用できる機能です。 機密データの検出と分類、データベースの潜在的な脆弱性の検出と軽減、データベースへの脅威を示す可能性がある異常なアクティビティの検出を行う機能が含まれています。 Microsoft Defender for SQL により、これらの機能を 1 つの場所で有効にして管理できます。

次のステップ