次の方法で共有


データ カタログ

データ カタログは、データ情報を一元的な場所に登録して維持し、組織で使用できるようにします。 これにより、異なるプロジェクト チームが冗長データを取り込む可能性が最小限に抑えられます。これにより、重複するデータ製品が防止されます。 データ ランディング ゾーン間で格納するデータ製品のメタデータを定義するデータ カタログ サービスを作成することをお勧めします。

クラウド規模の分析では、エンタープライズ データ ソースの登録、分類、データ品質の確保、高度なセキュリティで保護されたセルフサービス アクセスの提供を Microsoft Purview に依存しています。

Microsoft Purview は、各データ ランディング ゾーンと通信できるテナント ベースのサービスです。 マネージド仮想ネットワークが作成され、データ ランディング ゾーン リージョンにデプロイされます。 これらのマネージド仮想ネットワーク内の Azure マネージド仮想ネットワーク統合ランタイム (IR) は、使用可能な任意の Microsoft Purview リージョンにデプロイできます。 マネージド仮想ネットワーク IR は、プライベート エンドポイントを使用して、サポートされているデータ ソースに安全に接続してスキャンできます。 この方法は、データ統合プロセスの分離とセキュリティ保護に役立ちます。 詳細については、「 Microsoft Purview アカウントでマネージド仮想ネットワークを使用する」を参照してください。

Azure Databricks を使用する場合は、Microsoft Purview に加えて Azure Databricks Unity カタログ を使用することをお勧めします。 Unity Catalog は、Databricks ワークスペース全体で一元的なアクセス制御、監査、系列、およびデータ検出機能を提供します。 詳細については、Unity Catalog のベスト プラクティスを参照してください。

この記事では、ガバナンスに Microsoft Purview を使用することに重点を置いていますが、企業は、Alation、Okera、Collibra などの他の製品に投資している可能性があります。 これらのソリューションはサブスクリプション ベースです。 データ管理ランディング ゾーンにデプロイすることをお勧めします。 カスタム統合が必要な場合があります。

データの検出

データ検出には、企業が所有しているすべてのデータの状態が反映されます。 このデータは、データ資産と呼ばれます。 データ検出を行うと、データ資産がスキャンおよび分類されます。 このデータ スキャン プロセスは、設定されたスケジュールに従ってデータ ソースに直接接続します。

新しいデータ ランディング ゾーンを環境に追加する場合、関連付けられているデータ レイクとポリグロットな永続化ソースは、データ カタログ クローラーによってスキャンされるソースとして登録する必要があります。

カタログを設定するためにデータ資産の自動検出を使用すると、次のことができます。

  • Azure とオンプレミスのデータ ソースからメタデータをクロールする
  • データ レイク、BLOB、およびその他のサポートされているターゲットをスキャンする
  • XML、TSV、CSV、PSV、SSV、JSON、Parquet、Avro、ORC のファイルの種類のデータ ターゲットからスキーマを抽出する
  • 構成可能なスキャンのスケジュールとスキャン ルール セットを使用して、カタログの自動更新を許可する

重要

新しいデータ ランディング ゾーンを環境に追加する場合は、データ カタログ クローラーがデータ整合性をスキャン、管理、管理するためのソースとして、Azure DevOps を介して関連付けられているデータ レイクとポリグロット ストレージを登録します。

データ分類

Microsoft Purview では、ファイル、テーブル、または列の資産に、システムまたはカスタムのデータ分類を適用できます。

データ分類は、サブジェクト タグに似ています。 Microsoft Purview は、スキャン中にデータ資産内で見つかった特定のデータ型のコンテンツをマークして識別します。 秘密度ラベルを使用すると、組織データ内の分類の種類のカテゴリを識別できます。 また、秘密度ラベルを使用して、各カテゴリに適用したいポリシーをグループ化することもできます。 Microsoft Purview では、Microsoft 365 と同じ機密情報の種類を使用するため、コンテンツとデータ資産全体にわたって既存のセキュリティ ポリシーと保護を拡張できます。

Azure Purview では、ドキュメントをスキャンし、自動的に分類することができます。 たとえば、multiple.docx という名前のファイルがあり、その内容に国民識別番号が含まれている場合、Microsoft Purview によって、EU National Identification Number のような分類が資産の詳細ページに追加されます。

Microsoft Defender for SQL は、Azure SQL Database と Azure SQL Managed Instance で使用できる機能です。 機密データの検出と分類、データベースの潜在的な脆弱性の検出と軽減、データベースへの脅威を示す可能性がある異常なアクティビティの検出を行う機能が含まれています。 Microsoft Defender for SQL では、これらの機能を有効にして管理するための単一のジャンプ場所が提供されます。

次のステップ