次の方法で共有


統合カタログでデータ品質のデータ ソース接続を設定する

データ ソース接続は、統計スナップショットのデータをプロファイリングしたり、データ品質の異常やスコアリングをスキャンしたりするために必要な認証を設定します。

データ ソース接続の設定は、データ資産のデータ品質ライフ サイクルの 4 番目 の手順です。 前の手順は次のとおりです。

  1. すべてのデータ品質機能を使用するには、統合カタログでユーザーにデータ品質スチュワードのアクセス許可を割り当てます
  2. Microsoft Purview データ マップでデータ ソースを登録してスキャンします。
  3. データ製品にデータ資産を追加する

前提条件

  1. データ資産への接続を作成するには、ユーザーが データ品質スチュワード ロールである必要があります。
  2. 少なくとも、接続を設定するデータ ソースへの読み取りアクセス権が必要です。

サポートされているマルチクラウド データ ソース

サポートされているデータ ソース ドキュメントを参照して、サポートされているデータ ソースの一覧を表示します。これには、データ プロファイルのファイル形式や、仮想ネットワークのサポートありとなし、データ品質スキャンが含まれます。

現在、Microsoft Purview では、 マネージド ID を 認証オプションとして使用するデータ品質スキャンのみを実行できます。 データ品質サービスは 、Apache Spark 3.4Delta Lake 2.4 で実行されます。

重要

これらのソースにアクセスするには、Azure Storage ソースにオープン ファイアウォールを設定するか、[信頼された Azure サービスを許可する] を設定するか、プライベート エンドポイントを使用する場合は、データ品質管理仮想ネットワーク構成ガイドに記載されているガイドラインに従う必要があります。

データ ソース接続のセットアップ

  1. 統合カタログで、[正常性管理] を選択し、[データ品質] を選択します。

  2. 一覧からガバナンス ドメインを選択します。

  3. [管理] ドロップダウン リストで、[Connections] を選択して [接続] ページを開きます。

    Microsoft Purview データ品質の [接続] ページのスクリーンショット。

  4. [ 新規 ] を選択して、ガバナンス ドメインのデータ製品とデータ資産の新しい接続を作成します。

    Microsoft Purview データ品質のセットアップ接続ページのスクリーンショット。

  5. 右側のパネルで、次の情報を入力します。

    • 表示名
    • 説明
  6. [ ソースの種類] を選択し、いずれかのデータ ソースを選択します。

  7. データ ソースに応じて、アクセスの詳細を入力します。

  8. テスト接続が成功した場合は、接続構成を 送信 して接続のセットアップを完了します。

ヒント

  • プライベート エンドポイントと Microsoft Purview データ品質管理仮想ネットワークを使用して、リソースへの接続を作成することもできます。 詳細については、 マネージド仮想ネットワーク に関する記事を参照してください。
  • 接続のセットアップ手順は、ネイティブ コネクタによって異なります。 ネイティブ コネクタに関する記事から、Azure DatabricksSnowflakeGoogle BigQueryおよび Azure Synapse コネクタの接続のセットアップ手順を確認します。
  • Azure Dedicated SQL Pool (旧称 SQL DW) 接続を設定するには、ソースの種類をデータベースAzure SQL選択し、エンドポイント名としてsqldatawarehouse.database.windows.netを追加する必要があります。
  • 仮想ネットワーク リージョンは、選択したソース リージョンから自動的に設定されます。 仮想ネットワーク プロビジョニングの管理の詳細を確認します。

ソースに対する Microsoft Purview アクセス許可を付与する

接続が作成されたので、データ ソースをスキャンできるように、Microsoft Purview マネージド ID にはデータ ソースに対するアクセス許可が必要です。

次の手順

  1. データ ソース内の資産のデータ プロファイルを構成して実行します。
  2. プロファイリング結果に基づいてデータ品質ルールを設定し、データ資産に適用します。
  3. データ製品でデータ品質スキャンを構成して実行 し、データ製品でサポートされているすべての資産の品質を評価します。
  4. スキャン結果を確認 して、データ製品の現在のデータ品質を評価します。