Microsoft Purview Data Lineage のベスト プラクティス

データ系列は、データの配信元をまたぐライフサイクルと、データ資産間で時間の経過と同時に移動するライフサイクルとして広く理解されています。 Microsoft Purview では、organizationのデータ資産のさまざまな部分のデータと、次のようなさまざまな準備レベルのデータ系列をキャプチャできます。

  • さまざまなプラットフォームからステージングされた生データ
  • 変換および準備されたデータ
  • 視覚化プラットフォームで使用されるデータ

リネージュを採用する必要があるのはなぜですか?

データ系列は、存在するデータ、格納場所、およびシステム間の流れ方を記述するプロセスです。 データ系列が重要な理由は多数ありますが、大まかに見ると、これらすべてを 3 つのカテゴリに分類できます。ここでは、次の 3 つのカテゴリを紹介します。

  • レポート内のデータを追跡する
  • 影響分析
  • データライフ サイクルを通じてデータが存在する変更と場所をキャプチャする

Azure Data Factory系列のベスト プラクティスと考慮事項

Azure Data Factory インスタンス

  • Data Factory の接続状態が [接続済み] に変わるまで、データ系列はカタログに自動的に報告されません。 残りの状態 [切断済み] と [CannotAccess] は系列をキャプチャできません。

    データ ファクトリ接続の一覧を示すスクリーン ショット。

  • 各 Data Factory インスタンスは、1 つの Microsoft Purview アカウントにのみ接続できます。 別の Microsoft Purview アカウントで新しい接続を確立できますが、これにより既存の接続が切断されます。

    Azure Data Factoryを切断するための警告を示すスクリーンショット。

  • データ ファクトリのマネージド ID は、Microsoft Purview アカウントで系列プッシュ操作を認証するために使用されます。 データ ファクトリのマネージド ID には、Microsoft Purview ルート コレクションに対する Data Curator ロールが必要です。

  • 現時点では、一度に接続できるデータ ファクトリは 10 個のみです。 10 個を超えるデータ ファクトリを追加する場合は、ウィザードを使用して一度に 10 個の新しいデータ ファクトリ接続を追加するか、API を使用して 1 回の操作で 10 を超えるデータ ファクトリを接続してください。

Azure Data Factoryアクティビティ

  • Microsoft Purview は、次のAzure Data Factoryアクティビティからランタイム系列をキャプチャします。

  • ソースまたは宛先がサポートされていないデータ ストレージ システムを使用している場合、Microsoft Purview は系列を削除します。

    • コピー アクティビティでサポートされているデータ ソースは、Azure Data Factoryへの接続のサポートCopy アクティビティ一覧表示されます
    • データ フロー アクティビティでサポートされているデータ ソースは、connect to Azure Data FactoryのサポートData Flow一覧表示されます
    • SSIS でサポートされているデータ ソースの一覧には、SQL Server Integration Services からの系列SSIS 実行パッケージ アクティビティのサポートが記載されています
  • Microsoft Purview では、コピー アクティビティでコピー アクティビティ機能Azure Data Factory使用している場合、系列をキャプチャできません。「Connect to Azure Data Factoryコピー アクティビティ系列に関する制限事項」に記載されています。

  • データフロー アクティビティの系列の場合、Microsoft Purview ではソースとシンクのみがサポートされます。 データフロー変換の系列はまだサポートされていません。

  • データ フロー系列は、Microsoft Purview リソース セットと統合されません。 リソース セットの例:
    修飾名: https://myblob.blob.core.windows.net/sample-data/data{N}.csv 表示名: "data"

  • SSIS パッケージの実行アクティビティの系列については、ソースと宛先のみをサポートします。 変換の系列はまだサポートされていません。

    Microsoft Purview での SSIS の実行系列のスクリーンショット。

  • Microsoft Purview でAzure Data Factory系列をプッシュするには、次のステップ バイ ステップ ガイドを参照してください。

次の手順