次の方法で共有


データ系列

データ系列は、クラウド規模の分析において重要な役割を果たします。 系列は、生データと完成品の間の依存関係を示し、その生データを最終的なデータ製品に変換する変換と操作を説明します。 これは、組織がデータ品質を理解し、コンプライアンスを検証するのに役立ちます。 また、系列によってデータセットと製品に追加されるコンテキストを使用して、検出可能でセルフサービス可能なデータ製品を実現することができます。

データ カタログの主な機能は、データ製品間の系列を表示することです。 Azure Purview は、次の 3 つの Azure Data Factory アクティビティからデータ系列をキャプチャできるようにします。

  • データをコピーする
  • データ フロー
  • SSIS パッケージの実行

Azure Purview では、このネイティブの系列レポートに加えて、Apache Atlas フックまたは REST API を使用したカスタム系列レポートも可能です。

データ系列の図。

重要

Azure Data FactoryパイプラインとAzure Synapse パイプラインは、Azure Purview でのデータ系列を有効にするため、インジェスト ソリューションに対して推奨されます。 それ以外のインジェスト パターンでは、データ処理の一部としてデータ系列を更新するために Apache Atlas API を使用する必要があります。

Azure Purview データ系列

Azure Purview のプラットフォーム機能の 1 つに、データ プロセスによって作成されたデータセット間の系列を表示する機能があります。 Data Factory、Data Share、Power BI などのシステムでは、データの移動時に系列がキャプチャされます。 カスタム系列レポートは、Atlas フックと REST API を使用して取得することもできます。

ヒント

サポートされているシステムとベスト プラクティスの詳細については、「Microsoft Purview データ カタログ系列のユーザー ガイド」を参照してください。

次のステップ

Azure でマスター データを管理する方法について説明します。