Data Factory ラボへようこそ。 この記事では、Medallion タスク フローの概要、データ移動の調整、データの変換とコピーなどの重要な側面に焦点を当てて、Fabric Data Factory を利用するプロセスについて説明します。
このガイドに従うことで、Data Factory の使用を開始し、その強力な機能を適用して、データ移動の調整、データの変換、データのコピーを効率的に行うことができます。
このラボは、ファブリック インターフェイスをシミュレートするクリックバイクリック環境です。 ラボはシミュレーションであるため、実際の Fabric 環境を使用しないため、サインアップなしでラボにアクセスできます。
開始するには、Data Factory ラボ環境にアクセスする必要があります。 これを行うには、次のリンクを参照してください。
メダリオンのタスクフロー
Medallion タスク フローは、データ製品を構築して配信するための多層アプローチです。 データ品質を段階的かつ段階的に向上させ、ビジネス インテリジェンス (BI) および人工知能 (AI) アプリケーションに最適です。 Medallion アーキテクチャは、ブロンズ (生データ)、シルバー (検証済みデータ)、ゴールド (エンリッチされたデータ) の 3 つのレイヤーで構成されています。 これらのレイヤーをデータが移動すると、検証と変換が行われ、ACID プロパティ (原子性、整合性、分離性、持続性) が満たされ、分析用に最適化されます。
データ移動の調整
Data Factory でのデータ移動の調整には、ソースから宛先へのデータ フローをスムーズに行うために、さまざまなアクティビティを調整する必要があります。 パイプライン式ビルダーを使用して、特定の条件に基づいてデータのフローを制御する複雑な式を作成できます。 これにより、データ移動を自動化し、データが効率的に処理されるようにすることができます。
データの変換とコピー
データの変換とコピーには、Data Factory 内のさまざまなツールとアクティビティを使用してデータを準備および移動する必要があります。 たとえば、Dataflows Gen 2 を使用すると、より高いスケールでデータを取り込んで準備し、さまざまなストレージ ソリューションを介して OneLake にデータを配置できます。 また、コピー ジョブ 項目を使用して、バッチ、増分 (CDC)、リアルタイム データ コピーなどの複数の配信スタイルを使用して、任意のソースから任意の宛先にシームレスにデータを移動することもできます。