次の方法で共有


Dataflow Gen2 ステージング成果物のデータ

パフォーマンスと信頼性を向上させるために、Dataflow Gen2 はステージング項目を使用して、データ変換中に中間データを格納します。 この記事では、ステージング項目の概要と、その中でデータを処理する方法について説明します。

ステージング成果物とは

ステージング成果物は、データ変換中にデータを格納するために Dataflow Gen2 によって使用される中間データの保存場所です。 これらの成果物は、"DataflowsStagingLakehouse" と "DataflowsStagingWarehouse" の名前で行われます。 ステージング成果物は、パフォーマンスを向上させるために、データ変換中に中間データを格納するために使用されます。 これらの成果物は、最初のデータフローを作成するときに自動的に作成され、Dataflow Gen2 によって管理されます。 これらの成果物はワークスペース内のユーザーには表示されませんが、Get Data や Lakehouse エクスプローラーなどの他のエクスペリエンスで表示される場合があります。 ステージング成果物内のデータには、予期しない動作が発生する可能性があるため、直接アクセスまたは変更しないことを強くお勧めします。 また、ステージング成果物に自分でデータを格納することはサポートされておらず、データが失われる可能性があります。

ステージング成果物内のデータ

ステージング成果物は、ユーザーによる直接アクセス用に設計されていません。 Dataflow Gen2 は、ステージング成果物内のデータを管理し、データが一貫した状態であることを確認します。 ステージング成果物内のデータへの直接アクセスはサポートされていません。データが一貫した状態であることを保証することができないためです。 ステージング成果物のデータにアクセスする必要がある場合は、Power BI、Excel、またはその他のデータフローのデータフロー コネクタを使用できます。

ステージング成果物からのデータの削除は、次のいずれかのアクションによって強制できます。

  • データフローのステージングを無効にして更新します (30 日後にデータをガベージ コレクションします)。
  • データフローを削除します (データを直接削除します)。
  • ワークスペースを削除します (StagingLakehouse と StagingWarehouse を直接削除します)。