マッピングデータフローにおけるサロゲートキー変換

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

Data Factory in Microsoft Fabric は、よりシンプルなアーキテクチャ、組み込みの AI、および新機能を備えた次世代のAzure Data Factoryです。データ統合を初めて使用する場合は、Fabric Data Factory から始めます。既存の ADF ワークロードをFabricにアップグレードして、データサイエンス、リアルタイム分析、レポートの新機能にアクセスできます。

Fabric無料試用版を開始します。
Azure Data Factory から Microsoft Fabric の Data Factory へのアップグレード

データフローは、Azure Data Factory パイプラインとAzure Synapse Analytics パイプラインの両方で使用できます。この記事は、マッピングデータフローに適用されます。変換を初めて使用する場合は、入門記事「マッピングデータフローを使用したデータの変換」を参照してください。

データの各行に増分キー値を追加するには、代理キー変換を使用します。これは、スタースキーマ分析データモデルでディメンションテーブルを設計する場合に便利です。スタースキーマでは、ディメンションテーブル内の各メンバーには、ビジネスキー以外の一意のキーが必要です。

構成

代理キー変換

キー列: 生成された代理キー列の名前。

開始値: 生成される最小のキー値。

既存のソースからキーをインクリメントする

ソース内に存在する値からシーケンスを開始するには、キャッシュシンクを使用してその値を保存し、派生列変換を使用して 2 つの値をまとめて追加することをお勧めします。キャッシュされた参照を使用して出力を取得し、生成されたキーにそれを追加します。詳細については、キャッシュシンクおよびキャッシュされた参照に関するページを参照してください。

代理キー参照

既存の最大値からの増分

以前の最大によってキー値をシードするには、ソースデータがある場所に基づいて 2 つの手法を使用できます。

データベースソース

SQL クエリオプションを使用して、ソースから MAX () を選択します。たとえば、Select MAX(<surrogateKeyName>) as maxval from <sourceTable> のようにします。

代理キークエリ

ファイルソース

前の最大値がファイル内にある場合は、集計変換内で max() 関数を使用して、前の最大値を取得します。

代理キーファイル

どちらの場合も、キャッシュシンクに書き込み、値を参照する必要があります。

データフローのスクリプト

構文

<incomingStream> 
    keyGenerate(
        output(<surrogateColumnName> as long),
        startAt: <number>L
    ) ~> <surrogateKeyTransformationName>

例

代理キー変換

次のコードスニペットには、上記の代理キー構成に対するデータフロースクリプトが含まれています。

AggregateDayStats
    keyGenerate(
        output(key as long),
        startAt: 1L
    ) ~> SurrogateKey1

これらの例では、結合と派生列の変換を使用します。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-04-13

マッピング データフローにおけるサロゲートキー変換

構成

既存のソースからキーをインクリメントする

既存の最大値からの増分

データベース ソース

ファイル ソース

データ フローのスクリプト

構文

例

関連するコンテンツ

フィードバック

その他のリソース

マッピングデータフローにおけるサロゲートキー変換

データベースソース

ファイルソース

データフローのスクリプト