マッピングデータフローでの行の変更変換

[アーティクル]
10/03/2024

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューション、Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータサイエンス、リアルタイム分析、ビジネスインテリジェンス、レポートまで、あらゆるものをカバーしています。無料で新しい試用版を開始する方法について説明します。

データフローは、Azure Data Factory および Azure Synapse Pipelines の両方で使用できます。この記事は、マッピングデータフローに適用されます。変換を初めて使用する場合は、概要の記事「マッピングデータフローを使用してデータを変換する」を参照してください。

行の変更変換を使用して、行の挿入、削除、更新、アップサートポリシーを設定します。一対多の条件を式として追加できます。各行は最初に一致した式に対応するポリシーでマークされるので、これらの条件は優先度の順に指定する必要があります。これらの条件によってそれぞれ、行が挿入、更新、削除、アップサートされます。行の変更では、ご利用のデータベースに対して DDL と DML の両方を生成できます。

$[Alter row settings]$行の変更の設定$$

行の変更変換は、自分のデータフローのデータベース、REST、または Azure Cosmos DB シンクでのみ動作します。行に割り当てるアクション (挿入、更新、削除、アップサート) は、デバッグセッションの間には発生しません。データベースのテーブルに行変更ポリシーを適用するには、データフロー実行アクティビティをパイプラインで実行します。

Note

行の変更変換は、SQL Server や SAP などのネイティブ CDC ソースを使う変更データキャプチャデータフローには必要ありません。それらのインスタンスでは、ADF によって行マーカーが自動的に検出されるため、行の変更ポリシーは必要ありません。

既定の行ポリシーを指定する

行の変更変換を作成し、true() の条件を持つ行ポリシーを指定します。前に定義した式のいずれにも一致しない各行は、指定した行ポリシーでマークされます。既定では、どの条件式にも一致しない各行は、Insert でマークされます。

行の変更ポリシー

注意

すべての行を 1 つのポリシーでマークするには、そのポリシーの条件を作成し、条件を true() として指定します。

データのプレビューでポリシーを表示する

デバッグモードを使用して、[データのプレビュー] ペインで行の変更ポリシーの結果を表示します。行変更変換のデータプレビューでは、ターゲットに対する DDL または DML アクションは生成されません。

行の変更を行う複数のポリシー

各行変更ポリシーのアイコンは、挿入、更新、アップサート、または削除アクションが発生するかどうかを示します。上部ヘッダーは、プレビューで各ポリシーが影響を与える行数を示します。

シンクで行の変更ポリシーを許可する

行の変更ポリシーを機能させるには、データストリームがデータベースまたは Azure Cosmos DB シンクに書き込む必要があります。シンクの [設定] タブで、そのシンクで許可する行の変更ポリシーを有効にします。

行の変更のシンク

既定の動作では、挿入のみが許可されます。更新、upsert、または削除を許可するには、その条件に対応する、シンクのチェックボックスをオンにします。更新、upsert、または削除が有効になっている場合は、シンク内のどのキー列を照合するかを指定する必要があります。

Note

挿入、更新、または upsert によりシンクのターゲットテーブルのスキーマが変更される場合、データフローは失敗します。データベース内のターゲットスキーマを変更するには、テーブルアクションとして [Recreate table](テーブルの再作成) を選択します。これにより、新しいスキーマ定義でご利用のテーブルがドロップされ、再作成されます。

シンク変換では、一意の行 ID を表す 1 つのキーまたは一連のキーがターゲットデータベースに必要です。 SQL シンクの場合、それらのキーの設定は、シンク設定タブで行います。Azure CosmosDB の場合は、設定でパーティションキーを設定し、シンクのマッピングで Azure CosmosDB のシステムフィールド "ID" も設定します。 Azure CosmosDB の場合、更新、アップサート、削除のためにはシステム列 "ID" を含める必要があります。

Azure SQL Database と Azure Synapse を使用したマージと upsert

データフローでは、upsert オプションを使用した Azure SQL Database と Azure Synapse データベースプール (データウェアハウス) に対するマージがサポートされています。

しかし、ターゲットデータベーススキーマでキー列の ID プロパティが使われているシナリオが発生する場合があります。サービスでは、ユーザーは更新とアップサートの行の値を一致させるために使用するキーを識別する必要があります。ただし、ターゲット列に ID プロパティが設定されていて、アップサートポリシーを使っている場合、ターゲットデータベースでは列への書き込みが許可されません。分散テーブルのディストリビューション列に対して upsert を実行しようとすると、エラーが発生する場合もあります。

これを修正する方法を次に示します。

シンク変換の設定に移動し、"キー列の書き込みのスキップ" を設定します。これにより、マッピングのキー値として選んだ列を書き込まないようにサービスに通知します。
そのキー列が ID 列の問題の原因になっている列でない場合は、シンク変換前処理の SQL オプション SET IDENTITY_INSERT tbl_content ON を使用できます。次に、後処理の SQL プロパティ SET IDENTITY_INSERT tbl_content OFF を指定してこれをオフにします。
ID ケースとディストリビューション列ケースの両方について、条件分割変換を使用して別の更新条件と別の挿入条件を使用する Upsert からロジックを切り替えることができます。この方法では、更新パスにマッピングを設定して、キー列のマッピングを無視できます。

データフローのスクリプト

構文

<incomingStream>
    alterRow(
           insertIf(<condition>?),
           updateIf(<condition>?),
           deleteIf(<condition>?),
           upsertIf(<condition>?),
        ) ~> <alterRowTransformationName>

例

以下の例は、受信ストリーム SpecifyUpsertConditions を受け取り、行の変更条件を 3 つ作成する、CleanData という行の変更変換です。前の変換では、データベース内で行の挿入、更新、削除を実行するかどうかを決定する alterRowCondition という列が計算されます。列の値に、行変更ルールと一致する文字列値が含まれている場合は、そのポリシーが割り当てられています。

UI では、この変換は次の図のようになります。

行の変更の例

この変換のデータフロースクリプトは、次のスニペットに含まれています。

SpecifyUpsertConditions alterRow(insertIf(alterRowCondition == 'insert'),
	updateIf(alterRowCondition == 'update'),
	deleteIf(alterRowCondition == 'delete')) ~> AlterRow

行変更変換の後で、データをターゲットのデータストアにシンクすることが必要な場合があります。

次の方法で共有

マッピングデータフローでの行の変更変換

既定の行ポリシーを指定する

データのプレビューでポリシーを表示する

シンクで行の変更ポリシーを許可する

Azure SQL Database と Azure Synapse を使用したマージと upsert

データフローのスクリプト

構文

例

フィードバック

その他のリソース

次の方法で共有

マッピング データ フローでの行の変更変換

既定の行ポリシーを指定する

データのプレビューでポリシーを表示する

シンクで行の変更ポリシーを許可する

Azure SQL Database と Azure Synapse を使用したマージと upsert

データ フローのスクリプト

構文

例

関連するコンテンツ

フィードバック

その他のリソース

マッピングデータフローでの行の変更変換

データフローのスクリプト