マッピング データ フロー変換の概要

適用対象: Azure Data Factory Azure Synapse Analytics

ヒント

企業向けのオールインワン分析ソリューションである Microsoft Fabric の Data Factory をお試しください。 Microsoft Fabric は、データ移動からデータ サイエンス、リアルタイム分析、ビジネス インテリジェンス、レポートまで、あらゆるものをカバーしています。 無料で新しい試用版を開始する方法について説明します。

データ フローは、Azure Data Factory および Azure Synapse Pipelines の両方で使用できます。 この記事は、マッピング データ フローに適用されます。 変換を初めて使用する場合は、概要の記事「マッピング データ フローを使用してデータを変換する」を参照してください。

データ フローのマッピングで現在サポートされている変換のリストを次に示します。 それぞれの変換をクリックして、構成の詳細を確認します。

Name カテゴリ 説明
集計 スキーマ修飾子 既存の列または計算列によってグループ化される、SUM、MIN、MAX、COUNT などのさまざまな種類の集計を定義できます。
行の変更 行の修飾子 行に対して、挿入、削除、更新および upsert の各ポリシーを設定します。
Assert 行の修飾子 各行のアサート ルールを設定します。
Cast スキーマ修飾子 型チェックを使用して列データ型を変更します。
条件分割 複数の入力/出力 一致条件に基づいて、データの行を異なるストリームにルートします。
派生列 スキーマ修飾子 データ フローの言語を使用して、新しい列を生成するか、既存のフィールドを変更します。
外部呼び出し スキーマ修飾子 外部エンドポイントを行ごとにインラインで呼び出します。
Exists 複数の入力/出力 お使いのデータが別のソースまたはストリームに存在するかどうかを確認します。
Assert 行の修飾子 条件に基づいて、行をフィルターします。
フラット化 フォーマッタ JSON などの階層構造体の中で配列値を取得し、それらを個々の行に展開します。
Flowlet Flowlets 再利用可能なカスタムの変換ロジックを構築して追加します。
Join 複数の入力/出力 2 つのソースまたはストリームのデータを結合します。
Lookup 複数の入力/出力 別のソースからデータを参照します。
新しいブランチ 複数の入力/出力 同じデータ ストリームに対して複数の操作と変換を行います。
Parse フォーマッタ JSON、区切りテキスト、または XML 形式のテキストの文字列であるデータ ストリーム内のテキスト列を解析します。
ピボット スキーマ修飾子 1 つまたは複数のグループ化された列が、個々の列に変換された個別の行の値を持つ集計。
順位 スキーマ修飾子 並べ替え条件に基づいて順序付けされた順位付けを生成する
Select スキーマ修飾子 別名列とストリーム名、列のドロップまたは並べ替え
Sink - お使いのデータの最終受信先
Sort 行の修飾子 現在のデータ ストリームで受信行を並べ替える
ソース - データ フローのデータ ソース
Stringify フォーマッタ 複合型をプレーン文字列に変換する
代理キー スキーマ修飾子 ビジネス以外の任意のキー値のインクリメントを追加する
Union (結合) 複数の入力/出力 複数のデータ ストリームを垂直方向に結合する
ピボット解除 スキーマ修飾子 列を行の値にピボットする
ウィンドウ スキーマ修飾子 データ ストリーム内の列のウィンドウベースの集計を定義します。