Azure Synapse Analytics でデータをマッピングする

Map Data (データのマッピング) ツールとは

Map Data (データのマッピング) ツールは、ユーザーがコードを書くことなく、ソース データから Synapse Lake データベースのテーブルへの ETL マッピングやマッピング データ フローを作成するために使用できる、ガイド付きのプロセスです。 このプロセスは、ユーザーが Synapse Lake データベースの変換先テーブルを選択し、ソース データをこれらのテーブルにマッピングすることから始まります。

Synapse Lake データベースの詳細については、Azure Synappse データベース テンプレートの概要 - Azure Synapse Analytics | Microsoft Docs に関するページを参照してください

Map Data (データのマッピング) を使用すると、ユーザーはガイド付きのエクスペリエンスにより、キャンバスを 1 から始めなくてもマッピング データ フローを生成できます。 その後、Synapse パイプラインで実行可能なスケーラブルなマッピング データ フローをすばやく生成できます。

作業の開始

Map Data (データのマッピング) ツールは、Synapse Lake データベース エクスペリエンス内から起動します。 ここから、Map Data (データのマッピング) ツールを選択してプロセスを開始します。

Map Data (データのマッピング) を開く方法を示すスクリーンショット。

Map Data (データのマッピング) を利用するには、データのプレビューやソース ファイルのスキーマを読み取るための計算能力が必要です。 セッションで初めて Map Data (データのマッピング) を使用する場合は、クラスターをウォームアップする必要があります。 デバッグ クラスターを示すスクリーンショット。

まず、Lake データベース テーブルにマップするデータ ソースを選択します。 現在サポートされているデータ ソースは、Azure Data Lake Storage Gen 2 および Synapse Lake データベースです。 ソースを示すスクリーンショット。

選択できるファイルの種類

Azure Data Lake Storage Gen 2 などのファイル ストアを選択する場合は、次のファイルの種類がサポートされます:

  • Common Data Model
  • 区切りテキスト
  • Parquet

データ マッピングを作成する

選択したソースの種類でデータ マッピングを構成します。 マップ データ ファイルの構成設定を示すスクリーンショット。

Note

フォルダーまたは 1 個のファイルを選択できます。 フォルダーを選択すると、複数のファイルをレイク データベース テーブルにマップできます。 フォルダーを選択した場合は、必要に応じて、引き続き特定のファイルのみを含めるよう選択した後もダイアログが表示されます。

データ マッピングに名前を付け、Synapse Lake データベースの変換先を選択します。 名前付けと変換先を示すスクリーンショット。

ソースからターゲットへのマッピング

Synapse Lake データベースの変換先テーブルにマップするプライマリ ソース テーブルを選択します。 データのマッピング規則を示すスクリーンショット。

新しいマッピング

[New Mapping](新しいマッピング) ボタンを使用して、マッピングまたは変換を作成するマッピング メソッドを追加します。

その他のソース

マッピングに他のソースを結合および追加するには、[Additional source](追加のソース) ボタンを使用します。

データのプレビュー

[データのプレビュー] タブには、各変換のデータの対話型スナップショットが表示されます。 詳細については、デバッグ モードでのデータのプレビューに関するセクションを参照してください。

マッピング メソッド

次のマッピング メソッドがサポートされています。

パイプラインの作成

Map Data (データのマッピング) による変換が完了したら、[Create pipeline](パイプラインの作成) ボタンを選択してマッピング データ フローとパイプラインを生成し、変換をデバッグして実行します。