クイックスタート: Synapse Studio を使用した一括読み込み

2023-06-01

Synapse Studio の一括読み込みウィザードを使用すると、データを簡単に読み込むことができます。 Synapse Studio は Azure Synapse Analytics の機能です。一括読み込みウィザードの手順に従うと、COPY ステートメントを使用してデータを一括で専用 SQL プールに読み込むための T-SQL スクリプトを作成できます。

一括読み込みウィザードへのエントリポイント

データを一括読み込みするには、Synapse Studio 内の以下の領域 (ご使用のワークスペースにアタッチされている Azure ストレージアカウントのファイルまたはフォルダー) を右クリックします。

Screenshot that shows right-clicking a file or folder from a storage account.

前提条件

このウィザードを使うと、認証に Microsoft Entra パススルーを使う COPY ステートメントが生成されます。少なくとも Azure Data Lake Storage Gen2 アカウントでのストレージ BLOB データ共同作成者 Azure ロールがある状態で、ワークスペースに Microsoft Entra ユーザーがアクセスできる必要があります。
COPY ステートメントを使用するために必要なアクセス許可が必要です。さらに、読み込み先のテーブルを新しく作成する場合は、テーブルの作成アクセス許可が必要です。
Data Lake Storage Gen2 アカウントに関連付けられているリンクされたサービスには、読み込む "ファイルまたはフォルダーへのアクセス権が必要" です。たとえば、リンクされたサービスの認証メカニズムがマネージド ID の場合、ワークスペースのマネージド ID には、ストレージアカウントに対するストレージ BLOB データ閲覧者アクセス許可が少なくとも必要です。
お使いのワークスペースで仮想ネットワークが有効になっている場合は、ソースデータとエラーファイルの場所に対して Data Lake Storage Gen2 アカウントのリンクされたサービスに関連付けられている統合ランタイムで、インタラクティブな作成が有効になっていることを確認してください。インタラクティブな作成は、ウィザード内での自動スキーマ検出、ソースファイルの内容のプレビュー、および Data Lake Storage Gen2 ストレージアカウントの参照に必要です。

手順

[Source storage location](ソースストレージの場所) パネルで、ストレージアカウントと、読み込み元のファイルまたはフォルダーを選択します。ファイルのソースフィールドをターゲットの適切な SQL データ型にマッピングするなど、Parquet ファイルおよび区切りテキスト (CSV) ファイルの検出がウィザードによって自動的に試行されます。
一括読み込み処理中に拒否された行が存在する場合のエラー設定など、ファイル形式の設定を選択します。また、 [データのプレビュー] を選択すると、COPY ステートメントによってファイルがどのように解析されるかを確認できるため、ファイル形式設定を構成する際の参考にすることができます。ファイル形式設定を変更するたびに [データのプレビュー] を選択して、更新された設定で COPY ステートメントによってファイルがどのように解析されるかを確認します。
Note
- 複数文字のフィールドターミネータを使用したデータのプレビューは、一括読み込みウィザードではサポートされません。複数文字のフィールドターミネータを指定した場合、データが 1 列内でプレビューされます。
- [列名の推論] を選択すると、 [先頭行] フィールドによって指定された先頭行から、一括読み込みウィザードによって列名が解析されます。このヘッダー行を無視するために、COPY ステートメントの FIRSTROW の値が 1 行分、自動的にインクリメントされます。
- COPY ステートメントでは、複数文字の行ターミネータを指定できます。ただし一括読み込みウィザードではサポートされません。指定した場合はエラーがスローされます。
読み込みに使用する専用 SQL プールを選択します (既存のテーブルへの読み込みか、新しいテーブルへの読み込みか)。
[列マッピングの構成] を選択して、列マッピングが適切であることを確認します。 [Infer column names](列名の推測) を有効にした場合は、列名が自動的に検出されることに注意してください。新しいテーブルの場合、ターゲット列のデータ型を更新するには、列マッピングを構成することが非常に重要です。
[スクリプトを開く] を選択します。データレイクからの読み込みを実行する COPY ステートメントを含んだ T-SQL スクリプトが生成されます。

次のステップ

COPY ステートメントに関する記事を参照して COPY 機能の詳細を確認する。
データ読み込みの概要に関する記事で、ETL (抽出、変換、読み込み) プロセスの使用について確認する。

次の方法で共有

クイックスタート: Synapse Studio を使用した一括読み込み

一括読み込みウィザードへのエントリ ポイント

前提条件

手順

次のステップ

フィードバック

その他のリソース

一括読み込みウィザードへのエントリポイント