HDFS ファイル変換先
適用対象: SQL Server Azure Data Factory の SSIS 統合ランタイム
HDFS ファイル変換先コンポーネントは、SSIS パッケージが HDFS ファイルにデータを書き込めるようにします。 サポートされるファイル形式は、テキスト、Avro、および ORC です。
HDFS ファイル変換先を構成するには、HDFS ファイル ソースをデータ フロー デザイナー上にドラッグ アンド ドロップし、このコンポーネントをダブルクリックしてエディターを開きます。
Options
[Hadoop File Destination Editor] (Hadoop ファイル変換先エディター) ダイアログ ボックスの [全般] タブで、次のオプションを構成します。
フィールド | 説明 |
---|---|
Hadoop 接続 | 既存の Hadoop 接続マネージャーを指定するか、新しい Hadoop 接続マネージャーを作成します。 この接続マネージャーは、HDFS ファイルがホストされる場所を示します。 |
ファイル パス | HDFS ファイルの名前を指定します。 |
ファイル形式 | HDFS ファイルの形式を指定します。 テキスト、Avro、または ORC 形式を選択できます。 |
Column delimiter character (列区切り文字) | テキスト形式を選択した場合は、列区切り文字を指定します。 |
[先頭データ行を列名として使用する] | テキスト形式を選択した場合は、ファイルの最初の行に列の名前が含まれるかどうかを示します。 |
これらのオプションを構成した後、 [列] タブを選択し、データ フローのソース列を変換先列にマップします。
ORC ファイル形式の前提条件
ORC ファイル形式を使用するには Java が必須です。 Java ビルドのアーキテクチャ (32/64 ビット) は、SSIS ランタイムのそれと一致しなければ使用できません。 次の Java ビルドがテストされています。
Zulu の OpenJDK を設定する
- インストール zip パッケージをダウンロードし、抽出します。
- コマンド プロンプトから
sysdm.cpl
を実行します。 - [詳細設定] タブの [環境変数] を選択します。
- [システム変数] セクションで [新規] を選択します。
- [変数名] に「
JAVA_HOME
」と入力します。 - [ディレクトリの参照] を選択し、解凍したフォルダーに移動し、
jre
サブフォルダーを選択します。 [OK] を選択すると、変数の値が自動的に入力されます。 - [OK] を選択し、 [新しいシステム変数] ダイアログ ボックスを閉じます。
- [OK] を選択し、 [環境変数] ダイアログ ボックスを閉じます。
- [OK] を選択して [システム プロパティ] ダイアログ ボックスを閉じます。
Oracle の Java SE Runtime Environment を設定する
- exe インストーラーをダウンロードし、実行します。
- インストーラーの指示に従い、設定を完了します。