次の方法で共有


HDFS ファイル変換先

適用対象: SQL Server Azure Data Factory の SSIS 統合ランタイム

HDFS ファイル変換先コンポーネントは、SSIS パッケージが HDFS ファイルにデータを書き込めるようにします。 サポートされるファイル形式は、テキスト、Avro、および ORC です。

HDFS ファイル変換先を構成するには、HDFS ファイル ソースをデータ フロー デザイナー上にドラッグ アンド ドロップし、このコンポーネントをダブルクリックしてエディターを開きます。

HDFS ファイル変換先エディター

Options

[Hadoop File Destination Editor] (Hadoop ファイル変換先エディター) ダイアログ ボックスの [全般] タブで、次のオプションを構成します。

フィールド 説明
Hadoop 接続 既存の Hadoop 接続マネージャーを指定するか、新しい Hadoop 接続マネージャーを作成します。 この接続マネージャーは、HDFS ファイルがホストされる場所を示します。
ファイル パス HDFS ファイルの名前を指定します。
ファイル形式 HDFS ファイルの形式を指定します。 テキスト、Avro、または ORC 形式を選択できます。
Column delimiter character (列区切り文字) テキスト形式を選択した場合は、列区切り文字を指定します。
[先頭データ行を列名として使用する] テキスト形式を選択した場合は、ファイルの最初の行に列の名前が含まれるかどうかを示します。

これらのオプションを構成した後、 [列] タブを選択し、データ フローのソース列を変換先列にマップします。

ORC ファイル形式の前提条件

ORC ファイル形式を使用するには Java が必須です。 Java ビルドのアーキテクチャ (32/64 ビット) は、SSIS ランタイムのそれと一致しなければ使用できません。 次の Java ビルドがテストされています。

Zulu の OpenJDK を設定する

  1. インストール zip パッケージをダウンロードし、抽出します。
  2. コマンド プロンプトから sysdm.cpl を実行します。
  3. [詳細設定] タブの [環境変数] を選択します。
  4. [システム変数] セクションで [新規] を選択します。
  5. [変数名] に「JAVA_HOME」と入力します。
  6. [ディレクトリの参照] を選択し、解凍したフォルダーに移動し、jre サブフォルダーを選択します。 [OK] を選択すると、変数の値が自動的に入力されます。
  7. [OK] を選択し、 [新しいシステム変数] ダイアログ ボックスを閉じます。
  8. [OK] を選択し、 [環境変数] ダイアログ ボックスを閉じます。
  9. [OK] を選択して [システム プロパティ] ダイアログ ボックスを閉じます。

Oracle の Java SE Runtime Environment を設定する

  1. exe インストーラーをダウンロードし、実行します。
  2. インストーラーの指示に従い、設定を完了します。

参照

Hadoop 接続マネージャー
HDFS ファイル変換元