Azure HDInsight Pig Task
適用対象: SQL Server Azure Data Factory の SSIS 統合ランタイム
Azure HDInsight クラスターで Hive スクリプトを実行するには、 Azure HDInsight Hive Task を使用します。
Azure HDInsight Hive Taskを追加するには、SSIS デザイナーにドラッグ アンド ドロップし、ダブルクリックまたは右クリックして、 [編集] をクリックします。 [Azure HDInsight Hive Task エディター] ダイアログ ボックスが表示されます。
Azure HDInsight Hive Task は、SQL Server Integration Services (SSIS) Feature Pack for Azure のコンポーネントです。
次の一覧で、このダイアログ ボックスのフィールドについて説明します。
[HDInsightConnection] フィールドで、既存の Azure HDInsight 接続マネージャーを選択するか、スクリプトを実行するために使用される Azure HDInsight クラスターを参照する新しいものを作成します。
[AzureStorageConnection] フィールドで、既存の Azure ストレージ接続マネージャーを選択するか、クラスターに関連付けられている Azure ストレージ アカウントを参照する新しいものを作成します。 これは、スクリプト実行の出力とエラー ログをダウンロードする場合にのみ必要です。
[BlobContainer] フィールドでは、クラスターに関連付けられているストレージ コンテナー名を指定します。 これは、スクリプト実行の出力とエラー ログをダウンロードする場合にのみ必要です。
[LocalLogFolder] フィールドでは、スクリプト実行の出力およびエラー ログのダウンロード先となるフォルダーを指定します。 これは、スクリプト実行の出力とエラー ログをダウンロードする場合にのみ必要です。
実行する Hive スクリプトを指定するには、次の 2 つの方法があります。
インライン スクリプト: [スクリプトの入力] ダイアログ ボックスに実行するスクリプトをインラインで入力して、[Script] フィールドを指定します。
スクリプト ファイル: Azure Blob Storage にスクリプト ファイルをアップロードして、[BlobName] フィールドを指定します。 BLOB が HDInsight クラスターに関連付けられている既定のストレージ アカウントまたはコンテナーにない場合は、[ExternalStorageAccountName] と [ExternalBlobContainer] フィールドを指定する必要があります。 外部 BLOB の場合は、パブリックにアクセス可能として構成されていることを確認します。
両方が指定されている場合、スクリプト ファイルが使用され、インライン スクリプトは無視されます。