Задача Pig для Azure HDInsight
Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure
Используйте задачу Pig для Azure HDInsight для выполнения сценария Pig на кластере Azure HDInsight.
Чтобы добавить задачу Pig для Azure HDInsight, перетащите ее в конструктор SSIS, дважды щелкните или щелкните правой кнопкой мыши и выберите Изменить , чтобы открыть Редактор задач Pig для Azure HDInsight .
Задача Pig для Azure HDInsight входит в состав пакета дополнительных компонентов SQL Server Integration Services (SSIS) для Azure.
В следующем списке описаны поля этого диалогового окна.
В поле HDInsightConnection выберите существующий диспетчер подключений Azure HDInsight (или создайте новый), который ссылается на кластер Azure HDInsight, используемый для выполнения скрипта.
В поле AzureStorageConnection выберите существующий диспетчер подключений службы хранилища Azure (или создайте новый), который ссылается на учетную запись хранения Azure, связанную с кластером. Это необходимо только в том случае, если требуется скачать выходные данные выполнения скрипта и журналы ошибок.
В поле BlobContainer укажите имя контейнера хранилища, связанного с кластером. Это необходимо только в том случае, если требуется скачать выходные данные выполнения скрипта и журналы ошибок.
В поле LocalLogFolder укажите папку, в которую будут скачиваться выходные данные выполнения скрипта и журналы ошибок. Это необходимо только в том случае, если требуется скачать выходные данные выполнения скрипта и журналы ошибок.
Существует два способа указать выполняемый скрипт Pig.
Встроенный скрипт. Укажите значение в поле Скрипт, введя скрипт, который необходимо выполнить, в диалоговом окне Введите сценарий.
Файл скрипта. Отправьте файл скрипта в хранилище BLOB-объектов Azure и укажите значение в поле BlobName. Если BLOB-объект не находится в используемом по умолчанию хранилище или контейнере, связанном с кластером HDInsight, нужно указать значения в полях ExternalStorageAccountName и ExternalBlobContainer. Если используется внешний BLOB-объект, убедитесь в том, что он настроен как общедоступный.
Если использованы оба способа, будет задействован файл скрипта, а встроенный скрипт будет проигнорирован.