Задача Pig для Hadoop
Область применения: среда выполнения интеграции SSIS SQL Server в Фабрика данных Azure
Задача Pig для Hadoop используется для запуска сценария Pig в кластере Hadoop.
Чтобы добавить задачу Pig для Hadoop, перетащите ее в конструктор. Затем дважды щелкните задачу или щелкните ее правой кнопкой мыши и выберите команду Изменить, чтобы открыть диалоговое окно Hadoop Pig Task Editor (Редактор задач Pig для Hadoop).
Параметры
В диалоговом окне Hadoop Pig Task Editor (Редактор задач Pig для Hadoop) настройте следующие параметры.
Поле | Description |
---|---|
Hadoop Connection (Подключение Hadoop) | Укажите существующий диспетчер подключений Hadoop или создайте новый. Этот диспетчер указывает, где размещена служба WebHCat. |
Тип источника | Укажите тип источника запроса. Доступные значения: ScriptFile (Файл сценария) и DirectInput(Прямой ввод). |
InlineScript (Встроенный сценарий) | Если значение параметра SourceType (Тип источника) — DirectInput(Прямой ввод), укажите сценарий Pig. |
HadoopScriptFilePath (Путь к файлу сценария Hadoop) | Если значение SourceType (Тип источника) — ScriptFile(Файл сценария), укажите путь к файлу скрипта в Hadoop. |
TimeoutInMinutes (Время ожидания в минутах) | Укажите время ожидания в минутах. Задание Hadoop останавливается, если оно не завершилось до истечения времени ожидания. Укажите 0, чтобы запланировать асинхронное выполнение задания Hadoop. |