Compartir por


Tarea de Pig de Azure HDInsight

Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory

Utilice la tarea de Pig de Azure HDInsight para ejecutar el script de Pig en un clúster de Azure HDInsight.

Para agregar una tarea de Pig de Azure HDInsight, arrástrela al Diseñador de SSIS y haga doble clic o haga clic con el botón derecho y haga clic en Editar para ver el siguiente cuadro de diálogo: Azure HDInsight Pig Task Editor (Editor de tareas de Pig de Azure HDInsight).

La tarea de Pig de Azure HDInsight es un componente del paquete de características de Feature Pack de SQL Server Integration Services (SSIS) para Azure.

La lista siguiente describe los campos de este cuadro de diálogo.

  1. Para el campo HDInsightConnection, seleccione un Administrador de conexiones de Azure HDInsight existente o cree uno nuevo que haga referencia al clúster de Azure que se usó para ejecutar el script.

  2. Para el campo AzureStorageConnection, seleccione un Administrador de conexiones de Azure Storage existente o cree uno nuevo que haga referencia a una cuenta de Azure Storage asociada con el clúster. Esto solo es necesario si quiere descargar los registros de error y la salida de ejecución del script.

  3. Para el campo BlobContainer, especifique el nombre del contenedor de almacenamiento asociado con el clúster. Esto solo es necesario si quiere descargar los registros de error y la salida de ejecución del script.

  4. Para el campo LocalLogFolder, especifique la carpeta en la que se descargarán los registros de error y la salida de ejecución de script. Esto solo es necesario si quiere descargar los registros de error y la salida de ejecución del script.

  5. Hay dos maneras de especificar el script de Pig que se va a ejecutar:

    1. Script en línea: especifique el campo Script escribiendo en línea el script que quiere ejecutar en el cuadro de diálogo Escriba el script.

    2. Archivo de script: cargue el archivo de script en Azure Blob Storage y especifique el campo BlobName. Si el blob no está en el contenedor ni en la cuenta de almacenamiento predeterminados asociados con el clúster de HDInsight, deben especificarse los campos ExternalStorageAccountName y ExternalBlobContainer. Para un blob externo, asegúrese de que está configurado como accesible públicamente.

    Si se especifican ambos, se usará el archivo de script y se omitirá el script en línea.