Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
SE APLICA A:
Azure Data Factory
Azure Synapse Analytics
Sugerencia
Data Factory en Microsoft Fabric es la próxima generación de Azure Data Factory, con una arquitectura más sencilla, inteligencia artificial integrada y nuevas características. Si no está familiarizado con la integración de datos, comience con Fabric Data Factory. Las cargas de trabajo de ADF existentes pueden actualizarse a Fabric para acceder a nuevas funcionalidades en ciencia de datos, análisis en tiempo real e informes.
La actividad Pig de HDInsight en una canalización de Data Factory ejecuta consultas de Pig en su propio clúster de HDInsight o en uno a petición. Este artículo se basa en el artículo sobre actividades de transformación de datos , que presenta información general de la transformación de datos y las actividades de transformación admitidas.
Para obtener más información, lea la introducción a Azure Data Factory o Synapse Analytics y realice la Tutorial: transform data antes de leer este artículo.
Adición de una actividad de Pig de HDInsight a una canalización con la interfaz de usuario
Para usar una actividad de Pig de HDInsight en una canalización, complete los pasos siguientes:
Busque Pig en el panel Actividades de canalización y arrastrar una actividad de Pig al lienzo de la canalización.
Seleccione la nueva actividad de Pig en el lienzo si aún no está seleccionada.
Seleccione la pestaña Clúster de HDI para elegir o crear un nuevo servicio vinculado a un clúster de HDInsight que se usará para ejecutar la actividad MapReduce.
Seleccione la pestaña Script para seleccionar o crear un nuevo servicio vinculado de script en una ubicación Azure Storage donde se hospedará el script. Especifique el nombre de clase que se va a ejecutar en esa ubicación y una ruta de acceso de archivo dentro de la ubicación de almacenamiento. También puede configurar detalles avanzados, como la configuración de depuración o los argumentos y parámetros que se pasarán al script.
Sintaxis
{
"name": "Pig Activity",
"description": "description",
"type": "HDInsightPig",
"linkedServiceName": {
"referenceName": "MyHDInsightLinkedService",
"type": "LinkedServiceReference"
},
"typeProperties": {
"scriptLinkedService": {
"referenceName": "MyAzureStorageLinkedService",
"type": "LinkedServiceReference"
},
"scriptPath": "MyAzureStorage\\PigScripts\\MyPigScript.pig",
"getDebugInfo": "Failure",
"arguments": [
"SampleHadoopJobArgument1"
],
"defines": {
"param1": "param1Value"
}
}
}
Detalles de la sintaxis
| Propiedad | Descripción | Obligatorio |
|---|---|---|
| nombre | Nombre de la actividad | Sí |
| descripción | Texto que describe para qué se usa la actividad. | No |
| tipo | Para la actividad de Hive, el tipo de actividad es HDinsightPig | Sí |
| nombreDelServicioVinculado | Referencia al clúster de HDInsight registrado como servicio vinculado. Para obtener más información sobre este servicio vinculado, consulte el artículo Servicios vinculados de cómputo. | Sí |
| scriptLinkedService | Referencia a un servicio vinculado de Azure Storage utilizado para guardar el script de Pig que se va a ejecutar. Aquí solo se admiten los servicios vinculados Azure Blob Storage y ADLS Gen2. Si no especifica este servicio vinculado, se usará el servicio vinculado de Azure Storage definido en el servicio vinculado de HDInsight. | No |
| scriptPath | Proporcione la ruta de acceso al archivo de script almacenado en el Azure Storage al que hace referencia scriptLinkedService. El nombre del archivo distingue mayúsculas de minúsculas. | No |
| getDebugInfo | Especifica cuándo se copian los archivos de registro en el Azure Storage usado por el clúster de HDInsight (o) especificado por scriptLinkedService. Valores permitidos: Ninguno, Siempre o Error. Valor predeterminado: Ninguno. | No |
| argumentos | Especifica una matriz de argumentos para un trabajo de Hadoop. Los argumentos se pasan a cada tarea como línea de comandos. | No |
| defines | Especifique los parámetros como pares de clave y valor para referencia en el script de Pig. | No |
Contenido relacionado
Vea los siguientes artículos, en los que se explica cómo transformar datos de otras maneras: