Transformación de datos en data.world (versión preliminar) mediante Azure Data Factory o Synapse Analytics

SE APLICA A: Azure Data Factory Azure Synapse Analytics

Sugerencia

Pruebe Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. Obtenga información sobre cómo iniciar una nueva evaluación gratuita.

En este artículo, se indica cómo usar Data Flow para transformar datos en data.world (versión preliminar). Para obtener más información, lea el artículo de introducción para Azure Data Factory o Azure Synapse Analytics.

Importante

Este conector está actualmente en versión preliminar. Puede probarlo y enviarnos sus comentarios. Si desea depender de los conectores de versión preliminar en la solución, póngase en contacto con el soporte técnico de Azure.

Funcionalidades admitidas

Este conector data.world es compatible con las funcionalidades siguientes:

Funcionalidades admitidas IR
Flujo de datos de asignación (origen/-) 6

① Azure Integration Runtime ② Entorno de ejecución de integración autohospedado

Para obtener una lista de los almacenes de datos que se admiten como orígenes y receptores, consulte la tabla de almacenes de datos admitidos.

Creación de un servicio vinculado de data.world mediante la interfaz de usuario

Siga estos pasos para crear un servicio vinculado de data.world en la interfaz de usuario de Azure Portal.

  1. Vaya a la pestaña Administrar de su área de trabajo de Azure Data Factory o Synapse, y seleccione Servicios vinculados; a continuación, seleccione Nuevo:

  2. Busque data.world (versión preliminar) y seleccione el conector de data.world (versión preliminar).

    Screenshot showing selecting data.world connector.

  3. Configure los detalles del servicio, pruebe la conexión y cree el nuevo servicio vinculado.

    Screenshot of configuration for data.world linked service.

Detalles de configuración del conector

En las secciones siguientes, se proporciona información acerca de las propiedades que se usan para definir entidades de canalización de Data Factory y Synapse específicas para data.world.

Propiedades del servicio vinculado

Las siguientes propiedades son compatibles con el servicio vinculado de data.world:

Propiedad Descripción Obligatorio
type La propiedad type se debe establecer en Dataworld.
apiToken Especifique un token de API para data.world. Marque este campo como SecureString para almacenarlo de forma segura. O bien puede hacer referencia a un secreto almacenado en Azure Key Vault.

Ejemplo:

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Propiedades de Asignación de instancias de Data Flow

Al transformar datos en el flujo de datos de asignación, puede leer tablas de data.world. Para más información, consulte la transformación de origen en el flujo de datos de asignación. Solo puede usar un conjunto de datos insertado como tipo de origen.

Transformación de origen

En la tabla siguiente, se enumeran las propiedades que admite el origen de data.world. Puede editar estas propiedades en la pestaña Source options (Opciones del origen).

Nombre Descripción Obligatorio Valores permitidos Propiedad de script de flujo de datos
Nombre del conjunto de datos Identificador del conjunto de datos en data.world. String datasetId
Nombre de la tabla Identificador de la tabla en el conjunto de datos en data.world. No (si se especifica query) String tableId
Consultar Escriba una consulta SQL para recuperar datos desde data.world. Un ejemplo es select * from MyTable. No (si se especifica tableId) String Query
Propietario Propietario del conjunto de datos en data.world. String owner

Ejemplo de script del origen de data.world

Cuando se usa data.world como tipo de origen, el script de flujo de datos asociado es el siguiente:

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Para obtener una lista de almacenes de datos que la actividad de copia admite como orígenes y receptores, vea Almacenes de datos que se admiten.