Partage via


Transformer des données dans data.world (préversion) à l’aide d’Azure Data Factory ou de Synapse Analytics

S’APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Essayez Data Factory dans Microsoft Fabric, une solution d’analyse tout-en-un pour les entreprises. Microsoft Fabric couvre tous les aspects, du déplacement des données à la science des données, en passant par l’analyse en temps réel, l’aide à la décision et la création de rapports. Découvrez comment démarrer un nouvel essai gratuitement !

Cet article explique l’utilisation de Data Flow pour transformer des données dans data.world (préversion). Pour en savoir plus, lisez l’article d’introduction pour Azure Data Factory ou Azure Synapse Analytics.

Important

Ce connecteur est actuellement en préversion. Essayez-le et envoyez-nous vos commentaires. Si vous souhaitez établir une dépendance sur les connecteurs en préversion dans votre solution, veuillez contacter le support Azure.

Fonctionnalités prises en charge

Ce connecteur data.world est pris en charge pour les fonctionnalités suivantes :

Fonctionnalités prises en charge IR
Flux de données de mappage (source/-)

① Runtime d’intégration Azure ② Runtime d’intégration auto-hébergé

Pour obtenir la liste des magasins de données pris en charge en tant que sources et récepteurs, consultez le tableau Magasins de données pris en charge.

Créer un service lié data.world à l’aide de l’interface utilisateur

Utilisez les étapes suivantes pour créer un service lié data.world dans l’interface utilisateur du portail Azure.

  1. Accédez à l’onglet Gérer dans votre espace de travail Azure Data Factory ou Synapse, sélectionnez Services liés, puis sélectionnez Nouveau :

  2. Recherchez data.world (préversion) et sélectionnez le connecteur data.world (préversion).

    Capture d'écran montrant la sélection du connecteur data.world.

  3. Configurez les informations du service, testez la connexion et créez le nouveau service lié.

    Capture d'écran de la configuration du service lié à data.world.

Informations de configuration des connecteurs

Les sections suivantes fournissent des informations sur les propriétés utilisées pour définir les entités Data Factory ou les entités de pipeline Synapse propres à data.world.

Propriétés du service lié

Les propriétés prises en charge pour le service lié data.world sont les suivantes :

Propriété Description Obligatoire
type La propriété type doit être définie sur Dataworld. Oui
apiToken Spécifiez un jeton d’API pour data.world. Marquez ce champ comme SecureString pour le stocker en toute sécurité. Vous pouvez également référencer un secret stocké dans Azure Key Vault. Oui

Exemple :

{
    "name": "DataworldLinkedService",
    "properties": {
        "type": "Dataworld",
        "typeProperties": {
            "apiToken": {
                "type": "SecureString",
                "value": "<API token>"
            }
        }
    }
}

Propriétés du mappage de flux de données

Lors de la transformation de données dans le flux de données de mappage, vous pouvez lire des tables à partir de data.world. Pour plus d’informations, consultez Transformation de la source dans des flux de données de mappage. Vous pouvez uniquement utiliser un Jeu de données inlined comme type de source.

Transformation de la source

Le tableau ci-dessous répertorie les propriétés prises en charge par la source data.world. Vous pouvez modifier ces propriétés sous l’onglet Options de la source.

Nom Description Obligatoire Valeurs autorisées Propriété du script de flux de données
Nom du jeu de données ID du jeu de données dans data.world. Oui String datasetId
Nom de la table ID de la table dans le jeu de données dans data.world. Non (si query est spécifié) String tableId
Requête Entrez une requête SQL pour extraire des données de data.world. par exemple select * from MyTable. Non (si tableId est spécifié) String query
Propriétaire Propriétaire du jeu de données dans data.world. Oui String propriétaire

Exemple de script source data.world

Lorsque vous utilisez le type de source data.world, le script de flux de données associé est le suivant :

source(allowSchemaDrift: true,
	validateSchema: false,
	store: 'dataworld',
	format: 'rest',
	owner: 'owner1',
	datasetId: 'dataset1',
	tableId: 'MyTable') ~> DataworldSource

Consultez les magasins de données pris en charge pour obtenir la liste des sources et magasins de données pris en charge en tant que récepteurs par l’activité de copie.