Share via


Accéder aux produits de données dans Databricks Marketplace à l’aide de plateformes externes

Cet article décrit comment accéder aux produits de données dans Databricks Marketplace sans espace de travail Databricks compatible avec Unity Catalog. Vous pouvez utiliser les connecteurs de partage ouvert Delta Sharing pour accéder aux données de la Place de marché à l’aide de plusieurs plateformes courantes, notamment Microsoft Power BI, Microsoft Excel, pandas, Apache Spark et les espaces de travail Databricks non liés à Unity Catalog. Seuls les jeux de données tabulaires sont disponibles sur des plateformes externes (et non des notebooks Databricks, des volumes ou des modèles, par exemple).

Important

Si vous disposez d’un espace de travail Azure Databricks activé pour Unity Catalog, vous devez accéder aux données partagées à l’aide de Unity Catalog. Voir Accéder aux produits de données dans Databricks Marketplace (espaces de travail compatibles avec Unity Catalog).

Avant de commencer

Pour parcourir les listes de produits de données sur la Place de marché Databricks, vous pouvez utiliser l’une des options suivantes :

Pour effectuer une requête d’accès aux produits de données, quelle que soit la plateforme, vous devez disposer d’un espace de travail Azure Databricks.

Si vous n’en avez pas, vous pouvez obtenir un essai gratuit. Cliquez sur Essayer gratuitement sur la Place de marché ouverte et suivez les invites pour commencer votre essai.

Parcourir les listes de la Place de marché Databricks accessibles sur des plateformes externes

Pour trouver un produit de données souhaité, il vous suffit de parcourir ou de rechercher les offres de produits de données dans la Place de marché Databricks. Seuls les types de produits Jeu de données (données tabulaires) sont disponibles pour partager à l’aide de plateformes externes ou d’espaces de travail Azure Databricks non liés à Unity Catalog.

  1. Accédez à marketplace.databricks.com ou connectez-vous à votre espace de travail Azure Databricks et cliquez sur l’icône Place de marchéPlace de marché.

    Remarque

    Vous pouvez aussi rechercher des listes de la Place de marché en utilisant la barre de recherche globale en haut de votre espace de travail Azure Databricks. Consultez Recherche des objets de l’espace de travail.

  2. Parcourez ou recherchez le produit de données souhaité.

    Vous pouvez filtrer les listes par nom du fournisseur, type de produit, catégorie, coût (gratuit ou payant) ou recherche par mot clé. Seul le type de produit Jeu de données est disponible pour l’accès à l’aide de plateformes externes.

    Si vous êtes connecté à un espace de travail Azure Databricks, vous pouvez également choisir d’afficher uniquement les listes privées qui vous sont accessibles dans le cadre d’un échange privé. Voir Participer à des échanges privés.

Obtenir l’accès aux produits de données accessibles sur des plateformes externes

Pour effectuer une requête d’accès aux produits de données, vous devez être connecté à un espace de travail Azure Databricks, même si vous utiliserez le produit de données partagé sur une plateforme externe. Certains produits de données sont disponibles immédiatement, tandis que d’autres nécessitent l’approbation du fournisseur et l’achèvement d’une transaction à l’aide des interfaces des fournisseurs.

Accéder à des produits de données disponibles instantanément

Les produits de données disponibles instantanément ne nécessitent qu’une requête et l’acceptation des conditions. Ces produits de données sont répertoriés dans la rubrique Gratuit et disponible instantanément de la page de destination de la Place de marché, sont identifiés comme étant Gratuits sur la vignette de la liste et sont identifiés comme étant Disponibles instantanément sur la page de détail du référencement.

  1. Une fois que vous avez trouvé une offre qui vous intéresse sur la page d’accueil de la Place de marché, cliquez sur l’offre pour ouvrir la page de détails de l’offre.

  2. Cliquez sur le bouton Obtenir un accès instantané.

  3. Dans Autres options, sélectionnez Sur les plateformes externes.

  4. Acceptez les conditions générales de Databricks.

  5. Cliquez sur Obtenir un accès instantané.

  6. Cliquez sur le bouton Télécharger le fichier d’informations d’identification pour obtenir le fichier d’informations d’identification, que vous et votre équipe pouvez utiliser pour accéder aux données partagées à l’aide de plateformes de données tierces et d’espaces de travail Databricks non liés à Unity Catalog.

    Important

    Le fichier d’informations d’identification ne peut être téléchargé qu’une seule fois. Le bouton de téléchargement reste actif une fois que vous avez téléchargé le fichier, mais les téléchargements suivants se font avec de nouvelles informations d’identification. Les anciennes informations d’identification expirent après un jour ou après sa date d’expiration d’origine, selon ce qui se produit le plus tôt. Seules deux informations d’identification peuvent être actives en même temps.

  7. Stockez le fichier d’informations d’identification dans un emplacement sécurisé.

    Ne partagez pas le fichier d’informations d’identification avec des personnes extérieures au groupe d’utilisateurs qui doivent avoir accès aux données partagées. Si vous devez le partager avec une personne de votre organisation, Databricks recommande l’utilisation d’un gestionnaire de mots de passe.

Pour savoir comment accéder aux données partagées à l’aide de votre plateforme de choix, consultez Accéder aux données partagées à l’aide des connecteurs de partage ouverts Delta Sharing.

Demander des produits de données qui nécessitent l’approbation du fournisseur

Certains produits de données nécessitent l’approbation du fournisseur, généralement parce qu’une transaction commerciale est impliquée, ou le fournisseur peut préférer personnaliser les produits de données selon vos besoins. Ces offres sont identifiées sur la page de détails de l’offre en tant que Sur demande et incluent un bouton Demander l’accès .

  1. Une fois que vous avez trouvé une offre qui vous intéresse sur la page d’accueil de la Place de marché, cliquez sur l’offre pour ouvrir la page de détails de l’offre.

  2. Cliquez sur le bouton Demander l’accès.

  3. Entrez votre nom, votre société et une brève description de l’utilisation prévue pour le produit de données.

  4. Cliquez sur Autres options, puis sélectionnez Sur les plateformes externes.

  5. Acceptez les conditions générales de Databricks et cliquez sur Demander l’accès.

  6. Vous serez averti par e-mail lorsque le fournisseur a terminé son examen de votre demande.

    Vous pouvez également surveiller la progression de votre demande sur la page Mes demandes de la Place de marché. Voir Gérer les produits de données partagés Databricks Marketplace. Toutefois, toutes les transactions qui suivent utilisent les plateformes de communication et de paiement des fournisseurs. Aucune transaction commerciale n’est gérée directement sur la Place de marché Databricks.

  7. Une fois votre transaction terminée, vous recevrez un e-mail de notification de la part du fournisseur de données et la liste affichera un bouton Télécharger le fichier d’informations d’identification. Cliquez sur ce bouton pour télécharger le fichier d’informations d’identification, que vous et votre équipe pouvez utiliser pour accéder aux données partagées à l’aide de plateformes de données tierces et d’espaces de travail Databricks non liés à Unity Catalog.

    Vous pouvez également trouver la liste dans la Place de marché sous Mes requêtes. Lorsque les informations d’identification sont prêtes à être téléchargées, le produit de données apparaît sous l’onglet Produits de données installés.

    Important

    Le fichier d’informations d’identification ne peut être téléchargé qu’une seule fois. Le bouton de téléchargement reste actif une fois que vous avez téléchargé le fichier, mais les téléchargements suivants se font avec de nouvelles informations d’identification. Les anciennes informations d’identification expirent après un jour ou après sa date d’expiration d’origine, selon ce qui se produit le plus tôt. Seules deux informations d’identification peuvent être actives en même temps.

  8. Stockez le fichier d’informations d’identification dans un emplacement sécurisé.

    Ne partagez pas le fichier d’informations d’identification avec des personnes extérieures au groupe d’utilisateurs qui doivent avoir accès aux données partagées. Si vous devez le partager avec une personne de votre organisation, Databricks recommande l’utilisation d’un gestionnaire de mots de passe.

Pour savoir comment accéder aux données partagées à l’aide de votre plateforme de choix, consultez Accéder aux données partagées à l’aide des connecteurs de partage ouverts Delta Sharing.

Accéder aux données partagées à l’aide des connecteurs de partage ouverts Delta Sharing

Pour utiliser des plateformes externes ou des espaces de travail Azure Databricks non liés à Unity Catalog pour accéder à des jeux de données qui ont été partagés à l’aide de la Place de marché Databricks, vous avez besoin du fichier d’informations d’identification téléchargé à partir de la liste de la Place de marché. Vous utilisez ce fichier d’informations d’identification pour accéder aux données partagées à l’aide des connecteurs de partage ouvert Delta Sharing.

Pour obtenir des instructions complètes sur l’utilisation d’espaces de travail Azure Databricks non liés à Unity Catalog, Apache Spark, pandas et Power BI afin d’accéder et de lire des données partagées, consultez Lire les données partagées à l’aide du partage ouvert Delta Sharing (pour les destinataires).

Pour obtenir la liste complète des connecteurs Delta Sharing et les informations sur leur utilisation, consultez la documentation open source sur Delta Sharing.

Limitations relatives au partage sur des plateformes externes à l’aide de la Place de marché

Certaines tables nécessitent des informations de partition de la part du consommateur (pays, par exemple). Dans le protocole de partage ouvert, ces informations ne sont pas disponibles pour le partage et, par conséquent, la table n’est pas accessible. L’erreur suivante est retournée : « Échec de l’authentification du destinataire : les données sont limitées par les propriétés du destinataire qui ne s’appliquent pas au destinataire actuel dans la session. Veuillez contacter le fournisseur de données pour résoudre le problème. »