Qu’est-ce que la place de marché Databricks ?
Cet article présente la place de marché Databricks, un forum ouvert pour l’échange de produits de données. La place de marché Databricks tire parti de Delta Sharing pour donner aux fournisseurs de données les outils permettant de partager des produits de données en toute sécurité et aux consommateurs de données le pouvoir d’explorer et d’étendre leur accès aux données et aux services de données dont ils ont besoin.
Quels types de ressources de données sont partagés sur la Place de marché Databricks ?
Les ressources de la Place de marché incluent des jeux de données, des notebooks Databricks, des accélérateurs de solution Databricks et des modèles Machine Learning (IA). Les jeux de données sont généralement disponibles sous forme de catalogues de données tabulaires, bien que les données non tabulaires sous forme de volumes Azure Databricks soient également prises en charge. Les accélérateurs de solution sont mis à disposition en tant que référentiels Git clonables.
Comment les consommateurs ont-ils accès aux données dans la place de marché Databricks ?
Pour trouver un produit de données souhaité sur la Place de marché Databricks, parcourez ou recherchez simplement des descriptions de fournisseurs.
Vous pouvez parcourir :
- La place de marché ouverte, qui ne nécessite pas d’accès à un espace de travail Databricks.
- La place de marché Databricks sur votre espace de travail Databricks. Cliquez simplement sur Place de marché.
Pour demander l’accès aux produits de données dans la Place de marché Microsoft Azure, vous devez utiliser la Place de marché sur un espace de travail Databricks. Vous n’avez pas besoin d’un espace de travail Databricks pour accéder aux données et les utiliser une fois qu’elles sont partagées, même si l’utilisation d’un espace de travail Databricks avec Unity Catalog activé vous permet de profiter de l’intégration approfondie de Unity Catalog avec Delta Sharing.
Certains produits de données sont disponibles pour tous sur la place de marché publique, tandis que d’autres sont disponibles dans le cadre d’un échange privé, dans lequel un fournisseur partage ses annonces uniquement avec les consommateurs membres. Qu’ils soient publics ou privés, certains produits de données sont disponibles instantanément lorsque vous en faites la demande et que vous acceptez les conditions. D’autres peuvent nécessiter l’approbation du fournisseur et l’achèvement des transactions à l’aide d’interfaces de fournisseur. Dans les deux cas, le protocole Delta Sharing qui alimente la place de marché garantit que vous pouvez accéder aux données partagées en toute sécurité.
Prise en main de l’accès aux produits de données
Pour savoir comment démarrer en tant que consommateur de données :
- À l’aide d’un espace de travail Databricks activé pour Unity Catalog, consultez Accès aux produits de données dans Databricks Marketplace (espaces de travail compatibles avec Unity Catalog).
- À l’aide de plateformes tierces telles que Power BI, Pandas ou Apache Spark, ainsi que des espaces de travail Databricks non activés pour Unity Catalog, consultez Accès aux produits de données dans Databricks Marketplace à l’aide de plateformes externes.
Comment les fournisseurs répertorient-ils les produits de données dans la place de marché Databricks ?
La place de marché Databricks offre aux fournisseurs de données une plateforme sécurisée pour le partage de produits de données que les scientifiques et les analystes des données peuvent utiliser pour aider leur organisation à réussir. La place de marché Databricks utilise Delta Sharing pour assurer la sécurité et le contrôle de vos données partagées. Vous pouvez partager des données publiques, des exemples de données gratuits et des offres de données commercialisées. Vous pouvez partager des produits de données dans des annonces publiques ou dans le cadre d’échanges privés que vous créez, ce qui rend les listes détectables uniquement par les consommateurs membres. En plus des jeux de données, vous pouvez également partager des notebooks Databricks et d’autres contenus pour illustrer les cas d’usage et montrer aux clients comment tirer pleinement parti de vos produits de données.
Commencer à répertorier les produits de données
Pour répertorier vos produits de données sur la place de marché Databricks, vous devez :
- Vous devez avoir au moins un compte Azure Databricks et un espace de travail premium activé pour Unity Catalog. Vous n’avez pas besoin d’activer tous vos espaces de travail pour Unity Catalog. Vous pouvez en créer un spécifiquement pour la gestion des descriptions de la Place de marché.
- Demander à être un fournisseur par le biais du programme Databricks Data Partner. Par ailleurs, si vous ne souhaitez partager des données que dans le cadre d’échanges privés, vous pouvez utiliser le flux d’inscription en libre-service dans la console du fournisseur. Consultez S’inscrire en tant que fournisseur de la Place de marché Databricks.
- Passer en revue les stratégies du fournisseur de la place de marché.
Pour la prise en main, consultez Répertorier votre produit de données dans la place de marché Databricks.
Voir une démonstration
Cette vidéo présente la place de marché Databricks et montre comment les consommateurs accèdent aux annonces et comment les fournisseurs les créent.