Partage via


Se connecter à Dataiku

Dataiku est une plateforme IA de bout en bout pour la préparation des données, Mosaïque AutoML et MLOps. Vous pouvez intégrer vos entrepôts Databricks SQL et vos clusters Azure Databricks à Dataiku.

Se connecter à Dataiku à l’aide de Partner Connect

Remarque

Partner Connect prend en charge uniquement les entrepôts SQL pour Dataiku. Pour connecter un cluster à Dataiku, connectez-vous manuellement à Dataiku.

Pour connecter votre espace de travail Azure Databricks à Dataiku à l’aide de Partner Connect, effectuez les opérations suivantes :

  1. Dans la barre latérale, cliquez sur Bouton Partner Connect Partner Connect.

  2. Cliquez sur la vignette du partenaire.

    Remarque

    Si la vignette Dataiku comporte une icône en forme de coche, cela signifie qu’un administrateur a déjà utilisé Partner Connect pour connecter Dataiku à votre espace de travail. Passez à l’étape 5. Le partenaire utilise l’adresse e-mail de votre compte Azure Databricks pour vous inviter à vous connecter à votre compte Dataiku existant.

  3. Sélectionnez un catalogue dans la liste déroulante, puis cliquez sur Suivant.

    Remarque

    Si votre espace de travail est activé pour Unity Catalog, mais que le partenaire ne prend pas en charge Unity Catalog avec Partner Connect, le catalogue par défaut de l’espace de travail est utilisé. Si votre espace de travail ne dispose pas d’Unity Catalog, hive_metastore est utilisé.

  4. Sélectionnez un schéma dans la liste déroulante, puis cliquez sur Ajouter. Vous pouvez répéter cette étape pour ajouter plusieurs schémas.

  5. Sélectionnez Suivant.

    Partner Connect crée les ressources suivantes dans votre espace de travail :

    Partner Connect accorde également les privilèges suivants au principal de service <PARTNER>_USER :

    • (Unity Catalog)USE CATALOG : nécessaire pour interagir avec les objets du catalogue sélectionné.
    • (Unity Catalog) USE SCHEMA : permet de lire les schémas que vous avez sélectionnés.
    • (Unity Catalog) CREATE SCHEMA: permet de créer des schémas dans le catalogue sélectionné.
    • (Metastore Hive hérité) USAGE : Obligatoire pour interagir avec les objets dans hive_metastore et les schémas sélectionnés.
    • (Metastore Hive hérité) CREATE : permet de créer un schéma dans hive_metastore.
    • (Legacy Metastore Hive) READ_METADATA : accorde la possibilité de lire les métadonnées des schémas que vous avez sélectionnés.
    • (Metastore Hive hérité) SELECT : Permet de lire les schémas que vous avez sélectionnés.
  6. Cliquez sur Suivant.

    La zone E-mail indique l’adresse e-mail de votre compte Azure Databricks. Dataiku utilise cette adresse e-mail pour vous inviter à créer un compte de partenaire ou à vous connecter à votre compte de partenaire existant.

  7. Cliquez sur Se connecter à Dataiku ou Se connecter.

    Un nouvel onglet s’ouvre dans votre navigateur web, et affiche le site web Dataiku.

  8. Suivez les instructions à l’écran du site web Dataiku pour créer votre compte d’essai Dataiku, ou connectez-vous à votre compte Dataiku existant.

Se connecter à Dataiku manuellement

Cette section explique comment connecter manuellement un entrepôt ou un cluster SQL existant de votre espace de travail Azure Databricks à Dataiku.

Remarque

Pour les entrepôts Databricks SQL, vous pouvez vous connecter à Dataiku à l’aide de Partner Connect afin de simplifier l’expérience.

Exigences

Avant de vous connecter manuellement à Dataiku, vous avez besoin des éléments suivants :

  • Un cluster ou un entrepôt SQL dans votre espace de travail Azure Databricks.

  • Les détails de connexion pour votre cluster ou votre entrepôt SQL, en particulier les valeurs Nom d’hôte du serveur, Port et Chemin HTTP.

  • Un jeton d’accès personnel Azure Databricks ou un jeton Microsoft Entra ID (anciennement Azure Active Directory). Pour créer un jeton d’accès personnel, effectuez les actions suivantes :

    1. Dans votre espace de travail Azure Databricks, cliquez sur votre nom d’utilisateur Azure Databricks dans la barre supérieure, puis sélectionnez Paramètres dans la liste déroulante.
    2. Cliquez sur Développeur.
    3. À côté de Jetons d’accès, cliquez sur Gérer.
    4. Cliquez sur Générer un nouveau jeton.
    5. (Facultatif) Entrez un commentaire qui vous aide à identifier ce jeton à l’avenir et modifiez sa durée de vie par défaut (90 jours). Pour créer un jeton sans durée de vie (non recommandé), laissez vide la zone Durée de vie (en jours).
    6. Cliquez sur Générer.
    7. Copiez le jeton affiché dans un emplacement sécurisé, puis cliquez sur Terminé.

    Remarque

    Veillez à enregistrer le jeton copié dans un emplacement sécurisé. Ne partagez pas votre jeton copié avec d'autres. Si vous le perdez, vous ne pouvez pas régénérer exactement le même. Vous devez donc répéter cette procédure pour créer un jeton. Si vous perdez le jeton copié ou si vous pensez que le jeton a été compromis, Databricks vous recommande vivement de supprimer immédiatement ce jeton de votre espace de travail en cliquant sur l’icône de la corbeille (Révoquer) à côté du jeton de la page Jetons d’accès.

    Si vous n'êtes pas en mesure de créer ou d'utiliser des jetons dans votre espace de travail, cela peut être dû au fait que votre administrateur d'espace de travail a désactivé les jetons ou ne vous a pas donné l'autorisation de créer ou d'utiliser des jetons. Consultez votre administrateur d'espace de travail ou les rubriques suivantes :

    Remarque

    En guise de bonne pratique de sécurité, quand vous vous authentifiez avec des outils, systèmes, scripts et applications automatisés, Databricks recommande d’utiliser des jetons d’accès personnels appartenant à des principaux de service et non des utilisateurs de l’espace de travail. Pour créer des jetons d’accès pour des principaux de service, consultez la section Gérer les jetons pour un principal de service.

Étapes de connexion

Pour vous connecter manuellement à Dataiku, consultez Databricks dans la documentation Dataiku.

Ressources supplémentaires

Explorez les ressources Dataiku suivantes :