Se connecter à Matillion
Matillion ETL est un outil ETL/ELT conçu spécifiquement pour les plateformes de base de données cloud, notamment Azure Databricks. Matillion ETL dispose d’une interface utilisateur moderne et basée sur un navigateur, avec de puissantes fonctionnalités ETL/ELT.
Vous pouvez intégrer vos entrepôts Databricks SQL (anciennement points de terminaison Databricks SQL) et vos clusters Azure Databricks avec Matillion.
Se connecter à Matillion l’aide de Partner Connect
Cette section décrit comment utiliser Partner Connect pour simplifier le processus de connexion d’un entrepôt SQL ou d’un cluster existant dans votre espace de travail Azure Databricks à Matillion.
Exigences
Consultez la configuration requise pour l’utilisation de Partner Connect.
Étapes de connexion
Pour vous connecter à Matillion à l’aide de Partner Connect, suivez les étapes décrites dans cette section.
Conseil
Si vous disposez d’un compte Matillion existant, Databricks vous recommande de vous connecter manuellement à Matillion. En effet, l’expérience de connexion dans Partner Connect est optimisée pour les nouveaux comptes de partenaire.
Dans la barre latérale, cliquez sur Partner Connect.
Cliquez sur la vignette Matillion.
La zone E-mail indique l’adresse e-mail de votre compte Azure Databricks. Matillion utilise cette adresse e-mail pour vous inviter à créer un compte Matillion ou à vous connecter à votre compte Matillion existant.
Cliquez sur Se connecter à Matillion ETL ou Se connecter.
Un nouvel onglet s’ouvre dans votre navigateur qui affiche le Hub Matillion.
Suivez les instructions à l’écran dans Matillion pour créer votre compte Matillion d’essai de 14 jours ou pour vous connecter à votre compte Matillion existant.
Important
Si une erreur s’affiche indiquant qu’une personne de votre organisation a déjà créé un compte Matillion, contactez l’un des administrateurs de votre organisation pour qu’il vous ajoute au compte Matillion de votre organisation. Une fois qu’ils vous ont ajouté, connectez-vous à votre compte Matillion existant.
Suivez les instructions à l’écran pour fournir les détails de votre travail, puis cliquez sur Continuer.
Suivez les instructions à l’écran pour créer une organisation, puis cliquez sur Continuer.
Cliquez sur l’organisation que vous avez créée, puis sur Ajouter une instance Matillion ETL.
Cliquez sur Continuer dans Azure.
Le portail Azure s’ouvre.
Suivez Lancement de Matillion ETL à partir d’un modèle Azure ARM dans la documentation Matillion ETL, en commençant par l’étape 6.
Suivez les instructions de la Documentation ETL de Matillion.
Matillion ETL s’ouvre dans votre navigateur, et la boîte de dialogue Créer un projet s’affiche.
Suivez Créer un projet Delta Lake sur Databricks dans la documentation Matillion.
Pour les paramètres de la section Connexion Delta Lake dans ces instructions, entrez les informations suivantes :
- Pour ID de l’espace de travail, entrez l’ID d’espace de travail de votre URL Azure Databricks. N’incluez rien après le premier « point » (
.
). Consultez Noms d’instance, URL et ID d’espace de travail. - Pour Username (Nom d’utilisateur), entrez le mot
token
. - Pour Mot de passe, entrez la valeur d’un jeton d’accès personnel Azure Databricks.
Pour obtenir l’ID de l’espace de travail et générer un jeton d’accès personnel, procédez comme suit :
Revenez à l’onglet Partner Connect dans votre navigateur.
Notez l’ID de l’espace de travail.
Cliquez sur Générer un nouveau jeton.
Un nouvel onglet s’ouvre dans votre navigateur et affiche la page Paramètres de l’interface utilisateur Azure Databricks.
Cliquez sur Générer un nouveau jeton.
Si vous le souhaitez, entrez une description (commentaire) et la période d’expiration.
Cliquez sur Générer.
Copiez le jeton d’accès personnel généré et enregistrez-le en lieu sûr.
Revenez à l’onglet Matillion dans votre navigateur.
Pour les paramètres de la section Valeurs par défaut Delta Lake dans ces instructions, pour Cluster, choisissez le nom de l’entrepôt SQL ou du cluster.
- Pour ID de l’espace de travail, entrez l’ID d’espace de travail de votre URL Azure Databricks. N’incluez rien après le premier « point » (
Passez aux Étapes suivantes.
Se connecter manuellement à Matillion
Cette section explique comment connecter manuellement un entrepôt ou cluster SQL existant dans votre espace de travail Azure Databricks à Matillion.
Notes
Vous pouvez vous connecter à Matillion à l’aide de Partner Connect pour simplifier l’expérience.
Exigences
Avant d’intégrer Matillion manuellement, vous devez disposer des éléments suivants :
Une instance Matillion ETL, que vous pouvez lancer à l’aide de la Place de marché Azure ou d’Azure Resource Manager (ARM).
Jeton d’accès personnel Azure Databricks ou jeton Microsoft Entra ID.
Remarque
En guise de bonne pratique de sécurité, quand vous vous authentifiez avec des outils, systèmes, scripts et applications automatisés, Databricks recommande d’utiliser des jetons d’accès personnels appartenant à des principaux de service et non des utilisateurs de l’espace de travail. Pour créer des jetons d’accès pour des principaux de service, consultez la section Gérer les jetons pour un principal de service.
Étapes de connexion
Pour vous connecter manuellement à Matillion, procédez comme suit :
Obtenez le nom de la ressource de calcul existante que vous souhaitez utiliser (un entrepôt SQL ou un cluster) dans votre espace de travail. Plus tard, vous choisirez ce nom pour établir la connexion entre votre ressource de calcul et votre instance Matillion ETL.
- Pour voir les entrepôts SQL dans votre espace de travail, cliquez sur Entrepôts SQL dans la barre latérale. Pour créer un entrepôt SQL, consultez Créer un entrepôt SQL.
- Pour afficher les clusters dans votre espace de travail, cliquez sur Calcul dans la barre latérale. Pour créer un cluster, consultez Informations de référence sur la configuration de calcul.
Suivez les instructions fournies dans Se connecter à votre instance ETL Matillion et s’identifier dans la documentation Matillion.
Suivez les instructions fournies dans Créer un projet Delta Lake sur Databricks dans la documentation Matillion.
Pour les paramètres de la section Connexion Delta Lake dans ces instructions, entrez les informations suivantes :
- Pour ID de l’espace de travail, entrez l’ID d’espace de travail de votre URL Azure Databricks. N’incluez rien après le premier « point » (
.
). Consultez Noms d’instance, URL et ID d’espace de travail. - Pour Username (Nom d’utilisateur), entrez le mot
token
. - Pour Mot de passe, entrez le jeton d’accès personnel Azure Databricks ou le jeton Microsoft Entra ID.
Pour les paramètres de la section Valeurs par défaut Delta Lake dans ces instructions, pour Cluster, choisissez le nom de l’entrepôt SQL ou du cluster.
- Pour ID de l’espace de travail, entrez l’ID d’espace de travail de votre URL Azure Databricks. N’incluez rien après le premier « point » (
Passez aux Étapes suivantes.
Étapes suivantes
Explorez une ou plusieurs des ressources suivantes sur le site web de Matillion :