Matillion ETL est un outil ETL/ELT conçu spécifiquement pour les plateformes de base de données cloud, notamment Azure Databricks. Matillion ETL dispose d’une interface utilisateur moderne et basée sur un navigateur, avec de puissantes fonctionnalités ETL/ELT.
Vous pouvez intégrer vos entrepôts Databricks SQL (anciennement points de terminaison Databricks SQL) et vos clusters Azure Databricks avec Matillion.
Se connecter à Matillion l’aide de Partner Connect
Cette section décrit comment utiliser Partner Connect pour simplifier le processus de connexion d’un entrepôt SQL ou d’un cluster existant dans votre espace de travail Azure Databricks à Matillion.
Pour vous connecter à Matillion à l’aide de Partner Connect, suivez les étapes décrites dans cette section.
Conseil
Si vous disposez d’un compte Matillion existant, Databricks vous recommande de vous connecter manuellement à Matillion. En effet, l’expérience de connexion dans Partner Connect est optimisée pour les nouveaux comptes de partenaire.
Dans la barre latérale, cliquez sur Partner Connect.
Cliquez sur la vignette Matillion.
La zone E-mail indique l’adresse e-mail de votre compte Azure Databricks. Matillion utilise cette adresse e-mail pour vous inviter à créer un compte Matillion ou à vous connecter à votre compte Matillion existant.
Cliquez sur Se connecter à Matillion ETL ou Se connecter.
Un nouvel onglet s’ouvre dans votre navigateur qui affiche le Hub Matillion.
Suivez les instructions à l’écran dans Matillion pour créer votre compte Matillion d’essai de 14 jours ou pour vous connecter à votre compte Matillion existant.
Important
Si une erreur s’affiche indiquant qu’une personne de votre organisation a déjà créé un compte Matillion, contactez l’un des administrateurs de votre organisation pour qu’il vous ajoute au compte Matillion de votre organisation. Une fois qu’ils vous ont ajouté, connectez-vous à votre compte Matillion existant.
Suivez les instructions à l’écran pour fournir les détails de votre travail, puis cliquez sur Continuer.
Suivez les instructions à l’écran pour créer une organisation, puis cliquez sur Continuer.
Cliquez sur l’organisation que vous avez créée, puis sur Ajouter une instance Matillion ETL.
Pour les paramètres de la section Connexion Delta Lake dans ces instructions, entrez les informations suivantes :
Pour ID de l’espace de travail, entrez l’ID d’espace de travail de votre URL Azure Databricks. N’incluez rien après le premier « point » (.). Consultez Noms d’instance, URL et ID d’espace de travail.
Pour Username (Nom d’utilisateur), entrez le mot token.
Pour Mot de passe, entrez la valeur d’un jeton d’accès personnel Azure Databricks.
Pour obtenir l’ID de l’espace de travail et générer un jeton d’accès personnel, procédez comme suit :
Revenez à l’onglet Partner Connect dans votre navigateur.
Notez l’ID de l’espace de travail.
Cliquez sur Générer un nouveau jeton.
Un nouvel onglet s’ouvre dans votre navigateur et affiche la page Paramètres de l’interface utilisateur Azure Databricks.
Cliquez sur Générer un nouveau jeton.
Si vous le souhaitez, entrez une description (commentaire) et la période d’expiration.
Cliquez sur Générer.
Copiez le jeton d’accès personnel généré et enregistrez-le en lieu sûr.
Revenez à l’onglet Matillion dans votre navigateur.
Pour les paramètres de la section Valeurs par défaut Delta Lake dans ces instructions, pour Cluster, choisissez le nom de l’entrepôt SQL ou du cluster.
Jeton d’accès personnel Azure Databricks ou jeton Microsoft Entra ID.
Note
En guise de bonne pratique de sécurité, quand vous vous authentifiez avec des outils, systèmes, scripts et applications automatisés, Databricks recommande d’utiliser des jetons d’accès personnels appartenant à des principaux de service et non des utilisateurs de l’espace de travail. Pour créer des jetons d’accès pour des principaux de service, consultez la section Gérer les jetons pour un principal de service.
Étapes de connexion
Pour vous connecter manuellement à Matillion, procédez comme suit :
Obtenez le nom de la ressource de calcul existante que vous souhaitez utiliser (un entrepôt SQL ou un cluster) dans votre espace de travail. Plus tard, vous choisirez ce nom pour établir la connexion entre votre ressource de calcul et votre instance Matillion ETL.
Pour voir les entrepôts SQL dans votre espace de travail, cliquez sur Entrepôts SQL dans la barre latérale. Pour créer un entrepôt SQL, consultez Créer un entrepôt SQL.
Pour les paramètres de la section Connexion Delta Lake dans ces instructions, entrez les informations suivantes :
Pour ID de l’espace de travail, entrez l’ID d’espace de travail de votre URL Azure Databricks. N’incluez rien après le premier « point » (.). Consultez Noms d’instance, URL et ID d’espace de travail.
Pour Username (Nom d’utilisateur), entrez le mot token.
Pour Mot de passe, entrez le jeton d’accès personnel Azure Databricks ou le jeton Microsoft Entra ID.
Pour les paramètres de la section Valeurs par défaut Delta Lake dans ces instructions, pour Cluster, choisissez le nom de l’entrepôt SQL ou du cluster.
Faites la démonstration d’une compréhension des tâches d’engineering données courantes pour implémenter et gérer des charges de travail d’engineering données sur Microsoft Azure en utilisant un certain nombre de services Azure.