Configurer les catalogues
Remarque
Nous allons mettre hors service Azure HDInsight sur AKS le 31 janvier 2025. Avant le 31 janvier 2025, vous devrez migrer vos charges de travail vers Microsoft Fabric ou un produit Azure équivalent afin d’éviter leur arrêt brutal. Les clusters restants de votre abonnement seront arrêtés et supprimés de l’hôte.
Seul le support de base sera disponible jusqu’à la date de mise hors service.
Important
Cette fonctionnalité est disponible actuellement en mode Aperçu. Les Conditions d’utilisation supplémentaires pour les préversions de Microsoft Azure contiennent davantage de conditions légales qui s’appliquent aux fonctionnalités Azure en version bêta, en préversion ou ne se trouvant pas encore en disponibilité générale. Pour plus d’informations sur cette préversion spécifique, consultez les Informations sur la préversion d’Azure HDInsight sur AKS. Pour toute question ou pour des suggestions à propos des fonctionnalités, veuillez envoyer vos requêtes et leurs détails sur AskHDInsight, et suivez-nous sur la Communauté Azure HDInsight pour plus de mises à jour.
Chaque cluster Trino est livré par défaut avec quelques catalogues – system, tpcds, tpch
. Vous pouvez ajouter vos propres catalogues de la même manière que vous le feriez avec OSS Trino.
De plus, Trino avec HDInsight sur AKS permet de stocker des secrets dans Key Vault afin que vous n’ayez pas à les spécifier explicitement dans le modèle ARM.
Vous pouvez ajouter un nouveau catalogue en mettant à jour votre modèle ARM de cluster, à l'exception du catalogue ruche, que vous pouvez ajouter lors de la création du cluster Trino dans le Portail Microsoft Azure.
Cet article montre comment ajouter un nouveau catalogue à votre cluster à l'aide du modèle ARM. L'exemple de cet article décrit les étapes d'ajout de catalogues SQL Server et Memory.
Prérequis
- Un cluster Trino avec HDInsight sur AKS opérationnel.
- Base de données Azure SQL.
- Les identifiants/mots de passe du serveur Azure SQL sont stockés dans les secrets Key Vault et les MSI attribués par l'utilisateur attachés à votre cluster Trino disposent des autorisations nécessaires pour les lire. Référez-vous aux informations d’identification du magasin dans Key Vault et attribuez un rôle à MSI.
- Créez un modèle ARM pour votre cluster.
- Connaissance de la création et du déploiement de modèles ARM.
- Consultez l'exemple complet de modèle ARM de cluster arm-trino-catalog-sample.json.
Étapes pour ajouter un catalogue dans le modèle ARM
Attachez Key Vault et ajoutez des secrets à
secretsProfile
sous la propriétéclusterProfile
.Au cours de cette étape, vous devez vous assurer que Key Vault et les secrets sont configurés pour le cluster Trino. Dans l'exemple suivant, les informations d'identification du serveur SQL sont stockées dans ces secrets : trinotest-admin-user, trinotest-admin-pwd.
"secretsProfile": { "keyVaultResourceId": "/subscriptions/{USER_SUBSCRIPTION_ID}/resourceGroups/{USER_RESOURCE_GROUP}/providers/Microsoft.KeyVault/vaults/{USER_KEYVAULT_NAME}", "secrets": [ { "referenceName": "trinotest-admin-user", "keyVaultObjectName": "trinotest-admin-user", "type": "secret" }, { "referenceName": "trinotest-admin-pwd", "keyVaultObjectName": "trinotest-admin-pwd", "type": "secret" } ] },
Ajoutez des catalogues à
serviceConfigsProfiles
sous la propriétéclusterProfile
.Dans cette étape, vous devez ajouter la configuration du catalogue spécifique à Trino au cluster. L'exemple suivant configure deux catalogues à l'aide des connecteurs Memory et SQL Server. La configuration du catalogue peut être spécifiée de deux manières différentes :
- Paires clé-valeur dans la section valeurs.
- Chaîne unique dans la propriété de contenu.
Le catalogue de mémoire est défini à l'aide d'une paire clé-valeur et le catalogue du serveur SQL est défini à l'aide d'une option de chaîne unique.
"serviceConfigsProfiles": [ { "serviceName": "trino", "configs": [ { "component": "catalogs", "files": [ { "fileName": "memory.properties", "values": { "connector.name": "memory", "memory.max-data-per-node": "128MB" } }, { "fileName": "trinotestdb1.properties", "content":"connector.name=sqlserver\nconnection-url=jdbc:sqlserver://server-name.database.windows.net:1433;database=db1;encrypt=true;trustServerCertificate=false;hostNameInCertificate=*.database.windows.net;loginTimeout=30;\nconnection-user=${SECRET_REF:trinotest-admin-user}\nconnection-password=${SECRET_REF:trinotest-admin-pwd}\n" }, ] } ] } ],
Propriétés
Property Description serviceName trino component Identifie cette section qui configure les catalogues. Il doit s'agir de « catalogues. » files Liste des fichiers du catalogue Trino à ajouter au cluster. Nom de fichier Liste des fichiers du catalogue Trino à ajouter au cluster. content json
chaîne d'échappement à placer dans le fichier du catalogue Trino. Cette chaîne doit contenir toutes les propriétés du catalogue spécifiques à Trino, qui dépendent du type de connecteur utilisé. Pour plus d’informations, consultez la documentation OSS trino.${SECRET_REF:<referenceName>} Balise spéciale pour référencer un secret de secretsProfile. Trino, lors de l’exécution, récupère le secret à partir de Key Vault et le remplace dans la configuration du catalogue. . Il est possible de spécifier la configuration du catalogue en utilisant la propriété de contenu sous forme de chaîne unique et en utilisant des paires clé-valeur distinctes pour chaque propriété de catalogue Trino individuelle, comme indiqué pour le catalogue de mémoire.
Déployez le modèle ARM mis à jour pour refléter les modifications apportées à votre cluster. Découvrez comment déployer un modèle ARM.