Planifier un déploiement des services de données Azure Arc

Cet article explique comment planifier le déploiement des services de données compatibles Azure Arc.

Conseil

Examinez toutes les informations de cet article avant de commencer votre déploiement.

Étapes du déploiement

Pour pouvoir utiliser les services de données avec Azure Arc, vous devez accomplir les tâches suivantes.

  1. Planifier votre déploiement

    Les détails de cet article vous guideront dans votre plan.

  2. Installer les outils clients.

  3. Inscrivez le fournisseur Microsoft.AzureArcData pour l’abonnement dans lequel les services de données avec Azure Arc sont déployés, comme suit :

    az provider register --namespace Microsoft.AzureArcData
    
  4. Accédez à un cluster Kubernetes.

    À des fins de démonstration, de test et de validation, vous pouvez utiliser un cluster Azure Kubernetes Service. Pour créer un cluster, suivez les instructions fournies dans Démarrage rapide : Déployer des services de données avec Azure Arc – Mode connecté directement – Portail Azure pour parcourir l’ensemble du processus.

  5. Créer un contrôleur de données Azure Arc en mode de connectivité (prérequis).

    Pour d'autres façons de créer un contrôleur de données, consultez les liens sous Contenu associé.

  6. Créez des services de données.

    Par exemple, Créez une instance gérée SQL activée par Azure Arc.

  7. Connectez-vous avec Azure Data Studio.

Lorsque vous commencez à planifier le déploiement des services de données Azure Arc, il est important de bien comprendre les charges de travail de votre base de données et les besoins de votre entreprise pour ces charges de travail. Par exemple, vous devez envisager des choses telles que la disponibilité, la continuité des activités et les besoins en capacité pour la mémoire, le processeur et le stockage de ces charges de travail. Et vous devez préparer soigneusement l’infrastructure pour prendre en charge les charges de travail de base de données, en fonction des besoins de votre entreprise.

Prérequis

Avant de commencer, assurez-vous que vous respectez certaines conditions préalables et que vous disposez du contexte et des informations nécessaires. Pour garantir la réussite du déploiement, votre environnement d’infrastructure doit être correctement configuré avec le bon niveau d’accès et les quantités de capacité de stockage, de processeur et de mémoire appropriées.

Consultez les articles suivants :

Vérifiez que :

  • L’arcdataextension CLI est installée.

  • Les autres outils clients sont installés.

  • Vous avez accès au cluster Kubernetes.

  • Votre fichier kubeconfig est configuré. Il doit pointer vers le cluster Kubernetes sur lequel vous souhaitez effectuer le déploiement. Pour vérifier le contexte actuel du cluster, exécutez la commande suivante :

    kubectl cluster-info
    
  • Vous disposez d’un abonnement Azure sur lequel des ressources telles qu’un contrôleur de données Azure Arc, SQL Managed Instance activé par Azure Arc ou un serveur PostgreSQL compatible Azure Arc seront projetées et facturées.

  • Le fournisseur Microsoft.AzureArcData est inscrit pour l’abonnement dans lequel les services de données avec Azure Arc sont déployés.

Une fois l’infrastructure préparée, déployez les services de données Azure Arc de la façon suivante :

  1. Créez un contrôleur de données compatible Azure Arc sur l’une des distributions validées d’un cluster Kubernetes.
  2. Créez une instance gérée SQL activée par Azure Arc et/ou un serveur PostgreSQL compatible Azure Arc.

Attention

Certains des niveaux et modes des services de données sont généralement disponibles (GA), tandis que d’autres sont en préversion. Nous vous recommandons de ne pas mélanger les services GA et en préversion sur le même contrôleur de données. Si vous mélangez les services GA et en préversion sur le même contrôleur de données, vous ne pouvez pas opérer de mise à niveau sur place. Dans ce scénario, lorsque vous souhaitez opérer une mise à niveau, vous devez supprimer et recréer le contrôleur de données et les services de données.

Conditions requises pour le déploiement

Vous pouvez déployer des services de données Azure Arc sur différents types de clusters Kubernetes. Actuellement, la liste des services Kubernetes et distributions validée est la suivante :

  • Amazon Elastic Kubernetes Service (Amazon EKS)
  • Azure Kubernetes Service (AKS)
  • Service Azure Kubernetes sur Azure Stack HCI
  • Azure Red Hat OpenShift
  • Google Kubernetes Engine (GKE)
  • Kubernetes open source en amont (généralement déployé à l’aide de kubeadm)
  • OpenShift Container Platform (OCP)
  • K3s
  • Distributions Kubernetes supplémentaires validées par les partenaires

Important

  • La version minimale prise en charge de Kubernetes est la version v1.21.
  • La version minimale prise en charge d’OCP est 4.8.
  • si vous utilisez Azure Container Service, la taille de machine virtuelle du nœud Worker de votre cluster doit être au moins Standard_D8s_v3 et utiliser des disques Premium.
  • Le cluster ne doit pas s’étendre sur plusieurs zones de disponibilité.
  • Pour plus d’informations, consultez les Notes de publication.

Informations relatives au déploiement

Lorsque vous créez des services de données Azure Arc, indépendamment du service ou de l’option de distribution que vous choisissez, vous devez fournir les informations suivantes :

  • Nom du contrôleur de données : nom descriptif de votre contrôleur de données (par exemple, production-dc ou seattle-dc). Le nom doit respecter les normes de dénomination de Kubernetes.

  • Nom d’utilisateur : nom d’utilisateur de l’administrateur de Kibana/Grafana.

  • Mot de passe : mot de passe de l’administrateur de Kibana/Grafana.

  • Nom de votre espace de noms Kubernetes : nom de l'espace de noms Kubernetes dans lequel vous souhaitez créer le contrôleur de données.

  • Mode de connectivité : détermine le degré de connectivité de votre environnement de services de données Azure Arc vers Azure. Votre choix du mode de connectivité détermine les options des méthodes de déploiement. Pour plus d’informations, consultez Exigences et modes de connectivité réseau.

  • ID d'abonnement Azure : GUID de l'abonnement Azure dans lequel vous souhaitez que soit créée la ressource de contrôleur de données dans Azure. Tous les déploiements de SQL Managed Instance activés par Azure Arc et PostgreSQL compatible Azure Arc sont également créés et facturés sur cet abonnement.

  • Nom du groupe de ressources Azure : nom du groupe de ressources dans lequel vous souhaitez que soit créée la ressource de contrôleur de données dans Azure. Tous les déploiements de SQL Managed Instance activés par Azure Arc et PostgreSQL avec Azure Arc sont également créés dans ce groupe de ressources.

  • Emplacement Azure : emplacement Azure où les métadonnées de la ressource de contrôleur de données seront stockées. Pour obtenir la liste des régions disponibles, consultez la page Disponibilité des produits par région pour l’infrastructure globale Azure. Les métadonnées et les informations de facturation relatives aux ressources Azure gérées par le contrôleur de données que vous déployez sont stockées uniquement à l’emplacement dans Azure que vous spécifiez comme paramètre d’emplacement. Si vous effectuez le déploiement en mode de connectivité directe, le paramètre d’emplacement du contrôleur de données est le même que celui de votre ressource d’emplacement personnalisé ciblé.

  • Informations sur le principal du service :

  • Infrastructure : à des fins de facturation, vous devez indiquer l’infrastructure sur laquelle vous exécutez les services de données avec Azure Arc. Les options sont :

  • alibaba

  • aws

  • azure

  • gcp

  • onpremises

  • other

  • Runtime de conteneur : utilisez le runtime containerd pour le runtime de conteneur. Les services de données avec Azure Arc ne prennent pas en charge le runtime Docker.

Concepts supplémentaires pour le mode de connectivité directe

Comme expliqué dans Modes et spécifications de la connectivité, vous pouvez déployer le contrôleur de données Azure Arc en mode de connectivité directe ou indirecte. Le déploiement des services de données Azure Arc en mode de connectivité directe nécessite des concepts et considérations supplémentaires :

  • Tout d’abord, le cluster Kubernetes dans lequel les services de données avec Azure Arc seront déployés doit être un cluster Kubernetes avec Azure Arc. En connectant votre cluster Kubernetes à Azure, vous pouvez déployer et gérer les services de données Azure Arc sur votre cluster directement à partir du Portail Azure, télécharger automatiquement votre utilisation, vos journaux et vos mesures dans Azure et bénéficier de plusieurs autres avantages Azure. Pour découvrir comment, consultez Connecter votre cluster à Azure.

  • Une fois que le cluster Kubernetes est compatible avec Azure Arc, déployez les services de données Azure Arc en procédant comme suit :

    1. Créez l’extension des services de données Azure Arc. Pour en savoir plus, consultez Extensions de cluster sur Kubernetes avec Azure Arc.
    2. Créez un emplacement personnalisé. Pour en savoir plus, consultez Emplacements personnalisés sur Kubernetes avec Azure Arc.
    3. Créez le contrôleur de données Azure Arc.

    Vous pouvez effectuer ces trois étapes en une seule à l’aide de l’Assistant Création de contrôleur de données Azure Arc dans le portail Azure.

Après avoir installé le contrôleur de données Azure Arc, vous pouvez créer et accéder à des services de données tels que SQL Managed Instance activé par Azure Arc ou le serveur PostgreSQL compatible Azure Arc.

Limitations connues

Actuellement, un seul contrôleur de données Azure Arc est pris en charge par cluster Kubernetes. Toutefois, vous pouvez créer plusieurs services de données Arc, tels que des instances gérées SQL compatibles Arc et des serveurs PostgreSQL compatibles Arc, qui sont gérés par le même contrôleur de données Azure Arc.

Vous avez plusieurs options supplémentaires pour créer le contrôleur de données Azure Arc :

Vous voulez juste essayer ? Commencez rapidement avec Démarrage rapide avec Azure Arc sur AKS, Amazon EKS ou GKE, ou dans une machine virtuelle Azure.