Partager via


Effectuer un déploiement hors connexion d’un cluster Big Data SQL Server

Important

Les clusters Big Data Microsoft SQL Server 2019 sont mis hors service. La prise en charge des clusters Big Data SQL Server 2019 a pris fin le 28 février 2025. Pour plus d’informations, consultez le billet de blog d’annonce et les options Big Data sur la plateforme Microsoft SQL Server.

Cet article explique comment effectuer un déploiement hors connexion d’un cluster Big Data SQL Server 2019. Les clusters Big Data doivent avoir accès à un référentiel Docker à partir duquel extraire des images conteneur. Une installation hors connexion est une installation où les images requises sont placées dans un référentiel Docker privé. Ce référentiel privé est ensuite utilisé comme source d’image pour un nouveau déploiement.

Prerequisites

Warning

Le paramètre imagePullPolicy doit être défini comme "Always" dans le fichier du profil de déploiement control.json.

Charger des images dans un référentiel privé

Les étapes suivantes décrivent comment extraire les images conteneur de cluster Big Data à partir du référentiel Microsoft, puis les envoyer dans votre référentiel privé.

Tip

Les étapes suivantes expliquent le processus. Toutefois, pour simplifier la tâche, vous pouvez utiliser le script automatisé au lieu d’exécuter manuellement ces commandes.

  1. Téléchargez les images de conteneur du cluster Big Data en répétant la commande suivante. Remplacez par <SOURCE_IMAGE_NAME> chaque nom d’image. Remplacez <SOURCE_DOCKER_TAG> par la balise de la version du cluster Big Data, par exemple 2019-CU12-ubuntu-20.04.

    docker pull mcr.microsoft.com/mssql/bdc/<SOURCE_IMAGE_NAME>:<SOURCE_DOCKER_TAG>
    
  2. Connectez-vous au registre Docker privé cible.

    docker login <TARGET_DOCKER_REGISTRY> -u <TARGET_DOCKER_USERNAME> -p <TARGET_DOCKER_PASSWORD>
    
  3. Étiquetez les images locales avec la commande suivante pour chaque image :

    docker tag mcr.microsoft.com/mssql/bdc/<SOURCE_IMAGE_NAME>:<SOURCE_DOCKER_TAG> <TARGET_DOCKER_REGISTRY>/<TARGET_DOCKER_REPOSITORY>/<SOURCE_IMAGE_NAME>:<TARGET_DOCKER_TAG>
    
  4. Envoyez (push) les images locales au dépôt Docker privé :

    docker push <TARGET_DOCKER_REGISTRY>/<TARGET_DOCKER_REPOSITORY>/<SOURCE_IMAGE_NAME>:<TARGET_DOCKER_TAG>
    

Warning

Ne modifiez pas les images de cluster Big Data une fois qu’elles sont envoyées dans votre référentiel privé. L’exécution d’un déploiement avec des images modifiées entraîne une configuration de cluster Big Data non prise en charge.

Images de conteneur de cluster Big Data

Les images conteneur de cluster Big Data suivantes sont requises pour une installation hors connexion :

  • mssql-app-service-proxy
  • mssql-control-watchdog
  • mssql-controller
  • mssql-dns
  • mssql-hadoop
  • mssql-mleap-serving-runtime
  • mssql-mlserver-py-runtime
  • mssql-mlserver-r-runtime
  • mssql-monitor-collectd
  • mssql-monitor-elasticsearch
  • mssql-monitor-fluentbit
  • mssql-monitor-grafana
  • mssql-monitor-influxdb
  • mssql-monitor-kibana
  • mssql-monitor-telegraf
  • mssql-security-knox
  • mssql-security-support
  • mssql-server-controller
  • mssql-server-data
  • mssql-ha-operator
  • mssql-ha-supervisor
  • mssql-service-proxy
  • mssql-ssis-app-runtime

Automated script

Vous pouvez utiliser un script Python automatisé qui extrait automatiquement toutes les images conteneur requises et les envoie (push) dans un dépôt privé.

Note

Python est un prérequis pour l’utilisation du script. Pour plus d’informations sur l’installation de Python, consultez la documentation Python.

  1. À partir de bash ou de PowerShell, téléchargez le script avec curl :

    curl -o push-bdc-images-to-custom-private-repo.py "https://raw.githubusercontent.com/Microsoft/sql-server-samples/master/samples/features/sql-big-data-cluster/deployment/offline/push-bdc-images-to-custom-private-repo.py"
    
  2. Exécutez ensuite le script avec l’une des commandes suivantes :

    Windows:

    python push-bdc-images-to-custom-private-repo.py
    

    Linux:

    sudo python push-bdc-images-to-custom-private-repo.py
    
  3. Suivez les instructions pour entrer les informations du référentiel Microsoft et de votre dépôt privé. Une fois le script terminé, toutes les images requises doivent se trouver dans votre référentiel privé.

  4. Suivez les instructions ci-dessous pour savoir comment personnaliser le fichier de configuration de control.json déploiement pour utiliser votre registre de conteneurs et votre référentiel. Notez que vous devez définir les variables d’environnement DOCKER_USERNAME et DOCKER_PASSWORD avant le déploiement pour activer l’accès à votre référentiel privé.

Installer les outils hors connexion

Les déploiements de cluster Big Data nécessitent plusieurs outils, notamment Python, Azure Data CLI (azdata) et kubectl. Procédez comme suit pour installer ces outils sur un serveur hors connexion.

Installer Python hors connexion

  1. Sur une machine disposant d’un accès à Internet, téléchargez l’un des fichiers compressés suivants contenant Python :

    Operating system Download
    Windows https://go.microsoft.com/fwlink/?linkid=2074021
    Linux https://go.microsoft.com/fwlink/?linkid=2065975
    OSX https://go.microsoft.com/fwlink/?linkid=2065976
  2. Copiez le fichier compressé sur la machine cible et extrayez-le dans un dossier de votre choix.

  3. Pour Windows uniquement, exécutez installLocalPythonPackages.bat à partir de ce dossier en indiquant comme paramètre le chemin complet au dossier.

    installLocalPythonPackages.bat "C:\python-3.6.6-win-x64-0.0.1-offline\0.0.1"
    

Installer azdata hors connexion

  1. Sur une machine disposant d’un accès Internet et python, exécutez la commande suivante pour télécharger tous les packages Azure Data CLI (azdata) dans le dossier actif.

    pip download -r https://aka.ms/azdata
    
  2. Copiez les packages téléchargés et le requirements.txt fichier sur l’ordinateur cible.

  3. Exécutez la commande suivante sur l’ordinateur cible, en spécifiant le dossier dans lequel vous avez copié les fichiers précédents.

    pip install --no-index --find-links <path-to-packages> -r <path-to-requirements.txt>
    

Installer kubectl hors connexion

Pour installer kubectl sur un ordinateur hors connexion, procédez comme suit.

  1. Utilisez curl pour télécharger kubectl dans un dossier de votre choix. Pour plus d’informations, consultez Installer le fichier binaire kubectl à l’aide de curl.

  2. Copiez le dossier sur l’ordinateur cible.

Déployer à partir d’un référentiel privé

Pour effectuer le déploiement à partir du référentiel privé, utilisez les étapes décrites dans le guide de déploiement, mais utilisez un fichier de configuration de déploiement personnalisé qui spécifie vos informations de dépôt Docker privées. Les commandes Azure Data CLI (azdata) suivantes montrent comment modifier les paramètres Docker dans un fichier de configuration de déploiement personnalisé nommé control.json:

azdata bdc config replace --config-file custom/control.json --json-values "$.spec.docker.repository=<your-docker-repository>"
azdata bdc config replace --config-file custom/control.json --json-values "$.spec.docker.registry=<your-docker-registry>"
azdata bdc config replace --config-file custom/control.json --json-values "$.spec.docker.imageTag=<your-docker-image-tag>"

Le déploiement vous invite à entrer le nom d’utilisateur et le mot de passe Docker, ou vous pouvez les spécifier dans les variables d’environnement DOCKER_USERNAME et DOCKER_PASSWORD.

Next steps

Pour plus d’informations sur les déploiements de clusters Big Data, consultez Guide pratique pour déployer des clusters Big Data SQL Server sur Kubernetes.