Migrer un entrepôt de données vers un pool SQL dédié dans Azure Synapse Analytics

Les sections suivantes fournissent une vue d’ensemble des éléments impliqués dans la migration d’une solution d’entrepôt de données existante vers un pool SQL dédié Azure Synapse Analytics (anciennement entrepôt de données SQL).

Vue d’ensemble

Avant la migration, vous devez vérifier qu’Azure Synapse Analytics est la meilleure solution pour votre charge de travail. Azure Synapse Analytics est un système distribué conçu pour réaliser des tâches d’analytique sur de grandes quantités de données. La migration vers Azure Synapse Analytics exige d’apporter quelques modifications à la conception. Ces modifications ne sont pas complexes, mais leur implémentation peut prendre du temps. Si votre entreprise requiert un entrepôt de données de niveau entreprise, les avantages obtenus en valent la peine. Toutefois, si vous n’avez pas besoin de la puissance d’Azure Synapse Analytics, il est plus rentable d’utiliser SQL Server ou Azure SQL Database.

Envisagez d’utiliser Azure Synapse Analytics dans les cas suivants :

  • Vous avez au moins un téraoctet (To) de données.
  • Vous prévoyez d’effectuer des tâches d’analytique sur de grandes quantités de données.
  • Vous avez besoin de pouvoir mettre à l’échelle les ressources de calcul et de stockage.
  • Souhaitez réduire les coûts en interrompant les ressources de calculs, si vous n’en avez pas besoin.

À la place d’Azure Synapse Analytics, envisagez d’autres options pour les charges de travail de traitement transactionnel en ligne (OLTP) qui présentent ces caractéristiques :

  • Lectures et écritures haute fréquence.
  • Grand nombre de sélections singleton.
  • Volumes élevés d’insertions d’une seule ligne.
  • Besoins de traitement ligne par ligne.
  • Formats incompatibles (par exemple, JSON et XML).

Prémigration

Une fois que vous avez décidé de migrer une solution existante vers Azure Synapse Analytics, vous devez planifier votre migration avant de commencer. L’objectif principal de la planification est de s’assurer que vos données, vos schémas de table et votre code sont compatibles avec Azure Synapse Analytics. Il existe des différences de compatibilité à contourner entre votre système actuel et Azure Synapse Analytics. De plus, la migration de quantités importantes de données vers Azure prend du temps. Une planification minutieuse permet une migration plus rapide de vos données vers Azure.

Un autre objectif clé de la planification est d’ajuster votre conception pour s’assurer que votre solution tire pleinement parti des performances de requêtes élevées offertes par Azure Synapse Analytics. Le développement d’entrepôts de données prenant en charge la mise à l’échelle introduit des modèles uniques de conception, ce qui signifie que les approches traditionnelles ne sont pas toujours les mieux indiquées. Même si vous avez la possibilité d’apporter certains ajustements au niveau de la conception après la migration, effectuer ces modifications plus tôt dans le processus vous permet de gagner du temps par la suite.

Migrate

Pour une migration réussie, vous devez migrer vos schémas de table, votre code et vos données. Pour obtenir des instructions plus détaillées sur ces sujets, consultez les articles suivants :

Plus de ressources

Pour plus d’informations sur les migrations de Netezza ou Teradata vers Azure Synapse Analytics, commencez à la première étape d’une séquence de sept articles sur les migrations :

Ressources de migration à partir d’engagements réels

Pour plus d’informations sur l’exécution de ce scénario de migration, consultez les ressources suivantes. Elles ont été développées pour soutenir un engagement de projet de migration réel.

Titre/lien Description
Outil et modèle d’évaluation de charge de travail de données Cet outil fournit des suggestions pour les plateformes cibles, la préparation du cloud et le niveau de correction des applications/bases de données qui sont les mieux adaptés pour une charge de travail donnée. Il propose des fonctionnalités de génération de rapports et de calculs simples en un clic qui permettent d’accélérer les évaluations d’un vaste domaine en fournissant un processus de décision de plateforme cible automatisé et uniforme.
Gestion des problèmes de codage des données lors du chargement de données dans Azure Synapse Analytics Ce billet de blog fournit des aperçus sur certains des problèmes de codage des données que vous pouvez rencontrer lors de l’utilisation de PolyBase pour charger des données vers des pools SQL (anciennement entrepôt de données SQL) dédiés. Cet article fournit également des options que vous pouvez utiliser pour surmonter ce type de problèmes et charger les données avec succès.
Obtention des tailles de table dans le pool SQL Azure dédié à Synapse Analytics L’une des tâches clés qu’un architecte doit effectuer consiste à obtenir des mesures sur un nouvel environnement après la migration. Les exemples incluent la collecte des temps de chargement depuis un site local vers le cloud et la collecte des temps de chargement Polybase. L’une des tâches les plus importantes est de déterminer la taille de stockage dans des pools SQL dédiés (anciennement entrepôt de données SQL) par rapport à la plateforme actuelle du client.

L’équipe d’ingénierie SQL des données a développé ces ressources. La charte fondamentale de cette équipe a pour objet d’initier et d’accélérer une modernisation complexe et de faire face aux projets de migration de plateforme de données vers la plateforme Azure Data de Microsoft.

Vidéos

Regardez comment Walgreens a migré son système d’inventaire avec environ 100 To de données de Netezza vers Azure Synapse Analytics en un temps record.

Conseil

Pour plus d’informations sur les migrations Synapse, consultez Guides de migration Azure Synapse Analytics.