Azure Synapse Link pour SQL Server 2022

Article
03/25/2023

Cet article décrit les fonctions d’Azure Synapse Link pour SQL Server 2022. La fonctionnalité Azure Synapse Link pour SQL vous permet de répliquer vos données opérationnelles dans un pool SQL Azure Synapse Analytics dédié à partir de SQL Server 2022.

Connexion de liaison

Une connexion de liaison identifie une relation de mappage entre un serveur SQL Server 2022 et un pool SQL Azure Synapse Analytics dédié. Vous pouvez créer, gérer, surveiller et supprimer des connexions de liaison dans votre espace de travail Synapse. Lors de la création d’une connexion de liaison, vous pouvez sélectionner une base de données source et un pool SQL Synapse dédié de destination afin que les données opérationnelles de votre base de données source soient automatiquement répliquées vers le pool SQL Synapse dédié de destination spécifié. Vous pouvez également ajouter ou supprimer une ou plusieurs tables dans votre base de données source à répliquer.

Vous pouvez démarrer, arrêter, suspendre ou reprendre une connexion de liaison. Lors du démarrage, une connexion de liaison va commencer par le chargement initial complet de votre base de données source, suivi des flux de modification incrémentiels via la fonctionnalité de flux de modification dans SQL Server 2022. Lorsque vous arrêtez une connexion de liaison, les mises à jour apportées aux données opérationnelles ne seront pas synchronisées sur votre pool SQL Synapse dédié. Un chargement initial complet à partir de votre base de données source est effectué si vous redémarrez la connexion de liaison. Quand vous interrompez une connexion de liaison, les mises à jour apportées aux données opérationnelles ne sont pas synchronisées avec votre pool SQL Synapse dédié. Quand vous reprenez une connexion de liaison, elle continue de synchroniser la mise à jour là où vous avez interrompu la connexion de liaison à votre pool SQL dédié Synapse. Pour plus d’informations, consultez Flux de modification Azure Synapse Link pour SQL Server 2022 et Azure SQL Database.

Pour chaque connexion de liaison, vous devez sélectionner le nombre de cœurs de calcul pour la réplication de vos données. Le nombre de cœurs représente la puissance de calcul, et a une incidence sur la latence et le coût de réplication des données.

Vous pouvez également trouver un compromis entre le coût et la latence en sélectionnant le mode continu ou de traitement par lots pour répliquer les données. Quand vous sélectionnez le mode continu, le runtime s’exécute en continu et toutes les modifications appliquées à votre base de données SQL ou SQL Server sont répliquées sur Synapse avec une faible latence. Quand vous sélectionnez le mode de traitement par lots avec un intervalle spécifié, les modifications appliquées à votre base de données SQL ou SQL Server sont accumulées et répliquées sur Synapse en mode de traitement par lots avec l’intervalle spécifié. En procédant ainsi, vous pouvez réduire les coûts car seul le temps nécessaire au runtime pour répliquer vos données vous est facturé. Une fois chaque lot de données répliqué, le runtime est arrêté automatiquement.

Zone d'atterrissage

La zone d’atterrissage est un magasin de préproduction intermédiaire requis pour Azure Synapse Link pour SQL Server 2022. Tout d’abord, les données opérationnelles sont chargées du serveur SQL Server 2022 vers la zone d’atterrissage. Ensuite, les données sont copiées de la zone d’atterrissage vers le pool SQL dédié Synapse. Vous devez fournir votre propre compte Azure Data Lake Storage Gen2 à utiliser comme zone d’atterrissage. Il n’est pas possible d’utiliser cette zone d’atterrissage pour n’importe quoi d’autre qu’Azure Synapse Link pour SQL.

Le jeton de signature d’accès partagé (SAP) de votre compte Azure Data Lake Storage Gen2 est requis pour qu’une connexion de liaison obtienne l’accès à la zone d’atterrissage. N’oubliez pas que le jeton SAP a une date d’expiration. Veillez à effectuer la rotation du jeton SAP avant la date d’expiration pour vous assurer que le jeton SAP est valide. Sinon, Azure Synapse Link pour SQL ne parvient pas à répliquer les données à partir de SQL Server 2022.

Runtime d’intégration auto-hébergé

Le runtime d’intégration auto-hébergé est un agent logiciel que vous pouvez télécharger et installer sur une machine locale ou une machine virtuelle. Il est nécessaire pour qu’Azure Synapse Link pour SQL Server 2022 puisse accéder aux données sur SQL Server 2022 localement derrière le pare-feu. Actuellement, le runtime d’intégration auto-hébergé est pris en charge uniquement sur système d’exploitation Windows. Pour plus d’informations, consultez Créer un runtime d’intégration auto-hébergé avec plusieurs fabriques de données.

Monitoring

Vous pouvez surveiller Azure Synapse Link pour SQL aux niveaux de la liaison et de la table. Pour chaque connexion de liaison, vous verrez l’état suivant :

Initial : une connexion de liaison est créée, mais pas démarrée. Vous ne serez pas facturé à l’état initial.
Démarrage : une connexion de liaison configure des moteurs de calcul pour répliquer des données.
En cours d’exécution : une connexion de liaison réplique des données.
Arrêt : une connexion de liaison va être arrêtée. Le moteur de calcul est en cours d’arrêt.
Arrêté : une connexion de liaison est arrêtée. Vous ne serez pas facturé à l’état arrêté.
Pause : une connexion de liaison va être interrompue. Le moteur de calcul est en cours d’arrêt.
Interruption d’exécution : une connexion de liaison est interrompue. Vous ne serez pas facturé pour un état d’interruption.
Reprise : une connexion de liaison va reprendre en configurant des moteurs de calcul pour continuer à répliquer les modifications.

Pour chaque table, vous verrez l’état suivant :

Capture instantanée : une table source est initialement chargée dans la destination avec une capture instantanée complète.
Réplication : toutes les mises à jour de la table source sont répliquées vers la destination.
Échec : les données de la table source ne peuvent pas être répliquées vers la destination. Si vous souhaitez réessayer après avoir corrigé l’erreur, supprimez la table de la connexion de liaison, puis rajoutez-la.
Suspendu : la réplication est suspendue pour cette table en raison d’une erreur. Elle reprendra une fois l’erreur résolue.

Vous pouvez également obtenir les métriques suivantes pour activer le monitoring avancé du service :

Événements de connexion Link : nombre d’événements de connexion Link (démarrage, arrêt ou échec).
Événement de table Link : nombre d’événements de table Link (capture instantanée, suppression ou échec).
Latence de Link en seconde : latence du traitement de données en seconde.
Volume de données traitées Link (octets) : volume de données (en octets) traitées par Synapse Link pour SQL.
Ligne traitée Link : nombre de lignes (changées) traitées par Synapse Link pour SQL.

Pour plus d’informations, consultez Gérer le flux de modification Azure Synapse Link pour SQL.

Cohérence transactionnelle entre tables

Vous pouvez activer la cohérence transactionnelle entre tables pour chaque connexion de liaison. Toutefois, elle limite le débit de réplication global.

Limitations connues

Vous trouverez une liste consolidée des limitations et problèmes connus dans Limitations et problèmes connus d’Azure Synapse Link pour SQL.

Étapes suivantes

Pour en savoir plus, consultez Configurer Azure Synapse Link pour SQL Server 2022.

Partager via