Partage via


Qu’est-ce que la mise en miroir dans Fabric ?

La mise en miroir dans Fabric est une solution à faible coût et à faible latence qui regroupe les données de différents systèmes dans une plateforme d’analytique unique. Vous pouvez répliquer en continu votre patrimoine de données existant directement dans OneLake de Fabric à partir de différentes bases de données Azure et sources de données externes.

Avec les données les plus up-to-date dans un format interrogeable dans OneLake, vous pouvez utiliser tous les différents services de Fabric, tels que l’exécution d’analyses avec Spark, l’exécution de notebooks, l’ingénierie des données, la visualisation par le biais de Rapports Power BI, etc.

En utilisant la mise en miroir dans Fabric, vous bénéficiez d’un produit hautement intégré, de bout en bout et facile à utiliser qui simplifie vos besoins d’analyse. La mise en miroir est conçue pour l’ouverture et la collaboration entre Microsoft et les solutions technologiques qui peuvent lire le format de table Delta Lake open source. Il s’agit d’une solution clé en main à faible coût et à faible latence qui crée une réplique de vos données dans OneLake pour tous vos besoins analytiques.

Vous pouvez utiliser les tables Delta partout dans Fabric, ce qui vous aide à accélérer votre parcours dans Fabric.

Vous activez la mise en miroir en créant une connexion sécurisée à votre source de données opérationnelle. Vous choisissez de répliquer une base de données entière ou des tables individuelles, et la mise en miroir conserve automatiquement vos données synchronisées. Une fois configurées, les données sont répliquées en continu dans OneLake pour la consommation d’analytique.

Pourquoi utiliser la mise en miroir dans Fabric ?

Aujourd’hui, de nombreuses organisations ont des données opérationnelles ou analytiques critiques situées dans des silos.

L’accès et l’utilisation de ces données nécessitent des pipelines ETL complexes (extraire le chargement de transformation), des processus métier et des silos de décision, créant :

  • Accès restreint et limité aux données importantes, en constante évolution
  • Friction entre les personnes, le processus et la technologie
  • Temps d’attente longs pour créer des pipelines et des processus pour des données extrêmement importantes
  • Aucune liberté d’utiliser les outils dont vous avez besoin pour analyser et partager confortablement des insights
  • Manque de base appropriée pour que les gens partagent et collaborent sur des données
  • Aucun format de données ouvert commun pour tous les scénarios analytiques : BI, IA, Intégration, Ingénierie et même Applications

La mise en miroir dans Fabric offre une expérience simple pour accélérer la durée de vie des insights et des décisions, et pour décomposer les silos de données entre les solutions technologiques :

  • Réplication en temps quasi réel des données et des métadonnées dans un lac de données SaaS, avec des analyses intégrées pour la bi et l’IA

La plateforme Microsoft Fabric repose sur une base de Software as a Service (SaaS), qui prend en charge la simplicité et l’intégration à un tout nouveau niveau. Pour en savoir plus sur Microsoft Fabric, consultez Qu’est-ce que Microsoft Fabric ?

Voici les principes fondamentaux de la mise en miroir :

  • L’activation de la mise en miroir dans Fabric est simple et intuitive, sans avoir à créer de pipelines ETL complexes, à allouer d’autres ressources de calcul ou à gérer le déplacement des données.

  • La mise en miroir dans Fabric est un service entièrement géré. Vous n’avez donc pas à vous soucier de l’hébergement, de la maintenance ou de la gestion de la réplication de la connexion mise en miroir.

Objets de mise en miroir

La mise en miroir crée ces éléments dans votre espace de travail Fabric :

  • Un processus qui gère la réplication des données et des métadonnées dans OneLake et la conversion en Parquet, dans un format prêt pour l'analyse. Ce processus permet des scénarios en aval tels que l’ingénierie des données, la science des données et bien plus encore.
  • Un Serveur d'analyse SQL

Outre l’éditeur de requête SQL, il existe un vaste écosystème d’outils, notamment SQL Server Management Studio (SSMS),l’extension MSSQL pour Visual Studio Code et même GitHub Copilot.

Le partage facilite le contrôle de l’accès et la gestion des autorisations, ce qui vous permet de protéger les informations sensibles. Le partage permet également une prise de décision sécurisée et démocratisée au sein de votre organisation.

Types de mise en miroir

Microsoft Fabric propose trois approches différentes pour intégrer des données dans OneLake via la mise en miroir.

  • Mise en miroir de bases de données : la mise en miroir de bases de données dans Fabric réplique des bases de données et des tables entières pour regrouper les données de différents systèmes dans une plateforme d’analytique unique.
  • Mise en miroir de métadonnées : la mise en miroir de métadonnées dans Fabric synchronise les métadonnées (telles que les noms de catalogue, les schémas et les tables) au lieu de déplacer physiquement les données. Cette approche utilise des raccourcis, ce qui garantit que les données restent dans sa source tout en étant facilement accessibles dans Fabric.
  • Mise en miroir ouverte : la mise en miroir ouverte dans Fabric est conçue pour étendre la mise en miroir en fonction du format de table Delta Lake ouvert. Cette fonctionnalité permet aux développeurs d’écrire les données modifiées de leur application directement dans un élément de base de données mis en miroir dans Fabric, en fonction de l’approche de mise en miroir ouverte et des API publiques.

Actuellement, les bases de données externes suivantes sont disponibles :

Platform Réplication en temps quasi réel Type de mise en miroir Tutoriel de bout en bout
Bases de données en miroir de Microsoft Fabric à partir d'Azure Cosmos DB Oui Mise en miroir de bases de données Tutorial : Azure Cosmos DB
Microsoft Fabric bases de données mises en miroir à partir de Azure Databricks Oui Mise en miroir de métadonnées Tutorial : Azure Databricks
Les bases de données miroir de Microsoft Fabric provenant d’Azure Database pour PostgreSQL Oui Mise en miroir de bases de données Tutoriel : Azure Database pour PostgreSQL
Bases de données mises en miroir Microsoft Fabric à partir d’Azure Database pour MySQL (préversion) Oui Mise en miroir de bases de données Tutoriel : Azure Database pour MySQL (préversion)
Microsoft Fabric bases de données mises en miroir à partir de Azure SQL Database Oui Mise en miroir de bases de données Tutorial : Azure SQL Database
Microsoft Fabric bases de données mises en miroir à partir d'Azure SQL Managed Instance Oui Mise en miroir de bases de données Tutorial : Azure SQL Managed Instance
Bases de données en miroir de Microsoft Fabric depuis Google BigQuery (aperçu) Oui Mise en miroir de bases de données Tutoriel : Google BigQuery
Bases de données en miroir de Microsoft Fabric depuis Oracle Oui Mise en miroir de bases de données Tutoriel : Oracle
Bases de données de Microsoft Fabric dupliquées depuis SAP Oui Mise en miroir de bases de données Tutoriel : SAP
Les bases de données mises en miroir de Microsoft Fabric depuis Snowflake Oui Mise en miroir de bases de données Tutoriel : Snowflake
Bases de données mises en miroir Microsoft Fabric à partir de SQL Server Oui Mise en miroir de bases de données Tutorial : SQL Server
Ouvrir des bases de données mises en miroir Oui Ouvrir la mise en miroir Tutoriel : Ouvrir la mise en miroir
Bases de données répliquées Microsoft Fabric à partir d'une base de données SQL Fabric Oui Mise en miroir de bases de données Configuré automatiquement

Réplication en temps quasi réel

La réplication en temps quasi réel peut dépendre de différents facteurs, notamment :

  • Emplacement ou région de la source
  • Emplacement ou région de destination
  • Volume des modifications
  • Fréquence des modifications
  • Bande passante réseau et latence à partir de la source
  • Ressources de calcul allouées à la passerelle de données locale

Comment fonctionne la mise en miroir de bases de données ?

Les fichiers Delta arrivent de façon incrémentielle dans Fabric à partir de la source de données. La méthode d’identification des données modifiées de manière incrémentielle varie dans chaque source de données. Dans SQL Server 2025, par exemple, le Database Engine SQL analyse le journal des transactions de la base de données source à une fréquence élevée. SQL Server publie des modifications pour chaque table sur les fichiers correspondants dans la zone d’atterrissage Fabric.

À l’intérieur de Fabric, un moteur de réplicateur s’exécute toujours et analyse les fichiers nouvellement publiés à une fréquence élevée. Fabric fusionne immédiatement les modifications entrantes dans la table delta cible. Les modifications peuvent être publiées aussi rapidement que toutes les 15 secondes.

La logique d’interruption qui détecte une faible activité évite une surcharge excessive sur les moteurs de source de données en dehors de Fabric et réduit la latence en répondant à la fréquence des modifications de données entrantes.

Diagramme du fonctionnement de la mise en miroir de bases de données Fabric.

Comment fonctionne la mise en miroir de métadonnées ?

La mise en miroir permet non seulement la réplication des données, mais peut également être obtenue par le biais de raccourcis ou de mise en miroir de métadonnées plutôt que de réplication complète des données, ce qui permet aux données d’être disponibles sans déplacement physique ni duplication. La mise en miroir dans ce contexte fait référence à la réplication uniquement des métadonnées telles que les noms de catalogue, les schémas et les tables, plutôt que les données réelles proprement dites. Cette approche permet à Fabric de rendre les données provenant de différentes sources accessibles sans la dupliquer, en simplifiant la gestion des données et en réduisant les besoins de stockage.

Par exemple, lors de l’accès aux données enregistrées dans le catalogue Unity, Fabric reflète uniquement la structure du catalogue depuis Azure Databricks, ce qui permet d’accéder aux données sous-jacentes via des raccourcis. Cette méthode garantit que toutes les modifications apportées aux données sources sont instantanément reflétées dans Fabric sans nécessiter de déplacement de données, en conservant la synchronisation en temps réel et en améliorant l’efficacité de l’accès aux informations de up-to-date.

Comment fonctionne la mise en miroir ouverte ?

Outre l’activation de la réplication des données en créant une connexion sécurisée à votre source de données, la mise en miroir vous permet de sélectionner un fournisseur de données existant ou d’écrire votre propre application pour atterrir des données dans une base de données mise en miroir. Lorsque vous créez une base de données mise en miroir ouverte via l’API publique ou le portail Fabric, vous obtenez une URL de zone d’atterrissage dans OneLake où vous pouvez atterrir les données modifiées par spécification de mise en miroir ouverte.

Une fois que les données arrivent dans la zone d’atterrissage dans le format requis, la réplication démarre et gère la complexité de la fusion des modifications avec les mises à jour, l’insertion et la suppression pour être reflétées dans les tables delta. Cette méthode garantit que toutes les données écrites dans la zone d’atterrissage sont immédiatement reflétées, en conservant les données dans Fabric up-to-date.

Partage

Le partage facilite le contrôle d’accès et la gestion. Les contrôles de sécurité, tels que la sécurité au niveau des lignes (RLS), la sécurité au niveau des objets (OLS), et d'autres encore, garantissent que vous pouvez contrôler l'accès aux informations sensibles. Le partage permet également une prise de décision sécurisée et démocratisée au sein de votre organisation.

En partageant, les utilisateurs accordent à d’autres utilisateurs ou à un groupe d’utilisateurs l’accès à une base de données mise en miroir sans donner accès à l’espace de travail et au reste de ses éléments. Lorsqu’une personne partage une base de données mise en miroir, elle accorde également l’accès au point de terminaison d’analyse SQL.

Pour plus d’informations, consultez Partager votre base de données mise en miroir et gérer les autorisations.

Requêtes inter-bases de données

Avec les données de votre base de données mise en miroir stockée dans OneLake, vous pouvez écrire des requêtes inter-bases de données, joindre des données à partir de bases de données mises en miroir, d’entrepôts et de points de terminaison d’analytique SQL de Lakehouses dans une requête T-SQL unique. Pour plus d’informations, consultez Écrire une requête inter-bases de données.

Par exemple, vous pouvez référencer la table à partir de bases de données et d’entrepôts mis en miroir à l’aide d’un nommage en trois parties. Dans l’exemple suivant, utilisez le nom en trois parties pour faire référence à ContosoSalesTable dans l’entrepôt ContosoWarehouse. Dans d'autres bases de données ou entrepôts, la première partie de la convention de dénomination standard SQL à trois parties est le nom de la base de données mise en miroir.

SELECT *
FROM ContosoWarehouse.dbo.ContosoSalesTable AS Contoso
INNER JOIN Affiliation
ON Affiliation.AffiliationId = Contoso.RecordTypeID;

Coût de la mise en miroir

Pour la mise en miroir de bases de données et la mise en miroir ouverte, le stockage Fabric et OneLake sont gratuits jusqu’à une limite basée sur la capacité.

  • Le stockage pour les réplicas est gratuit jusqu'à une limite définie en fonction de la taille de la capacité. La mise en miroir offre un téraoctet gratuit de stockage de mise en miroir pour chaque unité de capacité (CU) que vous achetez. Par exemple, si vous achetez une capacité F64, vous obtenez 64 téraoctets gratuits de stockage, exclusivement utilisés pour la mise en miroir. Vous payez le stockage OneLake si vous dépassez la limite de stockage de mise en miroir gratuite ou lorsque la capacité est suspendue. Pour plus d’informations, consultez Microsoft Fabric Tarification.
  • Le calcul Fabric en arrière-plan utilisé pour répliquer vos données dans Fabric OneLake est gratuit et ne consomme pas de capacité. Les demandes adressées directement à OneLake pour les données mises en miroir utilisent la capacité comme lors d'une consommation normale des calculs OneLake. Le calcul pour l’interrogation de données à l’aide de SQL, Power BI ou Spark est facturé à des tarifs réguliers.
  • Une capacité Fabric en cours d’exécution est requise uniquement pour la configuration initiale de la mise en miroir.

Ingénierie des données avec vos données de base de données mises en miroir

Microsoft Fabric offre diverses fonctionnalités d’ingénierie des données pour vous assurer que vos données sont facilement accessibles, bien organisées et de haute qualité. À partir de Fabric Data Engineering, vous pouvez :

  • Créer et gérer vos données avec Spark en utilisant une architecture de type lakehouse
  • Concevoir des pipelines afin de copier des données dans votre lakehouse
  • Utiliser des définitions de travaux Spark pour envoyer un travail de traitement par lots ou de diffusion en continu vers un cluster Spark
  • Utiliser des notebooks pour écrire du code pour l’ingestion, la préparation et la transformation des données

Science des données avec vos données de base de données mises en miroir

Microsoft Fabric offre Fabric Data Science, qui permet aux utilisateurs d’effectuer des flux de travail de science des données de bout en bout à des fins d’enrichissement des données et d’informations commerciales. Vous pouvez effectuer un large éventail d’activités dans l’ensemble du processus de science des données, à partir de l’exploration des données, de la préparation et du nettoyage à l’expérimentation, à la modélisation, au scoring des modèles et au service d’insights prédictifs aux rapports BI.

Les utilisateurs de Microsoft Fabric peuvent accéder aux charges de travail de la science des données. À partir de là, ils peuvent découvrir et accéder à diverses ressources pertinentes. Par exemple, ils peuvent créer des expériences, des modèles, et des notebooks d'apprentissage automatique. Ils peuvent également importer des Notebooks existants sur la page d'accueil de Data Science.

Direct Lake avec vos données de base de données mises en miroir

Vous pouvez utiliser le mode Direct Lake avec des bases de données mises en miroir dans Microsoft Fabric pour activer l’interrogation hautes performances sur les données mises en miroir sans avoir besoin de déplacer ou de duplication des données. Lorsque vous créez une base de données mise en miroir, ses données sont stockées au format Delta Lake dans OneLake. Ce format natif permet Power BI et d’autres outils d’analytique de se connecter via le mode Direct Lake, offrant des insights en quasi-temps réel en accédant directement aux fichiers sous-jacents. Cette intégration combine la simplicité de mise en miroir avec la vitesse et l’extensibilité de Direct Lake, ce qui permet un rapport rapide et up-to-date sur les données opérationnelles.

Rétention des données mises en miroir

La mise en miroir dans Fabric réplique de manière continue votre ensemble de données existant dans OneLake au format de table Delta Lake. Pour conserver efficacement les données mises en miroir stockées et toujours prêtes pour l’analyse, le mirroring s’exécute automatiquement afin de supprimer les anciens fichiers qui ne sont plus référencés par un journal Delta.

Vous pouvez personnaliser le paramètre de rétention en fonction de vos besoins. Par exemple, vous pouvez choisir une période de rétention plus courte pour réduire la consommation de stockage de mise en miroir ou prolonger la période de rétention pour utiliser les fonctionnalités de voyage dans le temps de Delta pour l'analyse.

Pour les bases de données mises en miroir créées à partir du portail Fabric après la mi-juin 2025, la rétention par défaut est un jour. Pour les anciennes bases de données mises en miroir, la valeur par défaut est de sept jours. Pour vérifier ou mettre à jour le paramètre de rétention, dans le portail Fabric, accédez à votre base de données mise en miroir -> ->Delta table management tab, puis spécifiez le seuil de rétention. Vous pouvez également le configurer via l’API publique en spécifiant la retentionInDays propriété.

Base de données SQL dans Fabric

Vous pouvez également créer et gérer directement une base de données SQL dans Microsoft Fabric à l’intérieur du portail Fabric. Basé sur Azure SQL Database, SQL Database dans Fabric met automatiquement en miroir les données à des fins d’analytique et vous pouvez facilement créer votre base de données opérationnelle dans Fabric. La base de données SQL est le cœur de Fabric pour les charges de travail OLTP et peut s'intégrer à l'intégration du contrôle de code source de Fabric.